ITpro SPECIAL

ディープラーニングを活用したグルメサービスRettyが期待を寄せるDell EMC PowerEdgeサーバ

ディープラーニングを活用したグルメサービスRettyが期待を寄せるDell EMC PowerEdgeサーバ

右肩上がりで増え続ける利用者投稿された情報の効率的な整備が急務に

日本最大級の実名グルメサービス「Retty」を運営するRetty。同サービスの特長は、飲食店のおすすめ情報の多くが実名で投稿され、それらを誰でも自由に検索することができたり、訪問したお店のリストを他の利用者と共有したりできること。つまり、友人をはじめ、特定のジャンルやエリアで人気の投稿者、自分と食の嗜好が合致する利用者がおすすめする店舗情報を参照することで、より効率的に行きたい飲食店に出会えることにある。

Retty株式会社
CTO 樽石将人氏

RettyでCTOを務める樽石将人氏は、「私たちのサービスは、いわば、グルメの領域におけるソーシャルネットワークサービスです。人と人の繋がりによって蓄積される情報を参照し、行ってみたいお店や美味しいお店を簡単に見つけることができる点が評価され、多くの利用者を獲得しています」と説明する。事実、Rettyは年々、利用者を増加させ続けており、2017年5月時点での月間利用者数は3,000万人を突破している。

Rettyが提供するサービスは、利用者からのおすすめの口コミのほか、お店や料理等の画像の投稿によって成り立っており、近年では、投稿される口コミ数は数百万件、画像も一千万件規模に到達している。

だが、これらの膨大なデータはあくまでも断片的な情報であり、画像の分類や、料理写真のタグ付けといった処理のほか、テキストによるコメント文の分析を行うことで、より一層利用者にとって価値ある情報として提供されるようになる。

これまでRettyでは、そうしたデータの整理を人手で行ってきたという。だが、投稿される情報が増えれば増えるほど、コストも増加することになる。今後も利用者の拡大が予想される中、労働集約型による対処を続けていたのでは、ビジネスの俊敏性も損なわれてしまう。「また、食は人によって好みが大きく異なるだけでなく、シーンによって選ぶ店舗も変わります。データが日々、膨れ上がっていく一方、情報提示における切り口が多用化する中で、より効率的なデータ整理の手段が求められていたのです」と樽石氏は振り返る。

データ整理の効率化を目指し自作PCでAI基盤を構築

そこで樽石氏が着目したのが、口コミ等のテキストや投稿された画像を自動的に編集・加工するAIの開発である。

「畳み込みニューラルネットワーク(Convolutional Neural Network=CNN)による画像判別精度の向上等、近年のAIに関する飛躍的なイノベーションに加え、オープンソースによる機械学習のフレームワークであるGoogleのTensorFlowといった様々なライブラリが自由に使えるようになったことを背景に、AI基盤の構築に着手したのです」(樽石氏)

とはいえ、RettyにとってAIの導入は未知の領域である。「AIが本当にビジネスで利用できるものなのか、明確な判断が下せない中では、システムの構築に大規模な投資はできません。そこで、まずはなるべくコストをかけずにAIの効果を試せる環境を実現しようと考え、その基盤を自作することにしたのです」と樽石氏は話す。

具体的には汎用PCにGPUボードを搭載したマシンを構築、コストを抑えるため、必要なパーツも秋葉原に出向いて買い集めたという。そうして構築したRettyのAI基盤であるが、現在、NVIDIAのGPUボードであるGeForce GXTシリーズを2基搭載したATXマシンが5台に増設、クラスタ化されている。機械学習のライブラリは先述したTensorFlow、Preferred NetworksのChainerがLinux上で稼働。各マシンにはSSHでログイン可能な docker コンテナが稼働しており、社内のエンジニアの誰もが利用できるようになっている。

このAI基盤であるが、既に様々な場面で活用が進んでいる。その一例が、画像のカテゴリ分類だ。Rettyでは画像を「料理」「外観」「内観(店内)」「メニュー」に分けて提示している。従来はこの分類作業を手作業で行っていたが、AIの活用で自動化。分類に要していたコストを削減することができたという。このほか、料理写真に料理名をタグ付けする技術や、画像の解像度を高解像度化する技術も開発、実際に活用され、多くの成果を上げているという。さらに最近では、キャッチコピーの自動生成にも着手。樽石氏は、「投稿されたテキストを分析し、そのお店の特色を要約したキャッチコピーを自動的に生成する機能が、すでに一部で本番活用されています。利用者がどんなお店なのかを瞬時に判断できる仕組みを実現しました」と説明する。

将来的なディープラーニング基盤の強化に向けDell EMC PowerEdgeサーバの検証を開始

自作マシンによるAI基盤を構築してきたRettyだが、今後のさらなるスケールアウトにも対応可能な基盤の実現を見据え、エンタープライズサーバの導入も検討しているという。そこで、現在、同社が検証を進めているのが、Dell EMCのGPGPUソリューションに対応したサーバ、PowerEdge Rシリーズだ。

汎用性に優れた同PowerEdgeサーバは、わずか2Uのラックスペースに強力なプロセッサー、大容量メモリ、そして、GPUアクセラレーターを搭載したサーバ製品。

中でも注目のポイントは、GPGPUとして、機械学習に適したNVIDIA Tesla® P100が搭載可能である点だ。樽石氏は、「NVIDIA Tesla® P100は、半精度不動小数点演算(FP16)機能を実装しています。機械学習ではFP16の活用により、大幅な性能向上が見込めます。これは、自作マシンからNVIDIA Tesla P100を搭載したPowerEdgeサーバのようなエンタープライズサーバへ移行することのメリットの1つです」と話す。

機械学習に適した NVIDIA Tesla® P100

また、運用管理面においても、PowerEdgeサーバはライフサイクルコントローラを搭載しており、Dell Remote Access Controller(iDRAC)が提供する利便性の高い数々のサーバマネジメント機能により、煩雑な管理作業も容易に行えるようになる。

「自作マシンは構築コストを抑えられる一方、運用管理の負担が少なくありません。パーツも発売時期によって異なったものが各マシンに搭載されており、共通化できていないことから、資産管理も煩雑になってしまいます。また、リモートからの監視や電源のオンオフなど、障害発生時の対応も困難です。例えば、休日に会社に置いてあるAI基盤のシステムに障害が発生しリブートしたい時に、過去は休日に会社に出勤し電源のオンオフを行う必要がありました。対して、Dell EMC PowerEdgeサーバであれば充実したリモート管理ツールが揃っているので、自宅にいながらリモートでのサーバ電源のオンオフなどが簡単にできます。今後、AI基盤をさらに拡大するとともに、より安定した運用を実現していくにあたっては、管理機能が充実したエンタープライズサーバを選択することは重要なポイントとなります」(樽石氏)

最先端の技術を取り入れつつ、オープンで標準的な基盤技術にこだわっている点もDell EMCのサーバに対する評価ポイントだという。

「Dell EMCのサーバは、業界標準のオープン仕様でのシステム構築・運用に適した作りになっており、汎用的に活用できる製品です。私たちはオープンソースソフトウェアを多用していますが、Dell EMCのサーバは、ベンダー独自のテクノロジーに起因するトラブルも生じさせず、かつ、ディープラーニングを実施していくために必要な機能が揃っています。Dell EMCのオープンスタンダードな姿勢は、Rettyのシステム構築の考え方とも合致していると感じました」と樽石氏は話す。

今後は、Dell EMC PowerEdgeサーバを社内のAI基盤での活用のほか、Rettyが開催しているエンジニア向けの研修会において、同社のディープラーニング基盤を体験するためのシステムとして活用していきたいという。

これからもビジネスの成長を支援するため、AI基盤の拡張を推進していくRetty。その一翼をDell EMC のPowerEdgeが担っていきそうだ。最後に樽石氏は、今後のAI基盤のシステム拡張を見据え、次のようにメッセージを語った。

「Rettyはサービスの成長に伴い、サーバ基盤の強化を継続して推進しています。設立当初からクラウドを活用してきましたが、最近では、AI基盤については、現場エンジニアの実地トレーニングも兼ねて、オンプレミスの活用も進めています。クラウドやAI基盤系に強いと自負するエンジニアの方が活躍できる会社ですので、興味がありましたら是非、お声がけください」

LINK