アマゾン ウェブ サービス ジャパン

高速AI開発と実運用を実現する
クラウドソリューション

アマゾン ウェブ サービス ジャパン 技術統括本部 機械学習ソリューションアーキテクト 宇都宮 聖子 氏

高速AI開発と実運用を実現する
クラウドソリューション

アマゾン ウェブ サービス ジャパン
技術統括本部
機械学習ソリューションアーキテクト

宇都宮 聖子

AI(人工知能)を駆使したシステムの開発に挑む企業が急増している。しかし、実用化までには様々な課題がある。アマゾン ウェブ サービス ジャパン株式会社の宇都宮氏が、AI開発の高速化を阻む課題と、それを解決するソリューションを解説した。

急速に進化した機械学習が競争優位性の源泉に

 現在、多種多様な業界でビジネス課題を解決するためにAIを活用する取り組みが始まっている。いかに高速にAI開発環境を構築し、この数年で急速に進化した機械学習技術を取り入れられるかが非常に重要となる。

 宇都宮氏によると、米アマゾン・ドット・コムは20年以上にわたってAIの領域に大規模な投資を行ってきたという。

 ネット通販の最大手であるアマゾン・ドット・コムでは、数多くの社内システムで、機械学習アルゴリズムを実行している。フルフィルメントセンターにおける経路の最適化や、ウェブサイト上の推奨エンジン、新たな購買体験を提供する無人店舗「Amazon Go」など、今やアマゾン・ドット・コムにとって、機械学習が競争優位性の源泉の1つとなっている。

AI開発を高速にすればビジネスの競争力が高まる

 ただし、一般の企業が機械学習を活用したシステムを開発する際には、様々な課題に遭遇することになる。宇都宮氏は「モデルを構築したうえで学習させて、本番環境にデプロイするというプロセスは非常に複雑で膨大な時間を必要とするため、大半の開発者が、機械学習をビジネス上で実用化するのは想定よりも極めて困難だと感じているのが実情です」と指摘する。

 システムを本番稼働させるまでの「開発」「学習」「推論」のそれぞれのプロセスで大きな課題が待ち受けている。一般に開発と学習は同一のマシンを使うことが多く、開発のプロセスだけで考えると過剰な資源を抱えていることになり、コスト効率が悪い。

 学習のプロセスでは、大量の学習ジョブを順次実行していくと、膨大な時間を要するという課題がある。これを解決するために、分散学習環境を構築すると、コストが高くなるうえに運用管理に大きな手間がかかることになる。学習後に新たなデータに対して推測を行う推論のプロセスでは、アプリケーションから呼び出すためのAPIエンドポイントをつくるコストが高くつく。

 これらの課題が、機械学習を駆使したシステム開発の効率を悪化させる要因になっている。宇都宮氏は「開発の効率が悪いということは、新たなビジネスの立ち上げが遅くなることを意味しています。AI開発を高速にすることで、ビジネスの競争力が高まります」と語る。

プロセスごと・役割ごとに最適な環境を提供

 同社では、機械学習に対するニーズに応えるために、インフラレイヤーからアプリケーションサービスに至るまでのフルスタックで機械学習を利活用するための環境を提供中だ。「TensorFlow」や「PyTorch」「Apache MXNet」「Chainer」などの主要な機械学習フレームワークをサポートしているため、任意のモデルを活用することが可能だ。データサイエンティスト、機械学習の研究者、開発者のいずれも、ニーズと専門知識のレベルに合わせてサービスとツールを利用できる。

 AI開発の効率を飛躍的に高めるためにAWSが投入したクラウドソリューションが「Amazon SageMaker」である。このソリューションは、機械学習モデルを短期間で簡単に構築、トレーニング(学習)、デプロイできるようにするための完全マネージド型プラットフォーム。宇都宮氏は「機械学習システムで起こりがちな問題を解消して、データサイエンティストやエンジニアが素早くプロセスを回せるようにするサービス」だと評する。東京を含めて、世界中の13のリージョンで提供しているサービスだ。

予測結果が正しいことを判明させるためにも、いかに早く、安定してループを回せるかが重要となり、データレイクと環境整備が必須になる

予測結果が正しいことを判明させるためにも、いかに早く、安定してループを回せるかが重要となり、データレイクと環境整備が必須になる

画像を拡大する

 Amazon SageMakerは、開発・学習・推論というプロセスごと、およびデータサイエンティストとエンジニアという役割ごとに最適な環境を提供していることが大きな特徴。開発環境と学習環境を完全に分離しており、それぞれに適したパフォーマンスを提供している。開発のプロセスでは、AWSのストレージに保存した学習データを分析して可視化する「Jupyter Notebook」というツールを提供。アルゴリズムの選択に役立つように、主要な機械学習アルゴリズムやライブラリを事前にインストールしてある。

 Dockerコンテナ上で稼働する学習プロセスでは、Amazon SageMakerのAPIを通じて学習ジョブを実行する。複数の学習ジョブを同時に実行させることも可能だ。分散学習ジョブも容易に実行できる。

 同じくDockerコンテナ上で稼働する推論プロセスでは、高パフォーマンスと高可用性の両方を実現するために、複数のアベイラビリティゾーンに分散されているインスタンスのオート・スケーリング・クラスターにモデルをデプロイする。A/Bテスト機能も組み込んでいるので、モデルを様々なバージョンでテストして最良の結果を得るのに役立つ。

 2018年11月末には、re:Invent 2018で多くの機械学習の新サービスがリリースされたばかり。Amazon SageMakerの中で、マーケットプレイスで他社から購入した機械学習モデルが利用可能になり、機械学習データの準備としては、サードパーティや内部作業者に学習データのタグ付けを依頼できるAmazon SageMaker Ground Truthが利用可能になった。

 宇都宮氏は「月に1度、Amazon SageMakerの公開セミナーを開催しているので、ハンズオンを通した機械学習のプロセスや、お客様の実例にぜひとも触れていただきたい」と語る。

機械学習システムでよくある問題を解消し、データサイエンティストやエンジニアが素早くプロセスを回せるようにするためのサービスがAmazon SageMakerである

機械学習システムでよくある問題を解消し、データサイエンティストやエンジニアが素早くプロセスを回せるようにするためのサービスがAmazon SageMakerである

画像を拡大する

ライオンがハブラシの検品を自動化する新システムに活用

 Amazon SageMakerを活用して、ハブラシの検品を自動化するシステムの開発・実用化に取り組んでいるのがライオンだ。AIやIoTのソリューションを開発・提供しているAutomagi(東京・新宿区)の支援の下で、2018年10月からプロトタイプの開発を開始。2019年度中に製造ラインへの導入を目指している。Automagiでは、Amazon SageMakerの利用で、これまでよりも開発の効率化・スピードアップが可能になるとしている。

このページのトップに戻る