デバイスやサービスに“有能な執事”の魂が宿るAIエージェントが変えていくライフスタイル

 ごく自然に家電やスマホと会話しながら、テンポよくサービスを利用できる――。その様子はまるで、デバイスに“有能な執事”の魂が宿ったかのようだ。NTTドコモによる新AIエージェントは、インテリジェントな音声認識エンジンの集合体である。今回、NTTドコモでは中核となるAIエージェントAPIを開放し、パートナー企業とのコラボレーションを進める。いま最もホットな分野における「+d」(=協創)の狙いを、副社長、R&D戦略部長のインタビューとともに紹介する。

NTTドコモがプラットフォーム間をつなぐハブになる

 2017年6月、NTTドコモは「ドコモAIエージェント・オープンパートナーイニシアティブ」を発表した。NTTドコモが開発した音声認識エンジンの集合体である新AIエージェントのAPI群を外部に開放し、パートナー企業とともにオープンな姿勢で開発を進めていく構想である。 

ドコモAIエージェント・オープンパートナーイニシアティブの概要(NTTドコモの発表資料より)


 本サービスでNTTドコモが目指すものは何か。その狙いを、NTTドコモ 代表取締役副社長 中山俊樹氏に聞いた。

――改めて、AIエージェント・オープンパートナーイニシアティブとは何かを教えてほしい。

中山氏 今回オープンにするAIエージェントAPIは、NTTドコモが長年手がけてきた「しゃべってコンシェル」の自然言語処理、そしてNTTグループのAIである「corevo」で培ってきた知見などを凝縮したもの。日本において我々がリードしてきたこれらの技術をサービス側、デバイス側それぞれにオープン化するのがドコモAIエージェント・オープンパートナーイニシアティブの概要になる。

――その先にどのような世界を作り出していきたいのか。

中山氏 今後のユーザー体験には、いろんなサービスにおいて新しいサービス体験・サービス価値の享受が求められる。そこでAI機能に基づいた音声インタフェースを通じてサービスを拡充していくのが狙いだ。今回、髙島屋、食べログといち早くパートナーシップを結んだのもそのためだ。お客様は日常の中で、リアルな世界の買い物、ネットの世界でのリサーチを分け隔てなく体験している。音声による直感的なサービスで、今ある世界をそのまま写し取っていくような体験を提供したい。

 デバイスにも同じことが言える。確かにスマートフォン(スマホ)やタブレットは大きな力を秘めたデバイスだが、人々の生活はそれだけではない。自動車、冷蔵庫、洗濯機、電子レンジ、掃除機、エアコンなど、さまざまな場面で触れ合うデバイスが異なる。それら多様なデバイスを音声インタフェースがつないでいけば、新しいサービスの体験価値が生まれる。それはスマホが我々のライフスタイルを変えた衝撃に匹敵するものだと考えている。

 しかし、このイノベーションはNTTドコモ1社だけではできない。お客様が満足できるものにするためには、サービス側もデバイス側も一緒になって作っていく必要がある。まずは我々とパートナー企業との連携を深め、役立つサービスを増やしていくことがファーストステップだが、その先にはプラットフォーム間の連携を想定している。

NTTドコモ 代表取締役副社長 中山俊樹氏

――プラットフォーム間をつなぐ狙いは。

中山氏 これまでの企業はプラットフォーマーとしてサービスを独占することを目指してきたが、それは決してお客様にとっては有益でないことが多い。例えば今、たくさんの企業から音声操作のAIスピーカーが発売されているが、それぞれにプラットフォームがある。しかしこの先、限られたデバイスでしか使えないのではどこかで限界が出てくる。これからはプラットフォーム間も連携していかないと、お客様がそこに価値を見出してくれない。

 かつてのiモードも同じように多様なサービスをつなぐプラットフォームだったが、デバイスは携帯電話に限られていた。今回の狙いは、プラットフォーム間の連携によって新たなデバイスへのオープン性をどこまで広げるかにある。生活の場面に寄り添って、いかに音声インタフェースを生かせるかがチャレンジになる。

 もちろん、プラットフォーム間の協創と協調は単純に行く話ではないが、NTTドコモはプラットフォームが相互につながる地点を目指していく。それこそお客様にとって最も違和感のないサービスになるからだ。

――斬新な試みだが、どのようなパートナー企業に来てほしいのか。

中山氏 今回の施策を通じてお互いの事業がプラスとなるのであれば、ぜひ積極的にアプローチしてほしい。一方で、自分たちのユーザーを囲い込むような企業は今回の世界観を共有するのは難しいだろう。こちらもオープンにする以上、相手もオープンであってほしい。それがパートナーシップの理想だ。

 これからのサービスでは、“我々のお客様はみんなのお客様”といった考え方が必要になってくる。囲い込みでは限界があり、むしろさまざまなサービスと連携して手を組み、そこに送客することで我々の事業基盤が逆にしっかりしてくる。NTTドコモが+dで“協創”を打ち出しているのもその理由による。

 今ではマクドナルドの決済でdポイントを使える時代になった。ではdポイントの外部利用を“価値の流出”と見るか、お客様に喜んでもらって“NTTドコモのdポイントは便利”と感じてもらっていると見るか。弊社では今、後者の考え方が浸透してきている。もしかしたら、こうした付加価値によってNTTドコモに入ろうと思ってもらえるきっかけになるかもしれない。このように我々はパートナーと一緒になって、お客様にさらなる満足を提供していく。

NTTドコモ 執行役員 R&D戦略部長 イノベーション統括部長 兼務 大野友義氏

 続けて技術的な側面をメインに、NTTドコモ 執行役員 R&D戦略部長 イノベーション統括部長 兼務 大野友義氏に聞く。

――今回提供するAIエージェントAPIは、「多目的対話エンジン」「IoTアクセス制御エンジン」「先読みエンジン」から構成されている。具体的にそれぞれの機能を教えてほしい。まずは多目的対話エンジンから。

大野氏 多目的対話エンジンは、しゃべってコンシェル(2012年に提供を開始)などの知見を集約したもので、まずはスマホやタブレットと人間との自然な対話を磨いてきた。これまでに4300万人、17億回以上の発話ログデータを有し、年を経るにつれて対話型ロボットなど他デバイスへの実装にも成功。日本語の自然言語処理、意図解釈の性能向上、複数対話を実現しながら発展してきた。

 しかし実はアーキテクチャがまったく違う。しゃべってコンシェルは一問一答型だが、多目的対話エンジンは、自然な対話を想定したより高度な技術になっている。例えば「お腹がすいた」と聞いたところで、明確な答は出しにくい。通常「お腹がすいた」に続くのは「何が食べたい?」といった対話になる。ユーザーが何をしたいのかよくわからない会話を「あなたは結局、こういうことを言いたいんですよね?」と解釈して提案する。その提案を対話を通して行うのが多目的対話エンジンのそもそもの思想だ。

――AIが曖昧な要求を総合的に判断して答を出す。まさに未来の姿といえる。

大野氏 非常に難しいのは確かだが、対話を通して曖昧な要求を解決できるのであれば、ユーザーにとって利便性は一気に広がる。なぜなら、ユーザーの欲求を解釈するからだ。そして実際に、それをより深く理解できるところまで進化してきている。

――次にIoTアクセス制御エンジンについて。

大野氏 対話しながら家電をコントロールしたり、電気をつけたり、テレビのチャンネルを変えたりといったデバイス制御の技術になる。各メーカーや規格によってバラバラなデバイス制御を、新たに開発したデバイスWebAPIによって一本化し、実装を容易にした。

 例えば電球1つ取っても電球Aと電球Bでは制御方法やプロトコルが異なるが、デバイスWebAPIを実装すれば同じユーザーインタフェースでアプリを操作できるようになる。このIoTアクセス制御エンジンはOMA(Open Mobile Alliance)で標準化された汎用性の高いWebインタフェースであることも大きな特徴。一方で標準化しただけでは広がらないため、コンソーシアムを運営して普及活動も展開しており、既に124社(2017年8月4日現在)が参画中でさらに輪を広げていく。

――先読みエンジンは自然言語理解とはまた違った機能。今回のAPIの中でも非常に独創的な内容となっている。

大野氏 我々が最終的に作りたい機能は、いつも近くに寄り添うパーソナルエージェント。そのためには何かを聞いてデバイスが答えるのではなく、ユーザーが受動的な立場で支援されることが今後重要になってくると考えた。

 わかりやすい例は行動支援。例えば登録しているスケジュールがあり、普通であれば30分前に出ればいいとする。しかし交通の障害発生が事前に判明しているのであれば、その状況に沿ったプランを練り直さなくてはならない。そこでデバイスがプッシュして「交通状況が事故によって変わったので50分前に出てください」と通知して気づかせる。

 これらは対話によって得た情報、スケジュールや行動パターンに基づく高精度なレコメンド機能となる。次の行動を先読みして、最適なタイミングでユーザーに必要な情報を伝えるわけだ。ここでの理想は何でもプッシュせずに“空気を読んでくれる”ことだが、それは非常にハードルが高い。しかしパーソナルエージェントを目指すには、このポイントは外せないため、我々も注力して取り組んでいる。

――最初の窓口がNTTドコモによるメインエージェント、その後の専門窓口が各企業が提供するエキスパートエージェントという、パートナーシップありきの考え方がユニーク。この発想はどこから?

大野氏 今までNTTドコモは垂直統合型のモデルだった。iモードもオープンだったが、外からはドコモサービスの1つのような見え方になってしまっていた。

 これからの時代、NTTドコモだけですべてを提供することは不可能。そこで生まれたのが+dという“協創”のコンセプトだ。我々が目指すパーソナルエージェントはお客様に最も近いところにあるエージェントだが、それですべてを網羅できるわけではない。ならばエキスパートエージェントと連携しながら、お客様のやりたいこと、困っていることを実現する形にしたほうが、よりお客様にとってもわかりやすくなる。

 例えば先日の発表会では、エキスパートエージェントの例としてタクシー会社、運送会社、百貨店などの例を示した。最初の窓口は我々が担うが、専門的なサービスはエキスパートエージェントにサポートしてもらいながら、お客様のニーズを実現する。

 だからこそパートナーを分野で区切る考えはない。今回の取り組みにはいろんな企業が参入できて、無限の可能性があると思っている。こちらもオープンで接するので、パートナーもオープンな気持ちでアプローチしてほしい。

   次へ>