“明日”をつむぐテクノロジー special

人とつながる「メディアインテリジェンス」「未来の賢いインタフェースが社会を変える、生活を変える」

※記事中の情報につきましては、すべて取材時点のものとなります。
「メディアインテリジェンス」というコンセプトのもと、音声や画像を使った賢いユーザーインタフェースの実現に取り組む東芝ソリューション。音声認識、音声合成、知的対話、画像認識など、東芝グループが培ってきたメディアの要素技術を中核に、新たな価値やサービスの創出に取り組む。
ヒューマンインタフェースロボット アプリプチ(ApriPetit™) メディアインテリジェンスを、高齢者や子どもの見守り、公共施設・店舗での案内や監視などに、親しみやすく違和感なく利用していただくために生まれた。(試作品)
アプリプチ(ApriPetit™)

コンピュータを活用し、人々の生活を豊かにしたい--そんな想いで東芝ソリューションが取り組んでいる新たなコンセプトが「メディアインテリジェンス」である。

同社を含む東芝グループが培ってきた音声認識、音声合成、知的対話、画像認識などのメディア技術を核にして、人がより自然に振る舞える未来のヒューマンインタフェースを実現し、生活やビジネスの革新を図っていこうというのが「メディアインテリジェンス」が目指す世界だ(図1)。

モノが人の言動や意図を理解することから、「人を想うIoE(Internet of Everything)」ともいえる。

「メディアインテリジェンス」は、人が使う機器やサービスのほか、人が関わるあらゆるシーンに適用できるため、その応用範囲は極めて広い。自動車、家電、医療や介護、ソーシャルネットワーク、ゲームやパーソナルロボット、サイネージ、観光、コールセンター、インダストリアルなど、さまざまな市場において新たな価値やビジネスの創出につなげられる可能性を秘めている。

未来を志向したコンセプトではあるが、既に一部では実用化も始まっており、「Yahoo!カーナビ」における音声案内(ヤフー株式会社提供)、自動音声対話による相続相談サービス(株式会社東邦銀行提供)、介護従事者向けの「音声つぶやきSNS」、音声書き起こしクラウドエディタ「ToScribe」、テレビ番組を音声で指示できる「ざんまいスマートアクセス」、音声認識を備えたコールセンターソリューション「T-SQUARE/CT」(以上東芝提供)などに関連技術が展開されている。

図1 メディアインテリジェンスが目指す「人を想うIoE」
リンク

「見る・聞く・話す」を実現する。さまざまな要素技術で業界をリード

「メディアインテリジェンス」の中軸を構成するのが、コンピュータの「見る・聞く・話す」を実現する各要素技術だ。

「見る」を実現するのが画像認識技術である。顔認識、属性認識、人物追跡、人数カウント、体型センシング、情景文字認識などの高度な機能を実現しており、店舗における客の動線把握のほか、セキュリティ管理、看板文字の自動認識と自動翻訳といった応用が可能だ。

「聞く」は音声認識技術が担う。最先端のディープラーニング手法を使った音素識別により、話し言葉に強いことが特長で、専門辞書のカスタマイズも容易である。現時点で、会話の概要やキーワードを把握するには十分な認識率を実現している。

最後の「話す」には音声合成技術が使われる。個人の声の特徴を短い音声データから高速かつ高精度に学習し、喜びなどの感情口調や注意を喚起する切迫口調のほか、特定人物の声真似も自在に設定できる。日本語を含む11言語に対応している。

これらの各技術を結ぶのが、東芝グループが注力している意図理解技術や知的対話技術である。曖昧な話し言葉から意味を抽出し、適切な応答を返すことで、利用者とのインタラクティブなインタフェースを実現できる。

サービスモデルの一例を図2に示す。ビッグデータ解析を用いて新しい言葉を日々抽出しながら、大規模な統一辞書をクラウド上に構築。必要に応じて専門辞書を設けたうえで、メディア処理エンジンによってサービスを提供する流れだ。なお、辞書の整備にはインターネットを介して作業を依頼するクラウドソーシングも活用する。

図2 メディアインテリジェンスの全体像
リンク

未来のユーザーインタフェースが生活や仕事に新たな変化をもたらす

コンピュータの「見る・聞く・話す」を通じて、生活や社会においては楽しさや豊かさを、業務においては効率を高めてくれる「メディアインテリジェンス」

東芝ソリューションでは要素技術のさらなる研究開発を精力的に進めている。例えば、音声データから複数話者を識別する自動議事録作成システムや、外国人観光客を対象とした新たなサービスの創出につなげられる同時通訳技術や仮想試着技術などの実用化を進めている。

音声や画像などのメディア技術を軸に、クラウドサービス、コンサルテーション、運用保守サポート、システム開発、組み込み開発、さらには半導体開発まで、東芝グループが持つさまざまな強みの組み合わせから未来に向けたユーザーインタフェースが誕生し、新たな価値を生み出していく。

pagetop

お問い合わせ