ITpro Special ITpro EXPO 2015 review Cloud Days Tokyo 2015
ITpro EXPO 2015 review トップ

Cloud Days:東芝(A-347)

モノと人とのつながりが一気に広がるIoT時代には、ITを使う「人」を理解することがより重要になる。東芝のクラウド型音声・映像活用サービス「RECAIUS(リカイアス)」は、音声や映像から人の意図や状況を理解し、自然な対話や情報共有を可能にする。顧客サービスの向上に役立てるなど、企業での応用範囲も広い。

株式会社 東芝
インダストリアルICTソリューション社
商品統括部 商品企画部
メディアインテリジェンス商品企画担当 参事
鈴木 優

 東芝のRECAIUSは自社開発した高精度な音声認識・合成技術とメディアデータの知識処理技術で実現するクラウド型音声・映像活用サービスだ。話した言葉をテキスト化するだけでなく、曖昧な言葉からその意図を推定したり、映像認識と組み合わせて発言者の属性や人数を識別したりすることで、人の意図と状況に合ったリアクションが可能だ。「例えば、同じ意味の言葉を様々な言い方で話しても理解できるので、人との自然な対話に近いやりとりが可能です」と東芝の鈴木優氏は話す。クラウドサービスなので、大きな初期投資は不要。スマートフォンやタブレットはもちろん、デバイスを問わずに利用できる。

 RECAIUSは音声を認識してテキスト化する「音声ビューア」、録音音声の人手による書き起こしを支援する「音声書き起こしエディタ」、入力したテキストデータを音声化する「音声クリエータ」、書籍などのドキュメントを音声化する「音訳エディタ DaisyRings」、話していることをリアルタイムで翻訳する「同時通訳」、曖昧な問いかけにも応える「音声対話」、人物の映像から年齢・性別や人数を判定する「人物ファインダ」という七つのサービスで構成される。

会議の内容をすぐに情報共有 感情豊かな音声表現も可能

 中でも注目したいのが、音声ビューアと音声クリエータである。音声ビューアは話している内容をテキスト化するだけでなく、キーワードによる要約も可能だ。「例えば、会議の進行と同時に議事内容をテキスト化できるので、その場で情報共有が可能です。キーワードで要約すれば、会議の流れを把握することもできます。話すだけでテキストメモが作れるので、手がふさがることが多いフィールド業務でも威力を発揮します」(鈴木氏)。

 音声クリエータは、テキストを基に感情を込めた音声を作り出すサービス。声の種類やしゃべり方などを多彩に設定でき、日・米・中・韓など11言語に対応する。「感情を指定することで、例えば楽しい内容はうれしそうな声で、謝罪する時は悲しそうな声で表現することができます」と鈴木氏は説明する。店舗や施設の音声案内、エンターテインメント分野などに活用できる。既に導入事例も出てきている。百貨店の松屋銀座では、期間限定ではあるが接客支援として同時通訳ツールを提供した。外国人旅行客と店員の会話をタブレットの画面上に表示しコミュニケーションをサポートする。東邦銀行は国内金融機関で初めて、音声対話による相続相談サービスを開始した。Webサイト上で話しかけると相続手続きの流れや必要書類などを音声で説明する。

 今後も東芝はIoT時代のコミュニケーションの高度化を支援し、安心・安全・快適に過ごせる社会の実現に貢献する。

■RECAIUSの機能概要
東芝の音声・映像・知識処理技術をクラウドサービスで提供する
[画像のクリックで拡大表示]
お問い合わせ