人工知能(AI)の発達で、いま世界を取り巻く環境は大きく変わろうとしている。そんな中、最も重要な技術が、機械が人間の声を正確に認識し、適切に理解する「音声認識」だ。米国企業ニュアンスコミュニケーションズ(以下、ニュアンス)は、高度な音声認識技術を武器に、ひとと機械が対話でつながる未来をもたらそうとしている。同社の日本代表、西村哲郎氏が、音声認識が拓く未来を語る。

「キーボード」から「声」の時代がやってきた

ニュアンス・コミュニケーションズ・ジャパン株式会社
GM & President
西村哲郎

ひとが機械に話しかける。すると、その意を汲み取って、機械が適切に命令を実行する。対話を通じて、ひとと機械がコミュニケーションできるようになる。キーボードを叩いたり、スイッチを押したり、ハンドルを動かす代わりに、声をかけるだけで機械が反応し、実行してくれる。

そんなSFで描かれていたような世界が、現実のものとなろうとしています。すでにみなさんも使い始めているはずです。自動車を運転しながら「駐車場は近くにある?」とカーナビゲーションに話しかけて探してもらったり。「今日の東京の天気はどう?」とスマートフォンに話しかけて、傘を持っていくかどうかを決めたり。

カギとなるのは「音声認識技術」です。声という「あやふや」な命令言語を、機械が正確に柔軟に汲み取り、理解し、実行してくれるためには、音声認識技術の発達が欠かせません。

人間の声の微妙な「ニュアンス」を汲み取り、機械に認識させる。米国企業『ニュアンス』の音声認識技術は、すでに日本でも自動車業界や通信キャリア業界で導入が進んでいます。

ニュアンスは、自然言語理解の対応および辞書登録機能をスムーズにできる技術を開発しました。

様々な話し言葉で機械とスムーズにコミュニケーションがとることができる「自然言語対応」。人間の発したことばによる命令に対して、レスポンスよく的確に対応する為、クラウドサービスの利用に加えオフラインでも利用できる「ハイブリッド型ソリューション」。自社によるフレーズのカスタマイズ機能等々……。

こうした技術のおかげで、機械に気軽に命令ができ、必要なキーワードを学習させることができるようになってきています。

いまや、世界の大手IT企業が、音声認識ビジネスに参入しています。Apple SiriやGoogle Now、Amazon Echoなど音声認識を中心としたサービスでは、スマートフォンやパソコンにひとが話しかけると機械がちゃんと応えて要求を実行してくれます。

キーボード入力が苦手なシニア層や、面倒だと感じる若年層の間で。ハンドルから手を離せない自動車の運転手の間で。顧客からのさまざまな問い合わせに対して想定したシナリオを用意する必要があるコールセンターなどで。「機械が受け答えして、命令を実行する」音声認識技術の活用の場がどんどん広がっています。

▲ページの先頭へ