2016年11月15日、音声認識技術でグローバルにビジネス展開しているニュアンス コミュニケーションズ・ジャパンは都内で、「ニュアンス オートフォーラム ジャパン2016」を開催し、自動車メーカー、サプライヤーのエンジニアなどを対象に、人工知能、機械学習機能を備える次世代の音声認識技術などをアピールした。
ニュアンス コミュニケーションズ社は、アメリカのマサチューセッツ州バーリントンにグローバル本社を置き、さまざまな産業分野で使用される音声認識、音声入力の制御やソフトウェア開発をグローバルに事業展開している。アメリカ、ヨーロッパの病院の医師のための音声入力カルテ作成ソフトウエアを始め、アップル社のSiriやサムスンのGALAXY、IBM、HPなど各社へ音声認識技術を提供している。
また、自動車の分野では、世界各国の自動車メーカー、サプライヤー、ナビゲーションメーカーなどに音声認識が提供され、音声によるカーナビの目的地設定、電話番号検索や自動発信など多くの分野で使用されている。
■ドラゴンドライブの紹介
今回の「ニュアンス オートフォーラム ジャパン2016」では、同社が開発している次世代の車載用の音声認識技術、人工知能(AI)、機械学習を組合わせた対話形式によるコンシェルジュ・サービス「Dragon Drive(ドラゴンドライブ)」をプレゼンテーションした。
このシステムでは、自然言語による対話形式が可能であることはもちろん、対話における文脈の理解、対話に使用される代名詞の理解などの能力を持ち、さらには深層機械学習によりユーザーの属性や嗜好に最適化したカスタマイズ能力も与えられる。
つまり従来のようにドライバーが目的地を探し、走行ルートをナビで提示するというスタイルから、ドライバーの目的、例えばガソリンスタンドを探す、レストランを探し予約する、予約したレストランの最寄の駐車場を検索するといった一連の行動を、対話形式で進め、レストランの予約やルートガイド、予定到着時間などを実行できるコンシェルジュ・サービスとされる。
レストランの予約といったシーンでは、ドライバーが「A地点の近くのレストランを予約したい」と発音すると、システムは「和食か、中華料理か、イタリアンか?」とドライバーに尋ねるという具合に、従来の目的地検索よりはるかに高次元のサービスで、いあわば車載の対話ロボットとして機能するともいえる。
そのためには、システムがドライバーの嗜好や希望に合わせた検索と、候補の提示が行なわれ、それに対してドライバーが希望を発音。その希望に基づいてシステムは次の対応を提示するという展開で、こうしたコンシェルジュ・サービスではドライバーの求めるものをシステムが理解する必要があるのだ。
その理解、推論の分類化、ドライバー側の省略発音や代名詞の使用、あいまいな表現に対応できるAI能力と、ドライバーの嗜好を機械学習することで個々のドライバーの嗜好を先取りするといった機能が必須となってくる。次世代Dragon Driveは、こうした機能をクラウドの活用とクルマ側のローカルの性能向上により実現しようというものだ。
つまりドライバーが何を求めているか理解し、その背後にあるニーズを推論し最適な対応ができるためにはAI技術が不可欠だ。さらにルートガイドや目的地検索には膨大なデータベースが必要となる。高精度デジタルマップ会社、駐車場やガソリンスタンドのリアルタイムのデータベースなどはクラウドとの接続も必要になる。
このようにニュアンス コミュニケーションズは従来の音声認識技術による車載機器の音声コントロールから、自然言語による対話でドライバーの希望や思考を理解し、ドライバーにとってベストなサービス、情報を提供する、より高度なサービス提供システムへと進化するとしている。
現時点ではクラウド・データと連携した駐車場検索とルート案内、ガソリンスタンド検索とルート案内、目的地検索とルート案内、対話型のクルマの取扱い説明書機能が想定されているが、将来的にはクルマの多くの操作やコントロールについても対話形式に進化していくことも予見できる。
こうしたハンズフリーで多様な操作が実行できる対話ロボット型のクルマのシステムは、従来型のスイッチ、ボタン、手入力による操作などよりはるかに簡単で安全なので、将来的にはコンシェルジュ・サービスだけでなく、運転支援システムとの連携など含め、多くの領域で活用されるはずだ。