セレンス視線移動とAI会話を併用したナビ情報取得をデモンストレーション

セレンス社が開発した発話に対応した音声認識技術は、主要な自動車メーカー、カーナビ・メーカーに供給されており、世界的に圧倒的な高いシェアを持っている。最新技術では自然会話に対応したAI搭載型のドライバー・アシスト・システムを展開している。

その「セレンス」とは、メルセデス・ベンツの「MBUX（メルセデス・ベンツユーザーエクスペリエンス）」、BMWの「インテリジェント・パーソナル・アシスタント」に代表される自然会話型のAI搭載型ドライバー・アシスト機能を供給する企業で、グローバル音声関連ソフト開発企業のニュアンスコミュニケーションズが2019年10月から、オートモーティブ部門を分離・独立させ、新たに「セレンス」という企業名でスタートを切った。そして、今回セレンスとして、今後の事業戦略のプレゼンテーションを行なった。

セレンスが目指すロードマップ

新生「セレンス」は、車載のコグニティブ（認知）・アシスタント・システムを模索している。コグニティブとは、ドライバーや乗員とクルマとのコミュニケーション、つまりヒューマン・マシン・インターフェース（HMI)を飛躍的に高いレベルまで引き上げることを目指している。

高度運転支援システムや自動運転化に伴い、従来では考えられないようなHMIが求められているからだ。その背景には、高度運転支援システムや自動運転化により、クルマからはより多くの情報が提供され、ドライバーはそれらを理解し、対応する必要がある。このような条件では、ドライバーがより素早く、簡潔に重要な情報を認識できるかどうかが問われる。そのためには新たなコグニティブ（認知）・アシスタント・システムや、HMIが必要となってくるのだ。

そのため、「セレンス」のイノベーション・ロードマップでは、2021年〜2022年には、ドライバー・アシスタンスでは感情を持つAI、ドライバー・乗員のモニタリング・システム、マルチモーダル（複数の手段）なインターフェースの開発をテーマにしている。

その中でも特にセレンスは視覚、触覚、聴覚、臭覚などを意味するマルチモーダルな、もともと人間同士がコミュニケーションする方法に着目している。

したがって、高度運転支援システムや自動運転などの条件では、単一の情報伝達、例えば音声や警告表示ではなく、複数の、ドライバーがより確実に認知しやすいマルチモーダル・インターフェースが好ましいとなってくる。

そのためセレンスは、ジェスチャー、音声による会話、触覚、視線などを組み合わせたインターフェース方法を追求しているわけだ。

ロードマップの中で2023年以降は、拡張現実（AR)、人とクルマから、人と社会環境への拡大、人間の意識に訴えかける「没入体験」などの技術に挑戦すると想定している。

マルチモーダル・インターフェースのデモンストレーション

今回の技術デモンストレーションは、マルチモーダル・インターフェースのカテゴリーの中でドライバーと、クルマ、周囲の環境データとのインターフェースを具現化したものだ。ドライバーの視線方向（アイ・トラッキング）と、音声会話技術、車両周囲のデータベース組み合わせ、ドライバーが視線を向けた方向の対象物、建物や店舗などの情報をドライバーが会話で簡単に情報入手できるという仕組みになっている。

従来の車載AI会話システムでは、「〇〇に行きたい」と発話すると、クルマ側のシステムは候補地を示し、そこまでのルートを案内をするというスタイルだ。

ドライバーの視線移動の検知と車載会話AIシステムを組み合わせた、今回のマルチモーダル・インターフェースでは、ドライバーの視線が向かった先の店舗や、建物に関して「あの建物は何?」、「あのレストランの営業時間は?、電話番号は?」と発話すると、その建物や店舗に関する多くの情報がデータベースから得られる仕組みになっている。