【繁浩太郎の言いたい放題】 高齢者事故と音声認識の進化

今や音声認識の技術は、スマホの検索などでは、ほぼ完璧に使えるようになるレベルまで到達した。
クルマのナビに使われる音声認識も当然進化しています。今回は、今後のクルマと音声認識のかかわりを考えてみたいと思います。

アメリカ ニュアンス・コミュニケーションズ社 社屋
アメリカのマサチューセッツ州バーリントンにグローバル本社を置くニュアンス・コミュニケーションズ社

■音声認識の始まり

音声認識の代表的なメーカーとしてニュアンス・コミュニケーションズ社があります。アメリカのマサチューセッツにあるニュアンス社は、ほぼ全世界のカーメーカーに使われている音声認識技術の最大手のメーカーですが、ナビ・メーカー(Tier1)に納入して完成品になるので、いわゆるTier2となります。今回、ニュアンス社にお邪魔して、取材をさせていただいた。

車載音声認識 発展の歴史 概略図

音声認識は、スマホより早く2000年代に入って車載ナビで実用化されましたが、当初のものは目的地に「世田谷区」といった途端、「近くの、洗濯屋は・・・」となるような代物で、その後、私は長い間使っていませんでしたが、今回ニュアンス社の製品が搭載されたクルマに試乗してみると、ナビ機能を超えて音声だけでショートメッセージまで送れるように進化していました。

AIによるオートモーティブ・アシスタントのビジョン

また、音声認識システム側が話している途中でもドライバーが話しだせる、いわゆる「割り込み」もできます。将来はコンシェルジュ機能(詳細は掲載記事)を目指しているそうで、まさに隔世の感です。

■クルマの「品質感」

クルマとスマホフォン、パソコン等のIT関連の「品質感」は異なります。つまり、スマホなど新しい商品の普及期には、不具合も多く出ると思うのですが、例えばフリーズした時などユーザーは再起動などで簡単に対処します。つまり、そのやり方を知っていることが大切でカッコイイことなのです。

クルマは今では普及期を終え一般化し日常化していますから、フリーズどころか、ちょっとした不具合を感じても「なにコレ」となってしまいます。特に日本車などは、今では不具合が起きるはずもない商品になっていて、まさに家電以上に身近です。

10年乗っても殆ど故障なんてないし、ドカンと縁石に乗り上げるようなアクシデントがあっても、ボディは勿論、タイヤもエアー漏れやパンクなどもほぼしません。また、暑い沖縄から寒い北海道の環境変化があっても当たり前のように走ります。

クルマはその長い技術進化の歴史の中で、アクシデント、強度、耐久性など全ての品質を造り上げてきた結果、クルマの品質機能保証レベルは非常に高くなり、ユーザーの接する気持ちは、機能して当たり前という家電に近いものになったと思うのです。

■音声認識の課題

人間同士の会話の中においては、主語、述語などをキッチリと話さなくても会話は成立しますが、音声認識ではこれは難しいです。

音声認識の鍵となるAI技術のポイント スマートインタラクション パーソナライゼーション 文脈判断 ナレッジ

たとえば、
A君 :「今日のランチは?」
B君 :「イタリアン」
これで人間同士なら会話は成立しますが、音声認識が相手では、難しそうですね。つまり、辞書的意味ではイタリアンといえば普通はイタリア人の事で、次に「イタリアの」とかになります。「イタリアン」は正確には「イタリアン料理」と言ってほしくなりますね。しかしそれが現在では「イタリアン」でも、ほぼ理解してくれるように進化しています。

■クルマのUI(ユーザーインターフェイス)

今のクルマは、音声認識のみならずタッチパネルなどのUIが、進化しています。ジェスチャー認識もその一つです。ただ、よく考えるとクルマのUIは、運転中にクルマが揺れて表示がブレたりしても操作・認識できる確実性が大切になります。

そういう意味では、私はクルマのUIとしてのタッチパネルには疑問があります。いくらディスプレイが大きくても、視線をそこに向けて、しかも揺れる車内では手元も狂うから、より手先に意識を集中しなくてはなりません。タッチパネルは普段スマホで使っているので、馴染み良さはあるのですが、その操作性は疑問と考えます。

これが、音声認識ならドライバーの意識を運転以外にそらしてしまう問題は少ないと思います。クルマの進化の方向性は大きくは事故ゼロを目指した自動運転ですが、それまでの間は、安全と利便性を追求する意味で、音声認識が大きな役割を果たすのではないかと思っています。

BMWにおけるニュアンス・コミュニケーションズの音声認識も含むユーザーインターフェース

■音声認識の可能性

つまり、最近多い高齢者のペダルの踏み間違いやATの操作ミスを含めた事故にも音声認識は有効だと思うのです。目的地設定は音声だと簡単にできますから、エンジンONで、ハンドブレーキを外す前に、目的地を言い、入っているギアや踏もうとするペダル、駐車状態と道路をクルマがセンシングし、状況判断し、もし間違っていればクルマは動かず、言語で教えてくれることもできるはずです。

表示系ではドライバーが目視確認しなければなりませんが、音声だと強制的に耳に入って、しかも人間の頭で認識しやすいのです。高齢者や運転が苦手な人は、ナビ画面を見るよりも、「右、左・・」と言うような音声に従って運転する方が安全に運転ができると言います。

また鉄道では、「指差喚呼(しさかんこ)」、簡単に言うと「指さし確認」と言われますが、声を出すことを安全確認などの目的で行ないますが、これはより確実性を高めるために用いられています。

ニュアンス・コミュニケーションズ 中国 上海汽車への採用例

■高齢者事故の対策に

これに近いことが、高齢者運転には良いかもしれないと私は考えています。「そんなことやってられるか」と熟練した高齢者ドライバーは言うでしょうが、こうも高齢者事故が問題になってくると、安全運転の右にでるものはないのです。

クルマはユーザーにとって、ストレスフリー、安楽方向にもどんどん進化していますし、家電以上に身近ともいえ、その運転も日常化し、家電の操作とユーザー意識は変わらなくなっているような気もします。HEV車などでは、キーレスで乗り込み、スタートスイッチで起動(エンジン音しない)、小さなスイッチのようなATレバーを動かし、アクセル踏めば音もなくクルマは動きます。

音声ユーザーインターフェースの要素となる技術 概略図

そこに、運転という緊張感はなく、テレビをつけるような日常的な行為になってしまっているのではないでしょうか。クルマが普通のモノ、慣れ親しんだモノとなった今、高齢者だけでなく一般ドライバーにもあえて緊張感をもって運転することが必要ではないでしょうか?その方法論として、音声認識を使うことは有効だと思うのです。

ドライバー:「出発進行」
クルマ:「オッケー」

ニュアンス コミュニケーションズ アーカイブ
ニュアンス コミュニケーションズ 公式サイト

ページのトップに戻る