タグ: Dragon Drive

  • ニュアンスのDragon Drive、AIと相互運用性の技術によりドライバー・同乗者に対する音声対話・認知機能の提供可能に

    ニュアンスのDragon Drive、AIと相互運用性の技術によりドライバー・同乗者に対する音声対話・認知機能の提供可能に

    ニュアンス・コミュニケーションズ社(以下、ニュアンス)は、AI(人工知能)機能を持つコネクテッドカー・プラットフォームDragon Driveの機能を拡張し、ドライバーだけではなく同乗者に対する音声対話・認知機能の提供も可能になったことを発表した。

    この機能拡張により、ウェイクアップ・フレーズ(対話開始のための音声キーワード)の発話や音声ボタンを操作することなく、ナビゲーション、音楽、コンテンツへのアクセスなどの機能を音声だけで操作することが可能となる。また、Dragon Driveのクルマと住宅間の相互運用性も拡張され、自動車メーカーはスマートホーム・システムやアプリケーションを音声操作できる車載インフォテインメントの開発が可能となる。

    ニュアンスが世界の主要な自動車メーカーに対して行った最近の調査結果によると、各社のHMI(ヒューマン・マシン・インターフェース)戦略にとってAIが「重要」、または「非常に重要」と回答した会社は90%以上で、そのうちの85%が車内ユーザーエクスペリエンスの最適化が「重要」、または「非常に重要」と回答している。加えて回答者の43%は、AIが車載システムの全体的なユーザー満足度の向上にもっとも影響を与えると指摘した。

    自動車メーカーがAI対応のコネクテッドカーを実現する上で、ニュアンスはDragon Driveの対話・認知型AI機能を、車内の誰もが利用できるようにさらに向上させた。オートモーティブ・アシスタントのユーザーニーズとその好みを理解し学習する機能により、ドライバーと同乗者にナビゲーション、POI(興味のある場所)検索、ニュースフィード、さらに暖房や空調などの車内機能の操作にいたるまでパーソナライズされたユーザーエクスペリエンスを提供する。

    Dragon Driveは、車載グレードの音声信号処理とともに声紋認証、アンビエント・ウェイクアップ、組込みとクラウドのハイブリッド型音声認識、自然言語理解(NLU)、音声合成機能といった複数の革新的な音声機能を統合することにより、どの座席でも音声対話を利用することができる。Dragon Driveの全ての機能が、コネクテッドカーに最適化されたAIプラットフォームを生み出すニュアンスの機械学習と文脈理解技術により強化されている。

    ユーザーの音声を聞いて理解し、その内容を推論して結果を返すような究極のアシストを実現し、能動的にドライバーと同乗者に対応するという。アンビエント・ウェイクアップ機能の実例では、後部座席の同乗者が「お気に入りを再生」と言うだけで、Dragon Driveのオートモーティブ・アシスタントが同乗者を特定して、お気に入りに設定されているストリーミングラジオ局やプレイリストを再生するとしている。

    またDragon Driveは、オートモーティブ・アシスタントが照明、セキュリティ、その他のスマートホーム・ハブサービスなどのサードパーティ・アプリケーションやサービスと容易に統合可能な柔軟なプラットフォームを提供することで、クルマと住宅間の相互運用性に関するビジョンを推進し、ドライバーと同乗者がどこにいてもクルマと自宅がコネクトされる環境を提供する。

    ニュアンスのオートモーティブ事業部シニア・バイスプレジデント兼ゼネラルマネージャー、アーンド・ヴァイル(Arnd Weil)氏は次のように述べている。

    「カスタマイズ可能なオートモーティブ・アシスタントの統合機能を自動車メーカーに提供することは次の2つの理由から不可欠です。まず最初に、今日のコネクテッドカーには、多くの豊富なコンテンツアプリとサービスがあり、車内でのユーザーエクスペリエンスの一環として誰もがシームレスにアクセスを維持できる必要があります。次に、インテリジェントなオートモーティブ・アシスタントは、半自動運転車、および将来的な自動運転車に対するドライバーの信頼の鍵となり、また、その信頼は、自律的な運転を採用する上で不可欠です。これらの業界動向と、日常生活の一部としてサービスやアプリケーションを利用している消費者ニーズとが相まって、自動車メーカーにとってDragon Driveは直感的でインテリジェントなオートモーティブ・アシスタントを提供するための非常にユニークなソリューションとなっています」

    Dragon Driveは現在、アウディ、BMW、フォード、GMなど1億6000万台以上のクルマに搭載され、40以上の言語でユーザーエクスペリエンスを提供している。

    【関連リンク】
    ニュアンス(NUANCE)
    Dragon Drive
    アウディ(AUDI)
    ビー・エム・ダブリュー(BMW)
    フォード(Ford)
    ゼネラルモーターズ(GM)

  • 自然言語処理技術を搭載した車載コントロールを体験 ~ニュアンス・コミュニケーションズの最新音声技術が搭載されたBMW740e実車デモレポート

    自然言語処理技術を搭載した車載コントロールを体験 ~ニュアンス・コミュニケーションズの最新音声技術が搭載されたBMW740e実車デモレポート

    自動車のナビ操作における音声コントロール、誰もが一度は体験し、目的地を設定するために何度も問答を繰り返すそのわずらわしさから利用しなくなってしまった人も多いのではないだろうか。

    しかし、高精度、高レスポンスな音声認識と自然言語処理による意図理解技術の向上により、自然な口語でスムーズに車載システムをコントロールできる時代が急速に近づきつつある。ニュアンス コミュニケーションズ ジャパン株式会社のオートモーティブ ビジネスユニット プリンシパルマーケティングマネージャーの村上 久幸氏に案内頂き、BMW 7シリーズに搭載されたニュアンスの最新の音声認識技術を搭載したBMW iDriveの音声コントロールを実車BMW740eで体験した。

    IoTNEWS_20170217_BMWdemo_nuance02

    このBMW7シリーズのモデルにはニュアンスのコネクテッドカー開発プラットフォームである「Dragon Drive」を応用して、BMW社により開発されたインフォテイメントシステム「iDrive」が搭載されている。いままでニュアンスの音声関連の技術は、電装機器関係のサプライヤーを経由して自動車メーカーに提供されることがほとんどであったが、このBMW7シリーズに搭載されたiDriveの開発は、ニュアンスがBMW社へ直接提供する形でおこなわれた。これによりメーカーの細かな要望までも直接入るため様々なニーズをくみ取ることができた。またそれに対するメーカーへのレスポンスも良くすることができ、幾度かバージョンアップを繰り返し完成させたとのことだ。

    このシリーズのiDriveにはいくつかの世界初とされている機能が搭載されている。例えば、車載機組込み側とクラウドの両方の音声認識と自然言語理解を同時に利用するハイブリッド構成となっている。ドライバーの発話内容は、組込みとクラウドへ同時に送られて、それぞれで処理をして戻ってきた結果を組込み側のアプリケーションが統合判断して、ドライバに情報を提供する仕組みとなっている。このようにハイブリッド構成にすることで、組込みはレスポンスが早く、クラウドは若干のレイテンシーが発生するものの複雑な自然言語処理、意味理解を行うことができ、クラウドのメリットと組込みのメリットの良いとこ取りのインフォテイメントシステムが実現されている。

    車載機に自然言語理解の機能を搭載することで、階層的なメニュー構成を意識せずとも”近くのファミレスに行きたい”や”宇多田ヒカルのファーストラブをかけて”など、直接したいことを話しかけるだけで、自由かつダイレクトに機能を呼び出すことができる。このあたりはスマートフォンのSiriなどでは当たり前となっているが、今までの組込み車載機の音声コントロールの概念が覆された。

    また、助手席側の音声が入ったとしてもドライバーから的確な指示が入力されるよう、自動車内装設備にチューニングされる形で組み込まれている。音声コントロールはドライバーが行うことが前提となっており、音声操作中に助手席側の人が話してしまったとしても、助手席側のマイクと運転席側のマイクに入力される音声のタイミングのずれを認識し、助手席の声を除去する技術を搭載し、助手席からの不必要な音声をキャンセして音声認識に流れないようにしている。

    それ以外にも、曲名の一部からでも音楽を検索することができたり、システム側が音声案内中でも次の音声コマンドを受け付けることで操作を進めることができるなど、レスポンス性を高めてストレスなくドライバーが音声だけで車載をコントロールできる機能が複合的に搭載されている。

    音声コントロールを体験

    IoTNEWS_20170217_BMWdemo_nuance03

    例えば近くのスターバックスコーヒーに行きたいとき、「えーっと、スタバに行きたいんだけど」と音声を入力する。すると入力された音声はクラウドでテキストに変換され、変換されたテキストから「目的地検索」したいという発話者の意図と、目的地パラメータとして「スターバックスコーヒー」を抽出、この場合、発話者が場所を指定しなかったので検索場所を「現在地周辺」として、車載システム側にフィードバックされる。車載システムは受け取ったタスク、パラメータをもとに候補を検索して近くの目的地候補から順番に表示される。

    その後目的地を指定するための「登録番号をどうぞ」とガイダンスが流れるのだが、ガイダンスの途中でも「1番」と発話入力すると認識されるため、自然言語理解により人とガイダンスとの応答の回数が少なくなるだけでなく、人とガイダンスの応答のレスポンスも良くできるため、設定完了までの音声操作のわずらわしさを全く感じなかった。

    このほかに「おなかがすいた」と発話入力すると近くのレストランが検索されたり、「八王子でコーヒーが飲みたいんだけど」と発話入力されると八王子の喫茶店、コーヒーショップが検索される。

    IoTNEWS_20170217_BMWdemo_nuance05

    自分のスマートフォンにBMW専用アプリ「BMW Connected」を設定すると、オンラインニュースの読み上げや、カレンダー連携、Twitter、ショートメッセージの音声読み上げや音声作成などができるようになり、運転中の音声による車載コントロールができる世界がさらに広がる。

    IoTNEWS_20170217_BMWdemo_nuance06

    ドライバーが「カレンダーを開いて」と発話すると、自分のスマートフォンに設定されているカレンダーの情報が車載システムに連携され直近の予定を表示してくれるので、例えば高速道路を運転中にふと次の予定を知りたくなった時など、手元のスマートフォンを手動操作しなくとも確認ができ、もちろんドライバーが前方をしっかり見て運転ができるよう、予定を読み上げてくれることもできるのだ。

    IoTNEWS_20170217_BMWdemo_nuance07

    次にドライバーが「ショートメッセージを送る」と発話すると、自分のスマートフォンにアドレス登録されている人の名前で宛先を指定し、送信したいメッセージの入力から送信まですべて音声でコントロールすることができる。

    手順を踏んでメッセージを送ることはもちろんのこと、「村上さんにショートメッセージを送りたい。ただいま渋滞中なので少し遅れます。」と一度にすべてを発話しても、「ショートメッセージを送る」というタスクの判定、宛先のパラメータが「村上さん」、メッセージの内容が「ただいま渋滞中なので少し遅れます。」という自然言語理解をクラウドで行われ、ドライバーは簡単にショートメッセージを送ることができる。

    また相手から送られてきたメッセージは車載システムの音声合成で再生することもできるので、ドライバーは画面を見ずに運転をしながらショートメッセージのやり取りをおこなうことができる。

    IoTNEWS_20170217_BMWdemo_nuance08

    Twitterとも連携できるようになっている。ドライバーが「Twitterを開いて」と発話をすると、自分のスマートフォンを経由して自分がフォローしているツイートを取得して、車載システムの音声合成が順番に読み上げてくれる。

    自分がツイートしたい場合も、現在地や気温などの情報から生成されるテンプレートから選択して投稿することも、ドライバーが自由に音声で入力した文章を投稿することも可能になっている。

    次ページは、「Nuance Automotiveが目指すのはドライバー個々のニーズに応えるバーチャルアシスタント」