Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

マイクロソフト(アジア)インターネットエンジニアリングアカデミーは、新世代の音声インタラクション技術「Full-duplex Voice Sense」の発売を先導し、製品化を完了したと発表した。

[[223494]]

全二重は通信伝送の分野における用語で、同時に 2 方向にデータを伝送できます。対応する用語は半二重です。

従来の音声認識と機械の会話は、半二重通信に似ています。1 ラウンドの認識でも、複数ラウンドの連続認識でも、機械が理解して応答する前に、人が文を言い終える必要があります。これは、従来の格闘技ゲームのターン制戦闘に少し似ています。

Microsoft の新しいテクノロジは、人間が何を言おうとしているかをリアルタイムで予測し、リアルタイムで応答を生成し、会話のリズムを制御できるため、長距離の音声対話が可能になります。

この技術を使用するスマート ハードウェア デバイスでは、ユーザーは対話のたびにウェイクアップ ワードを言う必要がありません。 1 回のウェイクアップだけで継続的な会話を簡単に実現できるため、人間と機械の間の会話は、人間同士の自然なコミュニケーションに近くなります。

現在、この技術はマイクロソフトのXiaoiceのグローバル製品ラインに初めて実装されています。中国市場では、中国科学技術博物館のXiaoice電話ブースだけでなく、マイクロソフトはXiaomiと緊密に協力して、MiエコシステムのYeelight音声アシスタントの市販ハードウェア製品にこの技術を統合しています。

これは、全二重音声対話感覚機能を搭載した世界初のスマートデバイスであり、Microsoft XiaoIceを内蔵した初の「デュアルAI」スマートデバイスでもあります。

日本市場では、この技術を通じて「りんな」がライブ放送プラットフォームに実装され、***車載インテリジェントプロジェクトも路上テストを開始しました。

マイクロソフトは、今後 6 か月以内にこのテクノロジをさらに多くの製品ラインに拡大する予定です。

マイクロソフトのグローバル上級副社長兼マイクロソフトインターネットエンジニアリングアカデミー(アジア)の社長である王永東博士は次のように述べた。「今後1年間で、人工知能の応用は特定の技術分野から総合的な能力を発揮する段階へとますます移行すると予測しています。マイクロソフトはこの点について綿密な準備を進めてきました。全二重音声対話技術の発表は、コンピューター音声技術だけでなく、自然言語処理、人工知能コンテンツ作成などの分野も含みます。これは、これらの分野におけるマイクロソフトの長期にわたる準備と総合的な応用の結果の1つです。」

Microsoft XiaoIce のグローバル R&D 責任者である Zhou Li 博士は、次のように述べています。「実装された製品データとユーザー フィードバックから、共通の現象が観察されました。ユーザーが Microsoft XiaoIce の全二重音声対話感覚体験を使用すると、他の音声アシスタントとの対話に不快感を覚えるようになり、他の音声アシスタントに起動ワードを言うのを忘れることも頻繁にあります。新しいテクノロジにより、擬人化の自然さが大幅に向上し、従来の 1 回限りまたは複数回の連続音声対話体験に対するユーザーの満足度が急速に低下しました。古いものと新しいものを交互に使用するこの現象は、当社の R&D の期待と一致しています。」

<<:  AI as a Service: AIとクラウドコンピューティングが出会うとき

>>:  AIとIoTが教育に与える影響

ブログ    

推薦する

人工知能業界の給与データが公開され、私たちは転職を余儀なくされるのか?

人工知能は、現在最もホットな産業であると言っても過言ではありません。最先端のテクノロジー企業から革新...

ガートナー:テクノロジープロバイダーの33%が2年以内にAIに100万ドル以上を投資する

[[427302]]ガートナーの新しい調査によると、人工知能 (AI) 技術計画を持つテクノロジーお...

将来人工知能に置き換えられる可能性が最も低い10の仕事

人工知能(AI)の急速な発展は人々の生活に便利さをもたらしたが、労働市場には大きな変化をもたらすだろ...

ディープラーニングの最適化手法の簡単な紹介: 勾配降下法

実際、ディープラーニングは多くの厄介な最適化問題を解決しています。ニューラル ネットワークは、問題に...

データマイニングのためのK平均法アルゴリズムのグラフィカルな説明

K-means クラスタリング アルゴリズム 中国語名は「K-means クラスタリング アルゴリズ...

...

潜在能力を解き放つ: 人工知能がパーソナライズされた学習に与える影響

急速に進化する今日の教育環境では、テクノロジーの統合がかつてないほど普及しています。さまざまな技術の...

...

携帯電話が1秒で3Dホログラムを生成する、MITチームの新しい研究

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

無料の Python 機械学習コース 5: 多クラス分類ロジスティック回帰

ロジスティック回帰の2つの方法:勾配降下法と最適化関数ロジスティック回帰は非常に人気のある機械学習手...

...

AI対決シリーズ:あなたのレコメンデーションアルゴリズムは破られましたか?

[[408906]] Google でニュースを検索すると、検索結果にポルノ記事が大量に混ざって表...

ジャック・マーの未来の3大技術、AI、IoT、ブロックチェーンを理解する

ジャック・マー氏は今年の中国科学技術協会年次総会の開会式で、今後10年から20年の間に社会全体に大き...

AI ワークロード向けにデータセンターを最適化する 4 つの方法

AI は、データセンターの雇用市場の変化や、データセンターの監視およびインシデント対応業務の改善など...