Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

マイクロソフト(アジア)インターネットエンジニアリングアカデミーは、新世代の音声インタラクション技術「Full-duplex Voice Sense」の発売を先導し、製品化を完了したと発表した。

[[223494]]

全二重は通信伝送の分野における用語で、同時に 2 方向にデータを伝送できます。対応する用語は半二重です。

従来の音声認識と機械の会話は、半二重通信に似ています。1 ラウンドの認識でも、複数ラウンドの連続認識でも、機械が理解して応答する前に、人が文を言い終える必要があります。これは、従来の格闘技ゲームのターン制戦闘に少し似ています。

Microsoft の新しいテクノロジは、人間が何を言おうとしているかをリアルタイムで予測し、リアルタイムで応答を生成し、会話のリズムを制御できるため、長距離の音声対話が可能になります。

この技術を使用するスマート ハードウェア デバイスでは、ユーザーは対話のたびにウェイクアップ ワードを言う必要がありません。 1 回のウェイクアップだけで継続的な会話を簡単に実現できるため、人間と機械の間の会話は、人間同士の自然なコミュニケーションに近くなります。

現在、この技術はマイクロソフトのXiaoiceのグローバル製品ラインに初めて実装されています。中国市場では、中国科学技術博物館のXiaoice電話ブースだけでなく、マイクロソフトはXiaomiと緊密に協力して、MiエコシステムのYeelight音声アシスタントの市販ハードウェア製品にこの技術を統合しています。

これは、全二重音声対話感覚機能を搭載した世界初のスマートデバイスであり、Microsoft XiaoIceを内蔵した初の「デュアルAI」スマートデバイスでもあります。

日本市場では、この技術を通じて「りんな」がライブ放送プラットフォームに実装され、***車載インテリジェントプロジェクトも路上テストを開始しました。

マイクロソフトは、今後 6 か月以内にこのテクノロジをさらに多くの製品ラインに拡大する予定です。

マイクロソフトのグローバル上級副社長兼マイクロソフトインターネットエンジニアリングアカデミー(アジア)の社長である王永東博士は次のように述べた。「今後1年間で、人工知能の応用は特定の技術分野から総合的な能力を発揮する段階へとますます移行すると予測しています。マイクロソフトはこの点について綿密な準備を進めてきました。全二重音声対話技術の発表は、コンピューター音声技術だけでなく、自然言語処理、人工知能コンテンツ作成などの分野も含みます。これは、これらの分野におけるマイクロソフトの長期にわたる準備と総合的な応用の結果の1つです。」

Microsoft XiaoIce のグローバル R&D 責任者である Zhou Li 博士は、次のように述べています。「実装された製品データとユーザー フィードバックから、共通の現象が観察されました。ユーザーが Microsoft XiaoIce の全二重音声対話感覚体験を使用すると、他の音声アシスタントとの対話に不快感を覚えるようになり、他の音声アシスタントに起動ワードを言うのを忘れることも頻繁にあります。新しいテクノロジにより、擬人化の自然さが大幅に向上し、従来の 1 回限りまたは複数回の連続音声対話体験に対するユーザーの満足度が急速に低下しました。古いものと新しいものを交互に使用するこの現象は、当社の R&D の期待と一致しています。」

<<:  AI as a Service: AIとクラウドコンピューティングが出会うとき

>>:  AIとIoTが教育に与える影響

ブログ    

推薦する

GPT-2を使ってGPT-4を監督し、AIが人類を滅ぼすのを防ぐ?OpenAI Ilya Super Alignmentチームの最初の論文が発表される

たった今、OpenAI のチーフサイエンティスト Ilya が率いるスーパーアライメントチームが設立...

3年間の車両インターネット無料化により、自動運転の産業化が加速

最近、国家発展改革委員会と財政部は、新技術と新事業の発展を奨励するために、5905-5925MHz周...

「コーチ」はとても優しくて合格率も高いです!上海に「無人運転訓練」が登場。試してみませんか?

運転免許試験を受けるとき、2番目の科目で行き詰まっていませんか?コーチに「支配される」ことへの恐怖は...

AIがビールの品質をコントロールするので、コスト効率と信頼性が高まります。

海外メディアの報道によると、食品・飲料業界では人工知能やモノのインターネット技術がますます頻繁に利用...

ビッグデータと人工知能の関係、総合的な分析

ビッグデータはクラウドコンピューティングを採用PaaS レイヤーの複雑な汎用アプリケーションは、ビッ...

限定ダウンロード! Alibaba は AI をどのように活用してコードを記述しているのでしょうか?

[[315476]]今年のアリババ経済フロントエンド委員会の4つの主要な技術方向の1つとして、フロ...

GenAIの変革力は職場に知識をもたらします

GenAI は破壊的な力を持っていますが、どの程度破壊的なのでしょうか? 「大きなものになる」ことは...

...

機械学習がゲームにおける物理シミュレーションに革命をもたらす

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

さあ、アルゴリズムの複雑さをもう一度理解しましょう!

[[346356]] 0. はじめにみなさんこんにちは。私は、複数選択パラメータのプログラマーポッ...

運輸・物流業界におけるAIと自動化のユースケース

現在、世界の一部の国や地域の運輸・物流業界は、流行病によって深刻な影響を受けています。コロナウイルス...

前進を続けましょう: TensorFlow 2.4 の新機能を見てみましょう。

TensorFlow 2.4 が利用可能になりました!このリリースには、新しい機能、パフォーマンス...

AI テクノロジーはワイヤレス ネットワークのインテリジェンスに何をもたらすのでしょうか?

ワイヤレス ネットワークのインテリジェンスは、インターネット業界の発展における新たなトレンドとなって...

「ドメイン外」テキストは不要、Microsoft: NLP はターゲットを絞った方法で事前トレーニングする必要がある

[[337084]]バイオメディカルなどの専門分野では、NLP モデルのトレーニングには、特定のデー...