アリババの音声ロボットが李佳琦の生放送室に登場、その応答速度はSiriの20倍

10月30日、終了したばかりの李佳琦のライブ放送室で、オンラインショッピング客はアリババの音声ロボットを通じて初めてキャスターとのリアルタイムのインタラクションを実現した。生放送中、数十万人のユーザーが同時に音声で李佳琦の質問に答えた。最終的に、ロボットは音声認識と音声フィードバックの全プロセスを50ミリ秒以内に完了し、応答速度は従来の音声の20倍に達した。

タオバオ生放送室の観客は音声を通じて李佳琦と交流します。今年のダブル11期間中、タオバオ生放送室は「音声価格推測」機能を開始しました。これは、視聴者が生放送室で音声を通じて相互に交流できるようにする機能です。例えば、キャスターが出した商品の価格を推測するタスクに、口を動かすだけで応答することができます。音声ロボットは、この対話型プロセスがスムーズに行われるかどうかを決定する鍵となります。

報道によると、タオバオのライブ放送の視聴者数は数百万から数千万人に達し、ユーザーは全国に分散しており、アクセントも大きく異なります。現在主流の音声技術ソリューションでは、短時間でこれほど大量のユーザー音声に迅速に応答することが困難です。たとえば、Siriがユーザーの音声を認識する応答時間は1秒以上で、ライブ放送のシナリオでの強力なインタラクションの要件を満たすことができません。

今回、タオバオ生放送室はDAMOアカデミーの最新のモバイルオフラインエンドツーエンド音声認識技術を採用しました。新しいネットワーク構造と音声認識フレームワークに基づき、低スペックの携帯電話でも音声対話処理を50ミリ秒以内に完了できます。これは従来の音声認識より20倍高速です。さらに、この技術は発話速度の速さや強いアクセントなどの問題も解決し、難易度の高いシナリオでの音声認識エラー率が30％近く削減されます。

DAMOアカデミー音声ラボの技術専門家である万玉龍氏は、「リアルタイムの要件が極めて高いシナリオでは、従来のクラウドベースの音声ソリューションではニーズを満たすことができません。この音声技術の革新性は、認識速度と精度を同時に向上させたことにあります。音声AIモデルは各ユーザーのTaobao Live APPに展開されており、ライブ放送室に数千万人のユーザーがいても、AIが聞き逃したり判断が遅れたりすることはありません。」と述べています。

過去数年間、Alibaba Voice AI は基礎研究と応用において一連のブレークスルーを達成してきました。 2019年、アリババ音声AIはMIT Reviewの「世界のブレークスルーテクノロジートップ10」に選ばれ、リストに載った唯一の中国テクノロジー企業となった。今年7月にIDCが発表した「中国AIクラウドサービス市場半期調査レポート」によると、アリババ音声AIはクラウド音声AI市場で44％の市場シェアで第1位となった。

<<: 運輸省は自動運転について「技術革新を歓迎し、支持する」と回答

>>: 小さなロバが勤務中です！アリババの物流ロボットが11月11日に浙江大学菜鳥駅で荷物を配達する契約を締結

108 言語をサポートする Google 翻訳は、AI をどのように活用して翻訳の品質を向上させているのでしょうか?

アリババの音声ロボットが李佳琦の生放送室に登場、その応答速度はSiriの20倍

108 言語をサポートする Google 翻訳は、AI をどのように活用して翻訳の品質を向上させているのでしょうか?

Python+AIで静止画像を動かす

人工知能はどのように農業の発展を促進できるのでしょうか?

世界主要7カ国のAI戦略を総ざらい

人工知能のシンギュラリティに関する考察: 超知能 AI の倫理的問題は無視できない

AR のヒント | 説明する時間はありません。今すぐ保存してください。

「トランスフォーマーチャレンジャー」マンバはMacBookでも動く！ GitHub は半日で 500 以上のスターを獲得しました

AIイノベーションの解放：自然言語処理技術とアプリケーション

人工知能の時代、主役となるのは誰でしょうか?

ディープラーニングの一般化能力についての簡単な議論

推薦する

オープンソースフレームワークとコンピューティング能力の向上により、AI は第 3 のクライマックスを迎えています。AI を教育とどのように組み合わせることができるでしょうか?

GenAI はデータ分析分野のどこに位置づけられるのでしょうか?

人工知能が刑事司法を支援する方法：利点と落とし穴

たった 2 行のコードで、「三体問題」を一気に読み上げます。香港中文大学とMITの賈佳雅氏のチームが共同で超長文テキスト拡張技術をリリースし、法学修士課程の忘却の呪いを解く

引退した中国人女性のAIによるイラストがWeiboで話題に！「バカなガチョウの王様」とハッピー・パピーがGPT-4の想像力の限界に挑戦

アルパカはクジラに進化し、Meta は位置合わせを自動化し、Humpback は既存の LLaMa モデルをすべて打ち負かします

AIが無人車両群を指揮、中国が世界最大の3Dプリント建物を建設

マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能

私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

あなたはまだ顔認識精度指標に騙されていませんか?