アリババの音声ロボットが李佳琦の生放送室に登場、その応答速度はSiriの20倍

アリババの音声ロボットが李佳琦の生放送室に登場、その応答速度はSiriの20倍

10月30日、終了したばかりの李佳琦のライブ放送室で、オンラインショッピング客はアリババの音声ロボットを通じて初めてキャスターとのリアルタイムのインタラクションを実現した。生放送中、数十万人のユーザーが同時に音声で李佳琦の質問に答えた。最終的に、ロボットは音声認識と音声フィードバックの全プロセスを50ミリ秒以内に完了し、応答速度は従来の音声の20倍に達した。


タオバオ生放送室の観客は音声を通じて李佳琦と交流します。今年のダブル11期間中、タオバオ生放送室は「音声価格推測」機能を開始しました。これは、視聴者が生放送室で音声を通じて相互に交流できるようにする機能です。例えば、キャスターが出した商品の価格を推測するタスクに、口を動かすだけで応答することができます。音声ロボットは、この対話型プロセスがスムーズに行われるかどうかを決定する鍵となります。

報道によると、タオバオのライブ放送の視聴者数は数百万から数千万人に達し、ユーザーは全国に分散しており、アクセントも大きく異なります。現在主流の音声技術ソリューションでは、短時間でこれほど大量のユーザー音声に迅速に応答することが困難です。たとえば、Siriがユーザーの音声を認識する応答時間は1秒以上で、ライブ放送のシナリオでの強力なインタラクションの要件を満たすことができません。

今回、タオバオ生放送室はDAMOアカデミーの最新のモバイルオフラインエンドツーエンド音声認識技術を採用しました。新しいネットワーク構造と音声認識フレームワークに基づき、低スペックの携帯電話でも音声対話処理を50ミリ秒以内に完了できます。これは従来の音声認識より20倍高速です。さらに、この技術は発話速度の速さや強いアクセントなどの問題も解決し、難易度の高いシナリオでの音声認識エラー率が30%近く削減されます。

DAMOアカデミー音声ラボの技術専門家である万玉龍氏は、「リアルタイムの要件が極めて高いシナリオでは、従来のクラウドベースの音声ソリューションではニーズを満たすことができません。この音声技術の革新性は、認識速度と精度を同時に向上させたことにあります。音声AIモデルは各ユーザーのTaobao Live APPに展開されており、ライブ放送室に数千万人のユーザーがいても、AIが聞き逃したり判断が遅れたりすることはありません。」と述べています。

過去数年間、Alibaba Voice AI は基礎研究と応用において一連のブレークスルーを達成してきました。 2019年、アリババ音声AIはMIT Reviewの「世界のブレークスルーテクノロジートップ10」に選ばれ、リストに載った唯一の中国テクノロジー企業となった。今年7月にIDCが発表した「中国AIクラウドサービス市場半期調査レポート」によると、アリババ音声AIはクラウド音声AI市場で44%の市場シェアで第1位となった。

<<:  運輸省は自動運転について「技術革新を歓迎し、支持する」と回答

>>:  小さなロバが勤務中です!アリババの物流ロボットが11月11日に浙江大学菜鳥駅で荷物を配達する契約を締結

ブログ    

推薦する

AIはソフトウェアテスターの仕事を「奪う」のでしょうか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

...

AI 株神: 機械学習を使って株価を予測するには?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

世界の AI 人材レポートが発表されました: 清華大学が 3 位、北京大学が 6 位にランクイン!シリコンバレーが40万人を解雇、プログラマーの面接は12回

先ほど、グローバル AI 人材レポートが発表されました。世界のトップクラスの AI 人材のうち、約半...

...

何百万人もの人々が「焼けた赤ちゃん」の写真を見ました!バークレー教授が噂を否定:AI画像検出器は役に立たない

AI画像検出器が再び攻撃を受けました!最近、中東紛争の写真が大量にインターネット上に公開され、極限状...

アントチェーン、AI + ブロックチェーン技術でオリジナル作品を共同保護するデジタル著作権サービスプラットフォームの開設を発表

10月22日、アントチェーンはデジタル著作権サービスプラットフォームを社会全体に開放することを正式に...

Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

動画世代が猛スピードで進化する中、ピカは偉大なる将軍を迎える―― Google の研究者である Om...

英国メディアが人工知能の軍事応用とそのリスクを分析

[[440377]]はじめに12月7日、英国のドローン戦争ウェブサイトは、人工知能が各国の軍事部門に...

ビッグデータの本当の問題と、なぜ機械学習だけがそれを解決できるのか

多くの企業が、データの取得から洞察の獲得まで、スムーズに実行されるパイプラインの構築に依然として苦労...

UdeskブランドアップグレードWofeng TechnologyはAIコア技術を深化させ、5つの主要製品ラインでトップ1または2戦略を全面的に推進

6月9日、「新AI、新企業サービス、新旅」Wofeng Technologyブランドアップグレードメ...

...

中国の顔認識技術が世界を震撼させている! (顔認証調査報告書を添付します)

顔認識は皆さんもよくご存知だと思います。過去2年間、顔認識技術の急速な発展に伴い、「顔スキャン」は徐...

...