最近、アリババDAMOアカデミーの機械知能研究所は、新世代の音声認識モデルDFSMNを発表しました。世界最大の無料音声認識データベースLibriSpeechのデータによると、音声認識モデルDFSMNは、世界の音声認識精度記録を96.04%まで引き上げました。 DAMOアカデミー機械知能研究所の音声認識チームが音声認識モデルDFSMNの研究開発を主導し、世界中の企業や個人にオープンソースとして公開しました。最も広く使用されている LSTM モデルと比較すると、DFSMN モデルはトレーニング速度が速く、認識精度も高くなります。新しい DFSMN モデルを搭載したスマート スピーカーやスマート ホーム デバイスは、従来のディープラーニング トレーニングよりも 3 倍高速で、音声認識は 2 倍高速です。 雲奇会議武漢サミットでは、DFSMN音声認識モデルを搭載した「AIレジ係」と実際の店員との間で興味深い競争が行われました。騒がしい環境の中で、「AIレジ係」はユーザーの音声注文を正確に認識し、わずか49秒で34杯のコーヒーを注文しました。 DFSMN 音声認識モデルは、スマート注文受付「ウェイター」に使用されているだけでなく、上海地下鉄の券売機にも使用されています。 音声認識の著名な専門家で、西北工科大学の教授である謝磊氏は、「アリババが今回ソースを公開したDFSMNモデルは、音声認識精度の着実な向上において画期的な進歩を遂げた。これは、近年の音声認識分野におけるディープラーニングの最も代表的な成果の一つであり、世界の学術界とAI技術の応用に大きな影響を与えている」と述べた。 |
>>: 私の国のロボット産業には隠れた懸念があります。すべての関係者が協力して高品質の開発を推進します
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
私たちは前例のない危機を生きています。 COVID-19パンデミックの間、医療従事者は最前線のヒーロ...
過去 2 年間で、Linking Open Data などのプロジェクトの本格的な開発により、セマン...
機械学習開発者にとってアプリを構築するのはどれくらい難しいのでしょうか?実際、Python コードを...
ボストンのロボット犬はしばらく前から販売されているが、価格は少々魅力的ではない。インターネット上には...
統計モデルやその他のアルゴリズムに加えて、回帰は機械学習を正常に動作させるための重要な要素です。回帰...
本日、「0からNへ・原始開拓」をテーマにした2021年漢王科技秋季新製品発表会がオンラインで開催され...
最近、ChatGPT や Llama のような大規模言語モデル (LLM) がかつてない注目を集めて...
7月3日、北京で開催されたBaidu Create 2019 Baidu AI Developer ...
GAN は提案されて以来、急速に幅広い注目を集めています。 GAN は、無条件生成と条件情報に基づ...
[[226860]]タイトル画像提供:Visual China最近、海外の多くの企業で興味深い変化が...
[[408307]] IT Homeは6月30日、米国東部時間6月29日に米道路交通安全局(NHTS...