アリババDAMOアカデミーが自社開発の音声認識モデルDFSMNをリリースしオープンソース化を発表

アリババDAMOアカデミーが自社開発の音声認識モデルDFSMNをリリースしオープンソース化を発表

[[232119]]

最近、アリババDAMOアカデミーの機械知能研究所は、新世代の音声認識モデルDFSMNを発表し、世界の音声認識精度記録を96.04%に引き上げました(このデータテストは、世界最大の無料音声認識データベースであるLibriSpeechに基づいています)。

このモデルの開発はDAMOアカデミーの機械知能研究所の音声認識チームが主導し、世界中の企業や個人にオープンソースとして公開することを発表しました。業界で最も広く使用されているモデルである LSTM モデルと比較すると、DFSMN モデルはトレーニング速度が速く、認識精度も高くなります。新しい DFSMN モデルを使用するスマート スピーカーやスマート ホーム デバイスでは、前世代のテクノロジーと比較して、ディープラーニングのトレーニング速度が 3 倍、音声認識速度が 2 倍向上します。

図:アリババは自社開発のDFSMN音声認識モデルをGitHubプラットフォームでオープンソース化した

先日の雲奇会議武漢サミットでは、DFSMN音声認識モデルを搭載した「AIレジ係」が実際の店員との競争の中で、騒がしい環境でもユーザーの音声注文を正確に認識し、わずか49秒で34杯のコーヒーを注文した。さらに、この音声認識技術を搭載した自動券売機も上海地下鉄で導入されている。

著名な音声認識の専門家で、西北工科大学の教授である謝磊氏は、「アリババが今回オープンソース化したDFSMNモデルは、音声認識精度の着実な向上において画期的な成果を収めた。これは近年の音声認識分野におけるディープラーニングの最も代表的な成果の一つであり、世界の学術界とAI技術の応用に大きな影響を与えている」と述べた。業界関係者は、DFSMNが従来のLSTMモデルに次ぐ、世界の音声認識分野で最も重要な音響認識モデルの1つになると期待していると述べた。

<<:  全国の大学の人工知能学科の一覧がここにあります!今年の大学入試の受験を検討していますか?

>>:  人工知能とビッグデータの違い

推薦する

...

クック:人工知能が本当に知的であるためには、人間の価値観を尊重しなければならない

[[247844]]近年、FacebookやGoogleなどのインターネット大手は、ユーザーデータの...

将来的には映画の吹き替えにも人工知能が使われるようになるのでしょうか?

英国人映画監督が人工知能(AI)を使って外国映画の鑑賞方法に革命をもたらそうとしている。俳優の顔をデ...

女性は人工知能によって職を失う可能性が高いのでしょうか?人工知能は本当に失業の波を引き起こすのでしょうか?

[[274542]]近年、職場における女性はあ​​らゆる方面から注目されています。女性が職場で真に...

2018年: 人工知能の世界における8つのトレンド

​​ [[206934]]​​人工知能(AI)が私たちの仕事や生活に徐々に浸透してきていることは否定...

オープンソースのラマ2の背後には、若い中国人たちの力がある

最近、Llama 2 のオープン ソース化により、Yann LeCun 氏や業界関係者の多くが「ビッ...

科学技術の力を感じる: 人工知能とスマートヘルスケアの 4 つの注目のアプリケーションの分析

人工知能業界は急速に発展しており、医療、輸送、家具、電子機器などの業界で関連する応用事例が見つかりま...

機械学習を使うのに開発者である必要はありません

デジタル化と AI の導入が加速する中、企業では人工知能 (AI) と機械学習 (ML) の開発者が...

...

...

ジェネレーティブAIはCIOにとって成否を分ける瞬間

IT リーダーは、まずユースケースに合わせて戦略を最適化し、次世代 AI の可能性と落とし穴を実用的...

1.9k の星を獲得した LLM 微調整ツール Lamini は高速かつ強力で、無料で利用可能

LLM の微調整は、複雑な問題から、継続的な技術改善を通じてアクセス可能な問題へと変化しました。さて...

...

2021年に注目すべき5つのAIトレンド

[[392513]] 2020年にCOVID-19が世界的に猛威を振るう中、人々は人工知能技術の助け...