アリババは、DAMOアカデミーの1990年代生まれの科学者が開発した新世代のAIアルゴリズムモデルをオープンソース化しました。

[[270071]]

最近、Alibaba AI は新世代の人間とコンピュータの対話モデル ESIM をオープンソース化しました。このアルゴリズムモデルは2年以上前に提案され、GoogleやFacebookを含む国際的な学術界の200以上の論文で引用されています。また、国際対話システムテストコンペティション（DSTC7）でダブル優勝し、人間とコンピューターの対話精度の世界記録を94.1％に引き上げました。

ESIM モデルは、もともと DAMO アカデミーの音声研究室の 90 年代以降の科学者である Chen Qian によって開発されました。現在では、業界で人気のモデルおよび共通標準となっています。平均年齢30歳のR＆Dチームは、今後、ESIMモデルを世界中の企業や個人にオープンソース化し、この成果を世界中の開発者と共有し、人工知能技術の開発を共同で推進していくと発表した。

アリババは、自社開発の人間と機械の対話応答モデルESIMをGitHubプラットフォームでオープンソース化した。

昨年の DSTC 7 大会では、ESIM が MIT、ジョンズ・ホプキンス大学、IBM リサーチなどから約 20 の参加チームから抜きんでて NOESIS トラックを席巻し、このトラックの 2 つの大会で優勝しました。

DSTC は、学術界における権威ある対話システム評価コンテストです。2013 年に Microsoft Research とカーネギーメロン大学の科学者によって開始され、今年で 8 回目を迎えます。 NOESIS トラックでは、人間とコンピュータの対話を行う AI の能力を検証します。AI は、複数ラウンドにわたる人間とコンピュータの対話履歴に基づいて、数百から数万の文から正しい応答を選択する必要があります。

人間とコンピュータの対話システムとその背後にある認知知能は、人間とコンピュータの相互作用において最も複雑かつ重要な技術です。かつてビル・ゲイツはこれを「人工知能の至宝」と評しました。 ESIMは、機械が人間の表現を迅速かつ正確に理解できるようにするために、AIに「レーダー」システムを搭載し、会話履歴をリアルタイムに取得して干渉情報を自動的に除去し、人間が期待する応答を返すことができるようにしました。

この画期的な進歩は、インテリジェントな顧客サービス、ナビゲーションソフトウェア、スマートスピーカーなどのアプリケーションシナリオに大きな変化をもたらすでしょう。アリババがESIMモデルに基づいて開発したインテリジェント音声注文機や地下鉄音声チケット機などのアプリケーションは、杭州、上海などですでに実装されています。

アリババが最先端技術をオープンソース化するのは今回が初めてではない。 2018年、DAMOアカデミーは次世代音声認識モデルDFSMNをオープンソース化し、多くの研究者がこのモデルに基づいて研究するようになり、音声認識の世界記録を再び更新しました。

<<: AIと宇宙技術が日常生活をどう改善するか

>>: 北京初のT5レベル閉鎖型自動運転試験場が正式に運用開始