最近、Alibaba AI は新世代の人間とコンピュータの対話モデル ESIM をオープンソース化しました。このアルゴリズムモデルは2年以上前に提案され、GoogleやFacebookを含む国際的な学術界の200以上の論文で引用されています。また、国際対話システムテストコンペティション(DSTC7)でダブル優勝し、人間とコンピューターの対話精度の世界記録を94.1%に引き上げました。 ESIM モデルは、もともと DAMO アカデミーの音声研究室の 90 年代以降の科学者である Chen Qian によって開発されました。現在では、業界で人気のモデルおよび共通標準となっています。平均年齢30歳のR&Dチームは、今後、ESIMモデルを世界中の企業や個人にオープンソース化し、この成果を世界中の開発者と共有し、人工知能技術の開発を共同で推進していくと発表した。 アリババは、自社開発の人間と機械の対話応答モデルESIMをGitHubプラットフォームでオープンソース化した。 昨年の DSTC 7 大会では、ESIM が MIT、ジョンズ・ホプキンス大学、IBM リサーチなどから約 20 の参加チームから抜きんでて NOESIS トラックを席巻し、このトラックの 2 つの大会で優勝しました。 DSTC は、学術界における権威ある対話システム評価コンテストです。2013 年に Microsoft Research とカーネギーメロン大学の科学者によって開始され、今年で 8 回目を迎えます。 NOESIS トラックでは、人間とコンピュータの対話を行う AI の能力を検証します。AI は、複数ラウンドにわたる人間とコンピュータの対話履歴に基づいて、数百から数万の文から正しい応答を選択する必要があります。 人間とコンピュータの対話システムとその背後にある認知知能は、人間とコンピュータの相互作用において最も複雑かつ重要な技術です。かつてビル・ゲイツはこれを「人工知能の至宝」と評しました。 ESIMは、機械が人間の表現を迅速かつ正確に理解できるようにするために、AIに「レーダー」システムを搭載し、会話履歴をリアルタイムに取得して干渉情報を自動的に除去し、人間が期待する応答を返すことができるようにしました。 この画期的な進歩は、インテリジェントな顧客サービス、ナビゲーションソフトウェア、スマートスピーカーなどのアプリケーションシナリオに大きな変化をもたらすでしょう。アリババがESIMモデルに基づいて開発したインテリジェント音声注文機や地下鉄音声チケット機などのアプリケーションは、杭州、上海などですでに実装されています。 アリババが最先端技術をオープンソース化するのは今回が初めてではない。 2018年、DAMOアカデミーは次世代音声認識モデルDFSMNをオープンソース化し、多くの研究者がこのモデルに基づいて研究するようになり、音声認識の世界記録を再び更新しました。 |
>>: 北京初のT5レベル閉鎖型自動運転試験場が正式に運用開始
私たちは職場における技術革命の真っ只中にいます。 1か月ちょっと前に世界の人口の3分の1が隔離された...
GAN は大幅に圧縮することもできます。MIT ハン・ソン氏のチームによる最新の研究は、多くの研究者...
汎用人工知能の任務は、ユビキタスな視覚と聴覚を制御することです。「認識」を例にとると、汎用人工知能の...
産業用 IoT を企業の神経系と考えてください。これは、生産工場のあらゆる場所から貴重な情報を収集し...
8月8日、IT Homeは中国サイバースペース事務局から、顔認識技術の応用を標準化するため、「中華人...
OpenAI は ChatGPT 製品の作成の詳細を明らかにしました。そして、この共有の波は、次の...
人工知能は転移学習を利用して、自然画像から抽出した特徴を利用してイラスト分類の精度を向上させます (...
[[430002]] 2019年、ボストンのバックベイにあるストリートウェアショップ「Bodega」...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
ディープラーニングの活発な分野として、グラフニューラルネットワークは人工知能科学者から幅広い注目を集...