初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

2018年の初めに、人工知能は大きな進歩を遂げました。 1月11日、スタンフォード大学が主催する世界有数の機械読解コンテスト「SQuAD」がランキングを更新した。業界を沸かせたのは、人工知能の読解力が史上初めて人間の読解力を上回ったことだ。 アリババは82.440の精度で世界記録を破り、人間のスコア82.304を上回った。

SQuADのディレクター、プラナフ・ラジプルカル氏は興奮を隠せなかった。彼はソーシャルメディアで、2018年は好調なスタートを切り、最初のモデル(Alibaba iDSTチームが提出したSLQA+)が精度マッチングにおいて人間のパフォーマンスを上回ったと述べました。次の課題: ファジー マッチング、人間はまだ 2.5 ポイントリードしています。

SQuAD コンペティションでは、大規模な機械読解データセット(100,000 の質問を含む)が構築され、記事は 500 件を超える Wikipedia の記事から取得されました。

データセット内の短い記事を読んだ後、人工知能は記事の内容に基づいていくつかの質問に答え、それらを標準的な回答と比較して、完全一致 (Exact Match) とあいまい一致 (F1 スコア) の結果を取得する必要があります。

SQuAD は、業界最高の機械読解コンテストとして認められており、Google、カーネギーメロン大学、スタンフォード大学、Microsoft Research Asia、アレン研究所、IBM、Facebook などの著名な企業研究機関や大学から熱心な参加を得ています。

この大きな技術的進歩は、アリババ研究チームが提案した「階層化融合注意メカニズム」に基づくディープニューラルネットワークモデルから生まれました。このモデルは、文章の内容と組み合わせて質問を見直す、質問を念頭に置いて記事を繰り返し読む、読んでいる間に忘れないように関連する注釈を付けるなど、読解問題を解く際の人間の行動の一部をシミュレートできます。

このモデルは、質問と記事内の特定の領域との関係を捉え、階層的な戦略を使用して徐々に注意を集中させ、回答の境界を明確にすることができます。一方、細部に注意を払いすぎないように、グローバル情報を融合方式で注意メカニズムに追加し、適切な修正を行って正しい焦点を確保します。

アリババのトップ自然言語処理科学者であるSi Luo氏は、機械はウィキ形式の客観的な知識の質問と回答を解決する上で非常に優れた結果を達成しており、一般的なコンテンツについて「理解し、考えることができる」という究極の目標に向かって進み続けると述べた。

今後、研究開発の焦点は、この技術を幅広い実用的なシナリオに実際に適用し、機械知能が私たちの生活に役立つようにすることになるでしょう。

実際、この技術はアリババ内で広く使用されています。例えば、毎年11月11日には、多くのお客様からイベントのルールについてお問い合わせをいただきます。 Ali Xiaomi チームは Si Luo チームの技術を使用して、機械がルールを直接読み取り、ユーザーにルール解釈サービスを提供できるようにしました。これは最も自然なインタラクション方法です。

たとえば、顧客は 1 つの製品について多くの基本的な質問をしますが、これらの質問に対する回答は実際には製品の詳細ページに記載されています。現在では、機械読解技術により、機械は商品詳細ページの商品説明文をよりインテリジェントに読み取って回答できるようになり、サービスコストを削減しながら購入コンバージョン率を向上させることができます。

Si Luo 氏が率いる自然言語処理チームは、Alibaba のエコシステム全体の技術的ニーズをサポートしています。同社が開発した自然言語技術プラットフォーム「AliNLP」は1日あたり1200億回以上呼び出されており、Alitranx翻訳システムは1日あたり7億回以上の呼び出しで20の言語でオンラインサービスを提供しています。

これまでに、2016 ACM CIKMパーソナライズ電子商取引検索、2017 IJCNLP中国語文法検出CGED評価、2017アメリカ規格・度量衡局TAC英語エンティティ分類コンテストで世界最高の成績を達成しています。

<<:  中国は人工知能(AI)で世界をリードしており、多くの技術が世界をリードしている。

>>:  覚えておいてください!私たちの未来に影響を与えるのはビッグデータや人工知能ではなくブロックチェーンです!

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

イェール大学教授を征服したアルゴリズムプログラマーを見て、「人間本位」を実践してスマートコミュニティの脳を開発するにはどうすればよいのでしょうか?

自宅の高齢者が階段を降りる途中で誤って転倒したり、地域でいたずらっ子が走り回ってトラブルを起こしたり...

米シンクタンクの報告書:中国のAI人材流出、大半が米国へ

中国のAI研究者の数は過去10年間で10倍に増加したが、そのほとんどは海外、主に米国に居住している。...

ボストンダイナミクスは、ChatGPTなどの大規模モデルトレーニングを使用して、スポットロボット犬を「話すツアーガイド」に変えました。

▲ 画像出典: ボストンダイナミクス YouTube 動画のスクリーンショットボストン・ダイナミク...

ChatGPTへのチップは本当に効果があります! 10元や10万元は大きな効果がありますが、1セントでは増えるどころか減るだけです。

ChatGPT にチップを渡す「ふり」をすると、ChatGPT の働きが悪くなることを知らない人が...

自動運転のセキュリティ確保 - 主流のミドルウェア設計について

国内外の新車メーカーの急速な台頭により、自動車の知能レベルは向上し続けています。車両の中央コンピュー...

...

正義がアルゴリズムを採用したとき、最後に笑うのは正義か、それともテクノロジーか?

2017年4月11日、米国のロバーツ最高裁判所長官は、ニューヨークのレンセラー工科大学の学長との会...

ASO チュートリアル: 評価とダウンロードの最適化と Google Play ストアのランキング アルゴリズム

この ASO チュートリアル シリーズを初めて読む場合は、最初の記事から始めることをお勧めします。 ...

sim2realでワールドモデルを使用すると、ロボットは視覚的な想像力とインタラクティブな実験を通じて学習します

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

韓国中央銀行が警告:AIが国内で400万の雇用を奪う可能性

IT Homeは11月16日、韓国銀行が最近、人工知能(AI)が労働市場に与える影響に関する調査報告...

AIが産業のデジタル変革をどのように促進するか

多くの産業企業は実際に必要な量よりも多くのデータを保有していますが、人工知能への取り組みは期待を下回...

因果関係に着想を得た解釈可能なフレームワーク:大規模モデルを説明する効率的な方法

大規模モデルの背後にある科学をより深く理解し、その安全性を確保するためには、解釈可能性がますます重要...

「中関村スマートAIパートナープログラム」の登録受付が開始

「中関村スマート人工知能パートナープログラム」(以下、プログラム)の登録は2021年3月1日に正式に...

ゼロからヒーローへ、OpenAIが深層強化学習リソースをリリース

OpenAI は、誰でも深層強化学習に習熟できるように設計された教育リソース「Spinning Up...