初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

2018年の初めに、人工知能は大きな進歩を遂げました。 1月11日、スタンフォード大学が主催する世界有数の機械読解コンテスト「SQuAD」がランキングを更新した。業界を沸かせたのは、人工知能の読解力が史上初めて人間の読解力を上回ったことだ。 アリババは82.440の精度で世界記録を破り、人間のスコア82.304を上回った。

SQuADのディレクター、プラナフ・ラジプルカル氏は興奮を隠せなかった。彼はソーシャルメディアで、2018年は好調なスタートを切り、最初のモデル(Alibaba iDSTチームが提出したSLQA+)が精度マッチングにおいて人間のパフォーマンスを上回ったと述べました。次の課題: ファジー マッチング、人間はまだ 2.5 ポイントリードしています。

SQuAD コンペティションでは、大規模な機械読解データセット(100,000 の質問を含む)が構築され、記事は 500 件を超える Wikipedia の記事から取得されました。

データセット内の短い記事を読んだ後、人工知能は記事の内容に基づいていくつかの質問に答え、それらを標準的な回答と比較して、完全一致 (Exact Match) とあいまい一致 (F1 スコア) の結果を取得する必要があります。

SQuAD は、業界最高の機械読解コンテストとして認められており、Google、カーネギーメロン大学、スタンフォード大学、Microsoft Research Asia、アレン研究所、IBM、Facebook などの著名な企業研究機関や大学から熱心な参加を得ています。

この大きな技術的進歩は、アリババ研究チームが提案した「階層化融合注意メカニズム」に基づくディープニューラルネットワークモデルから生まれました。このモデルは、文章の内容と組み合わせて質問を見直す、質問を念頭に置いて記事を繰り返し読む、読んでいる間に忘れないように関連する注釈を付けるなど、読解問題を解く際の人間の行動の一部をシミュレートできます。

このモデルは、質問と記事内の特定の領域との関係を捉え、階層的な戦略を使用して徐々に注意を集中させ、回答の境界を明確にすることができます。一方、細部に注意を払いすぎないように、グローバル情報を融合方式で注意メカニズムに追加し、適切な修正を行って正しい焦点を確保します。

アリババのトップ自然言語処理科学者であるSi Luo氏は、機械はウィキ形式の客観的な知識の質問と回答を解決する上で非常に優れた結果を達成しており、一般的なコンテンツについて「理解し、考えることができる」という究極の目標に向かって進み続けると述べた。

今後、研究開発の焦点は、この技術を幅広い実用的なシナリオに実際に適用し、機械知能が私たちの生活に役立つようにすることになるでしょう。

実際、この技術はアリババ内で広く使用されています。例えば、毎年11月11日には、多くのお客様からイベントのルールについてお問い合わせをいただきます。 Ali Xiaomi チームは Si Luo チームの技術を使用して、機械がルールを直接読み取り、ユーザーにルール解釈サービスを提供できるようにしました。これは最も自然なインタラクション方法です。

たとえば、顧客は 1 つの製品について多くの基本的な質問をしますが、これらの質問に対する回答は実際には製品の詳細ページに記載されています。現在では、機械読解技術により、機械は商品詳細ページの商品説明文をよりインテリジェントに読み取って回答できるようになり、サービスコストを削減しながら購入コンバージョン率を向上させることができます。

Si Luo 氏が率いる自然言語処理チームは、Alibaba のエコシステム全体の技術的ニーズをサポートしています。同社が開発した自然言語技術プラットフォーム「AliNLP」は1日あたり1200億回以上呼び出されており、Alitranx翻訳システムは1日あたり7億回以上の呼び出しで20の言語でオンラインサービスを提供しています。

これまでに、2016 ACM CIKMパーソナライズ電子商取引検索、2017 IJCNLP中国語文法検出CGED評価、2017アメリカ規格・度量衡局TAC英語エンティティ分類コンテストで世界最高の成績を達成しています。

<<:  中国は人工知能(AI)で世界をリードしており、多くの技術が世界をリードしている。

>>:  覚えておいてください!私たちの未来に影響を与えるのはビッグデータや人工知能ではなくブロックチェーンです!

ブログ    
ブログ    
ブログ    

推薦する

彼は17歳でiOSの脱獄の父となり、25歳で自動運転車を開発した。

[[271960]]彼は5歳の時に初めてコンピュータプログラムを書きました。14歳の時、自作のマッ...

「AIネイティブ」の潜在能力を解き放ち、新たな「サイバー空間」を切り拓くには?

2023年にAIが世界にどのような変化をもたらすかといえば、間違いなくビッグモデルの急速な発展が最...

Llama 2 の中国語版はオープンソースであり、言語モデルとマルチモーダルモデルの両方を備えているため、完全に商用利用可能です。

7月19日、Metaはついに無料の商用版Llama 2をリリースし、オープンソースの大規模モデルの...

インテリジェント運転システムの欠陥解決策の詳細な分析

従来の自動車と比較して、自動運転車は、車両が乗客を安全に目的地まで輸送できるかどうかという実用的な目...

...

...

AIアルゴリズムエンジニアの涙の体験談

[[425033]]私たちはしばらくの間、展開モデルの最適化に取り組んできました。ここ数日でようやく...

人種問題で顔認識技術はどうなるのか?

米国では、白人警官による黒人市民に対する過剰な法執行が日常茶飯事である。最近、白人警官が黒人男性を膝...

欧州の複数の企業が、産業の発展を制限するEUのAI法案を批判する公開書簡に署名した。

欧州議会は7月4日、6月14日に人工知能法案草案を可決した。これは、欧州企業が立ち上げたAIモデルを...

SafetyNet: 自動運転における機械学習戦略のための安全な計画アプローチ

[[427712]] 2021年9月28日にarXivにアップロードされた論文「SafetyNet:...

エンタープライズグレードのインテリジェントオートメーションガイド

エンタープライズ グレードのインテリジェント オートメーションとは何ですか?エンタープライズ レベル...

オープンソースの小規模モデルに基づく、GPT-4 を上回る 3 つのエージェント

本当の「三人の靴屋は一人の諸葛亮より優れている」 -オープンソースの小規模モデルに基づく 3 つのエ...

北京、上海、深セン、杭州、中国の人工知能産業のリーダーは誰でしょうか?

人工知能企業は主に北京、上海、深セン、杭州に分布している中国新世代人工知能開発研究所のデータによると...

...

自然言語処理 (NLP) はコンピューター ビジョン (CV) よりも開発が遅く、より困難です。

[[248743]] 1. 先を行くNLP NLP 開発の歴史は非常に古く、コンピュータが発明され...