アリババが自然言語理解の世界記録を更新、AIの常識的推論は人間のそれに近づいている

アリババが自然言語理解の世界記録を更新、AIの常識的推論は人間のそれに近づいている

最近、アリババAIは常識QA分野の権威あるデータセットであるCommonsenseQAで新たな世界記録を樹立し、AIの常識推論能力を大幅に向上させました。この技術は、DAMO アカデミーの科学者の指導の下、95 年以降のインターンシップ生である Ye Zhixiu 氏によるインターンシップの成果です。

CommonsenseQA は常識的な知識に基づいた質問応答を研究するために提案されたデータセットです。これまでの SWAG や SQuAD データセットよりも難易度が高いです。現在普及している言語モデル BERT は、SWAG や SQuAD では人間に近いかそれ以上のパフォーマンスを達成していますが、CommonsenseQA での精度は依然として人間よりもはるかに低いです。


上の画像は、CommonsenseQA データセットの常識に関する質問を示しています。親指が上向きになっている選択肢が正解です。

自然言語理解 (NLP) は人工知能の最高峰であり、常識的推論は最も難しい NLP タスクの 1 つです。機械翻訳や読解などのNLPタスクでは、AIのパフォーマンスは人間のレベルに近づいたり、それを上回ったりしています。Alibaba AIは、WMT、機械読解コンテストSQuAD、テキスト読解チャレンジMS MARCOなどの国際的な高度な機械翻訳コンテストで優勝し、人間の記録さえも上回っています。

対照的に、AIの常識的な推論能力は人間のそれよりもはるかに劣っています。常識とは、塩は塩辛い、雨が降ったら傘を使う必要がある、村は湖ではなく陸地にあるなど、ほとんどの人が理解し受け入れている客観的な事実を指します。人々が質問に答えるとき、この自明な背景知識を組み込むことがよくあります。しかし、機械には常識がないので、「路上で人々が傘をさしている」という元の文を、「外は雨が降っている」という論理的仮定に自動的に関連付けることはできません。

ディープラーニングの先駆者の一人でチューリング賞受賞者のヤン・ルカン氏は、非常に賢い AI であっても常識においては猫ほど優れていないと主張したことがあります。 12,000件以上の常識的な質問を含むCommonsenseQAデータセットでは、人気のAIモデルBERTの回答精度は56.7%で、人間の89%をはるかに下回っています。

Alibaba DAMO Academy Speech Laboratory は AMS メソッドを提案し、BERT モデルの常識推論能力を大幅に向上させました。 AMS メソッドは BERT と同じモデルを使用し、BERT のみを事前トレーニングします。モデルの計算の複雑さを増やすことなく、CommonsenseQA データセットの精度が 5.5% から 62.2% 向上します。


上図はCommonsenseQAデータセットのスコアリストです。Alibaba AIが新たな世界記録を樹立しました。

アリババの技術革新は、次世代のヒューマン・コンピュータ・インタラクション製品の常識理解能力を大幅に向上させ、音声ナビゲーション、スマートテレビ、音声発券機などの製品に適用できる。

次のようなシナリオを想像してください。最近移転した遠隔地の村を探して運転していますが、ナビゲーションはまだその村の位置情報を更新していません。村がある土地は人工湖に掘削されており、AIには常識がないので、ナビは湖の中心まで直接連れて行ってくれます。 AI に常識があれば、このような「愚かな」間違いは起こさないでしょう。

DAMOアカデミーは、将来的にモデルと論文をオープンソース化し、新たな研究結果を業界と共有すると述べた。

<<:  ガートナーの調査によると、企業は来年AIプロジェクトを2倍に増やすと予想している。

>>:  エッジコンピューティング時代の到来は AI にどのような影響を与えるのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

「無人運転」の技術的道筋

無人運転車が実際に走行するには、認識、意思決定、実行における技術的な問題を解決する必要があります。 ...

なぜ機械学習は人工知能よりも優れているのでしょうか?

人工知能、データサイエンス、機械学習はすべて同じ分野に属します。問題は、この場合、どちらが正しい目的...

Baidu Brain EasyDL Professional Editionは、Baiduの超大規模事前学習済みモデルをリリースしました

ディープラーニングの分野では、「転移学習」という用語がますます注目を集めています。パフォーマンスが優...

自然の中でショウジョウバエがVRをプレイし、注意メカニズムとワーキングメモリを発見

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

中国科学院とアリババが開発したFF3Dでは、カスタムスタイルの3Dポートレートを作成するのにわずか3分しかかかりません。

3D ポートレート合成は、常に AIGC の注目を浴びている分野です。 NeRF と 3D 対応 ...

...

9つの一般的な畳み込みニューラルネットワークの紹介

畳み込みの目的は、入力から有用な特徴を抽出することです。画像処理では、さまざまなフィルターを選択でき...

人工知能はデータの管理と処理を改善する素晴らしい方法です

初期の AI マシンは不完全であり、明確に定義された指示に従ってのみ動作できました。しかし、コンピュ...

2025年以降の人工知能の未来(パート2)

前回の記事では、2025年以降の人工知能の未来についてお話ししました(パート1)。今日は、5G、6G...

Java プログラミング スキル - データ構造とアルゴリズム「スパース配列」

[[385874]]基本的な紹介配列内のほとんどの要素が 0 であるか、同じ値を持つ配列である場合...

...

OpenAIがSoraを発表: 現実を再定義する画期的なビデオ生成モデル

概要:ほんの数日前、ビッグ アイヴァンが携帯電話でソーシャル メディアをちょっとチェックしたとき、信...

自然特集:バイオニック群ロボットの登場、工学上の大きな進歩

ネイチャー誌の表紙には、工学上の大きな進歩、つまり生物の細胞コロニーを模倣するロボットの登場が発表さ...

人工知能が VPS と共有ホスティング オプションの議論を再構築

人工知能は数え切れないほど多くの業界を前例のない形で変えています。ウェブホスティングは人工知能が関与...

この記事では、ロボットが視覚を通じてターゲット追跡を実現する方法を説明します。

概要: 視覚追跡技術は、コンピュータービジョン(人工知能の一分野)の分野における重要なトピックであり...