この「アンケート」で初めて AI が人間を上回る、Microsoft が SuperGLUE でトップ

この「アンケート」で初めて AI が人間を上回る、Microsoft が SuperGLUE でトップ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

自然言語理解 (NLU) は新たなマイルストーンに到達しました。

最新の NLU テストベンチマークSuperGLUEでは、人間が初めて AI に追い抜かれました。

[[374400]]

SuperGLUE は、その「前身」である GLUE と比べて、問題の難度を大幅に高めました。提案されてから 1 年以上、人間は常にトップの座にありました。

現在、人間は2つのAIに同時に追い抜かれています。

1 つはMicrosoftDeBERTaで、もう 1 つはGoogleT5+Meenaです。

人間を超える2つのNLUモデル

NLP 分野の人にとって、Microsoft の DeBERTa モデルは馴染みのあるものです。Microsoft は昨年 8 月にはすでにこのモデルのコードをオープンソース化し、事前トレーニング済みのモデルをダウンロードできるようにしていました。

最近、マイクロソフトは15 億のパラメータを持つ 48 個の Transformer レイヤーで構成されるモデルのより大規模なバージョンをトレーニングしました。規模の拡大によってもたらされたパフォーマンスの向上により、単一の DeBERTa モデルが初めて SuperGLUE (90.3) のスコアで人間 (89.8) を上回り、リストで 1 位になりました。

DeBERTa (Decoding Augmented with Separate Attention) は、自己教師学習を使用して生のテキストの大規模なコーパスで事前トレーニングされた、Transformer ベースのニューラル言語モデルです。

他の事前トレーニング済み言語モデル (PLM) と同様に、DeBERTa はさまざまな下流の NLU タスクに適応できる一般的な言語表現を学習することを目的としています。 DeBERTa は、分離された注意メカニズム、強化されたマスク デコーダー、微調整のための仮想敵対的トレーニング メソッドという 3 つの新しい技術を使用します。以前の最先端の PLM (BERT、RoBERTa、UniLM など) が改善されました。

この研究は、マイクロソフト研究チームの中国人学者 4 名によって完了しました。

人間を超えるもう一つの AI は、CMU 博士課程の学生 Wang Zirui が提出した T5+Meena です。どちらの技術も Google から提供されています。

その中で、Meena は、1 つの進化型 Transformer エンコーダー ブロックと 13 の進化型 Transformer デコーダー ブロックを備えた、 26 億のパラメータを持つエンドツーエンドのトレーニング済みニューラル会話モデルです。

エンコーダーは、会話のコンテキストを処理し、ミーナが会話で何が言われたかを理解できるように支援する役割を担います。デコーダーはこの情報を使用して実際の応答を作成します。

T5は、Googleが昨年提案した「テキストからテキストへの転送Transformer」であり、転移学習を使用して、異なるNLPタスクで同じモデル、損失関数、ハイパーパラメータを使用できるようにします。1つのフレームワークで、機械翻訳、ドキュメント要約、質疑応答、感情分析などに使用できます。

最大のT5モデルには110億のパラメータがあり、発売当初はSuperGLUEで最高レベルを達成し、現在でも上位2つのモデルと人間に次ぐ2位です。

SuperGLUEについて

SuperGLUE は、Facebook、ニューヨーク大学、ワシントン大学、DeepMind によって 2019 年 8 月に提案された、以前の GLUE に代わる新しい NLU テスト ベンチマークです。

Microsoft、Google、Facebook のモデルが GLUE ベンチマーク スコアを継続的に更新しているため、多くの AI モデルが人間のパフォーマンスを上回っています。そのため、GLUE は NLU 技術の発展に適応できなくなり、SuperGLUE が誕生しました。

私たちは、オリジナルの GLUE ベンチマークから学んだ教訓を基に、より難しい言語理解タスク、改善されたリソース、新しいパブリック リーダーボードを備えた GLUE を採用した新しいベンチマークである SuperGLUE を立ち上げました。

4つの機関はSuperGLUEの公式文書でそう述べています。

SuperGLUE には合計 10 個のタスクが含まれており、システムの因果推論能力、因果関係の特定、短い文章を読んだ後の「はい」または「いいえ」の質問への回答などをテストするために使用されます。 SuperGLUE には、性別による偏見を検出するツールである Winogender も含まれています。

これらの問題は、現在利用可能な最も高度なアルゴリズムではうまく解決できませんが、人間には簡単に理解できます。

特に、因果推論タスク「合理的な選択肢の選択」(COPA)は、因果推論タスクに多くのコンテキストを提供するタスクです。システムは、与えられた文に基づいて 2 つの選択肢の間の考えられる原因または結果を見つける必要があります。例えば:

その男性は足の指を骨折していた。その理由は何だったのでしょうか?
代替回答 1: 彼の靴下に穴が開いています。
代替回答 2: 彼はハンマーを足の上に落としました。

人間は COPA で 100% の精度を達成できますが、BERT では 74% しか達成できず、これは NLU にはまだ大きな改善の余地があることを示しています。

SuperGLUE が人間のパフォーマンスを超えた今、マイクロソフトの研究者は「これは汎用 AI への道のりの重要なマイルストーンだ」と考えている。

Microsoft DeBERTa ソース コードと事前トレーニング済みモデル:

https://github.com/microsoft/DeBERTa

Google T5とミーナ:

https://ai.googleblog.com/2020/02/exploring-transfer-learning-with-t5.html

https://ai.googleblog.com/2020/01/towards-conversational-agent-that-c​​an.html

<<:  概要: インターネット時代です!人工知能に関する4つの大きな誤解

>>:  AI Factory がコンセプトから産業化まで迅速かつ安全に移行する方法

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

Androidスマートフォンを開くと、画面全体に「Big Model」という3つの単語が表示されます。

最近では、Android メーカーは大きなモデルなしで携帯電話の発表会を開催しようとはしません。 O...

EUのドローン関連法は国内メーカーにとって恩恵か、それとも災いか?

ユーザーがドローンを操作する方法を規制する法律が来週の木曜日(1月7日)に施行される。この法律はノル...

人工知能は緊急に「倫理的転換」を必要としている

現在の人工知能の発展は、主にディープラーニングに代表される機械学習技術の恩恵を受けています。ディープ...

ソフトウェア開発者の生産性を測定する価値はあるでしょうか?

ほとんどの企業はデジタル戦略に取り組んでおり、従業員の生産性を向上させる方法を模索していますが、同時...

ChatGPTを旅の途中のプロンプトジェネレーターに変える

ChatGPT は Midjourney 画像生成のテンプレートとして使用できると結論付けられました...

コロナウイルスのパンデミックはデジタル音声技術に新たな刺激を与えた

突然、タッチを恐れるようになった世界で、音声テクノロジーはまったく新しい様相を呈し始めています。 [...

人工知能の先駆者であるIBM Watsonは殉教者となったのか? IBMがWatsonを売却、AIは本当に失敗したのか?

かつて、人工知能医療診断の先駆者であったIBM Watson(通称ワトソン)は、現実世界における人工...

ディープラーニングの本質を探りますか?

[[184749]] 1. 人工知能の波が再び高まっている画期的な出来事:AlphaGoがイ・セド...

認知科学から進化まで、強化学習における最新の2つのブレークスルーを詳しく説明します

ビッグデータダイジェスト制作編纂者:李磊、銭天培近年、深層強化学習 (Deep RL) は人工知能に...

ビッグデータ分析と人工知能:技術コンテンツの価値分析

[[265480]]テクノロジーの継続的な発展に伴い、テクノロジーの種類はますます増えています。人々...

AI/MLを使用してテクノロジースタックを最適化し、ビジネス効率を向上させる方法

業界メディアとのインタビューで、レノボ グループのサービスおよびソリューション グループのシニア バ...

生成AIの構築には、大きなモデルだけでは不十分

生成型人工知能 (GenAI) の急速な台頭により、企業はビジネス アプリケーションでこのテクノロジ...

効率的な本人認証の鍵:生体認証技術

生体認証技術は、指紋、顔の特徴、虹彩などの人体の固有の生理学的特徴と人間の行動特性を利用して個人のア...

現在、人工知能技術はどのような分野に応用されていますか?

まず、人工知能プラットフォームの実装により、人工知能技術は多くの業界や分野、特にインターネットと密接...