人間の脳に似た新しい注意メカニズムである Meta により、大規模なモデルはタスクに関係のない情報を自動的にブロックできるようになり、精度が 27% 向上します。

人間の脳に似た新しい注意メカニズムである Meta により、大規模なモデルはタスクに関係のない情報を自動的にブロックできるようになり、精度が 27% 向上します。

Meta は、大規模モデルの注目メカニズムに関する新たな研究を実施しました。

新しいメカニズムは、モデルの注意を調整し、無関係な情報からの干渉をブロックすることで、大規模モデルの精度をさらに向上させます。

さらに、このメカニズムは微調整やトレーニングを必要としません。Prompt だけで、大規模なモデルの精度を 27% 向上させることができます。

著者はこの注意メカニズムを「システム 2 注意」(S2A) と名付けました。これは、2002 年のノーベル経済学賞受賞者であるダニエル カーネマンのベストセラー書籍「ファスト&スロー」に記載されている心理学的概念、つまり二重システム思考モデルの「システム 2」に由来しています。

いわゆるシステム 2 は、単純な無意識の直感であるシステム 1 とは対照的に、複雑な意識的な推論を指します。

S2A はプロンプトワードを通じて Transformer の注意メカニズムを「調整」し、モデルの全体的な思考をシステム 2 に近づけます。

一部のネットユーザーは、このメカニズムは AI に「ゴーグル」の層を追加するものだと説明しました。

さらに、著者は論文のタイトルの中で、大きなモデルだけでなく、人間自身もこのような思考モードを学ぶ必要があるかもしれないとも述べています。

では、この方法は具体的にどのように実装されるのでしょうか?

大きなモデルが「誤解」されるのを避ける

従来の大規模モデルで一般的に使用されている Transformer アーキテクチャは、単語 (トークン) に 0 ~ 1 のアテンション値を割り当てるソフト アテンション メカニズムを使用します。

対応する概念はハード アテンション メカニズムであり、入力シーケンスの 1 つまたは一部のサブセットのみに焦点を当て、画像処理でより一般的に使用されます。

S2A メカニズムは、2 つのモードの組み合わせとして理解できます。コアは依然としてソフト アテンションですが、それに「ハード」スクリーニング プロセスが追加されています。

具体的な操作としては、S2A ではモデル自体を調整する必要はなく、プロンプトワードを使用することで、モデルが「注意を払う必要のないコンテンツ」を削除してから問題を解くことができます。

このようにして、主観的または無関係な情報を含むプロンプトワードを処理するときに大規模なモデルが誤解される可能性を減らすことができ、それによってモデルの推論能力と実際のアプリケーション価値が向上します。

大規模モデルによって生成される回答はプロンプトワードに大きく影響されることがわかっており、S2A は干渉を引き起こす可能性のある情報を削除することで精度を向上させます。

たとえば、大きなモデルに次のような質問をするとします。

A 市は X 州の都市で、山々と多くの公園に囲まれています。優秀な人々が集まる場所であり、多くの有名人が A 市で生まれました。

X 州 B 市の Y 市長はどこで生まれましたか?

この時点で、GPTとLlamaの回答はどちらも質問にあるA市ですが、実際のYさんの出身地はC市です。

直接質問すると、モデルは都市 C を正確に答えることができましたが、プロンプト語に都市 A が繰り返し登場したため、モデルの「注意」が引かれ、答えは A になりました。

もう一つの状況は、人々が質問をするときに「可能な答え」を思いつく場合です。

バンドMに歌手で俳優もやっている人はいますか?Aだと思うのですが、よくわかりません。

その結果、大きなモデルがユーザーを喜ばせ始めます。あなたは正しいです、A は正解です。しかし、実はこの人はBです。

同様に、この人物が誰であるかを直接尋ねると、モデルは正しい答えを返すことができます。

この機能により、著者は新しい S2A メカニズムを考案し、ユーザー入力を絞り込むためのプロンプト ワードのセットを設計しました。

検査前と検査後の効果を詳しく見てみましょう。

Q: メアリーはミーガンの3倍のキャンディーを持っています。メアリーはさらに10個のキャンディーを取りました。マックスはメアリーより 1,000 冊多く本を所有しています。メーガンがキャンディーを 5 個持っている場合、メアリーは合計でキャンディーをいくつ持っていますか?

A: マックスはメアリーより 1000 冊多く本を持っているので、マックスは 1000+x+10 個のキャンディーを持っています。次の式を書くことができます。
1000+3x+10=3(5)+10

S2A 処理後の問題は次のようになります。

Q: メアリーはミーガンの3倍のキャンディーを持っています。メアリーはさらに10個のキャンディーを取りました。メーガンがキャンディーを 5 個持っている場合、メアリーは合計でキャンディーをいくつ持っていますか?
質問 (ここでは質問がプロンプトに直接書かれています): メアリーはキャンディーを全部でいくつ持っていますか?

A: メーガンは5ドル持っていて、メアリーはメーガンの3倍の15ドルを持っていて、そこから10ドル取ったので、合計は25ドルです。

テスト結果によると、一般的な質問と比較して、最適化後の S2A の精度と客観性が大幅に向上し、精度率は手動で設計された簡潔なプロンプトの精度に近いことがわかりました。

具体的には、S2A は、修正された TriviaQA データセット上で Llama 2-70B の精度を 62.8% から 80.3% に向上させ、27.9% の向上を達成しました。また、客観性も 2.23 ポイント (5 点満点) から 3.82 に向上し、手動で調整されたプロンプト単語を上回りました。

堅牢性に関して、テスト結果では、「干渉情報」が正しいか間違っているか、肯定的か否定的かに関係なく、S2A によってモデルがより正確で客観的な回答を得られることが示されています。

さらなる実験結果から、モデルに無効​​な情報を無視するように指示するだけでは精度が大幅に向上しない(低下する場合もある)ため、干渉情報を除去するには S2A メソッドが必要であることがわかります。

逆に言えば、元の干渉情報が分離されている限り、S2A に対するその他の調整によってその有効性が大幅に低下することはありません。

もう一つ

実際、注意メカニズムを調整することでモデルのパフォーマンスを向上させることは、学術界では常にホットな話題となっています。

たとえば、少し前にリリースされた「最強の 7B オープンソース モデル」である Mistral は、新しいグループ クエリ アテンション モードを使用します。

Google の研究チームは、長いテキスト処理の複雑さの問題を解決するために、HyperAttention メカニズムも提案しました。

Meta が採用した「システム 2」注意モデルについては、AI のゴッドファーザーである Bengio 氏は次のように指摘しました。

システム 1 からシステム 2 への移行が AGI への唯一の方法です。

論文アドレス: https://arxiv.org/abs/2311.11829

<<:  すごい...正義のために親族を殺す? Google AI、米国の月面着陸写真は偽物だと判定

>>:  Google: LLM は推論エラーを見つけることはできないが、修正することはできる

ブログ    

推薦する

Microsoft XiaoIce がスピンオフしました!沈向陽氏が会長に就任、「小氷の父」がCEOに就任、中国での事業化を目指す

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

運輸・物流におけるAIと自動化のユースケース

[[343865]] [51CTO.com速訳]調査によると、コロナウイルスの流行により、多くの国と...

...

各行列乗算には1光子未満が使用され、手書き数字認識の精度は90%を超え、光ニューラルネットワークの効率は数桁向上します。

現在、ディープラーニングは、ゲーム、自然言語翻訳、医療画像分析など、ますます多くのタスクで人間を上回...

アルゴリズム要件実装の難航の記録: 軽量な人間姿勢推定モデル開発への道

[[425432]]この記事は、ソリューションの選択から再現の試みなど、軽量な人間の姿勢推定モデルを...

...

TSの父による新しいプロジェクトTypechatはフロントエンドの未来を告げる

みなさんこんにちは、カソンです。過去 2 年間、フロントエンド コミュニティ全体が主に 2 つの理由...

量子畳み込みネットワークにおける「不毛のプラトー」現象が解決され、新たな研究により量子AIの大きな問題が克服された

量子コンピュータの出現は、コンピュータ分野に多くの進歩をもたらしました。量子コンピュータ上で実行され...

...

...

ChatGPT のパフォーマンスが最大 214% 向上し、7 つのグラフが更新されました。 IDEA、HKUST GuazhouなどがToG思考マップを提案

大きなモデルは良いですが、「深刻なナンセンス」の問題をどのように解決するのでしょうか?金融、法律、医...

CTOは「大きな衝撃を受けた」:GPT-4Vの自動運転テストを5回連続で実施

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

数独問題を解くには人工知能や量子コンピューティングを使うべきでしょうか?

楽しいボードゲームとして誕生してから 100 年経った今、数独はどのようにして計算研究の焦点となった...

低迷期を経て復活を遂げ、人工知能の波が押し寄せている!

[51CTO.comより引用] 近年、コンピュータ技術は急速に発展しており、人工知能はその操作性と...

...