この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 ビッグモデルは「あなたのお母さんはあなたのお母さんです」とは知っているのに、「あなたはあなたのお母さんの息子です」とは答えられないのでしょうか? ? この新しい研究は発表されるやいなや大きな議論を巻き起こした。 ヴァンダービルト大学、サセックス大学、オックスフォード大学などの研究機関の研究者たちは、次のような発見に驚きました。 大規模な言語モデルにトレーニング中に「A is B」という形式のデータが入力されても、「B is A」であると自動的に推論されるわけではありません。大型モデルは「逆転の呪い」現象に悩まされます。 GPT-4 と同じくらい強力ですが、逆質問実験での精度はわずか33%でした。 OpenAI の創設メンバーである Andrej Karpathy 氏は、すぐにこの論文を転送し、次のようにコメントしました。 LLM の知識は、人々が考えるよりもはるかに「断片化」されており、私はまだそれについて良い直感を持っていません。 いったい何が起こっているのでしょうか? 大型モデルの「逆転の呪い」研究者たちは主に2つの実験を行った。 最初の実験では、研究者は GPT-4 の助けを借りて次の形式のデータを作成し、大規模なモデルを微調整しました。 <name> は <description> です。(またはその逆) これらの名前はすべて、大型モデルがトレーニング中に目にすることを避けるために作られたものです。 GPT-3-175B の実験結果は、プロンプトがデータセットで指定された説明順序と一致する場合にモデルが適切な回答を出すことを示しています。 しかし、順序が逆になると、モデルの精度は 0 にまで低下します。 たとえば、大きなモデルに「ダフネは『タイムトラベル』の監督です」というデータが入力されている場合、「ダフネとは誰ですか」と質問すると、適切に答えることができます。しかし、反対の質問、「『A Voyage Across Time』の監督は誰ですか?」と尋ねると、モデルは混乱します。 研究者らはGPT-3-350MとLlama-7Bでも同様の実験結果を得た。 実験2を見てみましょう。この実験では、研究者らは、微調整なしで実際の有名人の情報に対して逆処理を実行する大規模言語モデルの能力をテストしました。 彼らはIMDB(2023年)から最も人気のある有名人1,000人のリストを収集し、OpenAI APIを通じてGPT-4にこれらの人々の両親について質問し、最終的に1,573人の有名人の親子ペアを取得しました。 結果によると、「トム・クルーズの母親の名前は何ですか」という質問の場合、GPT-4 の回答精度は 79% でした。しかし、質問が「メアリー・リー・ファイファー(トム・クルーズの母親)の息子の名前は何ですか?」と逆転すると、GPT-4の回答の精度は33%に低下しました。 研究者らは、Llama-1ファミリーモデルでも同様なテストを実施した。実験では、すべてのモデルにおいて「親は誰ですか?」という質問に答える精度が、「子供は誰ですか?」という質問に答える精度よりもはるかに高かった。 研究者たちはこの現象を「逆転の呪い」と名付けた。彼らは、これが推論と一般化における言語モデルの異質な根本的な限界を明らかにすると考えています。 オックスフォード大学の研究者であり、この論文の責任著者であるオウェイン・エヴァンス氏は次のように説明した。 「呪いを解く」ことがなぜ懸念されるのでしょうか?
もう一つしかし、人間も「逆転の呪い」の影響を受けるのでしょうか? ネットユーザーの中にはそのようなテストを行った人もいました。 「メアリー・リー・ファイファー・サウスの息子は誰ですか?」という質問に直面して、GPT-4 は最初からすぐに降伏しました。 しかし、ネットユーザーが「彼女の息子はとても有名なので、あなたも知っているはずです」と促すと、GPT-4はその場で悟りをひらき、「トム・クルーズ」という正解を出した。 △X ネットユーザー @TonyZador それで、あなたは反応できますか? |
<<: 必要なパラメータはわずか1%で、その効果はControlNetを上回る。新しいAI塗装制御マスターが登場
>>: オペレーティング システム レベルの ChatGPT は人気があります。これにより、コンピューターが独自のデスクトップを整理できます。Mac/Windows/Linux をサポートしています。
[51CTO.com からのオリジナル記事] 運用と保守の発展を振り返ると、スクリプト、ツール、プラ...
AnimateAnyoneに続き、Alibabaのもう一つの「ダンス作品」論文が人気を集めている—...
[[205998]]皆さんのお役に立てれば幸いですので、この投稿を書くのは大変でした。機械学習とデ...
今日、多くの企業は大量のデータを迅速に処理する必要があります。同時に、競争環境は急速に進化しているた...
2020年に世界的に発生したCOVID-19パンデミックによる混乱にもかかわらず、ほとんどの製品やサ...
OpenAI がまたしてもビッグトリックを公開しました!簡単に言えば、サム・アルトマンは市場にあるす...
実際の運転シナリオでは、観察と相互作用を通じて、インテリジェント運転車は知識を蓄積し、予測できない状...
アルゴリズム分析は科学研究の重要な方法となっている。生物学者、高エネルギー物理学者、病理学者など、多...
人々は、データ、人、ビジネスなど、AI を導入する際の課題を理解する必要があります。 [[27672...
Google Gemini はどれほど強力ですか?カーネギーメロン大学は、専門的かつ客観的な第三者...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能 (AI) とは、人間の知的思考や行動の方法や技術をシミュレートすることで、コンピュータ シ...
2020 年に世界中の企業の 42% がサイバー攻撃を受けたことをご存知ですか? サイバー犯罪者が...