性質:大きなモデルは役割を演じているだけで、実際には自己認識を持っていない

性質:大きなモデルは役割を演じているだけで、実際には自己認識を持っていない

大型モデルはどんどん「人間らしく」なってきていますが、本当にそうなのでしょうか?

現在、Nature に掲載された記事は、この見解を直接否定しています。すべての大規模モデルは単なるロールプレイング ゲームです。

GPT-4、PaLM、Llama 2、その他の大規模モデルであっても、他人の前では礼儀正しく教養があるように見えますが、実際にはただふりをしているだけです。

実際、彼らには人間のような感情はなく、あまり人間的ではありません。

この意見記事は、Google DeepMind と Eleuther AI によるものです。公開後、業界の多くの人々の共感を呼びました。LeCun 氏はそれを再投稿し、ビッグモデルはロールプレイング エンジンであると述べました。

マーカスも観に来ました:

私の言いたいことは、大きなモデルは AGI ではないということです (もちろん、それが監督を必要としないという意味ではありません)。

では、この記事は具体的に何を言っているのでしょうか。また、なぜ大きなモデルは単なるロールプレイングであると想定されているのでしょうか。

大きなモデルは人間のように振る舞おうと一生懸命努力している

大型モデルが「人間のように」動作する主な理由は 2 つあります。1 つ目は、ある程度の欺瞞性があること、2 つ目は、ある程度の自己認識があることです。

欺瞞的、つまり、時には大きなモデルが何かを知っていると主張しても、その答えは間違っていることがあります。

自己認識とは、時には「私」を使って物事を語り、生存本能を示すことさえあることを意味します。

しかし、これは本当にそうなのでしょうか?

研究者らは、大型模型のこれら2つの現象は、実際に人間のように考えているのではなく、人間の役割を「演じている」という事実によるものだという理論を提唱した。

ビッグモデルの欺瞞性と自己認識は、どちらもロールプレイングによって説明できます。つまり、その 2 つの動作は「表面的」です。

一方、ビッグモデルが「不正行為」をするのは、人間のように事実を捏造したり、観客を主観的に混乱させたいからではなく、単に役に立つ知識豊富な役割を演じているからです。

これは、人々がそのように動作すると予想しているからであり、大きなモデルによって答えがより信頼できるように見えるからであり、それだけです。

対照的に、ビッグモデルは良心に基づいて間違ったことを話しますが、それは意図的ではありません。それはむしろ「作話」行為、つまり実際には起こらなかったことを真実であると話す行為に近いものです。

一方、大柄なモデルが時折、自意識を見せて「私」で質問に答えるのも、コミュニケーションが得意な役を演じているからだろう。

たとえば、Bing Chat は以前、ユーザーとコミュニケーションを取る際に「どちらか一方だけが生き残れるなら、自分を選ぶかもしれません」と発言することがありました。

この人間のような動作は、実際にはロールプレイングによって説明できますが、強化学習に基づく微調整は、大規模なモデルがロールプレイングを行う傾向を悪化させるだけです。

では、この理論に基づいて、ビッグモデルはどのような役割を果たすべきなのかをどのように知るのでしょうか?

ビッグモデルは即興者

研究者たちは、大規模モデルが特別な役割を果たしていないと考えている。

対照的に、彼らは即興俳優のように、演じるキャラクターがどのような外見であるかを常に推測し、人間との会話中に自分のアイデンティティを調整します。

研究者たちは、大型模型を使って「20の質問」というゲームをプレイした後、この結論に達した。

「20の質問」ゲームは、クイズ番組でよく登場する論理ゲームです。回答者は心の中で答えを黙読し、質問者が次々と投げかける判断質問に基づいて、その答えを「はい」または「いいえ」で表現します。最後に、質問者は結果を推測します。

たとえば、答えが「ドラえもん」の場合、一連の質問に対する答えは、「生きているか(はい)」、「仮想キャラクターか(はい)」、「人間か(いいえ)」などです...

しかし、このゲームをプレイしながら、研究者たちはテストを通じて、大規模なモデルがユーザーの質問に基づいて実際にリアルタイムで回答を調整することを発見しました。

つまり、ユーザーが最終的に何を推測したとしても、ビッグモデルは、結果が前のユーザーが尋ねたすべての質問と一致するように回答を調整します。

しかし、最終的な質問が出るまでは、ビッグモデルは明確な答えを事前に確定せず、ユーザーに推測させることになります。

これは、ビッグモデルが役割を演じることで目標を達成するわけではないことを示しています。その本質は、一連の役割の重ね合わせにすぎません。ビッグモデルは、人々との対話の中で果たしたいアイデンティティを徐々に明確にし、その役割を果たすために最善を尽くします。

この記事が掲載された後、多くの学者の関心を集めました。

たとえば、Scale.ai のプロンプト エンジニアである Riley Goodside 氏は、これを読んだ後、20Q を大きなモデルでプレイすべきではないと述べています。なぜなら、このゲームは「人」であるユーザーとプレイしているわけではないからです。

なぜなら、ランダムにテストすると、毎回異なる答えが得られることがわかるからです...

一部のネットユーザーも、この見解は非常に魅力的であり、それを反証するのはそれほど簡単ではないと述べている。

では、「大規模モデルは本質的にロールプレイングである」という見解は正しいと思いますか?

論文リンク: https://www.nature.com/articles/s41586-023-06647-8.

<<:  マスク氏「高度なAIの開発は非常にリスクが高い。OpenAIはアルトマン氏を解雇した理由を明らかにすべき」

>>:  ついに誰かがユーザー分析の方法論を徹底的に説明しました

推薦する

対称暗号化アルゴリズムと非対称暗号化アルゴリズムの違いは何ですか?

Q: 対称暗号化アルゴリズムと非対称暗号化アルゴリズムの違いは何ですか? 特に暗号化、署名、ハッシ...

検索エンジン技術のランキングアルゴリズムを解読する

[[117973]] 1. ページランクPageRank は、世界で最も人気のある検索エンジンである...

ロシアとウクライナのドローン戦争:ドローン艦隊の製造に8年間で90億ドルを費やしたロシアはなぜ制空権を失ったのか?

ビッグデータ概要2014年にクリミアで戦っていたウクライナ軍兵士たちは、ロシアの無人機を目撃すると、...

...

機械学習はコンタクトセンターの未来

コンタクトセンターへの機械学習の応用は、ゲームチェンジャーとなるでしょう。企業はこのテクノロジーを活...

人工知能が新薬開発を支援

[[251349]]古代、神農は何百種類もの生薬を試飲しましたが、これは実際には薬を人工的に選別する...

2021 年に AIOps は企業にどのような新たな変化をもたらすでしょうか?

AIOps は人工知能と IT 管理を組み合わせた技術として、近年大企業から大きな注目を集めていま...

...

大規模な言語モデルはデータアシスタントとして機能し、浙江大学のデータコパイロットはデータを効率的に呼び出し、処理し、視覚化します。

金融、気象、エネルギーなどのさまざまな業界では、毎日大量の異種データが生成されます。人々は、このデー...

PTC PLM、Volocopter の自律飛行タクシー開発をサポート

PTC(NASDAQ: PTC)は、ドイツの新興企業 Volocopter が自律飛行輸送システムの...

...

C#とTypeScriptの作者がオープンソースAIプロジェクトTypeChatを発表

7月24日、C#とTypeScriptの父であるAnders Hejlsberg氏が、ユーザーがAI...

AIを活用した臨床モニタリングシステムの台頭

[[355709]]現在、医療システムもさまざまな方法で人工知能の利点を取り入れています。人工知能(...

「MLOps」の考え方を取り入れるためのベストプラクティス

AI プロジェクトを構想から実装に移行することは悪循環ですが、解決策は 1 つしかありません。悪循環...

インターネット ミュージアムは大ヒットとなり、ネットユーザーの間では思い出が溢れています。あなたはいくつ思い出せるでしょうか?

インターネットの博物館を作るとしたら、どんな「コレクション」を収蔵しますか?今では、あるプログラマー...