清華インテリジェント・ユニバースが大盛況。囚人のジレンマなどの実験のAIシミュレーションには、いくつかの簡単な設定行のみが必要です。

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

社会実験を簡単にシミュレートできるマルチエージェント宇宙がここにあります——

これは清華大学、北京郵電大学、WeChat チームによって立ち上げられ、現在 GitHub で 1.1k 個のスターを獲得しています。

名前はシンプルで分かりやすく、「 AgentVerse 」といいます。

重要なポイント: この環境は大規模言語モデル用に特別に開発されており、エージェントは LLM の機能を使用してタスクを完了できます。

ほんの数行の簡単な設定で、エージェントを希望する環境で成長させることができます。

例えば、囚人のジレンマ：

刑務官は容疑者2人にジレンマを突きつけ、協力するか裏切るか決めるよう求めた。

たとえば、 「NLP 教室」 :

教授はテキストを通じて教え、学生エージェントは質問があるときに手を挙げ、指名されて初めて発言することで、段階的に知識を習得します。

シンプルなポケモンゲームをシミュレートすることもできます...ユーザーは直接参加できます。

（テキスト入力による会話）

望むものは何でも手に入ります。すべてはあなた自身のパフォーマンス次第です。

著者はまた、このプロジェクトの本来の目的は、LLM を使用してカスタムマルチエージェント環境を構築するプロセスを簡素化し、誰もが研究そのものに集中できるようにすることだと述べています。

現在、AgentVerse の論文が公開されており、ソースコードも公開中です。

ぜひ見に来てください。

AgentVerse が大規模モデル向けに特別に開発されたのと同様に、より強力な一般化機能などのさまざまな LLM の助けにより、人間によるインテリジェントエージェントのトレーニングの有効性が大幅に向上しました。

しかし、現実世界と同じように、LLM の助けがあっても、協力することを学ぶことはこれらのエージェントが経験しなければならないことです。

ここで著者らは、マルチエージェント環境構築フレームワークである AgentVerse を提案します。

そのワークフローは、人間が協力して問題を解決するプロセスをシミュレートし、次の 4 つの段階に分かれています。

1.専門家の採用。

現在の問題解決の進捗状況に基づいて、タスクを処理するエージェントを調整します。

2. 共同戦略について話し合う（共同意思決定）。

前の段階で採用されたエージェントは、問題を解決するために必要な分担について話し合い、合意に達する必要があります。

3.アクションの実行

エージェントは環境と対話してタスクを完了します。

4.評価

タスクが完了すると、このモジュールは現在の状態と期待される目標を比較します。期待が満たされない場合は、最初のステップに戻るためのフィードバック報酬が送信されます。

冒頭で述べたように、AgentVerse フレームワークのハイライトの 1 つは、カスタム環境構成を実装できることです。

では、どのようにカスタマイズするのでしょうか?

このアプローチは 5 つの基本コンポーネントを通じて行われます。

各コンポーネントは実際にはルールを表します。異なるルールを組み合わせることで、さまざまな環境を構築できるため、研究者はさまざまな条件下でのインテリジェントエージェントの動作を研究しやすくなります。

具体的には、次の 5 つのコンポーネントです。

各エージェントに環境の説明を提供するDescriber 。このコンポーネントをカスタマイズすることで、独自の特定の要件に合わせて環境を構築できます。
順序は、エージェントが環境内でアクションを実行する順序を定義します。ランダム、順次、同時実行(各ラウンドですべてのエージェントがアクションを実行する)などのいくつかのデフォルトオプションがありますが、カスタマイズすることもできます。
セレクター: エージェントが無効な情報を生成する場合があり、この情報をフィルタリングして有効なコンテンツを選択するために使用されます。
各エージェントのメモリを更新するために使用されるUpdater 。これは、エージェントの応答がすべてのエージェントに表示されるべきではない場合があるためです(たとえば、同じ部屋にいない場合) 。その役割は、各応答が発生した後に各エージェントに表示されるコンテンツのみを更新することです。
可視性はエージェントリストを維持するために使用されます。エージェントが別の部屋に移動したり、その他の変更が行われたりすると、すべてのエージェントのリストが更新されます。