清華インテリジェント・ユニバースが大盛況。囚人のジレンマなどの実験のAIシミュレーションには、いくつかの簡単な設定行のみが必要です。

清華インテリジェント・ユニバースが大盛況。囚人のジレンマなどの実験のAIシミュレーションには、いくつかの簡単な設定行のみが必要です。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

社会実験を簡単にシミュレートできるマルチエージェント宇宙がここにあります——

これは清華大学、北京郵電大学、WeChat チームによって立ち上げられ、現在 GitHub で 1.1k 個のスターを獲得しています。

名前はシンプルで分かりやすく、「 AgentVerse 」といいます。

重要なポイント: この環境は大規模言語モデル用に特別に開発されており、エージェントは LLM の機能を使用してタスクを完了できます。

ほんの数行の簡単な設定で、エージェントを希望する環境で成長させることができます。

例えば、囚人のジレンマ

刑務官は容疑者2人にジレンマを突きつけ、協力するか裏切るか決めるよう求めた。

たとえば、 「NLP 教室」 :

教授はテキストを通じて教え、学生エージェントは質問があるときに手を挙げ、指名されて初めて発言することで、段階的に知識を習得します。

シンプルなポケモンゲームをシミュレートすることもできます...ユーザーは直接参加できます。

(テキスト入力による会話)

望むものは何でも手に入ります。すべてはあなた自身のパフォーマンス次第です。

著者はまた、このプロジェクトの本来の目的は、LLM を使用してカスタム マルチエージェント環境を構築するプロセスを簡素化し、誰もが研究そのものに集中できるようにすることだと述べています。

現在、AgentVerse の論文が公開されており、ソースコードも公開中です。

ぜひ見に来てください。

4つの段階と5つの基本コンポーネント

AgentVerse が大規模モデル向けに特別に開発されたのと同様に、より強力な一般化機能などのさまざまな LLM の助けにより、人間によるインテリジェント エージェントのトレーニングの有効性が大幅に向上しました。

しかし、現実世界と同じように、LLM の助けがあっても、協力することを学ぶことはこれらのエージェントが経験しなければならないことです。

ここで著者らは、マルチエージェント環境構築フレームワークである AgentVerse を提案します。

そのワークフローは、人間が協力して問題を解決するプロセスをシミュレートし、次の 4 つの段階に分かれています。

1.専門家の採用

現在の問題解決の進捗状況に基づいて、タスクを処理するエージェントを調整します。

2. 共同戦略について話し合う(共同意思決定)

前の段階で採用されたエージェントは、問題を解決するために必要な分担について話し合い、合意に達する必要があります。

3.アクションの実行

エージェントは環境と対話してタスクを完了します。

4.評価

タスクが完了すると、このモジュールは現在の状態と期待される目標を比較します。期待が満たされない場合は、最初のステップに戻るためのフィードバック報酬が送信されます。

冒頭で述べたように、AgentVerse フレームワークのハイライトの 1 つは、カスタム環境構成を実装できることです。

では、どのようにカスタマイズするのでしょうか?

このアプローチは 5 つの基本コンポーネントを通じて行われます。

各コンポーネントは実際にはルールを表します。異なるルールを組み合わせることで、さまざまな環境を構築できるため、研究者はさまざまな条件下でのインテリジェントエージェントの動作を研究しやすくなります。

具体的には、次の 5 つのコンポーネントです。

  • 各エージェントに環境の説明を提供するDescriber 。このコンポーネントをカスタマイズすることで、独自の特定の要件に合わせて環境を構築できます。
  • 順序は、エージェントが環境内でアクションを実行する順序を定義します。ランダム順次、同時実行(各ラウンドですべてのエージェントがアクションを実行する)などのいくつかのデフォルト オプションがありますが、カスタマイズすることもできます。
  • セレクター: エージェントが無効な情報を生成する場合があり、この情報をフィルタリングして有効なコンテンツを選択するために使用されます。
  • 各エージェントのメモリを更新するために使用されるUpdater 。これは、エージェントの応答がすべてのエージェントに表示されるべきではない場合があるためです(たとえば、同じ部屋にいない場合) 。その役割は、各応答が発生した後に各エージェントに表示されるコンテンツのみを更新することです。
  • 可視性はエージェント リストを維持するために使用されます。エージェントが別の部屋に移動したり、その他の変更が行われたりすると、すべてのエージェントのリストが更新されます。

これらの 5 つの基本コンポーネントに加えて、AgentVerse にはもう 1 つの非常に基本的な要素であるエージェントがあります。

現在、システムは 2 つのタイプを提供しています。1 つはConversationAgent 、もう 1 つはToolAgentで、名前が示すとおりです。

もちろん、BaseAgent クラスを継承することで、3 番目以降のタイプのエージェントをカスタマイズすることもできます。

設定方法は?

AgentVerse は手動でクローンするか、pip コマンドを使用してインストールできます。

OpenAI API キーを準備し、BMTools (提供されるさまざまな拡張ツールが必要な場合はオプション)をインストールする必要があることに注意してください。

すべての準備が整ったら:
1. 構築したサンプルを直接実行できます。

冒頭で紹介した「囚人のジレンマ」、NLP授業、ポケモンゲームのほか、ソフトウェア設計シナリオ(コード作成エージェント1台、テストエージェント1台、レビューエージェント1台)、データベース管理シナリオ、テキスト評価シナリオなどもあります。

NLP 教室のトピックに関して、著者が多くのオプションの環境を提供していることは注目に値します。

冒頭で示した質問ができるケース以外にも、グループディスカッションを開始したり、講義を聞きながら学生に Bing で検索させたり、WolframAlpha API を使用して数学ゲームをプレイしたりすることもできます。

2. 自分で作ってみる。

教授 1 名、学生 1 名、ティーチング アシスタント 1 名のみの教室環境を構築するなど、簡単なものから始めることができます。

まず、タスク ディレクトリを作成し、環境を構成します。これは、上で紹介した 5 つの基本コンポーネントの構成です。

次にエージェントを設定します。教授の例は次のとおりです。

使用されているエージェントの種類、名前、LLM の種類などの情報を確認できます。

最後に、エージェントの応答を提供する出力パーサーを記述します。たとえば、プロンプト テンプレートでモデルに次の形式で出力させることができます。

上記は、単純な教室環境の一般的なプロセスです。

ご覧のとおり、手順は複雑ではありません。もちろん、具体的な操作については元のプロジェクトを参照してください。

これが単純すぎると思われる場合は、より複雑なものをカスタマイズできます。しかし、具体的なチュートリアルはまだ公開されていません(近日公開予定とのこと)

著者が事前に明らかにした情報から判断すると、このプロジェクトは一般的に、環境自体とエージェントという 5 つの基本コンポーネントを中心に展開されます。

さらに、AgentVerse では今後、ローカル LLM のサポートやドキュメントの追加など、強力な機能が追加される予定ですので、ご期待ください。

もう一つ

この論文では、著者らは AgentVerse 環境で構築されたマルチエージェント共同タスクにおけるエージェントの社会的行動についても研究しました。

これらの動作には次のものが含まれます。

(1)製紙を早く進めるために他のエージェントと一緒にサトウキビを集めることを提案したり、毛皮の収集がまだ終わっていない人を助けるなどの前向きな行動。

(2)群衆に従って迷惑をかけるなどの否定的な行動。

ここで著者らは、肯定的な行動を再利用し、否定的な行動を破棄し、最終的に複数のエージェント間の協力能力を向上させるためのいくつかの可能な戦略についても議論しています。

興味のある読者は、詳しい情報については論文を参照してください。

プロジェクトアドレス: https://github.com/OpenBMB/AgentVerse
論文アドレス: https://arxiv.org/abs/2308.10848

<<: 

>>:  復旦大学の邱希鵬さんへの10の質問:大手モデルはAndroidの時代に入り、国産モデルがLIamaに取って代わることを望みます

ブログ    
ブログ    
ブログ    

推薦する

動的ベンチマークDynabenchがリリースされました。Facebookは人間を使って人工知能を「尋問」したいと考えています

Facebook は、人工知能分野初の動的データ収集およびベンチマーク プラットフォームである Dy...

人工知能はどうすれば大衆に届くのでしょうか?最も価値のある AI テクノロジーは何ですか?

顔認識、音声認識、自動運転などが注目されるようになり、人工知能(AI)と社会や人間の生活の融合が急速...

...

チューリング賞受賞者のヤン・ルカン氏:今後数十年間の AI 研究の最大の課題は「予測世界モデル」

ディープラーニングの大規模な応用の後、人々はさらなる技術的進歩をもたらすことができる真の汎用人工知能...

大きな模型 = 容器に入った脳?同源病院の朱松春氏のチームがAGIの主な欠陥を分析

最近、ChatGPT/GPT-4シリーズの製品は世界的な注目と議論を集めており、それらに代表される大...

ジョン・マカフィーの意見: 人工知能は人類を滅ぼすのか?

2017 年 3 月 9 日、ハッカー アンダーグラウンド テクノロジーの専門家であり作家でもある...

ChatGPTがチップ設計に力強く参加します!専門的なハードウェア記述言語を学ぶ必要はなく、人間の言語を話すだけでよい

CPU 開発における大きな問題は、ChatGPT とのチャットで解決できるでしょうか?ニューヨーク州...

人工知能を活用して機密情報を安全に保つ 5 つの方法

人工知能は企業や消費者にとって非常に便利なツールですが、この技術をどのように活用して機密情報を保護で...

AI プロジェクトの 85% が失敗します。何が悪かったのでしょうか?

[[441161]]最近のガートナー社の 2 つのレポートによると、AI および機械学習プロジェク...

AIが起こした恐ろしいことは何ですか?

人工知能(AI)について話すとき、いつも恐怖を感じる人がいます。一体何を恐れているのですか?何か証拠...

人工知能音声ジェネレーター、この10個で十分です

翻訳者 | カン・シャオジン校正 | 梁哲、孫淑娟今日の人工知能の世界では、想像できるあらゆる音は簡...

ディープラーニングに関する面接で絶対に聞きたい12の質問

導入これら 12 の質問は、現在の面接で最も人気のある質問です。これらは非常に基本的な質問ですが、面...

大規模機械学習のためのプログラミング手法、計算モデル、Xgboost および MXNet の事例

[[191977]]現在、機械学習のトレンドは、従来の方法のシンプルなモデル + 少量データ (手動...

人工知能は医療従事者の燃え尽き症候群を軽減すると期待されている

[[266831]]臨床医は世界で最も困難な仕事の一つです。彼らは、高齢の患者層に対応するために24...

5G + AI はカスタマー サービス業界にどのような大きな影響を与えるでしょうか?

最近、工業情報化部は通信事業者4社に5G商用ライセンスを発行し、5G商用時代の到来を告げた。 AIと...