AutoAgentsは、あらゆるシナリオで独自のAIエージェントチームを作成するためにここにあります

AutoAgentsは、あらゆるシナリオで独自のAIエージェントチームを作成するためにここにあります

最近、GitHubは新しいAIエージェントプロジェクト「AutoAgents」を立ち上げました。このプロジェクトはLinkSoul.AIチームが主導し、Llama2モデル[1]のリリースの翌日に中国語版のモデルをダウンロード用にリリースし、北京大学、香港科技大学、智源科技、ウォータールー大学が共催しました。参入障壁が高く、使用シナリオが限られているAutoGPT [2]やMetaGPT [3]と比較して、AutoAgentsはAIエージェントをあらゆるシナリオに適用し、対象シナリオに合わせてエージェントの合理的な組み合わせを自動的に設計し、複雑なタスクを役割とタスクに分解し、適切な役割が一致するタスクを解決できるようにすることに取り組んでいます。


  • プロジェクトリンク: https://github.com/LinkSoul-AI/AutoAgents
  • オンライン体験: https://huggingface.co/spaces/LinkSoul/AutoAgents

あらゆるシナリオでエージェントの適切な組み合わせを自動的に計画します

AutoAgents は、あらゆるシナリオに対応するユニバーサル ソリューションを提供することに注力しています。ユーザーの要件を 1 文入力するだけで、対象シナリオに適したインテリジェント エージェントのチームを迅速に編成し、複雑なタスクを自動的に分解して、適切なインテリジェント エージェントが連携して対応するタスクを完了します。

小説を書く

例えば、入力

「人工知能の覚醒についての小説を書く」

AutoAgents は「プロジェクト マネージャー」(プランナー) を起動し、現在のタスクを完了するために必要な他のロールと、各ロールがタスクを完了するために必要な特定のアクションを設計します。

このタスクを達成するには、プランナー デザインに複数の専門家が必要です。AI とその潜在的な覚醒についての情報を収集する研究者、小説のアウトラインを作成するストーリー プランナー、魅力的なキャラクターを作成するキャラクター開発者です。最後に、物語を書くライターが必要です。

さまざまな分野の専門家はすべて AI エージェントによって演じられ、計画に従ってタスクを実行します。たとえば、ストーリー プランナーは研究者から提供された検索情報を使用して、クライマックスとどんでん返しの両方を含むストーリーの導入部を書き、ストーリーをより魅力的なものにしました。

最後に、物語を書き終えるのは作家の責任です。さまざまなロールプレイングエージェント間の分業と協力を通じて、小説執筆タスクは効率的に完了しました。

小規模ゲームの迅速な実装

AutoAgents を使用すると、誰でも非常に低コストで小規模なゲーム開発チームを簡単に構築できます。AutoAgents は、プロジェクト マネージャー、プログラマー、テスター、その他の役割の「採用」に役立ちます。 ChatGPT を含む既存の一般的なソリューションとは異なり、プログラムとの継続的な対話の過程で、プロンプトを手動で記述し、使用するプログラミング言語を確認し、プロジェクトを計画し、ゲーム キャラクターを設計し、一連の面倒な作業を行う必要があります。AutoAgents では、タスクの目標を明確にするだけでよく、以下に示すように非常に簡単です

CLI スネーク ゲームのコード スニペットを表示

AutoAgents は必要なロールを作成し、そのロールに責任と機能を割り当て、各ロールが使用できる外部ツールのリストを決定します。その後、それぞれの役割が計画に従って順序よくタスクを実行し、互いに協力し合い、最終的に目標を達成します。

噂の検証

ソフトウェアやゲーム開発シナリオだけでなく、強力なシーン適応性を備えた AutoAgents は、あらゆる新しいシナリオに対して適切な「新しいエージェントの組み合わせ」を自動的に設計し、問題を解決できます。日常生活でも噂に悩まされることがあるかもしれません。噂を検証するためにドメイン エキスパートと言語エキスパートを自動的に作成する AutoAgents を利用できます。最近の LK-99 超伝導体インシデントを例にとると、AutoAgents にリクエストを送信するだけで済みます。

LK-99は本当に室温超伝導材料ですか? (LK-99は本当に室温超伝導物質なのでしょうか?)

AutoAgents は、材料科学者と言語専門家を自動的に作成し、インターネット上の既知の情報を自動的に整理して、LK-99 の状態を確認します。

上記は AutoAgents テクノロジーの単純な試みにすぎません。実際、その応用の可能性は私たちの想像力によってのみ制限されます。シナリオに関係なく、AutoAgents は最適な役割を作成し、分業を完了して、タスクを効率的に完了するのに役立ちます。

太陽に向かって進む若いチーム

先週末(8月26日)、LinkSoul.AIの創設者兼CEOであるShi Yemin博士は、Syncedが主催した「Llama 2大規模モデルアルゴリズムとアプリケーション実践」イベント[7]でLinkSoul.AIのマルチモーダル大規模モデル技術について発表し、Syncedのインタビューも受けました。

石イエミンは北京大学で学士号と博士号を取得し、黄鉄軍教授に師事しました。2013年からディープラーニングと事前学習済みモデルの研究を行っています。人工知能学院のイノベーション応用研究室長として、WuDao 3.0の開発に参加しました。市販されている中国語の教育データセットとしては最大規模のCOIGとCOIG-PCの発起者および主催者の一人です。CAMEOタンパク質構造予測コンテストで1位を獲得し、初の中国ラマ2モデルである中国ラマ2 7B [4]の開発を主導しました。また、中国語と英語のマルチモーダルモデルであるChinese Llama 2 [5]と、初の中国語と英語のバイリンガル音声テキストマルチモーダル対話モデルであるLLaSM [6]をオープンソース化しました。

Synced: チームの背景を簡単に紹介していただけますか?

Syncedのインタビューをありがとうございます。私たちはLinkSoul.AIというスタートアップです。私たちが目指すのは、人間とAI、AIとAIの精神的なつながりを実現することです。簡単に言うと、AIが人々の心の底から役に立つ存在になることを望んでいます。私たちのチームはまだ初期段階にあり、人数も多くありません。チームメンバーは主に北京大学、AI研究所、Huawei、ByteDanceなどの一流企業、大学、研究機関から来ています。オペレーター開発、クラスター構築、大規模モデルの事前トレーニング、命令の微調整、マルチモーダル大規模モデルのトレーニング、製品開発、発売の完全な経験を持ち、大規模モデルの開発、改善、発売の能力を備えた中国で数少ないチームの一つです。

Synced: LinkSoul.AI が複数のモデルを迅速にオープンソース化し、さらに AutoAgents テクノロジーをオープンソース化するという決定の背景には、どのような考慮事項があるのでしょうか?それはチームの時間の無駄になるでしょうか?

LinkSoul.AI をオープンソース プロジェクトに重点を置いた会社にするつもりはありません。中国の Llama 2 モデルは、チームが余暇に作った試みです。Llama 2 のリリースと時期が重なったため、トレーニングしてオープンソース化しました。チームは、コミュニティがマルチモーダル モデルとその技術的応用にもっと注目してくれることを期待して、画像と音声のマルチモーダル モデルをオープンソース化することを選択しました。チームは、マルチモーダル モデルがますます重要な役割を果たし、ゲーム、ソーシャル ネットワーキング、AR/VR/MR などの分野でますます重要な役割を果たすと考えています。 AutoAgents がオープンソースになったことで、AI エージェントの分野でのチームの長期にわたる蓄積がオープンソース コミュニティに貢献できることを期待しています。 LinkSoul.AI は、主にチームのこれまでの研究の蓄積に基づいて、新しい結果を迅速にリリースできます。これは日常業務の継続であり、大学、研究機関、企業との共同研究開発に大きく依存しているため、チームの注意をそらすことはありません。

Synced: Llama などのオープンソース モデルが急速に進歩している現在、これは大規模な国内モデル、特に基礎モデルの開発にどのような影響を与えるでしょうか?誰もが独自のモデルをトレーニングするのは過去のことでしょうか?

オープンソースとクローズドソースはどちらも非常に重要な分野だと思いますが、特にオープンソースモデルは超大規模モデルで試すのが難しく、クローズドソースモデルは再開発やトレーニングが困難です。一方、Llama モデルは現在主に英語で提供されており、中国語のサポートはまだ十分ではありません。Llama をローカライズする既存の試みは、成功しているとは言い難いです。したがって、大規模な中国モデルの需要だけを考慮したとしても、中国で大規模なモデルをトレーニングすることは依然として価値があります。

Synced: オープンソースの AutoAgents テクノロジーにはどのような革新性がありますか?

大規模言語モデルに基づく既存のマルチエージェント システムのほとんどは、タスクを完了するために事前定義されたエージェントに依存していますが、これらの事前定義されたエージェントはさまざまなシナリオへの適応性を制限します。 AutoAgents は、さまざまなタスクに応じてさまざまなミッション シナリオに適応する AI エージェントのチームを適応的に作成し、生成された AI エージェントの組み合わせに基づいて現在のタスクのソリューションを計画します。複数のエージェントの連携を自動的に計画することで、タスクを効率的に完了できます。同時に、実行環境には、実行結果に基づいて実行計画を動的に改善し、より正確なソリューションを生成するオブザーバーが存在します。 AutoAgents は、チームワークにおいて異なるタスクに異なる役割を割り当てることの重要性を強調し、複雑なタスクを処理するための新しい視点を提供します。

Synced: AutoAgents は LinkSoul.AI にとってどのような価値をもたらしますか?

LinkSoul.AIは、すべての人に役立つAIを提供することに尽力しており、AIを呼び出す能力が特定の人々の特権ではなくなるように、人間とAI、AI同士のコミュニケーションミドルウェアを構築したいと考えています。 AutoAgents は、AI と AI 間のコミュニケーションを改善し、AI エージェントを呼び出すハードルを誰もが利用できるレベルまで下げようとするチームの試みです。現段階では、AutoAgents はまだ有料の大規模モデル API サービスに依存しています。今後、チームは専用のエージェント生成モデル、エージェント スケジューリング モデルなどを開発して、API を置き換える予定です。同時に、LinkSoul.AI はより多くの人々と AI、AI と AI の実験も行い、人々に最も極端な AI 体験をもたらすことを目指しています。

AutoAgents ローカル展開

最後に、AutoAgent をローカルに展開することも非常に便利です。以下の手順に従うことで、AutoAgents の展開をローカルで簡単に完了できます。

ステップ1: プロジェクトリポジトリをダウンロードする

git clone https://github.com/LinkSoul-AI/AutoAgents cd AutoAgents

ステップ2: Dockerイメージを作成する

IMAGE="linksoul.ai/autoagents" VERSION=1.0 docker build -f docker/Dockerfile -t "${IMAGE}:${VERSION}" .

ステップ3: Dockerコンテナを起動する

docker run -it --rm -p 7860:7860 "${IMAGE}:${VERSION}"

これら 3 つの手順が正常に実行されたら、ブラウザーでリンク http://127.0.0.1:7860 を開いて、AutoAgents の使用を開始できます。

要約する

AutoAgents は新しく開始されたプロジェクトであり、まだ初期段階にあります。オープンソース コミュニティとオープンソース愛好家の皆様の積極的な参加と貢献を歓迎します。現在、大規模モデルの最も重要な開発方向として、AIインテリジェントエージェント技術は、将来、ソーシャル、ゲームなどの分野で確実に重要な役割を果たすでしょう。 LinkSoul.AI のようなチームがさらに出現し、人工知能技術を推進してすべての人に役立ち、AI の平等を実現することを期待しています。

<<:  ユニバーサルデータ拡張技術、ランダム量子化はあらゆるデータモダリティに適用可能

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

おそらく2030年までに、量子コンピューティングのChatGPTの瞬間が到来するだろう

2030 年までに RSA 暗号を解読できるマシンが登場するでしょうが、まずは量子センシングやその他...

AI CPUとMicrosoft Windows 12のリリースにより、2024年には世界のAI PC出荷台数が1,300万台を超えると予想

10月13日、Qunzhi Consultingが昨日発表した最新の調査によると、アルゴリズムとハー...

完全なグラフが利用できない場合にグラフディープラーニングを使用するにはどうすればよいでしょうか?

多様体学習は、2000 年に有名な科学雑誌 Science で初めて提案されて以来、情報科学の分野に...

製造および自動化アプリケーション向けの人工知能技術の選び方

人工知能 (AI) の定義は、産業オートメーションにおける生産と、研究室外の日常生活では大きく異なり...

家庭では人工知能がどのように活用されているのでしょうか?

人工知能(AI)は現在、私たちの家族構造にますます統合されています。さらに、快適性、利便性、安全性、...

エネルギー産業の変革、人工知能が次の機会となる

世界のエネルギーシステムは、再生可能エネルギーの発電、電気自動車、エネルギー IoT (EIoT) ...

AIの冷却:ディープラーニングは万能薬ではない

[[202706]]近年、ディープラーニングはある程度の流行状態に入り、人々はこの技術を使ってあらゆ...

LeCun は AGI を予測します: 大規模モデルと強化学習はどちらもランプです!私の「世界モデル」は新しい道です

現代の AI 界で最も有名な巨匠の一人であり、Meta の AI 研究所の魂である Yann LeC...

自然言語処理パート1: テキスト分類器

[[194511]]序文テキスト分類は、自動記事分類、自動メール分類、スパム識別、ユーザー感情分類な...

ファーウェイが推進する「マシンビジョン」はインダストリー4.0成功の鍵となるのか?

最近、「新インフラ」や「デジタルインフラ」がホットワードとなっている。新インフラの一つである「産業イ...

インテル、IoTとエッジ向け第10世代プロセッサーを発表

Intel は最近、第 10 世代 Core プロセッサが、スループット、LGA ソケットのスケーラ...

ChatGPT-4、Bard、Claude-2、Copilot空間タスクの正確性の比較

大規模言語モデル (LLM) を含む生成 AI は、エンコード、空間計算、サンプル データ生成、時系...

2021年のAIの発展:エッジAIは止められない

[[388887]]人工知能研究を専門とする外国の機関が、人工知能の実務家を対象に、2021年の人工...

ガートナー:世界の会話型 AI 支出は 2023 年に 186 億ドルに達すると予測

8月1日、ガートナーの最新レポートによると、カスタマーサービスセンター(CC)テクノロジー、会話型A...