GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

著者 | 王 睿平

今日、大規模言語モデル技術が継続的に成熟するにつれ、専門家はそれを活用してインテリジェントエージェントを構築する取り組みを始めていますが、それらは常に単純なタスクを実行するレベルに留まっており、複雑なタスクを深く探求する能力が欠けています。これは、以前の大規模な言語モデルが対応する「幻覚」の問題を引き起こし、開発を妨げていたためでもあります。

しかし、Meta はこの「呪い」を打ち破り、「MetaGPT」と呼ばれるフレームワークをオープンソース化しました。このフレームワークは、リリースからわずか数週間でインターネット全体で人気を博しました。現在、Github で 16.9k のスターを獲得しており、人工知能の分野で Meta が放ったもう 1 つの大ヒット作となっています。

写真

Github のオープンソース リストから、MetaGPT がさまざまな役割を抽象化でき、プロダクト マネージャー、アーキテクト、プロジェクト マネージャー、プログラマーを統合する AI ツールであることがわかります。驚くべきことは、コード生成中に内部監視を実行できるため、最終的な出力コードの品質が向上することです。

これにより、ソフトウェア企業のR&Dワークフローが完全に変わり、企業のR&D効率の向上に役立つだけでなく、R&Dコストの削減にも役立ちます。

そのため、開発者は一般的に「このモデルは『実際のソフトウェア開発プロセスをシミュレートする』際に、より多くの変数とより優れた監視を提供でき、競合製品によって生成される出力結果もより有利である」と述べています。

1. マルチエージェントメタプログラミングフレームワーク

簡単に言えば、MetaGPT によって構築されたマルチエージェント メタプログラミング フレームワークは、LLM によって駆動されるマルチエージェント コラボレーションに、メタプログラミング手法として効果的な人間のワークフローを組み込むことを目的としています。モデルのプログラミング フレームワークは、ChatGPT とソフトウェア アウトソーシング会社の SOP トレーニングに基づいています。その中でも、コード=SOP(チーム)が中核となる理念です。

ソフトウェア会社のマルチロール図(徐々に実装中)

フレームワーク図に示すように、上司の「一文」の要求に応じて、製品ドキュメント、アーキテクチャ設計、タスクリスト、コードなどを出力でき、大規模な言語モデルで構成された仮想チームとみなすことができます。

写真

まず、MetaGPT は標準化された操作手順 (SOP) を Prompt にエンコードして、マルチエージェント コラボレーション プロセスを構造化します。その後、研究チームは出力をさらにモジュール化し、エージェントと人間の作業員に、出力を検証して複合的なエラーを減らすための対応する専門分野の知識を与えました。

このように、MetaGPT はワークフローの形式で各エージェントに異なる役割を割り当て、複雑なマルチエージェントコラボレーション問題を効果的かつ一貫して分解できるフレームワークを確立します。

写真

公式ドキュメントには具体的なインストール方法も示されています。そこに「python startup.py」と入力し、「Toutiao」に似た推奨システムを記述します。データ構造やAPI設計など、一連の出力が得られます。

コストについては、分析と設計を含むサンプルの生成には約 0.2 ドル (GPT-4 API のコスト) かかり、プロジェクト全体を完了するには約 2.0 ドルかかります。

図: MetaGPT フレームワーク

ITBEAR で公開されている科学技術情報からも、MetaGPT モデルがさまざまな開発タスクに適用できることが示されています。アルゴリズム推奨システムを構築する必要がある場合、モデルはシステムの適用対象集団を分析し、適用対象集団の特性をリストして対応する機能要件を提案し、最後にコードを生成して検証することができます。従来の手動開発と比較して、これらのタスクを短期間でより迅速に完了できるため、開発コストを削減できます。

構造化されたプロセス、エージェントのコラボレーション、高度なモデル駆動型技術の融合により、ソフトウェア開発の状況は変化しています。このプロセスにおいて、研究者の主な貢献は、メタプログラミング フレームワークの導入、手動の SOP プロセス設計の統合、最先端のパフォーマンスの達成などです。

結果は、MetaGPT が LLM における幻覚問題に対処し、LLM システムが協力してより効果的な設計を完了できるように導く可能性があることを示しています。

これは良いように思えますが、手動開発を完全に置き換えることはできません。開発者は、一般的なモデルの出力結果に対して心理的な期待を持つ必要があります。結局のところ、このようなシナリオでは、より良い結果を得るために、専門的な垂直分野の知識トレーニングが必要です。

2. オールラウンド: プロダクトマネージャー + アーキテクト + プロジェクトマネージャー + エンジニア

オールラウンドな AI ツールとして、MetaGPT は製品マネージャー、アーキテクト、プロジェクト マネージャー、エンジニアの役割を直接果たし、開発関連のあらゆる作業を担当します。主な機能は、コードをインテリジェントに生成すること、つまり、要件を入力した後に完全なコードを「書き込む」ことです。

具体的には、製品の PRD ドキュメントでも、プロジェクトのアーキテクチャ分析でも、それらを完全に書き出すことができ、使用する言語とフレームワークをプロンプトし、最後に関連するフロー チャートを自動的に生成できるため、非常にプロフェッショナルです。

前述の GPT-Engineer は、単一のエンジニアの役割のみを「果たす」のに対し、MetaGPT は複数の役割を果たすことができ、これが最大の利点です。サーバー インターフェイス仕様を完全にリストし、コード ロジックを自動的に分析し、各ファイルの用途を通知することもできます。

写真

ネットユーザーの中には興味を持った人もいて、これを使って Snake ゲームのコマンドライン バージョンを作成しました。コード生成の効果はかなり良好でした。ヘビは実際に走ったり、豆を食べて尻尾を生やしたり、自分自身や壁にぶつかってもリセットしたりできます。

写真

さらに、MetaGPT では、コード、図、コメント、ドキュメントなどを含むブラックジャック ゲームを約 10 分でわずか 2 ドルで構築できるため、AGI への道がさらに開かれます。

3. エンジニア: 1行の要件でエンドツーエンドの開発プロセスが完了する

MetaGPT フレームワークには明るい未来があります!モデルを詳しく見てみると、実際には複数のインテリジェント エージェントが連携して複雑なソフトウェアの問題を解決する完全なソフトウェア会社であることがわかります。

具体的には、Sop をプロンプトとしてエンコードするために、MetaGPT は、ロール定義、タスク分解、プロセス標準化、およびその他の技術設計を通じて、1 行の要件のみでエンドツーエンドの開発プロセスを完了します。関連論文も発表されています。

写真

実験結果では、MetaGPT がより高度で包括的なソリューションを生成できることも示されています。既存の会話型およびチャットベースのマルチエージェント システムよりも一貫性があります。

最後に、設計の有効性を検証するために、研究者は共同ソフトウェア開発のワークフローを実証し、関連するコードの実現可能性を検証するための関連する実験を実施しました。

コード生成ベンチマークでは、MetaGPT は 81.7% と 82.3% という新たな最高値を達成しました。つまり、他の LLM ベースのプログラミング フレームワーク (AutoGPT、LangChain、AgentVerse など) と比較して、MetaGPT はより高レベルのソフトウェアを処理し、複雑な問題を解決し、幅広い機能で際立っています。

関連する実験評価において、MetaGPT は 100% のタスク完了率を達成し、MetaGPT フレームワークの高い効率性をさらに裏付けたことは注目に値します。

要約すると、この研究では、標準的な操作手順を統合することにより、LLM ベースのマルチエージェント システムの変革パラダイムを概説します。これにより、マルチエージェントの相互作用と関連する協力のための新たな道が開かれ、人工知能が再定義されるだけでなく、AGI への道も示されます。

4. 制限: 複雑な情報を処理できない

ただし、MetaGPT にはいくつかの制限があることに注意することが重要です。たとえば、MetaGPT では単一ページのアプリケーションしか作成できず、複数のページやデータベースなどの複雑な情報を処理することはできません。したがって、アイデアが非常に複雑な場合、MetaGPT はアプリケーションを正しく生成できない可能性があります。

これらの制限にもかかわらず、MetaGPT はシンプルなアプリケーションを作成するための効果的なツールとして有望です。さらに、その使いやすさはソフトウェア開発市場に大きな影響を与え、経験豊富なプログラマーの必要性を減らす可能性があります。

参考: https://arxiv.org/pdf/2308.00352.pdf

<<: 

>>:  ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ボストンダイナミクス「人間と犬のダンス」:PK韓国ボーイズバンド、ロボットダンスの神グループが登場

[[408381]]ロボット犬とボーイズバンドが一緒に「ダンス」すると、どんな火花が散るのでしょうか...

...

大きな変化!人工知能のせいであなたの給料は減ります!児童の就労も問題

30年後には失業が大きな問題になるだろう!私たちの子どもたちはどうするのでしょうか?私が誇張している...

ターゲット検出にはこの記事で十分です! 2019年版オブジェクト検出の総合ガイド

[[272485]]ビッグデータダイジェスト制作編纂者:張瑞怡、寧静コンピュータ ビジョンは、デジタ...

...

AIによる顔の変形の背後にある技術的な戦い

[[275567]]週末に集中的に流行した後、顔を変えるソフトウェアZAOの人気はようやく落ち着きを...

人工知能時代の到来により、代替が難しい仕事はどれでしょうか?

現在、人類社会は人工知能の時代に入り、人工知能技術は生活のあらゆる分野で実証され、人類社会の継続的な...

...

アルゴリズムの原理から推奨戦略まで

[[195281]]推奨アルゴリズムの紹介現在の推奨アルゴリズムは、一般的に次の 4 つのカテゴリに...

...

警察が採用したボストン・ダイナミクスの犬たちは、感情のない「監視ツール」になるのだろうか?

[[384524]]ニューヨークのマンハッタン北部のアパートで男性2人が人質に取られている。その数...

IoTドローンが都市を消毒する方法

貴州省黔南州応急管理局は、最近、貴州省黔南州都雲市でウイルス消毒作業を行うためヘリコプターを派遣した...

TCP輻輳制御アルゴリズムについての簡単な説明

最近、TCP/IP プロトコルの学習に時間を費やしました。主な理由は、TCP/IP に関する私の理解...

この「アンケート」で初めて AI が人間を上回る、Microsoft が SuperGLUE でトップ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...