GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

著者 | 王 睿平

今日、大規模言語モデル技術が継続的に成熟するにつれ、専門家はそれを活用してインテリジェントエージェントを構築する取り組みを始めていますが、それらは常に単純なタスクを実行するレベルに留まっており、複雑なタスクを深く探求する能力が欠けています。これは、以前の大規模な言語モデルが対応する「幻覚」の問題を引き起こし、開発を妨げていたためでもあります。

しかし、Meta はこの「呪い」を打ち破り、「MetaGPT」と呼ばれるフレームワークをオープンソース化しました。このフレームワークは、リリースからわずか数週間でインターネット全体で人気を博しました。現在、Github で 16.9k のスターを獲得しており、人工知能の分野で Meta が放ったもう 1 つの大ヒット作となっています。

写真

Github のオープンソース リストから、MetaGPT がさまざまな役割を抽象化でき、プロダクト マネージャー、アーキテクト、プロジェクト マネージャー、プログラマーを統合する AI ツールであることがわかります。驚くべきことは、コード生成中に内部監視を実行できるため、最終的な出力コードの品質が向上することです。

これにより、ソフトウェア企業のR&Dワークフローが完全に変わり、企業のR&D効率の向上に役立つだけでなく、R&Dコストの削減にも役立ちます。

そのため、開発者は一般的に「このモデルは『実際のソフトウェア開発プロセスをシミュレートする』際に、より多くの変数とより優れた監視を提供でき、競合製品によって生成される出力結果もより有利である」と述べています。

1. マルチエージェントメタプログラミングフレームワーク

簡単に言えば、MetaGPT によって構築されたマルチエージェント メタプログラミング フレームワークは、LLM によって駆動されるマルチエージェント コラボレーションに、メタプログラミング手法として効果的な人間のワークフローを組み込むことを目的としています。モデルのプログラミング フレームワークは、ChatGPT とソフトウェア アウトソーシング会社の SOP トレーニングに基づいています。その中でも、コード=SOP(チーム)が中核となる理念です。

ソフトウェア会社のマルチロール図(徐々に実装中)

フレームワーク図に示すように、上司の「一文」の要求に応じて、製品ドキュメント、アーキテクチャ設計、タスクリスト、コードなどを出力でき、大規模な言語モデルで構成された仮想チームとみなすことができます。

写真

まず、MetaGPT は標準化された操作手順 (SOP) を Prompt にエンコードして、マルチエージェント コラボレーション プロセスを構造化します。その後、研究チームは出力をさらにモジュール化し、エージェントと人間の作業員に、出力を検証して複合的なエラーを減らすための対応する専門分野の知識を与えました。

このように、MetaGPT はワークフローの形式で各エージェントに異なる役割を割り当て、複雑なマルチエージェントコラボレーション問題を効果的かつ一貫して分解できるフレームワークを確立します。

写真

公式ドキュメントには具体的なインストール方法も示されています。そこに「python startup.py」と入力し、「Toutiao」に似た推奨システムを記述します。データ構造やAPI設計など、一連の出力が得られます。

コストについては、分析と設計を含むサンプルの生成には約 0.2 ドル (GPT-4 API のコスト) かかり、プロジェクト全体を完了するには約 2.0 ドルかかります。

図: MetaGPT フレームワーク

ITBEAR で公開されている科学技術情報からも、MetaGPT モデルがさまざまな開発タスクに適用できることが示されています。アルゴリズム推奨システムを構築する必要がある場合、モデルはシステムの適用対象集団を分析し、適用対象集団の特性をリストして対応する機能要件を提案し、最後にコードを生成して検証することができます。従来の手動開発と比較して、これらのタスクを短期間でより迅速に完了できるため、開発コストを削減できます。

構造化されたプロセス、エージェントのコラボレーション、高度なモデル駆動型技術の融合により、ソフトウェア開発の状況は変化しています。このプロセスにおいて、研究者の主な貢献は、メタプログラミング フレームワークの導入、手動の SOP プロセス設計の統合、最先端のパフォーマンスの達成などです。

結果は、MetaGPT が LLM における幻覚問題に対処し、LLM システムが協力してより効果的な設計を完了できるように導く可能性があることを示しています。

これは良いように思えますが、手動開発を完全に置き換えることはできません。開発者は、一般的なモデルの出力結果に対して心理的な期待を持つ必要があります。結局のところ、このようなシナリオでは、より良い結果を得るために、専門的な垂直分野の知識トレーニングが必要です。

2. オールラウンド: プロダクトマネージャー + アーキテクト + プロジェクトマネージャー + エンジニア

オールラウンドな AI ツールとして、MetaGPT は製品マネージャー、アーキテクト、プロジェクト マネージャー、エンジニアの役割を直接果たし、開発関連のあらゆる作業を担当します。主な機能は、コードをインテリジェントに生成すること、つまり、要件を入力した後に完全なコードを「書き込む」ことです。

具体的には、製品の PRD ドキュメントでも、プロジェクトのアーキテクチャ分析でも、それらを完全に書き出すことができ、使用する言語とフレームワークをプロンプトし、最後に関連するフロー チャートを自動的に生成できるため、非常にプロフェッショナルです。

前述の GPT-Engineer は、単一のエンジニアの役割のみを「果たす」のに対し、MetaGPT は複数の役割を果たすことができ、これが最大の利点です。サーバー インターフェイス仕様を完全にリストし、コード ロジックを自動的に分析し、各ファイルの用途を通知することもできます。

写真

ネットユーザーの中には興味を持った人もいて、これを使って Snake ゲームのコマンドライン バージョンを作成しました。コード生成の効果はかなり良好でした。ヘビは実際に走ったり、豆を食べて尻尾を生やしたり、自分自身や壁にぶつかってもリセットしたりできます。

写真

さらに、MetaGPT では、コード、図、コメント、ドキュメントなどを含むブラックジャック ゲームを約 10 分でわずか 2 ドルで構築できるため、AGI への道がさらに開かれます。

3. エンジニア: 1行の要件でエンドツーエンドの開発プロセスが完了する

MetaGPT フレームワークには明るい未来があります!モデルを詳しく見てみると、実際には複数のインテリジェント エージェントが連携して複雑なソフトウェアの問題を解決する完全なソフトウェア会社であることがわかります。

具体的には、Sop をプロンプトとしてエンコードするために、MetaGPT は、ロール定義、タスク分解、プロセス標準化、およびその他の技術設計を通じて、1 行の要件のみでエンドツーエンドの開発プロセスを完了します。関連論文も発表されています。

写真

実験結果では、MetaGPT がより高度で包括的なソリューションを生成できることも示されています。既存の会話型およびチャットベースのマルチエージェント システムよりも一貫性があります。

最後に、設計の有効性を検証するために、研究者は共同ソフトウェア開発のワークフローを実証し、関連するコードの実現可能性を検証するための関連する実験を実施しました。

コード生成ベンチマークでは、MetaGPT は 81.7% と 82.3% という新たな最高値を達成しました。つまり、他の LLM ベースのプログラミング フレームワーク (AutoGPT、LangChain、AgentVerse など) と比較して、MetaGPT はより高レベルのソフトウェアを処理し、複雑な問題を解決し、幅広い機能で際立っています。

関連する実験評価において、MetaGPT は 100% のタスク完了率を達成し、MetaGPT フレームワークの高い効率性をさらに裏付けたことは注目に値します。

要約すると、この研究では、標準的な操作手順を統合することにより、LLM ベースのマルチエージェント システムの変革パラダイムを概説します。これにより、マルチエージェントの相互作用と関連する協力のための新たな道が開かれ、人工知能が再定義されるだけでなく、AGI への道も示されます。

4. 制限: 複雑な情報を処理できない

ただし、MetaGPT にはいくつかの制限があることに注意することが重要です。たとえば、MetaGPT では単一ページのアプリケーションしか作成できず、複数のページやデータベースなどの複雑な情報を処理することはできません。したがって、アイデアが非常に複雑な場合、MetaGPT はアプリケーションを正しく生成できない可能性があります。

これらの制限にもかかわらず、MetaGPT はシンプルなアプリケーションを作成するための効果的なツールとして有望です。さらに、その使いやすさはソフトウェア開発市場に大きな影響を与え、経験豊富なプログラマーの必要性を減らす可能性があります。

参考: https://arxiv.org/pdf/2308.00352.pdf

<<: 

>>:  ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

ブログ    
ブログ    
ブログ    

推薦する

もう一つの(深層)学習:自己教師あり学習は次の大きなものになるでしょうか?

自己教師あり学習入門[[251602]]確かに、ディープラーニングは、特に画像認識タスクにおいて、機...

GoogleはAIチップに出産を学習させ、次世代のTPUはAI自身によって設計される

[[405016]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

マイクロソフトがML.NET 3.0をリリース、ディープラーニング機能を拡張

11月29日、海外メディアの報道によると、マイクロソフトは最近、機械学習モデルを.NETアプリケーシ...

ビジネスに適したRPAソフトウェアの選び方

[[407278]] RPA(ロボティック・プロセス・オートメーション)は、ビジネスユーザーを退屈で...

AIやIoT技術を活用した企業が職場復帰する際に考慮すべきこと

新型コロナウイルス感染症のパンデミックにより、社会の多くの分野でデジタル変革が加速し、人工知能ツール...

...

Ant Financial が SOFAJRaft をオープンソース化: 製品グレードの Java Raft アルゴリズム ライブラリ

SOFAJRaftとは何ですか? SOFAJRaft は、 Raftコンセンサス アルゴリズムに基づ...

人工知能技術は、インターホンを構築する主流の技術の1つになると期待されています

現在、人工知能、ビッグデータ、顔認識技術、クラウドコンピューティングなどの新技術が急速に発展し、産業...

AIの冷却:ディープラーニングは万能薬ではない

[[202706]]近年、ディープラーニングはある程度の流行状態に入り、人々はこの技術を使ってあらゆ...

市場情報調査 | モノのインターネット市場における人工知能

現在、機械学習とディープラーニング技術は、IoT 向け人工知能の世界市場で 5.7% の CAGR ...

...

クラウドコンピューティングは AI を民主化するための鍵となるのでしょうか?

日本の収穫期には、農家の中には毎日多くの時間を費やして、農場で収穫したキュウリを種類ごとに仕分けする...

...

北京の平昌冬季オリンピック閉会式にAIとモバイクの自転車シェアリングが8分間強制的に介入

「人工知能、ユニークだと思います」。2月24日、北京8分監督のチャン・イーモウ氏が公演のハイライトを...

高性能な PyTorch はどのように実現されるのでしょうか?経験豊富な専門家がまとめた落とし穴を避ける10のヒント

最小限の労力で最も効率的な PyTorch トレーニングを完了するにはどうすればよいでしょうか? P...