GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

著者 | 王 睿平

今日、大規模言語モデル技術が継続的に成熟するにつれ、専門家はそれを活用してインテリジェントエージェントを構築する取り組みを始めていますが、それらは常に単純なタスクを実行するレベルに留まっており、複雑なタスクを深く探求する能力が欠けています。これは、以前の大規模な言語モデルが対応する「幻覚」の問題を引き起こし、開発を妨げていたためでもあります。

しかし、Meta はこの「呪い」を打ち破り、「MetaGPT」と呼ばれるフレームワークをオープンソース化しました。このフレームワークは、リリースからわずか数週間でインターネット全体で人気を博しました。現在、Github で 16.9k のスターを獲得しており、人工知能の分野で Meta が放ったもう 1 つの大ヒット作となっています。

写真

Github のオープンソース リストから、MetaGPT がさまざまな役割を抽象化でき、プロダクト マネージャー、アーキテクト、プロジェクト マネージャー、プログラマーを統合する AI ツールであることがわかります。驚くべきことは、コード生成中に内部監視を実行できるため、最終的な出力コードの品質が向上することです。

これにより、ソフトウェア企業のR&Dワークフローが完全に変わり、企業のR&D効率の向上に役立つだけでなく、R&Dコストの削減にも役立ちます。

そのため、開発者は一般的に「このモデルは『実際のソフトウェア開発プロセスをシミュレートする』際に、より多くの変数とより優れた監視を提供でき、競合製品によって生成される出力結果もより有利である」と述べています。

1. マルチエージェントメタプログラミングフレームワーク

簡単に言えば、MetaGPT によって構築されたマルチエージェント メタプログラミング フレームワークは、LLM によって駆動されるマルチエージェント コラボレーションに、メタプログラミング手法として効果的な人間のワークフローを組み込むことを目的としています。モデルのプログラミング フレームワークは、ChatGPT とソフトウェア アウトソーシング会社の SOP トレーニングに基づいています。その中でも、コード=SOP(チーム)が中核となる理念です。

ソフトウェア会社のマルチロール図(徐々に実装中)

フレームワーク図に示すように、上司の「一文」の要求に応じて、製品ドキュメント、アーキテクチャ設計、タスクリスト、コードなどを出力でき、大規模な言語モデルで構成された仮想チームとみなすことができます。

写真

まず、MetaGPT は標準化された操作手順 (SOP) を Prompt にエンコードして、マルチエージェント コラボレーション プロセスを構造化します。その後、研究チームは出力をさらにモジュール化し、エージェントと人間の作業員に、出力を検証して複合的なエラーを減らすための対応する専門分野の知識を与えました。

このように、MetaGPT はワークフローの形式で各エージェントに異なる役割を割り当て、複雑なマルチエージェントコラボレーション問題を効果的かつ一貫して分解できるフレームワークを確立します。

写真

公式ドキュメントには具体的なインストール方法も示されています。そこに「python startup.py」と入力し、「Toutiao」に似た推奨システムを記述します。データ構造やAPI設計など、一連の出力が得られます。

コストについては、分析と設計を含むサンプルの生成には約 0.2 ドル (GPT-4 API のコスト) かかり、プロジェクト全体を完了するには約 2.0 ドルかかります。

図: MetaGPT フレームワーク

ITBEAR で公開されている科学技術情報からも、MetaGPT モデルがさまざまな開発タスクに適用できることが示されています。アルゴリズム推奨システムを構築する必要がある場合、モデルはシステムの適用対象集団を分析し、適用対象集団の特性をリストして対応する機能要件を提案し、最後にコードを生成して検証することができます。従来の手動開発と比較して、これらのタスクを短期間でより迅速に完了できるため、開発コストを削減できます。

構造化されたプロセス、エージェントのコラボレーション、高度なモデル駆動型技術の融合により、ソフトウェア開発の状況は変化しています。このプロセスにおいて、研究者の主な貢献は、メタプログラミング フレームワークの導入、手動の SOP プロセス設計の統合、最先端のパフォーマンスの達成などです。

結果は、MetaGPT が LLM における幻覚問題に対処し、LLM システムが協力してより効果的な設計を完了できるように導く可能性があることを示しています。

これは良いように思えますが、手動開発を完全に置き換えることはできません。開発者は、一般的なモデルの出力結果に対して心理的な期待を持つ必要があります。結局のところ、このようなシナリオでは、より良い結果を得るために、専門的な垂直分野の知識トレーニングが必要です。

2. オールラウンド: プロダクトマネージャー + アーキテクト + プロジェクトマネージャー + エンジニア

オールラウンドな AI ツールとして、MetaGPT は製品マネージャー、アーキテクト、プロジェクト マネージャー、エンジニアの役割を直接果たし、開発関連のあらゆる作業を担当します。主な機能は、コードをインテリジェントに生成すること、つまり、要件を入力した後に完全なコードを「書き込む」ことです。

具体的には、製品の PRD ドキュメントでも、プロジェクトのアーキテクチャ分析でも、それらを完全に書き出すことができ、使用する言語とフレームワークをプロンプトし、最後に関連するフロー チャートを自動的に生成できるため、非常にプロフェッショナルです。

前述の GPT-Engineer は、単一のエンジニアの役割のみを「果たす」のに対し、MetaGPT は複数の役割を果たすことができ、これが最大の利点です。サーバー インターフェイス仕様を完全にリストし、コード ロジックを自動的に分析し、各ファイルの用途を通知することもできます。

写真

ネットユーザーの中には興味を持った人もいて、これを使って Snake ゲームのコマンドライン バージョンを作成しました。コード生成の効果はかなり良好でした。ヘビは実際に走ったり、豆を食べて尻尾を生やしたり、自分自身や壁にぶつかってもリセットしたりできます。

写真

さらに、MetaGPT では、コード、図、コメント、ドキュメントなどを含むブラックジャック ゲームを約 10 分でわずか 2 ドルで構築できるため、AGI への道がさらに開かれます。

3. エンジニア: 1行の要件でエンドツーエンドの開発プロセスが完了する

MetaGPT フレームワークには明るい未来があります!モデルを詳しく見てみると、実際には複数のインテリジェント エージェントが連携して複雑なソフトウェアの問題を解決する完全なソフトウェア会社であることがわかります。

具体的には、Sop をプロンプトとしてエンコードするために、MetaGPT は、ロール定義、タスク分解、プロセス標準化、およびその他の技術設計を通じて、1 行の要件のみでエンドツーエンドの開発プロセスを完了します。関連論文も発表されています。

写真

実験結果では、MetaGPT がより高度で包括的なソリューションを生成できることも示されています。既存の会話型およびチャットベースのマルチエージェント システムよりも一貫性があります。

最後に、設計の有効性を検証するために、研究者は共同ソフトウェア開発のワークフローを実証し、関連するコードの実現可能性を検証するための関連する実験を実施しました。

コード生成ベンチマークでは、MetaGPT は 81.7% と 82.3% という新たな最高値を達成しました。つまり、他の LLM ベースのプログラミング フレームワーク (AutoGPT、LangChain、AgentVerse など) と比較して、MetaGPT はより高レベルのソフトウェアを処理し、複雑な問題を解決し、幅広い機能で際立っています。

関連する実験評価において、MetaGPT は 100% のタスク完了率を達成し、MetaGPT フレームワークの高い効率性をさらに裏付けたことは注目に値します。

要約すると、この研究では、標準的な操作手順を統合することにより、LLM ベースのマルチエージェント システムの変革パラダイムを概説します。これにより、マルチエージェントの相互作用と関連する協力のための新たな道が開かれ、人工知能が再定義されるだけでなく、AGI への道も示されます。

4. 制限: 複雑な情報を処理できない

ただし、MetaGPT にはいくつかの制限があることに注意することが重要です。たとえば、MetaGPT では単一ページのアプリケーションしか作成できず、複数のページやデータベースなどの複雑な情報を処理することはできません。したがって、アイデアが非常に複雑な場合、MetaGPT はアプリケーションを正しく生成できない可能性があります。

これらの制限にもかかわらず、MetaGPT はシンプルなアプリケーションを作成するための効果的なツールとして有望です。さらに、その使いやすさはソフトウェア開発市場に大きな影響を与え、経験豊富なプログラマーの必要性を減らす可能性があります。

参考: https://arxiv.org/pdf/2308.00352.pdf

<<: 

>>:  ゴリラもMinecraftをプレイできるようになり、動画を一度見るだけで新しいスキルが手に入る

ブログ    

推薦する

大企業の面接官によく聞かれるアルゴリズム図:スタック内の最小値を見つける方法がまだわかりませんか?

今日のインタビューの質問はこれです...トピックスタックデータ構造を定義します。この型でスタックの最...

ゲームにおける経路探索アルゴリズムの深い理解

World of Warcraft などの MMOARPG ゲームをプレイしたことがあるなら、キャラ...

ディープラーニングを使った顔認証

[[390275]]今日は、ディープラーニングを使用して顔認証アルゴリズムを作成します。 私たちのタ...

...

2ポインタアルゴリズムを学んでLeetCodeをプレイする

[[421659]]みなさんこんにちは。私は梁唐です。今日は、非常に古典的で非常にシンプルなアルゴリ...

Googleが絵画におけるAI使用の権利を取り戻す、ネットユーザー「DALL・E 2は発売からわずか1ヶ月で時代遅れ?」

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

自然災害の予測に関しては、AIはまだ大丈夫でしょうか?

古代から現代に至るまで、自然災害は人類に限りない損失をもたらしてきました。都市社会がますます発展する...

Python で多層パーセプトロン ニューラル ネットワークを実装する

[[341199]]何かを学べない限り、車輪の再発明をしないでください。 TensorFlow、Py...

人工知能と教育や指導が出会うと、どんな火花が散るでしょうか?

人工知能は世界第4次産業革命であり、工業、医療などの分野での応用が拡大しています。オンライン教育の普...

アート業界におけるメタバースの探究

メタバースの概念がますます普及するにつれて、さまざまな業界がこの豊かな土地を探索し始めました。多くの...

量子コンピューティングの巨匠アーロンソンが OpenAI に加わりました!彼はまた、ヤオクラスのトップ生徒である陳立傑の家庭教師でもある。

国内企業の大物たちが次々と退職し、大学へ移ったり、起業したりしている。違うのは、量子コンピューティン...

...