ゲーム開発コストはたったの2元、最短3分で完成します！プロセス全体は、大規模なモデルによってサポートされている AI エージェントによって実行されます。

皆さん、OpenAI は誰でも開発できるカスタム GPT をリリースしたばかりです。そして、中国の大手モデルスタートアップも、 AI エージェントのコラボレーションを可能にする開発を再定義する製品をリリースしました。

たった一文、最速3分以内、費用は2元強で、「バンッ」とソフトウェアが開発されます。

たとえば、Red Envelope Rain 用の小さなソフトウェアを開発したい場合は、次の 1 文を述べるだけで済みます。

「赤い封筒の雨」は、小さなクリックゲームです。赤い封筒の外観は、高くて細い赤い丸い長方形です。赤い封筒は上からゆっくりと落ちてきます。各赤い封筒の間の距離は等しく、重なり合うことはありません。マウスで赤い封筒をクリックすると、インタラクティブなクリックで消えます。同時に、赤い封筒をつかむことで得られるお金の額を示す縁起の良い数字が表示されます。

さらに重要なのは、開発プロセス全体を通じて、プロダクトマネージャーからプログラマー、デザイナー、テスターまで、全員が AI エージェントであるということです。

そうです、プロセス全体を通して要件を提示するだけで、残りのインテリジェントエージェントは独自に議論し、通信し、さらには戦闘を行ってから、最終的に計画を決定し、実行します。

従来のソフトウェアの開発サイクルは 2 ～ 3 週間、コストは 10,000 ～ 50,000 米ドル(人件費を含む)であることを知っておく必要があります。これと比較すると、これはまさに「コスト削減と効率化」と言えます。

この魔法のツールは、 Mianbi Intelligenceがリリースした最新の SaaS レベルのインテリジェントソフトウェア開発プラットフォームであるChatDevです。

実際、2か月前にはすでに「ChatDev Intelligent Agent Collaborative Development Framework」がGitHubでオープンソース化されており、トレンドランキングで何度もトップになり、現在では約17,000個のスターを獲得しています。

Mianbi Intelligenceが今回製品版をリリースした理由は、「ひと言で開発」の敷居をもう一度下げるためだ。

今や、開発はもはや技術ではなく、創造性に関するものとなりました。

まるでドラえもんがそばにいるような感じ。思い切って考えれば、ドラえもんがあなたのためにそれを「創り出す」のです。

では、ChatDev の製品版ではどのような変更がもたらされるのでしょうか?これはどうやって行うのですか?

製品開発は変化し、より多くの創造性を詰め込むことができるようになった

ChatDev の製品版のサポートにより、開発の反復はアイデアの問題になりました。

たとえば、「赤い封筒」を必要な要素に置き換えたい場合も、必要なのは 1 つの文だけです。

その後、AI エージェントは新しい一連の作業プロセスを開始しました。今回は、これらがどのように連携して動作するかを詳しく見てみましょう。

赤い封筒の雨のデモを例に挙げてみましょう。

まず、前述したように、「プロジェクト名」と「プロンプト」を入力するだけです。

また、プロンプトが適切に書かれていない場合でも、ChatDev の横に「ワンクリックで仕上げる」機能があり、自動的に要件を完了するのに役立ちます。

すると、AI エージェントが「手をこすり合わせ」、作業の準備を始めるのがわかります。

最初に CTO が話し、その概要は次の通りでした。

仕事に取り掛かりましょう！お客様は「赤い封筒の雨」を降らせたいです〜

次

CTO は要件を詳細に分解し、プロジェクトで実行する必要のあるすべてのステップをリストしました。

タスクが割り当てられると、プログラマーが作業する番になります。

彼は簡単に Python コードをいくつか提供してくれました:

コードが完成すると、AI カウンセラーがプロジェクト全体を要約し、ロジックや結果などを提供します。

会話のプロセス全体は非常にスムーズでした。私たちは、これらの「AI従業員」がプロジェクトを秩序正しく進めるのを静かに見守る、大切なお客様のような気分でした。

昨今、開発は本当にアイデアの問題になってしまったと嘆かざるを得ません。

たとえば、Web クローラー、データベースの読み取りと書き込み、ファイルのバッチ処理、Web デザインなどのプログラミングアシスタント、Gobang や Snake などのカジュアルゲーム、デジタル時計、電卓、描画ボード、画像エディターなどの効率管理およびクリエイティブ補助ツールなどがあります。

すべて保持できます〜

これはどうやって行うのですか?

初期に公開された情報や論文から、元の ChatDev はグループインテリジェンスによって接続されたチーム設計のChatChain (コミュニケーションチェーン)であったことがわかります。

これは、専門的な役割を持つインテリジェントエージェントによる会話による情報のやり取りと意思決定を通じて、全プロセスの自動化されたソフトウェアエンジニアリングを推進する、アトミックタスクで構成された「ソフトウェア生産ライン」として考えることができます。

しかし、アプリケーションの革新は基本モデルの能力向上と切り離せないものです。Mianbi Intelligence による ChatDev の SaaS 版のリリースに伴い、自社開発の基本モデルにも新しいバージョンがあることがわかりました。

CPM-Cricket (CPM は Chinese Pretrained Model の略) は、 Mianbi Intelligent によって開発された、数千億のパラメータを持つ新世代の大規模モデルです。。

CPM-Cricket は壁向き知能の第 3 世代モデルであり、最初の 2 世代はそれぞれ CPM-Ant と CPM-Bee であると理解されています。

（興味深い点は、各世代のモデルの名前が英語のアルファベットの最初の文字に基づいており、昆虫を表す英語の単語にちなんで名付けられていることです。）

CPM-Cricket の機能について一言で言えば、ロジック、コード、知識、命令理解において大幅な改善が実現し、あらゆる面で Llama 2 を上回っています。

従来の LLM 評価セット(HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH など)では、CPM-Cricket は次のように動作します。

おそらく、このようなデータセットでは、あまり直感的な感覚は得られないでしょう。

次に、CPM-Cricket をベースにした ChatGPT のような製品であるLuca 3.0 を公務員試験のシナリオに「投入」した後のパフォーマンスを見ると、CPM-Cricket の機能が一目でわかるようになります。

トピックは次のとおりです。

2022～2023年度の公開試験問題が選定され、常識判断、数量関係、データ分析、判断・推論、言語理解・表現など様々な問題形式の425問が含まれた。

たとえば、次のような複数選択の質問に直面した場合、Luca 3.0 は数秒で回答できるだけでなく、解決の各ステップを詳細にリストすることもできます。

多くの対話を必要とし、実際の人間が反応するのに時間がかかる論理的な質問に直面したときでも、Luca 3.0 は簡単に答えることができました。

この一連の質問に対する Luca 3.0 のパフォーマンスは「高速」かつ「正確」であると言えます。

これに対抗した競合他社のMianbi Intelligenceも、業界では比較的ベンチマークとなる大規模モデルであるGPT-4を選択しました。

常識的な判断と判断力と推論力という 2 つの重要な能力において、Luca 3.0 が GPT-4 に対して相対的な優位性を維持できていることは容易にわかります。

それだけでなく、英語のテスト環境において、GMAT公式模擬試験問題におけるLuca 3.0の成績も全体的にGPT-4に匹敵します（リーディングはGPT-4の97％に達します）。

Luca 3.0 がこのような結果を達成できた理由は、その背後にある CPM モデルのアップグレードに加えて、FaceWall Intelligence が微調整においても対応する戦略を実行したためです。

1 つ目はカリキュラム学習(CL)トレーニング戦略で、簡単なものから難しいものへと進む人間の学習プロセスを模倣します。まず、モデルは事前トレーニングで基礎となる推論ルールを学習し、次に調整段階で人間の段階的な推論思考を学習します。

2 つ目は、モデルの推論をより説明可能にするために推論プロセスを分解するChain of thought (CoT)戦略です。

（追記：ルカは現在、一般公開されており、無料で体験できます〜）

トレーニング、圧縮、推論など、基盤となるインフラストラクチャの他の側面においても、Mianbi Intelligence は独自の戦略セットを開発しました。

BMTrain: 大規模モデルを効率的にトレーニングするためのフレームワーク
BMInf: 大規模モデル向けの効率的な推論フレームワーク
BMCook: 大規模モデルのための効率的な圧縮フレームワーク

その大規模モデルには 16,000 以上の実際の API が統合されており、ワンクリックでアクセスしてツールを呼び出すことで、より複雑なタスクを解決できると言われています。

さらに、Mianbi Intelligence は Int8 量子化モデルを導入し、モデル推論コストを 50% 削減しました。

要約すると、Mianbi Intelligence は、より低コストで効率的なモデルトレーニング方法を模索し、大規模なモデルを「トレーニング」できるだけでなく、「適切にトレーニング」して「適切に使用」できるようにしました。

これは、「ビッグモデル＋エージェント」の応用を推進するこのスタートアップ企業の強みであり自信なのかもしれません。

もっと大きなチェスゲームがある

しかし、これに加えて、Mianbi Intelligence は、大規模なモデルベースの基本機能に基づいて、 AgentVerseとXAgent という2 つの主要な作品もオープンソース化しています。

前述の ChatDev と合わせて、この 3 つは AI インテリジェントエンティティを中核とする壁面インテリジェンスの「トロイカ」を形成します。

AgentVerse は、大規模なモデル駆動型インテリジェントエージェントの汎用プラットフォームです。その機能は、さまざまな AI エージェントを作成し、認識、思考、推論、理解、連携、実行の能力を与えて、「チームを組んでモンスターと戦う」ことです。

XAgent は、エージェントが自律的な計画と意思決定機能を持ち、人間の指示を理解し、複雑な計画を立て、タスクを完了するために自律的なアクションを実行できるようにする、大規模なモデル駆動型 AI エージェントアプリケーションフレームワークです。

ChatDev はより焦点が絞られています。これは、大規模なモデルによって駆動されるマルチエージェント共同開発フレームワークです。ソフトウェアエンジニアリングウォーターフォールモデルの考え方を採用し、ソフトウェア開発をソフトウェア設計、システム開発、統合テスト、ドキュメントの 4 つの主要なリンクに分割します。

しかし、今回公開された「単一ノード」をすべてつなげてみると、FaceWall Intelligenceが実はもっと大きなゲームをしていることがわかります。

左手に大規模なモデル、右手に AI エージェントを持ち、インテリジェントエージェントネットワーク(Internet of Agents、IoA)を構築したいと考えています。

Mianbi Intelligence の視点から見ると、インターネットからモノのインターネットへの移行を経験しており、次の方向はインテリジェンスのインターネットです。

インターネットが 2 次元の情報の接続であり、モノのインターネットが 3 次元空間の接続であるならば、インテリジェンスのインターネットは、より高次元のインテリジェントなエンティティの接続です。

インテリジェンスのインターネットでは、AI エージェントが最も重要な存在であるはずです。AI エージェントは、実際の人や物体の擬人化されたネイティブエージェントまたはデジタルツインエージェントになることができます。

インテリジェントなエンティティを接続することで、AI は真に人類に貢献し、価値(生産性の向上、インタラクション方法の変化)を提供できます。

大胆な比喩を使うと、モノのインターネットの将来では、家庭内のテーブルや冷蔵庫でさえもインテリジェントな存在としての特性を持ち、人や他の物体とインテリジェントに対話できるようになります。

これがまさに、「壁向きの知性- あらゆるものを取り巻く知性」というビジョンの原点です。

「インテリジェンス」は AI エージェントを指し、「すべてのもの」は人や物を指します。
AIエージェントネットワークは、現実世界と仮想世界をつなぐ架け橋であり、両者が真に相互作用し、協力して価値を創造することを可能にします。

しかし、正直に言うと、インテリジェントインターネットの理想は素晴らしいものの、ChatDev や第 3 世代の大型モデルのリリースでさえ、そのビジョンに向けた一歩としか見なせないのが現実です。

では、壁向きの知性は将来「万物の知性」を解き放つのに十分な力を持っているのでしょうか?

<<:

>>:

同社はコストバランスに苦戦しており、AI部門で猛烈な採用を行い、他の部門では人員削減を行っている。

ブログ

ナレッジグラフは銀行のビジネスモデルをどのように変えるのでしょうか?

ブログ

Googleはディープラーニングを使ってCPUを強化することを提案：コンピューターをどんどん高速化する

ゲーム開発コストはたったの2元、最短3分で完成します！プロセス全体は、大規模なモデルによってサポートされている AI エージェントによって実行されます。

製品開発は変化し、より多くの創造性を詰め込むことができるようになった

これはどうやって行うのですか?

もっと大きなチェスゲームがある

同社はコストバランスに苦戦しており、AI部門で猛烈な採用を行い、他の部門では人員削減を行っている。

ナレッジグラフは銀行のビジネスモデルをどのように変えるのでしょうか?

Googleはディープラーニングを使ってCPUを強化することを提案：コンピューターをどんどん高速化する

大きな言語モデルに目を向けると、その画像認識性能は CLIP を超えています。スタンフォードのような新しい方法では、マルチモーダル事前トレーニングは不要である

人工知能の時代、3つの問題が未来を決定づける

AIはHRにどのように役立つのでしょうか?

清華大学の崔鵬氏：因果推論技術の最新開発動向

人間と機械の統合はなぜ難しいのでしょうか?

推薦する

AI研究者の邢波氏：機械学習には明確な理論的枠組みが欠けており、評価の目標と方法を再定義する必要がある

CMU の専門家が「マルチモーダル機械学習」の 6 つの主要な課題を包括的にまとめています。36 ページの長い記事 + 120 ページの PPT、すべて実用的な情報です。

完璧な切り抜き王ビンビン！ ByteDanceのインターンが開発したAIにより、4K 60fps動画のリアルタイム切り抜きが可能に

清華大学の博士が「チップレット・アクチュアリー」サミットを提案！ムーアの法則に近づくほど、マルチチップ統合のコスト効率は向上する。

C++ kmp アルゴリズムテンプレートコード解釈

極端なケースによって引き起こされた議論: アルゴリズムがあなたが死にたいと考えた時...

「概念のドリフト」問題と闘おう！ Google が新しい時間認識フレームワークをリリース: 画像認識精度が 15% 向上

AIが自動化に適した日常的なITタスク3つ

21 世紀においてインテリジェントオートメーションは誇張されすぎているのでしょうか?

2021 年の世界トップ 10 の人工知能アプリケーション

シリコンバレーの天才たちの没落: 才能から始まり、利益に転落し、「賢さ」のせいで失敗した