皆さん、OpenAI は誰でも開発できるカスタム GPT をリリースしたばかりです。そして、中国の大手モデル スタートアップも、 AI エージェントのコラボレーションを可能にする開発を再定義する製品をリリースしました。 たった一文、最速3分以内、費用は2元強で、「バンッ」とソフトウェアが開発されます。 たとえば、Red Envelope Rain 用の小さなソフトウェアを開発したい場合は、次の 1 文を述べるだけで済みます。 「赤い封筒の雨」は、小さなクリックゲームです。赤い封筒の外観は、高くて細い赤い丸い長方形です。赤い封筒は上からゆっくりと落ちてきます。各赤い封筒の間の距離は等しく、重なり合うことはありません。マウスで赤い封筒をクリックすると、インタラクティブなクリックで消えます。同時に、赤い封筒をつかむことで得られるお金の額を示す縁起の良い数字が表示されます。 さらに重要なのは、開発プロセス全体を通じて、プロダクトマネージャーからプログラマー、デザイナー、テスターまで、全員が AI エージェントであるということです。 そうです、プロセス全体を通して要件を提示するだけで、残りのインテリジェント エージェントは独自に議論し、通信し、さらには戦闘を行ってから、最終的に計画を決定し、実行します。 従来のソフトウェアの開発サイクルは 2 ~ 3 週間、コストは 10,000 ~ 50,000 米ドル(人件費を含む)であることを知っておく必要があります。これと比較すると、これはまさに「コスト削減と効率化」と言えます。 この魔法のツールは、 Mianbi Intelligenceがリリースした最新の SaaS レベルのインテリジェント ソフトウェア開発プラットフォームであるChatDevです。 実際、2か月前にはすでに「ChatDev Intelligent Agent Collaborative Development Framework」がGitHubでオープンソース化されており、トレンドランキングで何度もトップになり、現在では約17,000個のスターを獲得しています。 Mianbi Intelligenceが今回製品版をリリースした理由は、「ひと言で開発」の敷居をもう一度下げるためだ。 今や、開発はもはや技術ではなく、創造性に関するものとなりました。 まるでドラえもんがそばにいるような感じ。思い切って考えれば、ドラえもんがあなたのためにそれを「創り出す」のです。 では、ChatDev の製品版ではどのような変更がもたらされるのでしょうか?これはどうやって行うのですか? 製品開発は変化し、より多くの創造性を詰め込むことができるようになったChatDev の製品版のサポートにより、開発の反復はアイデアの問題になりました。 たとえば、「赤い封筒」を必要な要素に置き換えたい場合も、必要なのは 1 つの文だけです。 その後、AI エージェントは新しい一連の作業プロセスを開始しました。今回は、これらがどのように連携して動作するかを詳しく見てみましょう。 赤い封筒の雨のデモを例に挙げてみましょう。 まず、前述したように、「プロジェクト名」と「プロンプト」を入力するだけです。 また、プロンプトが適切に書かれていない場合でも、ChatDev の横に「ワンクリックで仕上げる」機能があり、自動的に要件を完了するのに役立ちます。 すると、AI エージェントが「手をこすり合わせ」、作業の準備を始めるのがわかります。 最初に CTO が話し、その概要は次の通りでした。
次 CTO は要件を詳細に分解し、プロジェクトで実行する必要のあるすべてのステップをリストしました。 タスクが割り当てられると、プログラマーが作業する番になります。 彼は簡単に Python コードをいくつか提供してくれました: コードが完成すると、AI カウンセラーがプロジェクト全体を要約し、ロジックや結果などを提供します。 会話のプロセス全体は非常にスムーズでした。私たちは、これらの「AI従業員」がプロジェクトを秩序正しく進めるのを静かに見守る、大切なお客様のような気分でした。 昨今、開発は本当にアイデアの問題になってしまったと嘆かざるを得ません。 たとえば、Web クローラー、データベースの読み取りと書き込み、ファイルのバッチ処理、Web デザインなどのプログラミング アシスタント、Gobang や Snake などのカジュアル ゲーム、デジタル時計、電卓、描画ボード、画像エディターなどの効率管理およびクリエイティブ補助ツールなどがあります。 すべて保持できます〜 これはどうやって行うのですか?初期に公開された情報や論文から、元の ChatDev はグループインテリジェンスによって接続されたチーム設計のChatChain (コミュニケーションチェーン)であったことがわかります。 これは、専門的な役割を持つインテリジェントエージェントによる会話による情報のやり取りと意思決定を通じて、全プロセスの自動化されたソフトウェアエンジニアリングを推進する、アトミックタスクで構成された「ソフトウェア生産ライン」として考えることができます。 しかし、アプリケーションの革新は基本モデルの能力向上と切り離せないものです。Mianbi Intelligence による ChatDev の SaaS 版のリリースに伴い、自社開発の基本モデルにも新しいバージョンがあることがわかりました。 CPM-Cricket (CPM は Chinese Pretrained Model の略) は、 Mianbi Intelligent によって開発された、数千億のパラメータを持つ新世代の大規模モデルです。 。 CPM-Cricket は壁向き知能の第 3 世代モデルであり、最初の 2 世代はそれぞれ CPM-Ant と CPM-Bee であると理解されています。 (興味深い点は、各世代のモデルの名前が英語のアルファベットの最初の文字に基づいており、昆虫を表す英語の単語にちなんで名付けられていることです。) CPM-Cricket の機能について一言で言えば、ロジック、コード、知識、命令理解において大幅な改善が実現し、あらゆる面で Llama 2 を上回っています。 従来の LLM 評価セット(HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH など)では、CPM-Cricket は次のように動作します。 おそらく、このようなデータセットでは、あまり直感的な感覚は得られないでしょう。 次に、CPM-Cricket をベースにした ChatGPT のような製品であるLuca 3.0 を公務員試験のシナリオに「投入」した後のパフォーマンスを見ると、CPM-Cricket の機能が一目でわかるようになります。 トピックは次のとおりです。 2022~2023年度の公開試験問題が選定され、常識判断、数量関係、データ分析、判断・推論、言語理解・表現など様々な問題形式の425問が含まれた。 たとえば、次のような複数選択の質問に直面した場合、Luca 3.0 は数秒で回答できるだけでなく、解決の各ステップを詳細にリストすることもできます。 多くの対話を必要とし、実際の人間が反応するのに時間がかかる論理的な質問に直面したときでも、Luca 3.0 は簡単に答えることができました。 この一連の質問に対する Luca 3.0 のパフォーマンスは「高速」かつ「正確」であると言えます。 これに対抗した競合他社のMianbi Intelligenceも、業界では比較的ベンチマークとなる大規模モデルであるGPT-4を選択しました。 常識的な判断と判断力と推論力という 2 つの重要な能力において、Luca 3.0 が GPT-4 に対して相対的な優位性を維持できていることは容易にわかります。 それだけでなく、英語のテスト環境において、GMAT公式模擬試験問題におけるLuca 3.0の成績も全体的にGPT-4に匹敵します(リーディングはGPT-4の97%に達します) 。 Luca 3.0 がこのような結果を達成できた理由は、その背後にある CPM モデルのアップグレードに加えて、FaceWall Intelligence が微調整においても対応する戦略を実行したためです。 1 つ目はカリキュラム学習(CL)トレーニング戦略で、簡単なものから難しいものへと進む人間の学習プロセスを模倣します。まず、モデルは事前トレーニングで基礎となる推論ルールを学習し、次に調整段階で人間の段階的な推論思考を学習します。 2 つ目は、モデルの推論をより説明可能にするために推論プロセスを分解するChain of thought (CoT)戦略です。 (追記:ルカは現在、一般公開されており、無料で体験できます〜) トレーニング、圧縮、推論など、基盤となるインフラストラクチャの他の側面においても、Mianbi Intelligence は独自の戦略セットを開発しました。
その大規模モデルには 16,000 以上の実際の API が統合されており、ワンクリックでアクセスしてツールを呼び出すことで、より複雑なタスクを解決できると言われています。 さらに、Mianbi Intelligence は Int8 量子化モデルを導入し、モデル推論コストを 50% 削減しました。 要約すると、Mianbi Intelligence は、より低コストで効率的なモデルトレーニング方法を模索し、大規模なモデルを「トレーニング」できるだけでなく、「適切にトレーニング」して「適切に使用」できるようにしました。 これは、「ビッグモデル+エージェント」の応用を推進するこのスタートアップ企業の強みであり自信なのかもしれません。 もっと大きなチェスゲームがあるしかし、これに加えて、Mianbi Intelligence は、大規模なモデルベースの基本機能に基づいて、 AgentVerseとXAgent という2 つの主要な作品もオープンソース化しています。 前述の ChatDev と合わせて、この 3 つは AI インテリジェント エンティティを中核とする壁面インテリジェンスの「トロイカ」を形成します。 AgentVerse は、大規模なモデル駆動型インテリジェントエージェントの汎用プラットフォームです。その機能は、さまざまな AI エージェントを作成し、認識、思考、推論、理解、連携、実行の能力を与えて、「チームを組んでモンスターと戦う」ことです。 XAgent は、エージェントが自律的な計画と意思決定機能を持ち、人間の指示を理解し、複雑な計画を立て、タスクを完了するために自律的なアクションを実行できるようにする、大規模なモデル駆動型 AI エージェント アプリケーション フレームワークです。 ChatDev はより焦点が絞られています。これは、大規模なモデルによって駆動されるマルチエージェント共同開発フレームワークです。ソフトウェア エンジニアリング ウォーターフォール モデルの考え方を採用し、ソフトウェア開発をソフトウェア設計、システム開発、統合テスト、ドキュメントの 4 つの主要なリンクに分割します。 しかし、今回公開された「単一ノード」をすべてつなげてみると、FaceWall Intelligenceが実はもっと大きなゲームをしていることがわかります。 左手に大規模なモデル、右手に AI エージェントを持ち、インテリジェント エージェント ネットワーク(Internet of Agents、IoA)を構築したいと考えています。 Mianbi Intelligence の視点から見ると、インターネットからモノのインターネットへの移行を経験しており、次の方向はインテリジェンスのインターネットです。 インターネットが 2 次元の情報の接続であり、モノのインターネットが 3 次元空間の接続であるならば、インテリジェンスのインターネットは、より高次元のインテリジェントなエンティティの接続です。 インテリジェンスのインターネットでは、AI エージェントが最も重要な存在であるはずです。AI エージェントは、実際の人や物体の擬人化されたネイティブ エージェントまたはデジタル ツイン エージェントになることができます。 インテリジェントなエンティティを接続することで、AI は真に人類に貢献し、価値(生産性の向上、インタラクション方法の変化)を提供できます。 大胆な比喩を使うと、モノのインターネットの将来では、家庭内のテーブルや冷蔵庫でさえもインテリジェントな存在としての特性を持ち、人や他の物体とインテリジェントに対話できるようになります。 これがまさに、「壁向きの知性- あらゆるものを取り巻く知性」というビジョンの原点です。
しかし、正直に言うと、インテリジェント インターネットの理想は素晴らしいものの、ChatDev や第 3 世代の大型モデルのリリースでさえ、そのビジョンに向けた一歩としか見なせないのが現実です。 では、壁向きの知性は将来「万物の知性」を解き放つのに十分な力を持っているのでしょうか? |
2018年、国内の人工知能とビッグデータ産業は引き続き急速な発展を遂げ、国家計画の導入に伴い、各地...
1. 大規模マルチエージェント意思決定モデルの課題現実世界における多くの実際的な問題は、複数のエージ...
教育者、心理学者、親たちが、子どもがスクリーンを見る時間の長さについて議論する一方で、人工知能や機械...
AIGC には、がんの治療に役立つ可能性など、驚くべき用途を含め、多くの潜在的な用途があります。 M...
ここ数年、ドローンをめぐる革新は数多くありました。 いくつかの企業はすでに、荷物や食品の配達のほか、...
高度な新しい AI アルゴリズムを使用して複雑な問題を解決し、高い給料を得られるというのは魅力的に思...
ここ数年、Python は人工知能とデータサイエンスの分野で最も人気のあるプログラミング言語になりま...
ディープラーニングなどのエンドツーエンドのモデルの場合、トレーニングプロセスをどのように説明し理解す...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[323254]]ちょうど今、Facebook と AWS は PyTorch の 2 つのメジ...
[[411738]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
[[213294]]写真はインターネットからアルゴリズム関連人材の市場では、需要と供給の不均衡が深...
新しいプロジェクトは従業員に恐怖心を引き起こす可能性があり、変更が導入される全体的な文化は、その恐怖...