清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い

人工知能の分野では、大規模なモデルを使用してインテリジェントエージェントを制御することは避けられない傾向です。インテリジェントエージェントは、大きなモデルに物理的な実体を与え、実際の物理世界を認識して対話する能力を持たせます。同時に、大規模モデルの助けを借りて、インテリジェントエージェントはより強力な認識、意思決定、実行能力を獲得し、より高い自律性と適応性を獲得することができます。この研究はロボット工学と自動化産業を活性化させ、より多くの雇用と経済成長を生み出す可能性があります。

このような状況において、Li Xuelong 氏のチームは、大規模モデル駆動型の異種インテリジェントエージェント協調制御アルゴリズムフレームワークを提案しました。このフレームワークは、大規模モデルを使用して複数のインテリジェントエージェントが自律的に協調するようにスケジュールし、「ロボットの可動化」を実現します。

提案されたフレームワークは、複雑なクロスシナリオおよびクロスエージェントタスクを、セマンティックタスク分析を通じて異種エージェントが共同で実行する複数のサブタスクに分割し、ドローンクラスター、ロボット犬、ロボットアームの共同制御を通じて指定されたタスクを完了することができます。高度なセマンティック理解機能、自己スキル認識機能、複雑なタスク実行機能を備えています。

何が考えられているかを理解し、何が行われているかを把握し、行われていることを実行することが、マルチエージェントコラボレーションを推進する大規模モデルの主な機能です。

あなたの考えを理解する：高度な意味理解能力

大規模モデルの意味理解能力を最大限に発揮し、ドローン、ロボット犬、ロボットアームなどの人工知能エージェントが入力自然言語に基づいて連携できるようにする方法は、インテリジェントエージェントが実際のシナリオで複雑なタスクを実行するための前提条件です。

この問題を解決するために、研究チームは国内の大規模モデルを意味理解の基盤として、ドローン群、ロボット犬、ロボットアームの3つの異種知能エージェントを協調制御プラットフォームとして使用しました。研究チームは、環境情報と自身の状態を統合するマルチモーダル大規模モデルインタラクションフレームワークを設計し、タスク理解、ハードウェア制御、調整と協力などの複雑な要件の意味分析を実現しました。

自分が何ができるかを知る：自分のスキルを認識する能力

インテリジェントエージェントの動作は、周囲の環境やエージェント自身の機械的構造などの制限要因によって簡単に影響を受けます。変化する外部環境においてインテリジェントエージェントが現在の行動能力を正確に認識できるようにする方法は、複数のインテリジェントエージェントのコラボレーションにおける重要なリンクです。

この目標を達成するために、チームは異種エージェント向けの汎用的な中レベルスキル認識アルゴリズムを提案し、異種エージェントクラスターのきめ細かい協調制御を実現しました。これに基づいて、インテリジェントエージェントは、自律的な環境認識、自己状態モデリング、および協調的な動作計画を通じて、複数のエージェントのスキル実行を適応的に調整します。

意図したとおりに行動する: 複雑なタスクを実行する能力

複雑なタスク目標を完了するには、異種エージェントのコラボレーションにより、サブタスク間の依存関係と環境制約に基づいて、安全で合理的なサブタスク実行順序と方法を設計する必要があります。

この問題に対処するために、チームは、タスク実行レベルで異種エージェント間の自律的なコラボレーションを可能にする、マルチエージェント閉ループフィードバックタスクコラボレーションメカニズムを設計しました。

複数のインテリジェントエージェントクラスターのコラボレーション中に、インテリジェントエージェントはサブタスクの実行ステータスをタスクセマンティック解析モジュールに報告し、タスクの割り当てと実行の動的な閉ループを形成し、タスクの目標によって導かれるインテリジェントエージェントの効率的なコラボレーションを実現します。

この成果は、大規模モデルアルゴリズムとインテリジェントエージェントハードウェアの交差点に関する革新的な研究であり、これにより、複数のインテリジェントエージェントクラスターをより自然で直感的な方法で制御できるようになり、人間とコンピューターのインタラクションの敷居が低くなります。

同時に、この研究は異種インテリジェントエージェント間の連携の自律性と流暢性も促進し、災害救助や工業生産などの複雑なシナリオにおける人工知能の柔軟な応用にとって大きな意義を持ちます。

研究チーム

李雪龍教授のチームは主に地球近傍安全技術システムの人材育成、科学研究、エンジニアリングを行っており、「情報容量（情報とデータの比率）」と「正のインセンティブノイズ（パイ/πノイズ、有用なノイズ、ノイズを追加またはノイズを使用してタスクをより良くする）」という2つの理論に依存し、低高度セキュリティ、水中セキュリティ、クロスドメインセキュリティに焦点を当て、マルチモーダル認知コンピューティング、クロスドメインリモートセンシング、安定した検出、ウェーディング光学、グループインテリジェント意思決定、コヒーレント光検出などの技術革新を実施し、ハイレベルな人材の育成と国家の主要な戦略ニーズに役立っています。

<<: OpenAI: ChatGPTはクローラープロトコルに準拠し、ウェブサイトは無料での使用を拒否できる

>>: