清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い

清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い

人工知能の分野では、大規模なモデルを使用してインテリジェントエージェントを制御することは避けられない傾向です。インテリジェント エージェントは、大きなモデルに物理的な実体を与え、実際の物理世界を認識して対話する能力を持たせます。同時に、大規模モデルの助けを借りて、インテリジェントエージェントはより強力な認識、意思決定、実行能力を獲得し、より高い自律性と適応性を獲得することができます。この研究はロボット工学と自動化産業を活性化させ、より多くの雇用と経済成長を生み出す可能性があります。

このような状況において、Li Xuelong 氏のチームは、大規模モデル駆動型の異種インテリジェントエージェント協調制御アルゴリズムフレームワークを提案しました。このフレームワークは、大規模モデルを使用して複数のインテリジェントエージェントが自律的に協調するようにスケジュールし、「ロボットの可動化」を実現します。

提案されたフレームワークは、複雑なクロスシナリオおよびクロスエージェントタスクを、セマンティックタスク分析を通じて異種エージェントが共同で実行する複数のサブタスクに分割し、ドローンクラスター、ロボット犬、ロボットアームの共同制御を通じて指定されたタスクを完了することができます。高度なセマンティック理解機能、自己スキル認識機能、複雑なタスク実行機能を備えています。

何が考えられているかを理解し、何が行われているかを把握し、行われていることを実行することが、マルチエージェントコラボレーションを推進する大規模モデルの主な機能です。

あなたの考えを理解する:高度な意味理解能力

大規模モデルの意味理解能力を最大限に発揮し、ドローン、ロボット犬、ロボットアームなどの人工知能エージェントが入力自然言語に基づいて連携できるようにする方法は、インテリジェントエージェントが実際のシナリオで複雑なタスクを実行するための前提条件です。

この問題を解決するために、研究チームは国内の大規模モデルを意味理解の基盤として、ドローン群、ロボット犬、ロボットアームの3つの異種知能エージェントを協調制御プラットフォームとして使用しました。研究チームは、環境情報と自身の状態を統合するマルチモーダル大規模モデルインタラクションフレームワークを設計し、タスク理解、ハードウェア制御、調整と協力などの複雑な要件の意味分析を実現しました。

自分が何ができるかを知る:自分のスキルを認識する能力

インテリジェントエージェントの動作は、周囲の環境やエージェント自身の機械的構造などの制限要因によって簡単に影響を受けます。変化する外部環境においてインテリジェント エージェントが現在の行動能力を正確に認識できるようにする方法は、複数のインテリジェント エージェントのコラボレーションにおける重要なリンクです。

この目標を達成するために、チームは異種エージェント向けの汎用的な中レベルスキル認識アルゴリズムを提案し、異種エージェント クラスターのきめ細かい協調制御を実現しました。これに基づいて、インテリジェント エージェントは、自律的な環境認識、自己状態モデリング、および協調的な動作計画を通じて、複数のエージェントのスキル実行を適応的に調整します。

意図したとおりに行動する: 複雑なタスクを実行する能力

複雑なタスク目標を完了するには、異種エージェントのコラボレーションにより、サブタスク間の依存関係と環境制約に基づいて、安全で合理的​​なサブタスク実行順序と方法を設計する必要があります。

この問題に対処するために、チームは、タスク実行レベルで異種エージェント間の自律的なコラボレーションを可能にする、マルチエージェント閉ループフィードバックタスクコラボレーションメカニズムを設計しました。

複数のインテリジェント エージェント クラスターのコラボレーション中に、インテリジェント エージェントはサブタスクの実行ステータスをタスク セマンティック解析モジュールに報告し、タスクの割り当てと実行の動的な閉ループを形成し、タスクの目標によって導かれるインテリジェント エージェントの効率的なコラボレーションを実現します。

この成果は、大規模モデル アルゴリズムとインテリジェント エージェント ハードウェアの交差点に関する革新的な研究であり、これにより、複数のインテリジェント エージェント クラスターをより自然で直感的な方法で制御できるようになり、人間とコンピューターのインタラクションの敷居が低くなります。

同時に、この研究は異種インテリジェントエージェント間の連携の自律性と流暢性も促進し、災害救助や工業生産などの複雑なシナリオにおける人工知能の柔軟な応用にとって大きな意義を持ちます。

研究チーム

李雪龍教授のチームは主に地球近傍安全技術システムの人材育成、科学研究、エンジニアリングを行っており、「情報容量(情報とデータの比率)」と「正のインセンティブノイズ(パイ/πノイズ、有用なノイズ、ノイズを追加またはノイズを使用してタスクをより良くする)」という2つの理論に依存し、低高度セキュリティ、水中セキュリティ、クロスドメインセキュリティに焦点を当て、マルチモーダル認知コンピューティング、クロスドメインリモートセンシング、安定した検出、ウェーディング光学、グループインテリジェント意思決定、コヒーレント光検出などの技術革新を実施し、ハイレベルな人材の育成と国家の主要な戦略ニーズに役立っています。

<<:  OpenAI: ChatGPTはクローラープロトコルに準拠し、ウェブサイトは無料での使用を拒否できる

>>: 

推薦する

中国のLMM体格に適したベンチマークであるCMMMUがここにあります:30以上のサブ分野、12Kの専門家レベルの質問

近年、大規模マルチモーダルモデル (LMM) の機能が向上したため、LMM のパフォーマンスを評価す...

人工知能の実用化を加速させるには

人工知能と機械学習ソリューションは、今日、さまざまな業界の組織で一般的になりつつあります。組織が A...

Jupyter のアップグレード: さまざまな大規模モデルを接続し、コードを生成し、チャットを通じてエラーを修正できます

これで、大規模言語モデル (LLM) が Jupyter に接続されました。これは主に、Projec...

自動運転で冬季オリンピックはよりスマートに

[[438829]]発進時に左ウィンカーを出し、歩行者がいる場合はスピードを落として迂回し、障害物が...

...

美団点評におけるディープラーニングの応用

序文近年、ディープラーニングは音声、画像、自然言語処理などの分野で優れた成果を上げており、最も注目さ...

...

顔認識はどのようにして国民の個人情報を侵害するのでしょうか?犯罪者がアリペイを騙し取るために3D顔モデルを作成

[[360029]]記者 | 趙孟近年、顔認識技術の普及に伴い、国民の個人情報のセキュリティに関する...

「AI+教育」は偽のトリックか本物のスキルか?本質は依然としてAIの能力のテスト

近年、教育業界の資金のほとんどは「AI+教育」を追い求めています。現在、「AI+教育」分野では、さま...

匿名の論文が驚くべきアイデアを提案!大規模なモデルと長いテキストの能力を強化する

大規模モデルで長いテキストを処理する能力を向上させる場合、長さの外挿やコンテキスト ウィンドウの拡張...

...

顔認識の法的境界と刑法適用の限界

[[413292]]顧客に顔のスキャンを義務付けることができるかどうかという議論を引き起こした最初の...

中国の大学の人工知能専攻ランキング:清華大学、浙江大学、上海交通大学がトップ3にランクイン

AIの開発が国家戦略にまで上り詰めるにつれ、人工知能は大学入試の選択肢の中でも最も注目され、最も人気...

...

あなたのビジネスに必要な AI 処理ユニットはどれですか?

データセンターに AI を導入することを検討している場合は、まず投資すべきハードウェアとインフラスト...