清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い

清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い

人工知能の分野では、大規模なモデルを使用してインテリジェントエージェントを制御することは避けられない傾向です。インテリジェント エージェントは、大きなモデルに物理的な実体を与え、実際の物理世界を認識して対話する能力を持たせます。同時に、大規模モデルの助けを借りて、インテリジェントエージェントはより強力な認識、意思決定、実行能力を獲得し、より高い自律性と適応性を獲得することができます。この研究はロボット工学と自動化産業を活性化させ、より多くの雇用と経済成長を生み出す可能性があります。

このような状況において、Li Xuelong 氏のチームは、大規模モデル駆動型の異種インテリジェントエージェント協調制御アルゴリズムフレームワークを提案しました。このフレームワークは、大規模モデルを使用して複数のインテリジェントエージェントが自律的に協調するようにスケジュールし、「ロボットの可動化」を実現します。

提案されたフレームワークは、複雑なクロスシナリオおよびクロスエージェントタスクを、セマンティックタスク分析を通じて異種エージェントが共同で実行する複数のサブタスクに分割し、ドローンクラスター、ロボット犬、ロボットアームの共同制御を通じて指定されたタスクを完了することができます。高度なセマンティック理解機能、自己スキル認識機能、複雑なタスク実行機能を備えています。

何が考えられているかを理解し、何が行われているかを把握し、行われていることを実行することが、マルチエージェントコラボレーションを推進する大規模モデルの主な機能です。

あなたの考えを理解する:高度な意味理解能力

大規模モデルの意味理解能力を最大限に発揮し、ドローン、ロボット犬、ロボットアームなどの人工知能エージェントが入力自然言語に基づいて連携できるようにする方法は、インテリジェントエージェントが実際のシナリオで複雑なタスクを実行するための前提条件です。

この問題を解決するために、研究チームは国内の大規模モデルを意味理解の基盤として、ドローン群、ロボット犬、ロボットアームの3つの異種知能エージェントを協調制御プラットフォームとして使用しました。研究チームは、環境情報と自身の状態を統合するマルチモーダル大規模モデルインタラクションフレームワークを設計し、タスク理解、ハードウェア制御、調整と協力などの複雑な要件の意味分析を実現しました。

自分が何ができるかを知る:自分のスキルを認識する能力

インテリジェントエージェントの動作は、周囲の環境やエージェント自身の機械的構造などの制限要因によって簡単に影響を受けます。変化する外部環境においてインテリジェント エージェントが現在の行動能力を正確に認識できるようにする方法は、複数のインテリジェント エージェントのコラボレーションにおける重要なリンクです。

この目標を達成するために、チームは異種エージェント向けの汎用的な中レベルスキル認識アルゴリズムを提案し、異種エージェント クラスターのきめ細かい協調制御を実現しました。これに基づいて、インテリジェント エージェントは、自律的な環境認識、自己状態モデリング、および協調的な動作計画を通じて、複数のエージェントのスキル実行を適応的に調整します。

意図したとおりに行動する: 複雑なタスクを実行する能力

複雑なタスク目標を完了するには、異種エージェントのコラボレーションにより、サブタスク間の依存関係と環境制約に基づいて、安全で合理的​​なサブタスク実行順序と方法を設計する必要があります。

この問題に対処するために、チームは、タスク実行レベルで異種エージェント間の自律的なコラボレーションを可能にする、マルチエージェント閉ループフィードバックタスクコラボレーションメカニズムを設計しました。

複数のインテリジェント エージェント クラスターのコラボレーション中に、インテリジェント エージェントはサブタスクの実行ステータスをタスク セマンティック解析モジュールに報告し、タスクの割り当てと実行の動的な閉ループを形成し、タスクの目標によって導かれるインテリジェント エージェントの効率的なコラボレーションを実現します。

この成果は、大規模モデル アルゴリズムとインテリジェント エージェント ハードウェアの交差点に関する革新的な研究であり、これにより、複数のインテリジェント エージェント クラスターをより自然で直感的な方法で制御できるようになり、人間とコンピューターのインタラクションの敷居が低くなります。

同時に、この研究は異種インテリジェントエージェント間の連携の自律性と流暢性も促進し、災害救助や工業生産などの複雑なシナリオにおける人工知能の柔軟な応用にとって大きな意義を持ちます。

研究チーム

李雪龍教授のチームは主に地球近傍安全技術システムの人材育成、科学研究、エンジニアリングを行っており、「情報容量(情報とデータの比率)」と「正のインセンティブノイズ(パイ/πノイズ、有用なノイズ、ノイズを追加またはノイズを使用してタスクをより良くする)」という2つの理論に依存し、低高度セキュリティ、水中セキュリティ、クロスドメインセキュリティに焦点を当て、マルチモーダル認知コンピューティング、クロスドメインリモートセンシング、安定した検出、ウェーディング光学、グループインテリジェント意思決定、コヒーレント光検出などの技術革新を実施し、ハイレベルな人材の育成と国家の主要な戦略ニーズに役立っています。

<<:  OpenAI: ChatGPTはクローラープロトコルに準拠し、ウェブサイトは無料での使用を拒否できる

>>: 

ブログ    

推薦する

モデル量子化とエッジAIがインタラクションを定義する方法

AI とエッジ コンピューティングの融合により、多くの業界が変革されるでしょう。移植性を向上させ、モ...

OpenAI が GPT-4 やその他のモデルを更新し、新しい API 関数呼び出しを追加し、価格を最大 75% 引き下げ

数日前、OpenAIのCEOサム・アルトマン氏は世界ツアーのスピーチで、OpenAIの最近の開発ルー...

人工知能は産業の発展を促進し、産業構造のアップグレードを加速する

トップレベルの設計を継続的に改善し、コンピュータービジョン、音声認識、機械学習、ナレッジグラフなどの...

AI モデルのデータセンターのエネルギー消費を効果的に削減するにはどうすればよいでしょうか?

人工知能をより良くするための競争において、MIT リンカーン研究所は、電力消費の削減、効率的なトレー...

人工知能の新たなブレークスルー:ニューラルネットワークが画像内の物体を自律的に識別できる

海外メディアの報道によると、フィンランドのコンピューター科学者は神経生物学的手法を用いて人工知能研究...

イメージフリーの認識がさらに一歩前進! ScalableMap: 大規模高精度地図に向けた新しいソリューション!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

有名人の「ペイント肌」顔変更技術を悪用したいたずら合成AI動画の調査

[[265249]]新華社、上海、5月13日。AI技術の発展により、動画の顔を変える技術的ハードルが...

アナーキストとの対話: ノーム・チョムスキーが語るディープラーニングの未来

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

暗号通貨ボットで利益を上げる方法: トレーディングボットの説明

暗号通貨は、その極端な変動性で知られています。市場の価格は非常に急速に変動するため、トレーダーが市場...

大国同士が競争する中、なぜ彼らは人工知能で優位に立とうとするのでしょうか?

不確実性が人間関係を形作ります。感染症は、かつては直線的でスムーズで予測可能だった社会を予期せぬ形で...

...

新型コロナウイルスが猛威を振るう中、AI技術は流れを変えることができるのか?

最近、謎の新型コロナウイルスが驚くべき速さで猛威を振るっています。先週木曜日、世界保健機関(WHO)...

RPAとAIの違いを理解する

CIO は自動化と AI の導入を加速し、これらのテクノロジーが提供するスピードとコスト削減の利点を...

効率が1200倍にアップ! MIT、医薬品製造向けの新たなAIモデルを開発

海外メディアTech Xploreによると、MITの研究者らは最近、新しいタンパク質分子の構造を事前...