清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い

清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い

人工知能の分野では、大規模なモデルを使用してインテリジェントエージェントを制御することは避けられない傾向です。インテリジェント エージェントは、大きなモデルに物理的な実体を与え、実際の物理世界を認識して対話する能力を持たせます。同時に、大規模モデルの助けを借りて、インテリジェントエージェントはより強力な認識、意思決定、実行能力を獲得し、より高い自律性と適応性を獲得することができます。この研究はロボット工学と自動化産業を活性化させ、より多くの雇用と経済成長を生み出す可能性があります。

このような状況において、Li Xuelong 氏のチームは、大規模モデル駆動型の異種インテリジェントエージェント協調制御アルゴリズムフレームワークを提案しました。このフレームワークは、大規模モデルを使用して複数のインテリジェントエージェントが自律的に協調するようにスケジュールし、「ロボットの可動化」を実現します。

提案されたフレームワークは、複雑なクロスシナリオおよびクロスエージェントタスクを、セマンティックタスク分析を通じて異種エージェントが共同で実行する複数のサブタスクに分割し、ドローンクラスター、ロボット犬、ロボットアームの共同制御を通じて指定されたタスクを完了することができます。高度なセマンティック理解機能、自己スキル認識機能、複雑なタスク実行機能を備えています。

何が考えられているかを理解し、何が行われているかを把握し、行われていることを実行することが、マルチエージェントコラボレーションを推進する大規模モデルの主な機能です。

あなたの考えを理解する:高度な意味理解能力

大規模モデルの意味理解能力を最大限に発揮し、ドローン、ロボット犬、ロボットアームなどの人工知能エージェントが入力自然言語に基づいて連携できるようにする方法は、インテリジェントエージェントが実際のシナリオで複雑なタスクを実行するための前提条件です。

この問題を解決するために、研究チームは国内の大規模モデルを意味理解の基盤として、ドローン群、ロボット犬、ロボットアームの3つの異種知能エージェントを協調制御プラットフォームとして使用しました。研究チームは、環境情報と自身の状態を統合するマルチモーダル大規模モデルインタラクションフレームワークを設計し、タスク理解、ハードウェア制御、調整と協力などの複雑な要件の意味分析を実現しました。

自分が何ができるかを知る:自分のスキルを認識する能力

インテリジェントエージェントの動作は、周囲の環境やエージェント自身の機械的構造などの制限要因によって簡単に影響を受けます。変化する外部環境においてインテリジェント エージェントが現在の行動能力を正確に認識できるようにする方法は、複数のインテリジェント エージェントのコラボレーションにおける重要なリンクです。

この目標を達成するために、チームは異種エージェント向けの汎用的な中レベルスキル認識アルゴリズムを提案し、異種エージェント クラスターのきめ細かい協調制御を実現しました。これに基づいて、インテリジェント エージェントは、自律的な環境認識、自己状態モデリング、および協調的な動作計画を通じて、複数のエージェントのスキル実行を適応的に調整します。

意図したとおりに行動する: 複雑なタスクを実行する能力

複雑なタスク目標を完了するには、異種エージェントのコラボレーションにより、サブタスク間の依存関係と環境制約に基づいて、安全で合理的​​なサブタスク実行順序と方法を設計する必要があります。

この問題に対処するために、チームは、タスク実行レベルで異種エージェント間の自律的なコラボレーションを可能にする、マルチエージェント閉ループフィードバックタスクコラボレーションメカニズムを設計しました。

複数のインテリジェント エージェント クラスターのコラボレーション中に、インテリジェント エージェントはサブタスクの実行ステータスをタスク セマンティック解析モジュールに報告し、タスクの割り当てと実行の動的な閉ループを形成し、タスクの目標によって導かれるインテリジェント エージェントの効率的なコラボレーションを実現します。

この成果は、大規模モデル アルゴリズムとインテリジェント エージェント ハードウェアの交差点に関する革新的な研究であり、これにより、複数のインテリジェント エージェント クラスターをより自然で直感的な方法で制御できるようになり、人間とコンピューターのインタラクションの敷居が低くなります。

同時に、この研究は異種インテリジェントエージェント間の連携の自律性と流暢性も促進し、災害救助や工業生産などの複雑なシナリオにおける人工知能の柔軟な応用にとって大きな意義を持ちます。

研究チーム

李雪龍教授のチームは主に地球近傍安全技術システムの人材育成、科学研究、エンジニアリングを行っており、「情報容量(情報とデータの比率)」と「正のインセンティブノイズ(パイ/πノイズ、有用なノイズ、ノイズを追加またはノイズを使用してタスクをより良くする)」という2つの理論に依存し、低高度セキュリティ、水中セキュリティ、クロスドメインセキュリティに焦点を当て、マルチモーダル認知コンピューティング、クロスドメインリモートセンシング、安定した検出、ウェーディング光学、グループインテリジェント意思決定、コヒーレント光検出などの技術革新を実施し、ハイレベルな人材の育成と国家の主要な戦略ニーズに役立っています。

<<:  OpenAI: ChatGPTはクローラープロトコルに準拠し、ウェブサイトは無料での使用を拒否できる

>>: 

ブログ    
ブログ    

推薦する

機械学習の成功事例5つ

IT リーダーが、人工知能と機械学習を使用してビジネス上の洞察を得る方法を共有します。組織が顧客の好...

Amazon Translateについて

Amazon Translate は、高速、高品質、手頃な価格の言語翻訳を提供するニューラル機械翻訳...

「初の顔認証事件」の最終判決がこちら

[[392244]] 4月9日午後3時、「初の顔認識事件」は杭州市中級人民法院で二審判決を受けた。こ...

フォーブスの分析:深刻な問題により自動運転技術は「寒い冬」を迎える可能性がある

フォーブスによると、コーエン研究所の研究者らは最近、テスラのオートパイロットシステムへのハッキングに...

銀行、金融、保険業界に革命をもたらす主要技術

不安定な市場環境、規制上のハードル、そしてBrexitは、好況時でも最も回復力のある企業にさえ課題を...

遠隔医療ロボットにはこれらの特性が求められる

科学技術の継続的な革新により、より多くの新しいインテリジェント製品が開発され、さまざまな業界で使用さ...

仕事とAIの未来

[[340645]] [51CTO.com クイック翻訳] 人工知能が雇用に与える影響は、現在、さま...

...

NLP ビッグモデルを時系列に適用するにはどうすればよいでしょうか? 5つの方法をまとめました!

最近、カリフォルニア大学は時系列の大規模言語モデルに関する研究のレビューを発表しました。この記事では...

...

敏捷性の秘密: iPCA ネットワーク パケット保存アルゴリズム

次世代ネットワークにおける「見える化」への欲求ネットワークが複雑になるにつれて、ネットワーク管理に対...

ソフトバンクの孫正義社長:AIの知能は10年以内に人間を超えると予想

ロイター通信は10月4日、ソフトバンクグループの創業者兼CEOの孫正義氏が本日、汎用人工知能(AGI...

...

AI ソフトウェアは教育分野にどのように役立つのでしょうか?

[[280714]]人工知能は世界に大きな影響を与えます。 2025年までに、AIソフトウェアの総...