メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

メタ研究者が新たなAIの試み:地図や訓練なしでロボットに物理的なナビゲーションを教える

Meta Platformsの人工知能部門は最近、少量のトレーニングデータのサポートにより、AIモデルに物理的な世界での歩行を学習する方法を教えており、急速な進歩を遂げていると述べた。

この研究により、AI モデルが視覚ナビゲーション機能を習得するのにかかる時間が大幅に短縮されます。これまで、このような目標を達成するには、大規模なデータセットと「強化学習」の繰り返しの使用が必要でした。

Meta AI の研究者たちは、AI 視覚ナビゲーションのこの研究は仮想世界に大きな影響を与えるだろうと述べています。このプロジェクトの基本的な考え方は複雑ではありません。単純に観察と探索を通じて、AIが人間のように物理空間内を移動できるように支援することです。

Meta AI は次のように説明しています。「たとえば、AR グラスを使って鍵を探す場合、AI が見慣れない、常に変化する環境レイアウトを理解できるようにする方法を見つけなければなりません。結局のところ、これは非常に詳細で小さな要件であり、多くのコンピューティング リソースを消費する高精度のプリセット マップに常に頼ることは不可能です。人間は、衝突することなく簡単に角を曲がるために、コーヒー テーブルの正確な位置や長さを知る必要はありません。」

この目的のために、Meta は「具現化された AI」、つまり 3D シミュレーションのインタラクティブなメカニズムを通じて AI システムをトレーニングすることに重点を置くことにしました。この分野では、Meta 社は地図や GPS センサーなしで新しい環境をナビゲートできる有望な「ポイント ターゲット ナビゲーション モデル」を構築したと述べています。

このモデルは、視覚測定学と呼ばれる技術を使用しており、これにより AI は視覚入力に基づいて現在の位置を追跡できます。 Meta は、このデータ拡張技術により、手動でデータを注釈付けする必要なく、効果的なニューラル モデルを迅速にトレーニングできると述べています。 Meta 社はまた、独自の Habitat 2.0 具現化 AI トレーニング プラットフォーム (Realistic PointNav ベンチマーク タスクを使用して仮想空間シミュレーションを実行) でのテストを 94% の成功率で完了したと述べました。

メタ氏は、「私たちの方法はまだデータセット内のすべてのシナリオを完全に解決したわけではありませんが、この研究は、現実世界の環境をナビゲートする能力を実現するために必ずしも明示的なマッピングが必要ではないことを最初に実証しました」と説明した。

地図に頼らずに AI ナビゲーション トレーニングをさらに改善するために、Meta は Habitat-Web と呼ばれるトレーニング データセットを作成しました。このデータセットには、人間が実証した 10 万を超えるさまざまなオブジェクト ターゲット ナビゲーション メソッドが含まれています。 Amazon.com の Mechanical Turk サービスには、Web ブラウザ上で実行される Habitat シミュレーターを通じてアクセスでき、ユーザーは仮想ロボットをリモートで安全に操作できます。メタ氏は、得られたデータはAIエージェントが「最先端の結果」を達成するのに役立つトレーニング教材として役立つだろうと述べた。部屋をスキャンして全体的な空間特性を把握したり、角に障害物がないか確認したりすることは、すべて AI が人間から学ぶことができる効率的な物体検索動作です。

さらに、Meta AI チームは、独自の「ゼロサンプル体験学習フレームワーク」を通じて、ロボットがさまざまなセマンティックナビゲーションタスクとターゲットパターンを一般化できるようにする、いわゆる「プラグアンドプレイ」モジュールアプローチを開発しました。このようにして、AI エージェントは、リソースを大量に消費するマップやトレーニングなしで基本的なナビゲーション スキルを習得し、追加の調整なしで 3D 環境でさまざまなタスクを実行できるようになります。

Meta は、これらのエージェントがトレーニング中に画像オブジェクトを継続的に検索すると説明しています。環境内のランダムな場所で撮影された写真を受け取り、自律ナビゲーションを使用してその写真を探します。 Metaの研究者は、「私たちの方法はトレーニングデータを1/12.5に削減し、最先端の転移学習技術よりも成功率が14%高くなります」と述べています。

コンステレーション・リサーチのアナリスト、ホルガー・ミューラー氏はインタビューで、Metaの最新の進歩が同社のメタバース開発計画において重要な役割を果たすことが期待されると語った。彼は、将来仮想世界が標準になるとすれば、AI はこの新しい空間を理解できなければならず、理解にかかるコストは高すぎてはならないと考えています。

ミュラー氏はさらに、「AI の物理世界を理解する能力は、ソフトウェアベースのアプローチによって拡張される必要があります。Meta はこの道を歩み、具現化された AI の進歩を遂げ、トレーニングなしで周囲を理解できるソフトウェアを開発しています。この取り組みの早期の実際の応用を見るのが楽しみです」と付け加えました。

これらの実際の使用例は、そう遠くない将来に実現するかもしれません。 Meta 氏は、次のステップは、これらの進歩をナビゲーションからモバイル操作にまで進め、特定のタスク (財布を識別して所有者に返却するなど) を実行できる AI エージェントを開発することだと述べています。

<<:  Transformer 機械学習モデルとは何ですか?

>>:  5G悪報セキュリティ管理プラットフォームにおけるディープラーニングに基づくテキスト感情認識技術の応用

推薦する

高度な数学に希望があります!ニューラルネットワークは1秒未満で偏微分方程式を解く

タスクの数が増えるにつれて、現在の計算方法を使用して汎用の日常的なロボットを構築するコストは法外なも...

AIはあなたの建物をスマートで健康的な建物にします

すぐにスマートで健康的な建物で仕事に戻り、スマートフォンのアプリを使ってハンズフリーでドアを開けるこ...

AI は製造業と産業用 IoT をどのように変えるのでしょうか?

Business Insider によると、製造業ではモノのインターネット (IoT) と AI ...

人工知能と機械学習の違いとその重要性を区別する必要がある

人工知能と機械学習の技術は世界に革命をもたらし、世界をより先進的なものにしていますが、この 2 つの...

...

...

2021年第1四半期のロボット産業の新製品在庫

2021 年の最初の 3 か月間にロボット業界ではどのような新製品が登場しましたか? [[38857...

AIoTは単なる発言ではない

みなさんこんにちは。今日はAIoTについてお話します。 AIoT、つまり AI + IoT は、人工...

将来、人間に取って代わるのはAIではなく、AIのスキルを習得した人間です。

[[264419]] 「機械学習」「ディープラーニング」「ニューラルネットワーク」に関する高度な技...

Googleの人工知能部門DeepMindが想像力を駆使した新システムを開発

北京時間8月19日のreadwriteによると、2014年にGoogleに買収された英国の人工知能企...

サイバー犯罪者が機械学習を利用する 7 つの方法: 対抗策

[51CTO.com クイック翻訳] イスラエルのベングリオン国際空港は、世界で最も安全な空港の一つ...

ヒントン氏の「AIは常識を持つ」という予測は、どうすれば実現できるのか?ケンブリッジ大学の最新研究:子犬から学ぶ

常識は常に AI の開発を悩ませてきた難しいパズルでした。たとえ AI が囲碁で人間に勝ったとしても...

...

大規模モデル: 大規模モデルの難しさは何ですか?

みなさんこんにちは。私の名前はティムです。 GPT モデルの誕生以来、そのパラメータスケールは継続的...

機械学習は株式市場を正確に予測できるのでしょうか?

株式市場が始まって以来、人々はシステムを悪用し、市場に勝とうとしてきました。長年にわたり、人々は何千...