新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

移動ロボットは、人間が設計したタスクを完了するために、現実世界の環境を効果的にナビゲートし、周囲の人間やその他の障害物を回避できる必要があります。一般的に、ロボットは静止した物体を検出して回避するのは簡単ですが、人間を回避するには、人間の将来の動きを予測し、それに応じて計画を立てる必要があるため、より困難になる可能性があります。

カリフォルニア大学バークレー校の研究者らは最近、オフィス、自宅、美術館などの屋内環境で人間のためのロボットナビゲーション機能を強化できる新しいフレームワークを開発した。 arXiv で事前公開された論文で発表された彼らのモデルは、HumANav と呼ばれるフォトリアリスティックな画像のデータセットでトレーニングされました。

「我々は、学習ベースの知覚とモデルベースの最適制御を組み合わせた、人間の周囲を移動する新しい枠組みを提案する」と研究者らは論文に記している。

研究者らが開発した新しいフレームワークは LB-WayPtNav-DH と呼ばれ、認識、計画、制御モジュールという 3 つの主要コンポーネントで構成されています。認識モジュールは畳み込みニューラル ネットワーク (CNN) に基づいており、教師あり学習を使用してロボットの視覚入力をウェイポイント (つまり、次の望ましい状態) にマッピングするようにトレーニングされています。

CNN によってマップされたウェイポイントは、フレームワークの計画モジュールと制御モジュールに送られます。これら 2 つのモジュールを組み合わせることで、ロボットは周囲の障害物や人を回避しながら、安全に目標地点に移動できるようになります。

この図は、HumANav データセットに含まれる内容と、それが人を含む屋内環境のフォトリアリスティックなレンダリングをどのように可能にするかを示しています。画像出典: Tolani et al.

研究者らは、HumANavと呼ばれるデータセットに含まれる画像でCNNをトレーニングした。 HumANav には、SURREAL と呼ばれる別のデータセットから適応された、人間が動き回ることができるシミュレートされた建物環境のフォトリアリスティックなレンダリング画像が含まれています。これらの画像は、体型、性別、速度別に整理された、歩いている 6,000 人のテクスチャ付き人間メッシュを示しています。

「提案されたフレームワークは、将来の人間の動きを明示的に予測することなく、単眼RGB画像のみに基づいて人の動きを予測し、それに反応することを学習する」と研究者らは論文に記している。

研究者らは、シミュレーションと現実世界の両方で一連の実験を行い、LB-WayPtNav-DH を評価しました。実際の実験では、オープンソースソフトウェアを搭載した低価格の移動ロボット「Turtlebot 2」に適用しました。研究者らは、ロボットナビゲーションフレームワークは、シミュレートされた環境と現実世界の環境の両方で、目に見えない建物を効果的に回避できるほど十分に推測できると報告している。

画像クレジット: Varun Tolani MS

「我々の実験では、モデルベースの制御と学習を組み合わせると、純粋に学習ベースのアプローチに比べて、より優れた、よりデータ効率の高いナビゲーション動作につながることがわかった」と研究者らは論文に記している。

この新しいフレームワークは、最終的にはさまざまな移動ロボットに適用され、屋内環境でのナビゲーション機能を強化することができます。これまでのところ、彼らのアプローチはうまく機能することが証明されており、シミュレーションで開発されたポリシーを現実世界の設定に転送しています。

今後の研究では、研究者らはより複雑な環境や混雑した環境の画像でフレームワークを訓練することを計画している。さらに、編集したトレーニング データセットを拡張して、より多様な画像セットを含めたいと考えています。

<<:  AIは宇宙探査の商業化をどのように推進するのでしょうか?

>>:  AIインファナルアフェア!清華大学チームがAIセキュリティプラットフォームを立ち上げ、トップの顔認識アルゴリズムを欺き、脆弱性を修正

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

AIの成功には適切なデータアーキテクチャが必要

人工知能 (AI) を習得したいと考えている企業にとって、AI はコストを節約し、競争上の優位性を獲...

GPT-4 に匹敵するオープンソース モデルがリークされました。ミストラルのボスが確認: 正式版はさらに強力になる

ミストラル・ミディアムが誤って漏洩した?以前は API 経由でのみ利用可能でしたが、そのパフォーマン...

変革のトレンド: ジェネレーティブ AI とソフトウェア開発への影響

人工知能の出現により、ソフトウェア開発の継続的な発展が加速しています。この強力なテクノロジーは、ソフ...

機械学習とデータサイエンスに関する必読の無料オンライン電子書籍 10 冊

KDnuggets 編集者の Matthew Mayo が、機械学習とデータ サイエンスに関連する書...

6月にはロボット産業が再び活況を呈し、数十億元の資金調達が相次いだ。

科学技術の継続的な発展により、ロボットは業界でますます注目され、支持されるようになっています。ロボッ...

機械学習と従来のプログラミングの違いについて話す

[[264779]] AI と ML は誇張されすぎていて、if 文を書いたりプログラミングに関係す...

Googleが4月22日に発表したアルゴリズム改善策の分析

Google の中国ウェブマスター ブログにログインすると、4 月 22 日の午後に更新された「品質...

学者がインテリジェンス、モデルとデータAI、デジタルトランスフォーメーションについて語る。このAIイベントには技術的な内容が含まれている。

2022年、学者たちは人工知能の将来の発展をどのように見ているのでしょうか?将来、AI はモデル駆...

人工知能は消費者部門で何をもたらしましたか?

最近、北京にショッピングモールがオープンした。オープン当日、客を出迎えたのは「人」ではなく「ロボット...

...

AIは人間を失業させるのか? ジャック・マーとポニー・マーはそうは思わない

[[212627]] 【今後30年間、インターネットをうまく活用した企業は驚異的な発展を遂げるでしょ...

高性能な MongoDB データ移行ツールの構築: Java 開発の実践

ビッグデータ時代の到来により、データ移行は多くの企業や組織が直面しなければならない課題の 1 つにな...

TensorFlow2020: Tensorflow.js を使用してコンピューター ビジョン アプリケーションを実行する方法は?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

...