新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

移動ロボットは、人間が設計したタスクを完了するために、現実世界の環境を効果的にナビゲートし、周囲の人間やその他の障害物を回避できる必要があります。一般的に、ロボットは静止した物体を検出して回避するのは簡単ですが、人間を回避するには、人間の将来の動きを予測し、それに応じて計画を立てる必要があるため、より困難になる可能性があります。

カリフォルニア大学バークレー校の研究者らは最近、オフィス、自宅、美術館などの屋内環境で人間のためのロボットナビゲーション機能を強化できる新しいフレームワークを開発した。 arXiv で事前公開された論文で発表された彼らのモデルは、HumANav と呼ばれるフォトリアリスティックな画像のデータセットでトレーニングされました。

「我々は、学習ベースの知覚とモデルベースの最適制御を組み合わせた、人間の周囲を移動する新しい枠組みを提案する」と研究者らは論文に記している。

研究者らが開発した新しいフレームワークは LB-WayPtNav-DH と呼ばれ、認識、計画、制御モジュールという 3 つの主要コンポーネントで構成されています。認識モジュールは畳み込みニューラル ネットワーク (CNN) に基づいており、教師あり学習を使用してロボットの視覚入力をウェイポイント (つまり、次の望ましい状態) にマッピングするようにトレーニングされています。

CNN によってマップされたウェイポイントは、フレームワークの計画モジュールと制御モジュールに送られます。これら 2 つのモジュールを組み合わせることで、ロボットは周囲の障害物や人を回避しながら、安全に目標地点に移動できるようになります。

この図は、HumANav データセットに含まれる内容と、それが人を含む屋内環境のフォトリアリスティックなレンダリングをどのように可能にするかを示しています。画像出典: Tolani et al.

研究者らは、HumANavと呼ばれるデータセットに含まれる画像でCNNをトレーニングした。 HumANav には、SURREAL と呼ばれる別のデータセットから適応された、人間が動き回ることができるシミュレートされた建物環境のフォトリアリスティックなレンダリング画像が含まれています。これらの画像は、体型、性別、速度別に整理された、歩いている 6,000 人のテクスチャ付き人間メッシュを示しています。

「提案されたフレームワークは、将来の人間の動きを明示的に予測することなく、単眼RGB画像のみに基づいて人の動きを予測し、それに反応することを学習する」と研究者らは論文に記している。

研究者らは、シミュレーションと現実世界の両方で一連の実験を行い、LB-WayPtNav-DH を評価しました。実際の実験では、オープンソースソフトウェアを搭載した低価格の移動ロボット「Turtlebot 2」に適用しました。研究者らは、ロボットナビゲーションフレームワークは、シミュレートされた環境と現実世界の環境の両方で、目に見えない建物を効果的に回避できるほど十分に推測できると報告している。

画像クレジット: Varun Tolani MS

「我々の実験では、モデルベースの制御と学習を組み合わせると、純粋に学習ベースのアプローチに比べて、より優れた、よりデータ効率の高いナビゲーション動作につながることがわかった」と研究者らは論文に記している。

この新しいフレームワークは、最終的にはさまざまな移動ロボットに適用され、屋内環境でのナビゲーション機能を強化することができます。これまでのところ、彼らのアプローチはうまく機能することが証明されており、シミュレーションで開発されたポリシーを現実世界の設定に転送しています。

今後の研究では、研究者らはより複雑な環境や混雑した環境の画像でフレームワークを訓練することを計画している。さらに、編集したトレーニング データセットを拡張して、より多様な画像セットを含めたいと考えています。

<<:  AIは宇宙探査の商業化をどのように推進するのでしょうか?

>>:  AIインファナルアフェア!清華大学チームがAIセキュリティプラットフォームを立ち上げ、トップの顔認識アルゴリズムを欺き、脆弱性を修正

ブログ    
ブログ    

推薦する

初心者必読!畳み込みニューラルネットワークの始め方

畳み込みニューラル ネットワークは、ディープ ニューラル ネットワークの中で非常に人気のあるネットワ...

...

DeepSense: モバイルセンサーの時系列データを処理するためのディープラーニングフレームワーク

DeepSense は、エンドデバイス上で実行されるディープラーニング フレームワークです。ローカル...

...

金融ロボットの解読:毒ではなくアシスタント

[[231414]]会計、税務、監査などの業務でロボットが人間に取って代わったらどうなるか想像してみ...

AIを活用して産業データの価値を見出す

すべての業界に共通するものが 1 つあります。それは、大量のデータです。データ量は、個人用デバイス、...

3 つの質問、7 人の CXO、「自動運転」に関するブレインストーミング

[[442506]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

アルゴリズムの法則から法則のアルゴリズムへ、アルゴリズムの時代を巻き起こす

ビッグデータの出現、クラウド コンピューティング テクノロジーの成熟度の向上、ディープラーニング ア...

AirPodsは「あなたの脳を読む」ことができるのか?あるいは汗中の乳酸濃度も監視できるタイプ|ネイチャー

AirPods は脳の信号を監視できますか? !それともアルツハイマー病やパーキンソン病を予測できる...

非常に厳しい CPU 制約下でも正常に動作しますか? Java におけるさまざまな圧縮アルゴリズムのパフォーマンス比較

この記事では、一般的に使用されているいくつかの圧縮アルゴリズムのパフォーマンスを比較します。結果は、...

あなたの「読書」は他の人に読まれている。清華大学の研究者はWeChatの「Look」からこれらのパターンを発見した。

WeChatの「Take a Look」アプリの最もアクティブなユーザーは実は私たちの両親であり、...

APP はユーザーのプライバシーと顔認識生体認証情報を深く掘り下げ、「データ疫病」の到来に注意

315 Gala で摘発された企業は、業界内ではほんの少数派です。ユーザーのプライバシーを侵害するア...

新薬研究開発の方向性は?人工知能はどのように発展するのでしょうか?トップ科学者の意見

昨日は第4回世界トップ科学者フォーラムの2日目でした。世界トップの科学者たちがオンラインとオフライン...