新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

移動ロボットは、人間が設計したタスクを完了するために、現実世界の環境を効果的にナビゲートし、周囲の人間やその他の障害物を回避できる必要があります。一般的に、ロボットは静止した物体を検出して回避するのは簡単ですが、人間を回避するには、人間の将来の動きを予測し、それに応じて計画を立てる必要があるため、より困難になる可能性があります。

カリフォルニア大学バークレー校の研究者らは最近、オフィス、自宅、美術館などの屋内環境で人間のためのロボットナビゲーション機能を強化できる新しいフレームワークを開発した。 arXiv で事前公開された論文で発表された彼らのモデルは、HumANav と呼ばれるフォトリアリスティックな画像のデータセットでトレーニングされました。

「我々は、学習ベースの知覚とモデルベースの最適制御を組み合わせた、人間の周囲を移動する新しい枠組みを提案する」と研究者らは論文に記している。

研究者らが開発した新しいフレームワークは LB-WayPtNav-DH と呼ばれ、認識、計画、制御モジュールという 3 つの主要コンポーネントで構成されています。認識モジュールは畳み込みニューラル ネットワーク (CNN) に基づいており、教師あり学習を使用してロボットの視覚入力をウェイポイント (つまり、次の望ましい状態) にマッピングするようにトレーニングされています。

CNN によってマップされたウェイポイントは、フレームワークの計画モジュールと制御モジュールに送られます。これら 2 つのモジュールを組み合わせることで、ロボットは周囲の障害物や人を回避しながら、安全に目標地点に移動できるようになります。

この図は、HumANav データセットに含まれる内容と、それが人を含む屋内環境のフォトリアリスティックなレンダリングをどのように可能にするかを示しています。画像出典: Tolani et al.

研究者らは、HumANavと呼ばれるデータセットに含まれる画像でCNNをトレーニングした。 HumANav には、SURREAL と呼ばれる別のデータセットから適応された、人間が動き回ることができるシミュレートされた建物環境のフォトリアリスティックなレンダリング画像が含まれています。これらの画像は、体型、性別、速度別に整理された、歩いている 6,000 人のテクスチャ付き人間メッシュを示しています。

「提案されたフレームワークは、将来の人間の動きを明示的に予測することなく、単眼RGB画像のみに基づいて人の動きを予測し、それに反応することを学習する」と研究者らは論文に記している。

研究者らは、シミュレーションと現実世界の両方で一連の実験を行い、LB-WayPtNav-DH を評価しました。実際の実験では、オープンソースソフトウェアを搭載した低価格の移動ロボット「Turtlebot 2」に適用しました。研究者らは、ロボットナビゲーションフレームワークは、シミュレートされた環境と現実世界の環境の両方で、目に見えない建物を効果的に回避できるほど十分に推測できると報告している。

画像クレジット: Varun Tolani MS

「我々の実験では、モデルベースの制御と学習を組み合わせると、純粋に学習ベースのアプローチに比べて、より優れた、よりデータ効率の高いナビゲーション動作につながることがわかった」と研究者らは論文に記している。

この新しいフレームワークは、最終的にはさまざまな移動ロボットに適用され、屋内環境でのナビゲーション機能を強化することができます。これまでのところ、彼らのアプローチはうまく機能することが証明されており、シミュレーションで開発されたポリシーを現実世界の設定に転送しています。

今後の研究では、研究者らはより複雑な環境や混雑した環境の画像でフレームワークを訓練することを計画している。さらに、編集したトレーニング データセットを拡張して、より多様な画像セットを含めたいと考えています。

<<:  AIは宇宙探査の商業化をどのように推進するのでしょうか?

>>:  AIインファナルアフェア!清華大学チームがAIセキュリティプラットフォームを立ち上げ、トップの顔認識アルゴリズムを欺き、脆弱性を修正

ブログ    
ブログ    

推薦する

人工知能、ディープラーニング、マシンビジョン、理解すべき概念

人工知能の概念は長年提唱されてきたが、最近の流行は「人間対機械」の競争で囲碁の世界的名人、イ・セドル...

5GとAIの相互影響

技術革新に関しては、私たちは転換点に達したようです。過去 5 年間で、私たちは、アイデアの創出から会...

新しい指紋技術でコカインの使用を検出できる

[[401970]]メラニー・ベイリー博士は、工学・物理科学研究評議会 (EPSRC) の研究員です...

グラフニューラルネットワークは CV の未来でしょうか?中国科学院ソフトウェア研究所は、ViTを上回る新しいCVモデルViGをリリースした。

コンピュータービジョンのネットワーク構造は新たな革命を迎えようとしているのでしょうか?畳み込みニュー...

インテルの宋吉強氏:AIは爆発の臨界点に達しており、今年中に専用チップを発売する予定

インテルとニューインテリジェンスが共同で開催した2017年ニューインテリジェンスオープンソースエコシ...

...

Google は 1,000 以上の「ロングテール」言語に対応する機械翻訳システムを開発、すでにいくつかのニッチ言語をサポート

学術および商用の機械翻訳 (MT) システムの品質は、過去 10 年間で劇的に向上しました。これらの...

次世代交通におけるAI世代の影響

次世代の交通手段は、電子機器、持続可能性、経験を設計の中核としており、Gen AI は、想定される次...

人工知能技術は成熟しており、AI音声業界は幅広い発展の見通しを迎えている

新しいインフラの波の下で、業界のデジタル変革は本格化しています。この過程で、AI音声は近年最も成熟し...

...

性質:大きなモデルは役割を演じているだけで、実際には自己認識を持っていない

大型モデルはどんどん「人間らしく」なってきていますが、本当にそうなのでしょうか?現在、Nature ...

...

統計と機械学習の違いは何ですか?

[[263249]]ビッグデータダイジェスト制作出典: medium編纂者:周嘉楽、郭小白、蒋宝尚...

悪意のあるハッカーが生成AIを武器化している

研究結果をブログのネタとして使うことに慣れていないのですが、次の点に注目しました。Vulcan Cy...

...