移動ロボットは、人間が設計したタスクを完了するために、現実世界の環境を効果的にナビゲートし、周囲の人間やその他の障害物を回避できる必要があります。一般的に、ロボットは静止した物体を検出して回避するのは簡単ですが、人間を回避するには、人間の将来の動きを予測し、それに応じて計画を立てる必要があるため、より困難になる可能性があります。 カリフォルニア大学バークレー校の研究者らは最近、オフィス、自宅、美術館などの屋内環境で人間のためのロボットナビゲーション機能を強化できる新しいフレームワークを開発した。 arXiv で事前公開された論文で発表された彼らのモデルは、HumANav と呼ばれるフォトリアリスティックな画像のデータセットでトレーニングされました。 「我々は、学習ベースの知覚とモデルベースの最適制御を組み合わせた、人間の周囲を移動する新しい枠組みを提案する」と研究者らは論文に記している。 研究者らが開発した新しいフレームワークは LB-WayPtNav-DH と呼ばれ、認識、計画、制御モジュールという 3 つの主要コンポーネントで構成されています。認識モジュールは畳み込みニューラル ネットワーク (CNN) に基づいており、教師あり学習を使用してロボットの視覚入力をウェイポイント (つまり、次の望ましい状態) にマッピングするようにトレーニングされています。 CNN によってマップされたウェイポイントは、フレームワークの計画モジュールと制御モジュールに送られます。これら 2 つのモジュールを組み合わせることで、ロボットは周囲の障害物や人を回避しながら、安全に目標地点に移動できるようになります。 この図は、HumANav データセットに含まれる内容と、それが人を含む屋内環境のフォトリアリスティックなレンダリングをどのように可能にするかを示しています。画像出典: Tolani et al. 研究者らは、HumANavと呼ばれるデータセットに含まれる画像でCNNをトレーニングした。 HumANav には、SURREAL と呼ばれる別のデータセットから適応された、人間が動き回ることができるシミュレートされた建物環境のフォトリアリスティックなレンダリング画像が含まれています。これらの画像は、体型、性別、速度別に整理された、歩いている 6,000 人のテクスチャ付き人間メッシュを示しています。 「提案されたフレームワークは、将来の人間の動きを明示的に予測することなく、単眼RGB画像のみに基づいて人の動きを予測し、それに反応することを学習する」と研究者らは論文に記している。 研究者らは、シミュレーションと現実世界の両方で一連の実験を行い、LB-WayPtNav-DH を評価しました。実際の実験では、オープンソースソフトウェアを搭載した低価格の移動ロボット「Turtlebot 2」に適用しました。研究者らは、ロボットナビゲーションフレームワークは、シミュレートされた環境と現実世界の環境の両方で、目に見えない建物を効果的に回避できるほど十分に推測できると報告している。 画像クレジット: Varun Tolani MS 「我々の実験では、モデルベースの制御と学習を組み合わせると、純粋に学習ベースのアプローチに比べて、より優れた、よりデータ効率の高いナビゲーション動作につながることがわかった」と研究者らは論文に記している。 この新しいフレームワークは、最終的にはさまざまな移動ロボットに適用され、屋内環境でのナビゲーション機能を強化することができます。これまでのところ、彼らのアプローチはうまく機能することが証明されており、シミュレーションで開発されたポリシーを現実世界の設定に転送しています。 今後の研究では、研究者らはより複雑な環境や混雑した環境の画像でフレームワークを訓練することを計画している。さらに、編集したトレーニング データセットを拡張して、より多様な画像セットを含めたいと考えています。 |
<<: AIは宇宙探査の商業化をどのように推進するのでしょうか?
>>: AIインファナルアフェア!清華大学チームがAIセキュリティプラットフォームを立ち上げ、トップの顔認識アルゴリズムを欺き、脆弱性を修正
人工知能の概念は長年提唱されてきたが、最近の流行は「人間対機械」の競争で囲碁の世界的名人、イ・セドル...
技術革新に関しては、私たちは転換点に達したようです。過去 5 年間で、私たちは、アイデアの創出から会...
[[401970]]メラニー・ベイリー博士は、工学・物理科学研究評議会 (EPSRC) の研究員です...
コンピュータービジョンのネットワーク構造は新たな革命を迎えようとしているのでしょうか?畳み込みニュー...
インテルとニューインテリジェンスが共同で開催した2017年ニューインテリジェンスオープンソースエコシ...
学術および商用の機械翻訳 (MT) システムの品質は、過去 10 年間で劇的に向上しました。これらの...
次世代の交通手段は、電子機器、持続可能性、経験を設計の中核としており、Gen AI は、想定される次...
新しいインフラの波の下で、業界のデジタル変革は本格化しています。この過程で、AI音声は近年最も成熟し...
大型モデルはどんどん「人間らしく」なってきていますが、本当にそうなのでしょうか?現在、Nature ...
[[263249]]ビッグデータダイジェスト制作出典: medium編纂者:周嘉楽、郭小白、蒋宝尚...
研究結果をブログのネタとして使うことに慣れていないのですが、次の点に注目しました。Vulcan Cy...