ほとんどのロボットの移動方法は、ほとんどの人間の移動方法とは大きく異なります。ロボットは、環境を包括的に理解し、周囲のすべてのものを完全に幾何学的に再構築し、さらに自分自身の位置と向きを正確に理解しているときに、最高のパフォーマンスを発揮します。 LiDAR、既存の地図、強力なコンピューター、さらにはモーション キャプチャ システムなど、自律型ロボットの必要性は無限です。 しかし、明らかにこれらのことはあまり拡張性がなく、もちろんそれはおそらく研究に費用がかからないだけでしょう。 これを念頭に、カリフォルニア大学バークレー校の人工知能博士課程の学生である Dhruv Shah 氏と彼の指導者 Sergey Levine 氏は、最近の論文「ViKiNG: 地理的ヒントを使用した視覚ベースのキロメートル単位のナビゲーション」で、ロボットがナビゲートするための別の方法を研究しました。彼らは、ロボットのナビゲーションから高性能で電力を大量に消費するコンポーネントを排除し、単眼カメラ、いくつかのニューラル ネットワーク、基本的な GPU システム、そして非常に基本的な人間が判読できる俯瞰図の形でのいくつかの簡単なヒントだけを必要とすることを提唱しています。 このような手がかりはそれほどインパクトがあるようには思えないかもしれませんが、非常に単純なロボットが見慣れない環境を効率的かつインテリジェントに移動して遠くの目的地に到達できるようになります。
具体的には、学習と計画を統合し、概略的な道路地図、衛星地図、GPS 座標などの補助情報を計画ヒューリスティックとして活用できる学習ベースのアプローチを提案します。 ViKiNG には、ロボットの現在のカメラベースの観測と潜在的なサブゴールを調べて、サブゴールに到達するのがどれだけ簡単かを推測するローカル トラバーサビリティ モデルが組み込まれています。 さらに、ViKiNG には、トップダウンビューを調べて、さまざまなサブゴールから目的地までの距離を推定するヒューリスティック モデルが含まれています。 ViKiNG は明示的なジオメトリ再構築を実行せず、環境のトポロジ表現のみを活用します。 ViKiNG トレーニング データセットでは 80 メートルを超える軌道を見たことがないにもかかわらず、これまで見たことのない環境で最大 3 キロメートル離れたターゲットまで移動し、画像ベースの学習コントローラーと目標指向ヒューリスティックを使用して複雑な動作を示すことができます。 ViKiNG は、基盤となるコントローラが最終的に独自の画像観測に基づいて決定を下すのに対し、地図は計画のためのヒューリスティックとしてのみ機能するため、信頼性の低い地図や GPS に対しても非常に堅牢です。 ViKiNG ロボットのナビゲーションは次のとおりです。 ViKiNGについてその小さなロボットに見覚えがあるとしたら、それは数年前にレバインの生徒であるグレッグ・カーンから紹介されたからです。当時、このロボットは BADGR と名付けられ、その特別なスキルは、単純な画像と人生経験、あるいはロボットにとっての人生経験に基づいて、新しい環境をナビゲートすることを学習することでした。 ViKiNGの前身はBADGRでした。 BADGR は現在、ViKiNG (Vision-Based Kilometer-Level Navigation with Geographic Hints) に進化しました。 BADGR は狭い範囲を自由に移動できますが、その後継機である ViKiNG は長距離を移動してターゲットを見つけるように設計されており、実用化に向けた重要な一歩となります。 ナビゲーションとは、非常に広い意味では、自分がどこにいるのか、どこに行きたいのか、そしてどうやってそこに行きたいのかを理解することです。ロボットにとって、これは長期的な目標となります。特定の経路を数メートル維持するなど、一連の短期目標を達成することで、遠方の GPS 座標に到達できる場合もあります。十分な短期目標を達成すれば、長期目標も達成できるでしょう。しかし、ある種の中期目標もあり、これは最善の道筋は何かというより複雑で抽象的な決定を伴うため、特に難しいものです。言い換えれば、長期目標を達成するというミッションに最も適した短期目標の組み合わせは何かということです。 方法の概要。 ここでViKiNGが役に立ちます。衛星地図や道路地図を使用することで、ロボットは短期的な目標についてより情報に基づいた選択を行うことができ、目標を達成する可能性が大幅に高まります。道路地図があっても、ViKiNG は道路に限定されません。ViKiNG が持っている情報は道路に関する情報なので、道路に適している可能性があります。道路やその他の地形を含む衛星画像は、ロボットにさらに多くの情報を提供します。マップは指示ではなくヒントであるため、ViKiNG は予期していなかった障害物に適応することができます。もちろん、地図ではロボットに小規模な場所(短期的な目標が通過可能かどうか)を正確に伝えることはできませんが、ViKiNG は単眼カメラでそれを自力で処理できます。 ViKiNG のパフォーマンスは素晴らしいです。写真でわかるように、青い線は ViKiNG のナビゲーション パスであり、一般的にはターゲットまでの最適なルートです。研究者が ViKiNG に周囲の環境の地図を提供しなかったことは特筆に値します。ViKiNG は基本的な GPS を通じてこのタスクを完了します。さらに、写真、ターゲットの GPS 座標、単眼カメラ、地図も提供する必要があります。上の画像は、ViKiNG が自律的に移動できる短い経路をロボットが横断している様子を示しています。 論文の責任著者であり、カリフォルニア大学バークレー校の助教授で強化学習の専門家であるセルゲイ・レヴィン氏は、「この研究はプロセス全体が非常に単純なので興味深い」と述べた。大規模なソフトウェア スタックと相互作用するコンポーネントを使用する自動運転システムとは異なり、このシステムでは 2 つのニューラル ネットワーク (1 つは一人称画像の処理用、もう 1 つはマップ画像の処理用) と計画アルゴリズムを使用して、ロボットの歩行経路を決定します。 今日のロボットナビゲーションシステムは大規模に展開するには複雑すぎるため、この研究は重要です。シンプルな学習ベースのシステムが、複雑な手作業で設計された方法に匹敵するか、それを上回る性能を発揮できれば、将来の機械ナビゲーション アプリケーションへの道が開かれる可能性があります。 |
>>: たった 1 回のトレーニングで 4K から 16K まで対応できる、初のシングルサンプルの超高解像度画像合成フレームワークが登場
スマートフォンや駅で顔認識技術が大規模に導入され始めており、誰もがこの新しい技術に精通しているはずで...
[[270736]]近年、人工知能はテクノロジー界で注目されている分野です。中国では、Megvii...
[[344159]]効果的なディープラーニング モデルを作成するには、モデルを効果的にトレーニング...
この記事は公式アカウント「Reading the Core」(ID: AI_Discovery)から...
[[438709]]大規模なコーパスでトレーニングされた Transformer モデルは、自然言...
ベストセラー作家のバーナード・マー氏はフォーブス誌に「人工知能はいかにして資本主義を殺すか」と題する...
[[190464]]勾配降下法の理論部分では、導出プロセスが非常にわかりにくいと嘆いたことがあり、よ...
標準ルーティングテーブル1.次駅経路選定の基本的な考え方ルーティング テーブルは、宛先までの完全なパ...
Amazon Lex は、音声とテキストを使用してあらゆるアプリケーションに会話型インターフェースを...
中国は、インダストリー4.0の提案と国家インテリジェント製造2025開発計画の公布により、製造大国か...
この 6 部構成のシリーズでは、AI の人類史を探り、革新者、思想家、労働者、さらには小規模なトレー...
[[399107]]ウー・ウェイ UiPath Greater China 社長前回 UiPath...
翻訳者 | 邱凱校正 | 梁哲、孫淑娟列に並ぶ必要がなく、遅延もなく、便利に購入できるという顧客体験...
産業用IoTにおける機械学習の応用産業用 IoT (IIoT) に機械学習を適用すると、企業の予測分...