解読: ボストン ダイナミクスがアルゴリズムを使用してアトラス ロボットの感覚世界を構築する方法

解読: ボストン ダイナミクスがアルゴリズムを使用してアトラス ロボットの感覚世界を構築する方法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

ボストン・ダイナミクスは1週間前に90秒のビデオを公開した。ビデオでは、アトラスが複雑な障害物コースを完璧に走る様子が映し出されています。多くのネットユーザーは、どのようなブラックテクノロジーがロボットをこれほど賢くしているのか興味を持っています。

ロボットはどのようにしてアスリートのように走ったり、宙返りしたり、ジャンプしたりできるのでしょうか?こうしたエネルギーあふれるデモを作成するのは楽しい挑戦ですが、ボストンの技術的目標は派手なショーを作成することだけにとどまりません。アトラス プロジェクトでは、パルクールを実験テーマとして使い、動的な動き、知覚、制御の関係を通じて関連する問題を研究しました。これらの問題を解決すると、ロボットがよりスムーズに動作するようになります。

パルクールのロボット認識

ロボット認識アルゴリズムは、カメラやライダーなどのセンサーからのデータを戦略に変換し、物理的な動作を計画するために使用されます。 Atlas は IMU、関節位置、力センサーを使用してボディを制御し、バランスを取るために地面を感知しますが、図 1 に示す木箱や狭い橋などの障害物を識別するための認識アルゴリズムも必要です。

図 1: このアニメーションは、Atlas ロボットの深度カメラによって生成された点群の回転ビューを示しています。

Atlas は深度カメラを使用して、1 秒あたり 15 フレームで環境のポイント クラウドを生成します。ポイントクラウドは距離測定データの集合です。 Atlas の認識ソフトウェアは、マルチプレーン セグメンテーションと呼ばれるアルゴリズムを使用して、ポイント クラウドから表面を抽出します。アルゴリズムによって出力されたデータはマッピング システムに入力され、最終的にシステムは Atlas がカメラで捉えたさまざまなオブジェクトのモデルを構築するのに役立ちます。

図 2: 知覚出力によるアトラス レンダリング。

図 2 は、Atlas が認識したオブジェクトと、フィードバックと計算後に計画するアクションを示しています。 左上隅には深度カメラで撮影された赤外線画像があります。メイン画像の白い点は点群を形成します。オレンジ色の輪郭は、パルクール障害物によって検出された長方形の面を示しており、時間の経過とともにセンサーによって追跡されます。これは、Atlas が特定の動作を設定するのに役立ちます。たとえば、緑色の足跡は、次にジャンプしたりジョギングしたりする場所を示します。

パルクールのコースを延長するために、ロボットには、どこへ行くか、途中でどのような動きをするかのコマンドを含む高度なマップが提供されます。この高レベルマップは実際のコースと正確には一致していませんが、障害物の位置といくつかの主な動きの簡単な説明です。そのため、Atlas はこの概要情報を使用してナビゲーションを行い、リアルタイムの知覚データを使用して詳細を入力します。たとえば、アトラスはジャンプできる箱を探し、その箱が横に 0.5 メートル移動すると、アトラスはそこに箱を見つけて姿勢を調整します。ボックスが遠くに移動しすぎると、システムはボックスを見つけられず停止します。

図 3: パルクール コースにおけるロボットのパートナー認識を示すアニメーション。

これは、パルクール障害物コースを走行中にロボットが見ているものと、その内容に基づいたロボットの計画を示す 3D 視覚化です。アクティブに追跡されているオブジェクトは緑色で描画され、オブジェクトの距離が認識範囲を超えると、アイコンが緑色から紫色に変わります。追跡システムは物体の姿勢を継続的に追跡してナビゲーション システムに送信し、ナビゲーション システムは地図上の情報に基づいて対応する物体のグリーン フットプリントを設計します。

行動ライブラリ

アトラスがパルクール プログラムで実行するすべての動きは、「Trajectory Optimization Offline Design」によって作成されたテンプレートから生成されます。 これらのテンプレート ライブラリを使用すると、研究者はライブラリに新しい軌跡や新しい機能を追加できます。

軌道最適化のオフライン設計により、エンジニアはロボットの機能の限界をインタラクティブに探索し、ロボットの計算負荷を削減できます。例えば、ロボットが手足を折り曲げてバック宙をする方法など、これらの成果はプロジェクトの前進に大いに役立ちます。これはロボットが最も合理的な運転を実現するのに役立つからです。研究者は、オフライン最適化を使用して重要な力のポイントをキャプチャし、コントローラーを使用してオンラインで動きを調整できます。

図 4: この跳び越え動作は、オフライン軌道最適化を使用して設計された複雑な全身動作の例です。

モデル予測

ロボットの前方にある箱、傾斜路、障害物の位置が決定され、それらを乗り越えるための一連の動作が設計されました。残る課題は、ロボットが計画を実行するために必要な詳細を入力することです。

Atlas のコントローラーは、ロボットのダイナミクスのモデルを使用して動作がどのように変化するかを予測するため、モデル予測コントローラー (MPC) と呼ばれます。コントローラーの動作原理は、現時点で最も実行する必要があることの計算を最適化し、可能な限り最良の動作姿勢を形成することです。

前述のように、動作ライブラリ内の各テンプレートは、コントローラーに最適なソリューションを見つけるソリューションを提供します。コントローラーは、環境の形状、足の滑り、その他のリアルタイムの要因を考慮して、力、姿勢、動作のタイミングなどの詳細を調整します。これにより、テンプレートのモーションから逸脱したコントロールが可能になり、独自のモーション プロセスを作成できます。このソリューションにより、ロボットに必要なシナリオ動作テンプレートも大幅に削減されます。たとえば、52cm のプラットフォームからジャンプする場合と 40cm のプラットフォームからジャンプする場合、MPC は詳細を自動的に把握します。

図 5: 認識された経路と計画された経路を示す一人称視点。青い矢印は、ロボットが経路を移動する際におけるロボットの重心と運動量に関する MPC の予測に対応しています。

MPC の予測的な性質により、Atlas は動作の境界を越えることができます。たとえば、ジャンプの後にバックフリップが続くことを認識すると、コントローラーは自動的にスムーズな遷移を作成できます。これにより、研究者が事前に考えられる行動シーケンスについて考える必要がなくなるため、行動作成の問題も簡素化されます。しかし、MPC のイノベーションには限界があります。たとえば、ジョギング動作からバック宙に移行しようとしてもうまくいきません。

未来への基盤を築く

彼らは、Atlas システムにおける動的な動作 (ダンスも含む) の作成と制御について深い理解を得ました。しかし、さらに重要なのは、Atlas システムが自身の環境を感知して変化できるようにすることで、チームとともに成長するスケーラブルなソフトウェア システムを作成する機会が生まれたことです。

この記事はボストンダイナミクスの公式サイトから翻訳されたものです

<<:  青春が戻ってきた! AIが『スラムダンク』の登場人物を実在の人物に変身させたら、一番イケメンは流川楓じゃないのか?

>>:  これは人工ニューラルネットワークの非常に簡単な説明です

ブログ    

推薦する

...

研究結果:人工知能はパンデミック後にさらに普及するだろう

人工知能と機械学習は当初は懐疑的な見方に直面していたかもしれないが、新たな報告書によると、パンデミッ...

...

人工知能は「大きい」と「小さい」に分けられる

大規模な多国籍産業企業は、進行中のデジタル産業革命で効果的に競争できるように、機械をよりスマートにす...

データセンターにおけるAI技術の応用

AI技術はここ数年で進歩しており、データセンターを含む多くの業界で導入されています。たとえば、Goo...

速報です!ヒントンがロボットスタートアップに参入、同社は9000万ドルの新規投資を受ける

チューリング賞受賞者であり、ディープラーニングの父であるジェフリー・ヒントンの次の旅が決まりました。...

レースをしながら「機械学習」を学ぶ? 380万人が観ていなかったら、信じられなかったでしょう。

[[440972]] 「秋名山には人が少なく、ドライバー同士が競争することが多い。今は自動運転車が...

...

2022年の主要イベントが近づいています。ビッグネームの共演をお見逃しなく

2022年、デジタル化の東風が到来し、新たな技術・産業革命が本格化します。デジタル化の波に立ち、絶え...

Meta、Google、Tesla、競合他社が団結してOpenAIについて不満を訴える!ソラは物理世界を理解していません。GPT3 だけです。

編集者 | ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)先週、...

対話 | QingCloud CTO: AI が到来し、基本的なクラウド サービス プロバイダーもそれに備える必要があります。

[51CTO記者の李玲玲が北京からレポート] 真夏が到来し、人工知能も北京の天気のように、より暑い...

すべてがAI+になる新しい形の人工知能があなたを待っています

人工知能技術は急速に発展し、人々の生活に微妙な影響を与えています。掃除ロボット、調理ロボット、配達ロ...

...

ウェブ開発のための機械学習フレームワークトップ 5

この記事では、TensorFlow や Caffe など、Web 開発用の主要な機械学習フレームワー...

機械学習でサンプルが不均衡な場合はどうすればよいでしょうか?

銀行が新規顧客が債務不履行になるかどうかを判断する際、債務不履行にならない顧客と債務不履行になる顧客...