「スラムダンク」は、ヒューマノイドロボットをシミュレートし、人間のバスケットボールの動きを1対1でコピーします。特定のタスクに対する報酬を必要とせず、一度見るだけで習得できます。

「スラムダンク」は、ヒューマノイドロボットをシミュレートし、人間のバスケットボールの動きを1対1でコピーします。特定のタスクに対する報酬を必要とせず、一度見るだけで習得できます。

シュート、ドリブル、指をひねる...この物理シミュレーションされたヒューマノイド ロボットはバスケットボールをプレイできます。

写真

トリックはたくさんあります:

写真

彼が自分の技を披露した後、他の人からそれを学び、動きの細部まで正確にコピーしたことが判明しました。

写真

それが PhysHOI と呼ばれる新しい研究の目的です。この研究では、物理的にシミュレートされたヒューマノイド ロボットが、人間と物体の相互作用 (HOI) のデモンストレーションを観察することで、これらの動きやスキルを学習し、模倣できるようにします。

重要なのは、PhysHOI では特定のタスクごとに特定の報酬メカニズムを必要とせず、ロボットが自律的に学習して適応できることです。

さらに、ロボットには合計 51 x 3 の独立した制御ポイントがあるため、非常にリアルな模倣が可能になります。

写真

これがどのように実現されるかを見てみましょう。

シミュレーションのヒューマノイドロボットが「スラムダンク」に変身

この研究は、北京大学、IDEA研究所、清華大学、カーネギーメロン大学の研究者によって共同で提案されました。

写真

研究者らによると、これまでの類似研究の大半は、単独の模倣動作、タスク特有の報酬の必要性、器用な全身動作を伴わないなどの限界があるという。

写真

彼らが提案した PhysHOI は、モーション キャプチャ技術を適用して HOI データを抽出し、模倣学習を使用して人間の動きとオブジェクトの制御を学習することで、これらの問題を解決します。

その中で、HOI データの重要な構成要素の 1 つが運動学データです。運動学データは、人間の動き、物体の動き、相対的な動きをカバーし、位置、速度、角度などの情報を記録しま す。

さらに、動的データは移動プロセス中のリアルタイムの変更と更新を反映するため、これも非常に重要です。

写真

HOI データの動的情報の不足を補うために、研究者は接触グラフ (CG) を導入しました。

写真

CG のノードはロボットの手足とオブジェクトで構成され、各エッジはバイナリ接触ラベルであり、「接触」または「接触なし」の 2 つの状態のみを表します。

さらに、複数の手足パーツを 1 つのノードに配置して集約された CG を形成することもできます。

具体的には、PhysHOI メソッドは次のとおりです。

まず、モーション キャプチャを通じて、人間の動き、オブジェクトの動き、インタラクション マップ、接触マップなどの参照 HOI 状態シーケンスが取得されます。

写真

次に、最初のフレームの情報を使用して物理シミュレーション環境が初期化され、現在のシミュレーション状態と次の参照状態を含むシステム状態が構築されます。

次に、ポリシーネットワークによって生成されたアクションが入力され、ヒューマノイドロボットが制御されます。物理シミュレーターは、アクションに基づいて人体とシーン内のオブジェクトの状態を更新し、モーションマッチングや接触マップなど、さまざまな側面で報酬を計算します。

報酬、状態、アクションサンプルを使用してポリシーネットワークを最適化し、更新されたポリシーネットワークを使用して新しいラウンドのシミュレーションを開始します。このサイクルは、ネットワークが収束するまで継続され、最終的に参照 HOI スキルを再現できる制御戦略が得られます。

研究者らがタスクに依存しない HOI 模倣報酬を設計したことは特筆に値します。これにより、さまざまなタスクに合わせて報酬関数をカスタマイズする必要がなくなります。これには、動きの一致を反映する身体報酬と物体報酬、接触の正確さを反映する接触マップ報酬が含まれており、物体に接触する際に間違った身体部位を使用するなどの局所的な最適解を回避します。

コンタクトマップの報酬が鍵

研究者らは、2つのHOIデータセットでPhysHOIをテストしました。

さまざまな全身を使ったバスケットボールのスキルを収録した BallPlay データセットが紹介されています。

写真

彼らは、GRAB データセットの S8 サブセットから 5 つの把持ケースを選択し、BallPlay データセットから 8 つのバスケットボール スキルを選択しました。

研究者らは、DeepMimic や AMP などの従来の方法を基準として、公平な比較のために HOI 模倣タスクに適応するようにそれらを修正しました。

写真

結果は、運動学的報酬のみを使用する従来の方法では相互作用を正確に再現できず、ボールが落とされたり、つかむのに失敗したりすることを示しました。

接触グラフのガイダンスに従って、PhysHOI は HOI 模倣を正常に実行しました。

PhysHOI は、両方のデータセットで最高の成功率 (それぞれ 95.4% と 82.4%) を達成し、同時に最も低いモーション エラーも達成し、他の方法を大幅に上回りました。

写真

アブレーション研究では、接触グラフ報酬は、動作情報のみを使用する方法が局所最適状態に陥るのを効果的に防ぎ、ロボットが正しい接触を達成するように誘導できることが示されています。

写真

接触マップの報酬がなければ、ヒューマノイド ロボットはボールを制御できなかったり、誤って体の他の部分を使ってボールを制御したりする可能性があります。

写真

論文リンク: https://arxiv.org/abs/2312.04393

<<:  業界の洞察 | スマート シティと省エネ通信インフラ

>>:  HuaweiがTransformerアーキテクチャを改良! Pangu-πは特性欠陥問題を解決し、同じスケールでLLaMAよりも優れた性能を発揮します。

ブログ    
ブログ    
ブログ    

推薦する

...

...

第12回中国国際交通博覧会は、都市がインテリジェント交通の新時代を切り開くことを支援するBaiduのスマート交通管理ソリューションを正式に発表した。

5月12日、第12回中国道路交通安全製品博覧会及び公安交通警察装備展示会(以下:交通博覧会)が重慶...

5GとAIの強力な組み合わせは、どのような新たな機会をもたらすのでしょうか?

[[261281]]新興技術への投資家として、私は既存の市場を改善したり、新しい市場を創出したりで...

企業はどのように AI を活用してビジネスの成長を促進できるのでしょうか?

人工知能 (AI) の導入によって得られる潜在的な利益を考えると、企業は傍観者でいるわけにはいきませ...

チューリング賞受賞者のベンジオが新論文を発表、Redditがクラッシュ: アイデアがクラッシュ

[[403771]]機械学習における重要な研究はモデルの一般化を改善することであり、モデルをトレーニ...

Python に基づく簡単な自然言語処理の練習

Python によるシンプルな自然言語処理この記事は、Python をベースにした簡単な自然言語処理...

触覚がこんなにリアルになったのは初めてです!南カリフォルニア大学の2人の中国人博士が「触覚知覚」アルゴリズムを発明した

電子技術の発達により、私たちはいつでもどこでも「視聴覚の饗宴」を楽しめるようになり、人間の聴覚と視覚...

GPTは「贅沢」すぎるが、代替案が多数用意されており、展開の問題を心配する必要はもうない

近年、生成的事前トレーニング済みモデル (GPT など) の台頭により、自然言語処理の分野に革命が起...

人工知能がハイパー監視を推進

私たちは通常、監視カメラを、見方によっては私たちを監視する、あるいは私たちに代わって監視するデジタル...

不動産業界における人工知能のメリットトップ10

人工知能 (AI) は不動産業界に革命をもたらし、データ分析の強化から顧客体験の向上まで、さまざまな...

Google DeepMind の最新研究: 敵対的攻撃は人間に対しても有効であり、人間も AI も花瓶を猫と間違える!

人間のニューラルネットワーク(脳)と人工ニューラルネットワーク(ANN)の関係は何ですか?ある先生が...

ディープラーニングの分野でよく使われるディープラーニングフレームワーク10選

このセクションでは、MindSpore、PaddlePaddle、PyTorch、TensorFlo...

デジタル時代におけるデータ近代化の重要性

1. データの近代化とは何ですか? デジタル時代においてなぜ重要なのですか?データの最新化とは、デー...

2020年の人工知能と機械学習の予測

人々が次の年に向けて準備を進める中、業界の専門家が 2020 年の人工知能と機械学習に関する予測を発...