正直に言うと、私はロボット犬の技をたくさん見てきました - しかし、私は今日も驚きました。 CMU の最新の研究結果により、犬は直接学習できるようになりました。 体長の2倍の高さまでジャンプしたり、走り幅跳びや逆立ちをしたり、階段を逆立ちで降りたりもできます では早速、写真を見てみましょう。 これは走り幅跳びです これは走り高跳びです △逆立ちして楽しもう △逆さまに階段を降りる 走り高跳びのシーンでの「奮闘」が、犬の表情を特に魂のこもったものにしている、と言わざるを得ません。 これらの活動に加えて、CMU は完全に自律的なパルクール ビデオもいくつか公開しました。 彼は階段を登り、隙間を通り抜け、非常にスムーズに斜面を横切りました。 途中で「間違い」があっても、当面の進行にはまったく影響しません。 笑いネズミはストレステストまで実施し、結果はもちろん「合格」でした〜 最も驚くべきことは、CMU によれば、上記の極端な操作はすべて単一のニューラル ネットワークによって完了されるということです。 これを聞いたルカンは親指を立てずにはいられなかった。 そのような魂をどうやって育てればよいのでしょうか?ツイートの中で、著者は犬の技を一つ一つ分析した。 まず、視覚による端から端までの歩行と比較すると、体長倍の高跳びや走り幅跳びなどの極限動作は、まったく次元の違うものです。 結局のところ、どんな間違いも「致命的」になる可能性があります。 これに対応して、CMU はsim2realを使用して正確な足制御を実現し、機械的利点を最大化することに挑戦しています。 その中で、使用されるシミュレーターはジムです。 2番目は逆立ちです。二足歩行は四足歩行よりも明らかにずっと困難です。 しかし、CMU のロボット犬は同じ基本的な方法を使用して両方のタスクを同時に達成し、逆さまに立ったまま階段を降りることさえできます。 第三に、パルクール動作(本研究の焦点)では、ロボット犬は人間の指示に従うのではなく、正確な「眼筋」の調整を通じて自らの方向を決定する必要がある。 たとえば、2 つのスロープを連続して横断する場合、特定の角度でスロープにジャンプし、すぐに方向転換する必要があります。 こうした正しい方向を学習させるために、CMU はMTS (Mixed Teacher Student)システムを使用してロボット犬に指導を行っています。 その中で、予測された方向が真の値に近い場合にのみ、システムに採用されます。 具体的には、システムは2つの段階に分かれています。 最初の段階では、RL を使用して移動戦略を学習します。このプロセスでは、いくつかの特権情報にアクセスできます。環境パラメータとスキャン ポイント(スキャンドット)に加えて、CMU はロボット犬に一般的な方向を誘導するための適切なランドマーク(ウェイポイント)も提供します。 次に、正規化オンライン適応 (ROA)を使用して推定器をトレーニングし、観測履歴からコンテキスト情報を回復します。 第2段階では、スキャンドットから戦略を抽出し、戦略と深度情報に基づいてシステムが自律的に前進方法を決定し、機敏にモーターコマンドを出力します。 全体のプロセスは、「教師が教え、生徒が類推によって学ぶ」ようなものです。 このシステムに加えて、パルクールでは障害物を乗り越えるためにさまざまなアクションが必要なので、障害物ごとに特定の報酬関数を設計することも頭の痛い作業です。 ここで、著者らは、すべてのタスクに対して統一された単純な内積報酬関数を定式化することを選択しました。 さまざまな報酬を自動的に生成し、さまざまな地形の形状に完全に適応できます。 それがなければ、犬は次のように行動します。 最後に、CMU は、深度画像から機敏な動作の指示と急速に変動する方向を抽出するための新しい二重蒸留法も提案しました。 同様に、それがなければ、犬は酔っ払いのように振る舞います。 上記の操作の後、犬はついに新しいタイプの自律パルクールを学習し、難しい動きを織り交ぜるようになりました。 興奮していますか?急がないでください: CMU は上記の成果をすべてオープンソース化しました(日付を見ると、まだホットです) 。 同時に、この新聞はオンラインでも創刊されました。最後に入手できます。 著者についてこの研究は CMU によって完全に完了され、著者は合計 4 名でした。 2人は共著者であり、両者とも中国人である。 Xuxin Cheng は CMU の大学院生時代にこの研究を完了しました。現在は Xiaolong Wang の指導の下、カリフォルニア大学サンディエゴ校(UCSD)の博士課程に在籍しています。 もう1人は、CMU ロボット工学研究所の客員研究員である Shi Kexin 氏です。彼女は西安交通大学を卒業し、学士号を取得しました。 プロジェクトのホームページ(論文、コードなどへのリンクを含む):https://extreme-parkour.github.io/ |
>>: Microsoft OneDrive 3.0 が発表されました: 新しいデザイン、共有の改善、Copilot AI など
【51CTO.com クイック翻訳】1. はじめにテキスト要約は、自然言語処理 (NLP) の分野に...
誰のため?なぜ?コミュニティ顔認識システム導入の需要の源と目的多くの居住コミュニティが顔認識システム...
はじめに:AI(人工知能)技術は、Meituan AppからDianping App、フードデリバリ...
01不意を突かれた!今回、Google は「人間を作った」のです! 5月8日、Googleは毎年恒...
この記事では、主に 8 つの一般的なソート アルゴリズムの基本概念とそれらの Python 実装を紹...
今、ボス・マーの「Xユニバース」がまた成長しました。それ以来、Twitter は単なるソーシャル ネ...
今後10年間で、翻訳者、ジャーナリスト、アシスタント、警備員、運転手、販売員、カスタマーサービス、ト...
最初の大規模モデルアライメント技術レポート(大規模言語モデルにおけるRLHFの秘密パートI)がNeu...
動画世代が猛スピードで進化する中、ピカは偉大なる将軍を迎える―― Google の研究者である Om...
脅威の状況が絶えず変化する中、高度なサイバー攻撃に対する防御手段として、生成型人工知能 (GAI) ...
PyTorch は、次の 2 つの高レベル機能を提供する Python パッケージです。強力な GP...
大規模言語モデル (LLM) に基づいて、開発者やユーザーは、タスクを記述し、いくつかの例を示して自...
1. 自然言語理解と言語モデル1.1 自然言語処理自然言語処理 (NLP) は人工知能 (AI) の...
防疫期間中の電子温度測定ドアから、宅配業界で使用されているドローンやロボットによる仕分け、私たちがよ...