ディズニーは強化学習を利用して新しいロボットをスターウォーズ風に仕上げた

ディズニーは強化学習を利用して新しいロボットをスターウォーズ風に仕上げた

ディズニーの新しいロボットがデビュー!

では早速、どんな感じか見てみましょう——

大きく輝く目、揺れる頭、しなやかに揺れる触手、そして短い一対の足。

歩行は非常にスムーズですが、重要なのは非常に安定していることです。

機械ではありますが、その振る舞いは非常に「精神的」であると言わざるを得ません。

先日終了した国際ロボットサミットIROSで、ディズニー・リサーチの研究科学者モーリッツ・ベッチャー氏が率いるチームが披露した新型ロボットは、とても愛らしく、観客全員を驚かせた。

この小さな子にはまだ正式な名前はありませんが、そのパフォーマンスは十分に印象的です。

一般的な二足歩行ロボットとの最大の違いは、歩行中に動的バランスを維持できるだけでなく、動きを通じて何らかの「感情」を表現できることです。

研究者らによると、これは主に、チームが昨年1年かけて開発した強化学習システムをトレーニングの過程で使用し、プロのアニメーターも招いて動きをデザインし、アニメのキャラクターが動きを通して感情を表現する方法をロボットに適用したためだという。

これを踏まえると、この小さな男はもはや冷たい機械ではない。 GPT脳を搭載すると、自宅の犬が危険にさらされる可能性も考えられます~~~

レシュバイ、私は大学生です、ください。

多くのネットユーザーは、これを見た後、スターウォーズの登場人物を思い浮かべた。

別のネットユーザーたちは、この小さな男の子がとてもかわいくて、明らかにウォーリー(『ウォーリー』の登場人物)の実写版だと思った。

ネットユーザーの中には、自分たちが「ロボット革命の最前線に立っている」と感じているとさえ言う者もいた。

この小さな子はなぜこんなに安定して歩くのでしょうか?開発者は具体的にどうやって「感情」を与えたのでしょうか?読み続けましょう。

スイスの森を散歩

首を振りながらスムーズに動ける秘密は、頭と脚のデザインにあります。

この小さな男の頭は4つの自由度で設計されており、上下左右の4方向への傾斜観察を実現できます。

脚部には5つの自由度があり、股関節も装備されているため、歩行時に動的なバランスを保つことができます。

後ろから押すか、意図的にカーペットを足の下に引っ張ると、簡単に対処できます。


より複雑な地形に挑戦し、スイスの野生の森を歩いてみましょう。

安定感がありながらも魅力的で、歩きながら踊ることもできます。

研究者によれば、この効果を達成するには構想から最終的な仕上げまで1年もかからなかったという。

これも、モジュール式のハードウェアとアクチュエータを使用して設計と反復の速度を大幅に向上させる3D プリントテクノロジーのおかげです。

では、次に「感情」を与えることについてお話ししましょう。

実際、ロボットを感情的に動かすのはディズニーの得意分野です。ディズニーは 1960 年代から 1970 年代にかけて、すでに機械人形を開発していました。

しかし、ロボットがより高度で機動性が高くなるにつれて、ロボットと互換性のある感情的な行動を設計することが困難になります。

この目的のために、ディズニーは切り札を切り、動きを通してキャラクターの感情を伝えるのが得意なアニメーターを雇い、ロボットの動きをデザインした。

しかし、アニメーターが動きをデザインするとなると、難しい問題に直面することになります。

アニメーション ツールには物理法則が組み込まれていないことが多く、アニメーターが思い描いたものを現実に実現するのは難しい場合があります。これには、チームが多くの時間を費やして実験を行う必要があります。

このギャップを埋めるために、チームは強化学習システムを使用しました。

その背後には強化学習のサポートがある

研究チームは、シミュレーションを通じてアニメーターの視覚とロボットの動きを組み合わせる強化学習ベースのパイプラインを開発しました。

このプロセスは本質的に、アニメーターに物理的な制約を提供し、彼らが設計した表現力豊かな動きを現実に実行できるように、またはロボットが実行できる動作に可能な限り近づけられるようにします。

ディズニー・リサーチの研究科学者モーガン・ポープ氏は次のように語った。

これは単に歩くことだけではありません。歩くことは強化学習システムへの入力の 1 つにすぎません。もう 1 つの重要な入力は、歩き方です。

幸いなことに、この場合、強化学習の大きな利点は、生成された動作が非常に堅牢であることです。

研究者らによると、このプロセスを使用すれば、PC 上でわずか数時間でロボットに新しい動作を実行させるトレーニングが可能になり、新しいロボット キャラクターの開発に必要な時間が大幅に短縮されるという。

同時に、繰り返しのトレーニング中に、モーター性能、質量分布、ロボットと地面の間の摩擦を微妙に調整することができます。

チームリーダーのベッチャー氏は、「これにより、ディズニーが新しいロボットキャラクターを開発するのにかかる時間が数年から数か月に短縮された」と確信している。

また研究者たちは、重要なのはロボットではなくプロセスであると強調した。

したがって、足や腕を追加したり、まったく新しいキャラクターを作成したりしたい場合には、新しい動きをすぐに教えることができます。既製のアクチュエーター、3D プリントされたコンポーネント、適応性の高い強化学習フレームワークはすべて、見た目も動きも大きく異なるロボットに適用できます。

そして、このロボットはその旅の第一歩に過ぎません。

<<: 

>>:  Jia Jiayaのチームが世界初の70B長文大規模言語モデルをオープンソース化し、ProMaxを使って論文や小説を直接読めるようにした。

ブログ    
ブログ    

推薦する

...

...

3つのステップで声紋システムを構築する方法

背景声紋検索は、その名前が示すように、話者認識であり、音を通じて話者の声を確認または識別します。声紋...

ブロックチェーン技術の 6 つのコア アルゴリズム。6 つのコア アルゴリズムを理解すれば、ブロックチェーンの専門家になれます。

最近、暗号通貨が「混乱期」を経験した後、ブロックチェーンは再び人気を集め、各方面から大きな注目と注目...

データのクリーニングと前処理の完全ガイド

データの前処理は、機械学習モデルを構築する際の最初の (そしておそらく最も重要な) ステップであり、...

AI動画の「ちらつき」問題が解決しました!動画スタイルを簡単に変更、北京大学卒業生の作品

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

MITが脳制御ロボットを開発:脳波を使ってロボットのエラーを修正できる

ロボットが人間のように行動するためには、人間を理解する必要があります。多くの場合、それは妥協しなけれ...

ライトスピードコンピューティングが画期的な進歩を達成、AIトレーニングコストの問題が解決される可能性

画像出典: Visual China 1956年、アメリカの経済学者によって「人工知能」の概念が提唱...

教師あり学習、教師なし学習、強化学習とは何ですか?ついに誰かが明らかにした

01 用語このセクションでは、機械学習の概要とその 3 つの分類 (教師あり学習、教師なし学習、強化...

生成型 AI が従来のデータベースを破壊する 10 の方法

ピーター・ウェイナーノアが編集生成 AI の華やかさにもかかわらず、この新しい時代における最大の変化...

規制がなければ、AIは金融危機を引き起こす可能性がある

人工知能の影響はビジネス界のほぼすべての側面に広がっており、金融業界も例外ではありません。金融業界の...

...

OpenAI 開発者会議: OpenAI が AI 分野で再び波を起こす方法

AI業界の実務家にとっては、眠れない夜を過ごしたかもしれない。北京時間11月7日早朝、アメリカの人工...