テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

数ヶ月沈黙していたテスラのヒューマノイドロボット、オプティマスプライムがついに新たな展開を見せた。私が最後にそれを見たのはテスラの株主総会、オプティマスが自由に歩いたり、柔軟に物をつかんだり置いたりするスキルを披露したときだったと覚えています。

今日、テスラ オプティマスは再び進化しました。今ではオブジェクトを自律的に分類できるようになりました。注目すべき点は、ニューラル ネットワークがビデオ入力、制御出力など、エンドツーエンドで完全にトレーニングされていることです。これは、すべての入力信号を処理して運転の決定を出力する、テスラの自動運転 FSD V12 の開発におけるニューラル ネットワーク トレーニングに似ています。

どうやってこれを実現するのかと問わずにはいられません。

オプティマスは腕と脚を自己調整する能力を備えており、視覚と関節位置エンコーダーのみを使用して、空間内で手足を正確に配置することができます。

正確なキャリブレーション機能により、Optimus はさまざまなタスクをより効率的に学習でき、ニューラル ネットワークは視覚のみを使用して完全にオンボードで実行されます。

これにより、Optimus は完全に自律的にオブジェクトを色別に分類できるようになります。

オプティマスは、誰かが妨害した場合でも、物体を色で正確に分類できます。

Optimus は、自律的に自己修正する (傾いた物体をまっすぐにする) 能力も実証しました。

トレーニング後には、分類されたオブジェクトのシャッフルなどの新しいタスクも実行できるようになります。

長い一日の「仕事」の後は、ストレッチをして手を合わせる時間です。

チームのシニア ソフトウェア エンジニアである Julian Ibarz 氏は、「チームがこの数か月で成し遂げた進歩を皆さんにお伝えできることを大変嬉しく思います。Optimus は、タスクにまったく依存しない方法でオブジェクトを自動的に分類するなど、長年の課題を解決できるようになりました。より多くのデータを収集するだけで、コードを変更することなく新しい複雑なタスクをトレーニングできます。」と述べています。

マスク氏もこの「進歩」を認めた。

ネットユーザーは衝撃を受けた一方で、オプティマスにタスクを実行させるためのプロンプトを入力することは可能なのかなど、いくつかの疑問も提起した。答えは「はい」です。ビデオでは、分類または分類解除のタスクを実行するために同じネットワークが使用されているので、Optimus に何をしたいかを伝えるだけです。

オプティマスの前世

Optimus は当初は物理的なロボットではありませんでした。「Tesla Bot」と呼ばれる一般的なロボット プロジェクトからゆっくりと孵化しました。

2021年、マスク氏は「Tesla AI Day」でTesla Botの一般的な外観を披露した。

テスラボットが動作をデモンストレーションしているときも、スタッフは特製のぴったりとした衣装を着て、ロボットに扮してダンスを披露した。しかし、そのようなアイデアは徐々に根付き、現実のものとなり、何度も画期的な進歩で人々を驚かせます。

1年後の「テスラAIデー」では、かつて人間が演じていたテスラボットがロボットのオプティマスに変身しました。

オプティマスがテスラAIデー2022で人々を迎える

新しく発表されたオプティマスはすでに箱を運んだり、花に水をやったり、工場で働いたりすることができる。しかし、これはオプティマスの最終目標ではありません。オプティマスは「脳」を持ったヒューマノイドロボットを目指しています。

オプティマスはテスラのギガファクトリーで働いている

マスク氏は、このロボットの設計にはわずか半年しかかからなかったと語り、今後の登場に大いに期待したいと述べた。

実際、2023年のテスラ株主総会では、オプティマスの足取りはより滑らかになり、動きもより巧みになった。

オプティマスは柔軟に物を掴んだり置いたりする

今、オプティマスは目標に向かって前進しており、「脳」を所有するための道筋はますます明確になりつつあります。次回どのように進化するか楽しみに待ちましょう。

<<:  MAmmoT により、LLM は形式論理と算術演算を学習する能力を備え、数学のジェネラリストになることができます。

>>:  ChatGPT Plus の一部加入者は、他のユーザーを無料トライアルに招待できますが、招待できるのは 1 回のみです。

ブログ    

推薦する

...

ビデオ監視産業の発展動向とAI技術の応用

1. ビデオ監視産業の発展動向わが国では、安全都市やインテリジェント交通などのさまざまな建設プロジェ...

...

Meta がテキストを音声に変換するオープンソースライブラリ AudioCraft をリリース

最近、Meta は Llama シリーズのモデルやすべてを分割する SAM モデルなど、複数の AI...

...

インダストリー4.0における人工知能

人工知能は、強化された接続性とインテリジェントな自動化を通じて、インダストリー 4.0 に破壊的な変...

人工知能:ニューノーマルにおける成長の原動力

人工知能技術は急速に発展し、成熟しつつあります。多くの最新のアルゴリズムと問題解決手法が日々革新され...

謎の日本人男性がコードを自動的に削除できるAIを開発し、業界に衝撃を与える

[[317093]]モザイクは、一般的に広く使用されている画像/ビデオ処理方法であり、画像/ビデオ内...

...

...

ディープラーニングパーセプトロンの原理の詳しい説明

前回の機械学習のトピックは終了しました。機械学習の分野でよく使用されるアルゴリズム、モデル、その原理...

空中で疫病と戦うドローン

新型コロナウイルス肺炎の流行が始まって以来、多くのハイテク技術がこの疫病との戦いに後方支援を提供して...

GPT-4 に匹敵するオープンソース モデルがリークされました。ミストラルのボスが確認: 正式版はさらに強力になる

ミストラル・ミディアムが誤って漏洩した?以前は API 経由でのみ利用可能でしたが、そのパフォーマン...

...

...