テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

数ヶ月沈黙していたテスラのヒューマノイドロボット、オプティマスプライムがついに新たな展開を見せた。私が最後にそれを見たのはテスラの株主総会、オプティマスが自由に歩いたり、柔軟に物をつかんだり置いたりするスキルを披露したときだったと覚えています。

今日、テスラ オプティマスは再び進化しました。今ではオブジェクトを自律的に分類できるようになりました。注目すべき点は、ニューラル ネットワークがビデオ入力、制御出力など、エンドツーエンドで完全にトレーニングされていることです。これは、すべての入力信号を処理して運転の決定を出力する、テスラの自動運転 FSD V12 の開発におけるニューラル ネットワーク トレーニングに似ています。

どうやってこれを実現するのかと問わずにはいられません。

オプティマスは腕と脚を自己調整する能力を備えており、視覚と関節位置エンコーダーのみを使用して、空間内で手足を正確に配置することができます。

正確なキャリブレーション機能により、Optimus はさまざまなタスクをより効率的に学習でき、ニューラル ネットワークは視覚のみを使用して完全にオンボードで実行されます。

これにより、Optimus は完全に自律的にオブジェクトを色別に分類できるようになります。

オプティマスは、誰かが妨害した場合でも、物体を色で正確に分類できます。

Optimus は、自律的に自己修正する (傾いた物体をまっすぐにする) 能力も実証しました。

トレーニング後には、分類されたオブジェクトのシャッフルなどの新しいタスクも実行できるようになります。

長い一日の「仕事」の後は、ストレッチをして手を合わせる時間です。

チームのシニア ソフトウェア エンジニアである Julian Ibarz 氏は、「チームがこの数か月で成し遂げた進歩を皆さんにお伝えできることを大変嬉しく思います。Optimus は、タスクにまったく依存しない方法でオブジェクトを自動的に分類するなど、長年の課題を解決できるようになりました。より多くのデータを収集するだけで、コードを変更することなく新しい複雑なタスクをトレーニングできます。」と述べています。

マスク氏もこの「進歩」を認めた。

ネットユーザーは衝撃を受けた一方で、オプティマスにタスクを実行させるためのプロンプトを入力することは可能なのかなど、いくつかの疑問も提起した。答えは「はい」です。ビデオでは、分類または分類解除のタスクを実行するために同じネットワークが使用されているので、Optimus に何をしたいかを伝えるだけです。

オプティマスの前世

Optimus は当初は物理的なロボットではありませんでした。「Tesla Bot」と呼ばれる一般的なロボット プロジェクトからゆっくりと孵化しました。

2021年、マスク氏は「Tesla AI Day」でTesla Botの一般的な外観を披露した。

テスラボットが動作をデモンストレーションしているときも、スタッフは特製のぴったりとした衣装を着て、ロボットに扮してダンスを披露した。しかし、そのようなアイデアは徐々に根付き、現実のものとなり、何度も画期的な進歩で人々を驚かせます。

1年後の「テスラAIデー」では、かつて人間が演じていたテスラボットがロボットのオプティマスに変身しました。

オプティマスがテスラAIデー2022で人々を迎える

新しく発表されたオプティマスはすでに箱を運んだり、花に水をやったり、工場で働いたりすることができる。しかし、これはオプティマスの最終目標ではありません。オプティマスは「脳」を持ったヒューマノイドロボットを目指しています。

オプティマスはテスラのギガファクトリーで働いている

マスク氏は、このロボットの設計にはわずか半年しかかからなかったと語り、今後の登場に大いに期待したいと述べた。

実際、2023年のテスラ株主総会では、オプティマスの足取りはより滑らかになり、動きもより巧みになった。

オプティマスは柔軟に物を掴んだり置いたりする

今、オプティマスは目標に向かって前進しており、「脳」を所有するための道筋はますます明確になりつつあります。次回どのように進化するか楽しみに待ちましょう。

<<:  MAmmoT により、LLM は形式論理と算術演算を学習する能力を備え、数学のジェネラリストになることができます。

>>:  ChatGPT Plus の一部加入者は、他のユーザーを無料トライアルに招待できますが、招待できるのは 1 回のみです。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

海外メディア:アップルは2025年までに完全自動運転車を発売する可能性

アップル社が2025年までに完全自動運転車を発売する計画だとブルームバーグが報じたことを受け、同社の...

Diffie-Hellman 鍵交換は、一般的な暗号化アルゴリズムです。

公開されたばかりの Logjam 脆弱性 (FREAK 脆弱性のバリエーション) に関する情報はブラ...

...

2018年ニューリテール5大トレンド:無人小売が広がり続け、人工知能やIoTが新たな価値を創出

[[220105]]画像出典: Visual China 2016年10月の雲旗大会で、ジャック・マ...

Google DeepMindがAGIをランク付け、ChatGPTのランクはどこになるか推測してください

AGI(汎用人工知能)をどのように定義すればよいでしょうか? 100 人の AI 専門家に答えを尋ね...

GenAI が近づくにつれて、データ ガバナンスはどのように進化するべきでしょうか?

著者 | アイザック・サコリック編集者 | ヤン・ジェン制作:51CTO テクノロジースタック(We...

...

...

...

機械学習アルゴリズムに関する 16 のヒント

スイスアーミーナイフについて聞いたことがあるかもしれません。そうでない場合は、下の図をご覧ください。...

認知AIの台頭:2025年にAIは質的に飛躍する

[[441939]] AIの概念が初めて提唱されたのは1956年なので、60年以上の歴史があります。...

専門家の洞察: 顔が高度なアクセス制御認証情報である 5 つの理由

認証情報としての顔認識は、最新の正確で高速なテクノロジーを導入し、ほとんどのアクセス制御アプリケーシ...

モノのインターネットにおけるAIの役割

[[380960]]私たちの周りのすべてのものが知的になることを考えたことはありますか?ガジェットは...

知識経済は死んだ! AIが生み出す「直感経済」の新時代!

AI をめぐっては興奮と恐怖が同時に存在しているのは否定できない現実です。一方では、マイクロソフト...

Linux環境で仮想化技術を使用する方法

仮想化テクノロジーは、物理ホストが複数の仮想コンピューティング環境を同時に実行できるように、コンピュ...