テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

テスラのヒューマノイドロボットが再び進化:視覚のみに基づいて物体を自律的に分類し、ヨガができる

数ヶ月沈黙していたテスラのヒューマノイドロボット、オプティマスプライムがついに新たな展開を見せた。私が最後にそれを見たのはテスラの株主総会、オプティマスが自由に歩いたり、柔軟に物をつかんだり置いたりするスキルを披露したときだったと覚えています。

今日、テスラ オプティマスは再び進化しました。今ではオブジェクトを自律的に分類できるようになりました。注目すべき点は、ニューラル ネットワークがビデオ入力、制御出力など、エンドツーエンドで完全にトレーニングされていることです。これは、すべての入力信号を処理して運転の決定を出力する、テスラの自動運転 FSD V12 の開発におけるニューラル ネットワーク トレーニングに似ています。

どうやってこれを実現するのかと問わずにはいられません。

オプティマスは腕と脚を自己調整する能力を備えており、視覚と関節位置エンコーダーのみを使用して、空間内で手足を正確に配置することができます。

正確なキャリブレーション機能により、Optimus はさまざまなタスクをより効率的に学習でき、ニューラル ネットワークは視覚のみを使用して完全にオンボードで実行されます。

これにより、Optimus は完全に自律的にオブジェクトを色別に分類できるようになります。

オプティマスは、誰かが妨害した場合でも、物体を色で正確に分類できます。

Optimus は、自律的に自己修正する (傾いた物体をまっすぐにする) 能力も実証しました。

トレーニング後には、分類されたオブジェクトのシャッフルなどの新しいタスクも実行できるようになります。

長い一日の「仕事」の後は、ストレッチをして手を合わせる時間です。

チームのシニア ソフトウェア エンジニアである Julian Ibarz 氏は、「チームがこの数か月で成し遂げた進歩を皆さんにお伝えできることを大変嬉しく思います。Optimus は、タスクにまったく依存しない方法でオブジェクトを自動的に分類するなど、長年の課題を解決できるようになりました。より多くのデータを収集するだけで、コードを変更することなく新しい複雑なタスクをトレーニングできます。」と述べています。

マスク氏もこの「進歩」を認めた。

ネットユーザーは衝撃を受けた一方で、オプティマスにタスクを実行させるためのプロンプトを入力することは可能なのかなど、いくつかの疑問も提起した。答えは「はい」です。ビデオでは、分類または分類解除のタスクを実行するために同じネットワークが使用されているので、Optimus に何をしたいかを伝えるだけです。

オプティマスの前世

Optimus は当初は物理的なロボットではありませんでした。「Tesla Bot」と呼ばれる一般的なロボット プロジェクトからゆっくりと孵化しました。

2021年、マスク氏は「Tesla AI Day」でTesla Botの一般的な外観を披露した。

テスラボットが動作をデモンストレーションしているときも、スタッフは特製のぴったりとした衣装を着て、ロボットに扮してダンスを披露した。しかし、そのようなアイデアは徐々に根付き、現実のものとなり、何度も画期的な進歩で人々を驚かせます。

1年後の「テスラAIデー」では、かつて人間が演じていたテスラボットがロボットのオプティマスに変身しました。

オプティマスがテスラAIデー2022で人々を迎える

新しく発表されたオプティマスはすでに箱を運んだり、花に水をやったり、工場で働いたりすることができる。しかし、これはオプティマスの最終目標ではありません。オプティマスは「脳」を持ったヒューマノイドロボットを目指しています。

オプティマスはテスラのギガファクトリーで働いている

マスク氏は、このロボットの設計にはわずか半年しかかからなかったと語り、今後の登場に大いに期待したいと述べた。

実際、2023年のテスラ株主総会では、オプティマスの足取りはより滑らかになり、動きもより巧みになった。

オプティマスは柔軟に物を掴んだり置いたりする

今、オプティマスは目標に向かって前進しており、「脳」を所有するための道筋はますます明確になりつつあります。次回どのように進化するか楽しみに待ちましょう。

<<:  MAmmoT により、LLM は形式論理と算術演算を学習する能力を備え、数学のジェネラリストになることができます。

>>:  ChatGPT Plus の一部加入者は、他のユーザーを無料トライアルに招待できますが、招待できるのは 1 回のみです。

ブログ    
ブログ    
ブログ    

推薦する

...

...

黄仁勲のNVIDIAの1兆ドル規模のビジネスを管理するクレイジーな方法:計画なし、レポートなし、階層なし

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

アルゴリズムがバグをキャッチ:ディープラーニングとコンピュータービジョンが昆虫学を変える

[[390223]]導入コンピュータ アルゴリズムは、ソフトウェア プログラムのバグを検出するのに役...

MiniGPT-4: 高度な大規模言語モデルを使用した AI 視覚言語理解の向上

1. プロジェクトの背景と動機今年初め、OPEN AI の GPT-4 は前例のないマルチモーダル機...

恥ずかしい! ChatGPT を使用して論文を書いたのですが、生成ボタンを削除するのを忘れました。出版社から「論文を撤回します」と言われました。

それは恥ずかしいですね。物理学の論文でも ChatGPT ボタンがコピーされていました。結果は2か月...

Google が AVA データベースを開始: 動画内の人間の行動を機械が認識できるようにする

[[207258]]コンピューター ビジョンはテクノロジー企業にとって恩恵となりつつあり、これまでは...

国際研究機関:アリババの音声AIが中国でトップに

7月14日、国際的に権威のある調査機関IDC(International Data Corporat...

...

人工知能と機械学習モデル向けのオープンソースフレームワークトップ5

[[253697]] [51CTO.com クイック翻訳] 過去 10 年間の人工知能の急速な成長...

AIはインダストリー4.0の最適化段階の鍵となる

[[282511]]製造業の新たな課題製造業はインテリジェント製造に向けてアップグレードし、変革する...

ディープラーニングと機械学習を混同しないでください。

[[313942]] [51CTO.com クイック翻訳] ご存知のとおり、ディープラーニングは人...

この新しい自己蒸留フレームワーク、新しいSOTAは、トレーニングコストを削減し、ネットワークの変更を必要としません。

ディープラーニングは人工知能(AI)分野の継続的な発展を促進し、多くの技術的進歩を達成しました。同時...

...

AIスタートアップの構築から得た3つの重要な教訓

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...