マスク氏が「アイアンマン」のようなロボットを発売!テスラが世界最速のAIコンピューターを発表

マスク氏が「アイアンマン」のようなロボットを発売!テスラが世界最速のAIコンピューターを発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

世界最速のAIトレーニング速度の称号が交代した。

Nvidia GPU でも、Google TPU でもありません...

テスラはマスク氏のリーダーシップの下、独自のAIトレーニングチップ「D1」と独自のAIスーパーコンピューター「Dojo ExaPod」を開発しており、どちらもデビューと同時に最高の性能を達成し、世界一となった。

[[418694]]

さらに、マスク氏はテスラのもう一つの新製品も発表した。

この自動車ロボットには、チップを含むテスラのハードウェアおよびソフトウェアシステムが搭載されているが、百度のロボットとは異なり、自動車というよりは人間に近い。

これは、テスラの毎年恒例の AI オープン デーでマスク氏が再び発表した一連の刺激的な進歩です。

テスラが自社開発したAIトレーニングチップD1が発売

マスク氏は「オートパイロットを含む自動運転システム全体を訓練するには超高速のコンピューターが必要だ」と述べた。

こうしてDOJOが誕生しました。

[[418696]]

DOJO は日本語で「武術の訓練」という意味で名付けられました。名前の通り、DOJO は Tesla AI がリーン カンフーを継続的に練習する道場です。

DOJO は、ネットワーク構造を通じて接続された分散コンピューティング アーキテクチャです。また、大規模なコンピューティング プレーン、非常に高い帯域幅と低レイテンシ、およびパーティション分割されマッピングされた大規模なネットワークも特徴としています。

実際、CVPR 2021で、テスラはすでにDOJOの関連パフォーマンスを明らかにしていました。

当時の総演算能力は1.8EFLOPSに達し、読み書き速度は1.6TBpsにも達し、一時は世界一のスーパーコンピュータ「富岳」を上回り、スーパーコンピュータの新記録を樹立したとされた。

しかし、当時の DOJO は NVIDIA の A100 GPU を使用しており、1 枚のカードの計算能力は 321TFLOPS、合計カード数は5,760 枚、ノード数は最大 720 でした。

現在、DOJO はさらに一歩進んで、独自の「ハート」チップを開発しました。

テスラ初のAIトレーニングチップD1が正式にリリースされました。

7nmプロセスでは、単一のFP32チップの計算能力は22.6TOPSに達し、BF16の計算能力は362TOPSに達します。

テスラの記者会見では、画像を使ってパフォーマンスを実証し、NvidiaのGPUを圧倒し、GoogleのTPUを蹴散らした。

一言でまとめると、これは現在市場に出回っているどのチップよりも優れています。

テスラは、D1 チップを指すのに「Pure Learning Machine 」という用語も使用しています。

さらに、D1チップは個人の戦闘能力だけでなく、集団戦闘能力も優れており、シームレスに統合することで超大規模コンピューティングアレイになることができます。

それはどれくらいの大きさになるのでしょうか? 次に、テスラは前回の予熱ポスターで「謎の種」を公開しました。

25個のD1チップを統合したトレーニングモジュール!

これはテスラの最初のトレーニング モジュールでもあります。複数のモジュールを組み合わせることで、より高度な計算能力を備えたトレーニング アレイを形成できます。

この時点で、テスラが独自に開発したスーパーコンピューターDOJOが完全登場しました!

500,000 を超えるトレーニング ノード。各モジュールの計算能力は 9 ペタフロップス、帯域幅は 36 TB/秒です。

DOJO の恐ろしいところは、さまざまなタスクを実行する必要がある世界の他のスーパーコンピューターとは異なり、DOJO の唯一の使命は AI のトレーニング、つまり自動運転アルゴリズムのトレーニングに重点を置いているということです。

集中していたからこそ、初演がピークだったんです。

AutoPilot、FSD、および Tesla のその他の AI トレーニング タスクはすべて、DOJO でより効率的に練習できます。

さらに、テスラの関係者は次のように明かし続けました。「これで終わりではありません。次世代の DOJO ではパフォーマンスが 10 倍向上します。」

それでここで終わりですか?服を着なさい。

最後で最も強力なのは、Tesla D1 を搭載した究極のキラーです。

ExaPOD には 120 個のトレーニング モジュールが統合されており、3,000 個の D1 チップと 100 万個を超えるトレーニング ノードが含まれています。計算能力は1.1EFLOPに達します。

さらに、エネルギー消費量あたりのパフォーマンスは、今日の最も強力なスーパーコンピューターの 1.3 倍ですが、炭素排出量はわずか 1/5 です。

業界をリードする速度とパフォーマンス。

そこでテスラはこう明言した。 「これは世界最速の AI トレーニング コンピューターです。」

興味深いことに、2019年に米国エネルギー省は、2023年に利用可能になるEクラスのスーパーコンピューターの構築に6億ドルを費やすと発表しました...

意外なことに、この目標を最初に達成したのは「自動車会社」テスラでした。

最も強力な「錬金術炉」は誰のために作られたのでしょうか?

そこで疑問なのは、自社開発の D1 チップと、最強の AI トレーニング スーパーコンピューター DOJO が完成した今、テスラは次にどのような変化を遂げるのだろうか、ということです。

テスラのAI技術ディレクター、アンドレイ・カルパシー氏(リー・フェイフェイ氏の弟子)がステージに登場し、自動運転で競合他社をリードするテスラの「魔法の薬」として主に機能するD1チップとDOJOを紹介した。

純粋に視覚的なソリューション

事故が頻繁に発生し、論争が巻き起こった。ほとんどの中国企業がビジョン+ライダーの総合ソリューションに目を向けたが、テスラは依然として主張し続けた。

カルパシー氏は、テスラの高純度ビジョンソリューションの背景にあるアイデア、現在の 8 台のカメラ ソリューションの特徴、そしてそれが機能する理由について詳しく紹介しました。

テスラのピュア ビジョン ソリューションは、自動運転システムを目、神経、脳を備えた生物として扱うという基本的な構築原理に基づいています。

現在のソリューションには 8 台のカメラがあり、その背後には HydraNets と呼ばれるマルチタスク学習ニューラル ネットワークがあります。

「Hydra Network」は、ターゲット検出、交通標識認識、車線予測などのタスクを同時に処理できます。鍵となるのは、さまざまなデータの特徴抽出にあり、異なるタイプのデータの特徴共有、異なるタスクの個別のパラメータ調整、パラメータ調整を高速化するパラメータキャッシュなどが含まれます。

これは、FSD のアジャイル開発を実現し、半年以内に 2 ~ 3 つのバージョンを反復するための鍵でもあります。

次に、カルパシー氏は、ピュアビジョンアプローチの歴史と今日までのその開発の背後にあるロジックについて説明し、テスラが画像データを処理するビデオを披露しました。

同氏は、FSD は以前は優れていたものの、そのようなシステムは完璧ではないことが判明したと述べました。各カメラはエンジニアが期待するターゲットを検出できましたが、その背後にあるニューラル ネットワークのベクトル空間は十分ではありませんでした。

そこで、テスラはニューラル ネットワークを再設計しました。それが、前述の「ヒドラ」です。

さらに、カメラのキャリブレーション、キャッシュ、キュー、最適化などの側面も可能な限り簡素化されています。

テスラは、マルチカメラ ソリューションとシングル カメラ ソリューションの違いも比較しました。同じシナリオでは、シングル カメラ ソリューションの認識率は、マルチカメラ ソリューションよりも大幅に低かったです。

テスラ車の 8 台のカメラが生の入力を受け取った後、システムはさまざまな機能や目的に合わせてさまざまな解像度で画像を作成します。

これらのさまざまな画像は、さまざまなタスクを個別に処理するニューラル ネットワークに送られ、自動運転システム全体の意思決定の基礎として機能します。

次に、カルパシー氏は、運転中に車線や環境をリアルタイムでモデル化する車両機能であるテスラの「究極の建築家」を紹介した。

リアルタイムの車線ラインモデリングは、実際にはテスラ独自の高精度マップ機能です。

多くの中国の自動運転プレイヤーは「高精度の地図」を重視しているが、テスラの考えでは「既成のリソース」は本質的な能力ではない。本質的な能力は「リソースを創り出す」能力であるべきだ。

最後に、Karpathy 氏は AI 企業によくあるデータ ラベリングの問題について語りました。同氏は、データを第三者に外注して手動でラベリングするのは得策ではないと考え、Tesla はデータのラベリングを行う独自のチームを構築することを選択しました。現在、同社は 2D 画像ラベリングから 4D ベクトル空間ラベリングにアップグレードしています。

これはテスラの自動運転における急速な進化の核心でもあります。

大量生産された自動車が道路を走った後に生成される大規模なデータに手動でラベル付けすることは明らかに不可能であるため、自動ラベル付けのみが閉じたデータ ループを形成できます。

オープンデーでは、テスラは車線や 2D 画像などから 4D 注釈やモデリングへと段階的に移行していく様子も実演しました。

歩行者、車両、木、建物などが鮮明に見え、意図認識も行えます。

テスラはまた、脳のような知覚システム、自動ラベリング機能、シミュレーションにより、純粋な視覚に基づいたより高次元の自動運転を実現できることを強調した。

シミュレーションとは、簡単に言えば、実際のデータを使用して、現実世界のリアルタイムの動的なシーンをコンピューター システムで再構築および再現することです。

このシミュレーション プログラムは、テスラの言葉を借りれば、自動運転をプレイヤーとするビデオ ゲームです。

このシステムでは、奇妙で極端なシナリオを含むあらゆる要素を追加できます。

たとえば、ここでは人が多すぎてターゲットをマークするのが難しく、車両も多​​すぎます。

テスラはここでミリ波レーダーについても言及することを忘れなかった。純粋な視覚でも良い働きをすることができ、いわゆるレーダーの冗長性の効果は限られている。

テスラはまた、現在のラベリングおよびシミュレーションシステムでは最大3億7100万のデータとシナリオをシミュレートできることも明らかにした。

もちろん、自動運転は最終的にはビットの世界から原子の世界に移行するという問題を解決する必要があります。

今回、テスラは主に制御と計画の進捗状況を公開した。

テスラの自動運転担当ディレクターのアショク・エルスワミー氏は、複雑なシナリオに対応するテスラの計画ソリューション「ハイブリッド計画システム」について語った。

主なアイデアと技術的な方法は、最適なパス計画を実現するためのモンテカルロ ツリー検索に基づいています。

最後に、認識から意思決定計画までのテスラの自動運転プロセス全体を 1 つの図にまとめることができます。

もう一つ:テスラの「ロボット」

ついに、記者会見は自動運転に関するものばかりだと誰もが思っていた矢先…

「短いティーブレイク」セッション中に、実際に「ロボットダンス」が行われました。ロボットたちはモデルのような服を着ており、とても「シリコンベース」に見えました。

[[418701]]

これはテスラのパフォーマンスアートですか?

いやいや、また予想外だ。

マスク氏は再びステージに上がり、厳粛にこう発表した。 「テスラのロボット。」

身長5フィート8インチ、約172cm、体重125ポンド、約56.7kg、耐荷重は45ポンド、約20kg。

表面は重要な情報を表示するディスプレイ画面です。

外見上、手足は人間のものと同じです。

バランスと敏捷性を実現するために、手足には 40 個の電気機械アクチュエータが使用されています。

同時に、テスラのさまざまなAIやチップ技術も応用される。

例えば、オートパイロットカメラは認識システムとして使用され、胸腔内にはFSDと同じテスラの自社開発チップが組み込まれている。また、マルチカメラビデオニューラルネットワーク、プランニング機能、マーキングなど、テスラが開発した数々の技術も搭載される。

そしてマスク氏は、これはおもちゃの周辺機器ではなく、最終的には実現されるものであり、来年正式に発売される可能性があり、それがテスラの電気自動車の次のステップであると強調した。

シリコンバレーのアイアンマンは、自分は人間のために人間が作った非常に役に立つロボットであり、常に人間に友好的で、危険で反復的で退屈な作業から人間を解放できるだろうとも語った。

テスラのすでに高度に自動化された車両生産とさらに統合し、連携することも可能です。しかしマスク氏によれば、最優先事項は「家事をすること」であるべきだという。

興味深いことに、テスラの「ロボット」の発表により、太平洋の両側では「ロボット」がスマートカーの変革における次のステップであると認識されています。

中国では、百度のCEO、ロビン・リー氏が「カーロボット」を発表したばかりだが、それは「人」というよりは「車」に似ている。

[[418702]]

アメリカの反対側では、マスク氏のテスラロボットは「車」というより「人」に近い。

この違いはマスク氏のニックネームにも関係しているかもしれない。

イーロン・マスクは現実のアイアンマンではないですか?

<<:  機械が壁の建設を手伝うことがなぜそんなに難しいのでしょうか?これは人類の100年にわたる闘争の歴史である

>>:  機械学習ガバナンスの5つの課題

ブログ    
ブログ    
ブログ    

推薦する

...

...

エンジニアリングだけではありません!人間の認知バイアスが原因の AI 研究における 12 の盲点

[[255272]]ビッグデータダイジェスト制作編集者: ゴウ・シャオバイ、チャン・チウユエ、アイリ...

...

2022年の中国人工知能産業の発展状況と市場規模の分析 市場規模は3000億元を超える

人工知能業界の主要上場企業:Hikvision(002415)、iFlytek(002230)、Sa...

...

人工知能は職場のつながりとコラボレーションを変革できる

世界の人工知能(AI)市場は2027年までに2,670億ドルに達すると予想されています。しかし、テク...

...

キャッシュ、キャッシュ アルゴリズム、キャッシュ フレームワークの概要

導入私たちは皆、キャッシュについて聞いたことがあります。キャッシュとは何かと尋ねると、完璧な答えが返...

職場でロボットが増えると、雇用に影響が出るでしょうか?

最近、中国労働・社会保障科学院の莫容研究チームが発表した研究結果によると、わが国における人工知能の雇...

クラウドコンピューティングは、サービスアウトソーシングアルゴリズムに、減算から加算への革命をもたらしました。

クラウド コンピューティングの自然な仲間は、ソフトウェア対応のサービス アウトソーシングと電子商取引...

...

...

AIと自動化を活用して機密データを大規模に識別する方法

AIベースの機密情報検出サービスプロバイダーであるText IQのCEO、Apoorv Agarwa...