Tesla FSD V12 はどのようにして誕生したのでしょうか?マスク氏:大画面に走行距離がリアルタイムで表示され、従業員は問題を解決するたびにゴングを鳴らす

Tesla FSD V12 はどのようにして誕生したのでしょうか?マスク氏:大画面に走行距離がリアルタイムで表示され、従業員は問題を解決するたびにゴングを鳴らす

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

マスク氏によるエンドツーエンドの自動運転に関する最新のライブ放送:

Tesla FSD V12 はどのようにして作られたのでしょうか?

伝記作家ウォルター・アイザックソンは、近々出版予定の著書『イーロン・マスク』でいくつかのネタバレをしています。

コード制御ではなく完全なニューラルネットワークを実現するために、システムは毎日、テスラの車両群から約1600億フレームのビデオを取得してトレーニングしていると報告されています。

しかし、奇妙で異常に混雑した交差点に関するデータなど、最も有用なビデオは1% 未満でした。

マスク氏は、彼らが構想するニューラルネットワークが機能するには、少なくとも100万本のビデオでトレーニングする必要があると述べた。

今年の初めまでに、FSD V12 は 1,000 万件のビデオ分析を完了しました。

これらの数字に加えて、マスク氏は実際の開発プロセス中にいくつかの特別な管理方法も確立しました。

たとえば、この本では、チームメンバーが作業する作業エリアに設置された 85 インチの巨大なモニターについて説明されており、そこには、何の介入もなく車が何マイル走行したかがリアルタイムで表示されます。

Lao Ma 氏は、数字が更新されるのを見ることで従業員のモチベーションを高めることを可能にしています。

さらに興味深いのは、彼は全員にゴングも渡し、エンジニアは介入問題を解決するたびにそれを鳴らさなければならなかったことです。

それで、Tesla FSD V12 の開発ストーリーは何でしょうか?早速見てみましょう。

毎日1600億フレームのビデオトレーニングが取得されます

FSD v12 より前は、Tesla の自動操縦システムは常にルール判断に依存していました。

つまり、車のカメラがまず車線、歩行者、車両、標識、信号などを識別し、その後、テスラのエンジニアが手作業で書いた数十万行の C++ コードを使用して、赤信号で停止する、青信号で進む、衝突するほどの速度の車両がない場合にのみ交差点を通過するなど、さまざまな状況に対処します。

すべてのアクションにはルールと条件付き判断コードがあります。

しかし現在、テスラの自動運転システムへの最も重要なアップグレードとして、FSD v12 は、人間が車を運転する様子を捉えた数十億フレームのビデオを分析するだけで、自ら運転を学習するようになった。

マスク氏は8か月前に従業員にこの新しいアプローチを全面的に採用し始めた。

チームの若手エンジニアであるダヴァル・シュロフ氏は次のように語る。

これは ChatGPT のトレーニングに似ていますが、車向けです。

では、彼らが構想したニューラル ネットワークが適切に機能するには、どの程度のトレーニングが必要になるのでしょうか?

答えは少なくとも 100 万本のビデオ クリップです。

マスク氏は、これは大きな問題ではないと述べた。

私たちには自然の利点があります。

他の自動車メーカーや AI 企業と比較すると、テスラは世界中で合計 200 万台近くの車両を保有しており、毎日運転クリップを収集できます。

この本ではまた、テスラが訓練のために毎日約1600億フレームのビデオを艦隊から取得していることも明らかにされている。

しかし、マスク氏はツイッターでこう反応した。

大量のデータを管理するのは困難であり、そのほとんどは破棄されてしまいます。重要なのは、奇妙な交差点や異常に交通量が多い交差点のデータなど、1% 未満を占める希少な動画です。

しかしいずれにせよ、今年の初めには、V12 のニューラル ネットワーク プランナーは 1,000 万本のビデオ クリップの分析を完了していました。

一つの疑問は次のとおりです。

あらゆる点で人間を模倣しているので、人間のドライバーの平均的なレベルにしか到達できないのでしょうか?

この点に関して、若いエンジニアのダヴァル・シュロフ氏は次のように語りました。

いいえ、テスラは人間が状況をうまく処理したときのデータのみを使用するためです。

そのため、データラベラーの仕事は不可欠です。

ニューヨーク州バッファローでは、マスク氏から「五つ星のUberドライバー」のような行動をするよう指示された。

「スコアのないビデオゲームはつまらない」

V12の開発中、マスク氏はテスラ本社に頻繁に出向き、最前線の作業現場に直接赴き、エンジニアたちと即興で議論を交わした。

本の説明によれば、彼は彼らの横にひざまずいていた。

マスク氏も「ハエを殺すのに巡航ミサイルを使うべきではない、ハエたたきで十分だ」と固く信じていたため、疑問を抱いていたことも言及する価値がある。

ニューラルネットワークは本当に必要でしょうか?それはちょっとやりすぎではないでしょうか?

研究チームは、ニューラルネットワークがコーディング手法よりも効果的であることを示す例を挙げて、彼の「気が散る考え」を払拭した。

そのデモンストレーションでは、道路にはゴミや倒れたコーンなどさまざまな障害物が散乱していたが、ニューラル ネットワーク プランナーはそれらの障害物を回避して車を誘導し、車線を横断し、必要に応じていくつかのルールを破って横断を成功させた。

従業員は実演しながら、マスク氏にこう語った。

コードからニューラル ネットワークに切り替えることで、構造化されていない環境でも車がクラッシュすることはなくなります。

これには老馬も大満足し、いくつかの「007風」の空想が生まれた。

爆弾が四方八方で爆発し、UFOが空から落ちてきて、車は何もぶつからずに猛スピードで通り過ぎていった。

「スコアのないビデオゲームはつまらない」というのと同じように、従業員のモチベーションを上げるために、マスク氏は全員に目標も設定した。

人間の介入なしに車が完全自動運転モードで走行したマイル数。

マスク氏は、従業員がこの指標を毎日見て、常に更新されることでモチベーションを高めたいと考えている。

そこで、全員が作業するエリアに85インチの巨大モニターを設置し、走行距離をリアルタイムで表示できるようにした。

介入事件が発生するたびに、従業員は問題の根本原因を解決しなければなりません。解決した後は、祝意を表すためにゴングを鳴らさなければなりません。

このゴングも机の近くに設置されています。

非常にユニークな経営手法といえるでしょう。

規制当局の承認後にのみリリース

V12は急速に進歩しています。

マスク氏は今年4月中旬に初めてこのシステムをテストした

彼に同行したのは、テスラの自動運転ソフトウェア担当ディレクターのアショク・エルスワミー氏と、後列に座っていた3人のチームメンバーだった。

ラオ・マーさんはハンドルから手を離し、地図から目的地の駐車場を選択し、テスラの本社ビルから出発した。

テストは25分間かかり、高速道路や生活道路を走行し、複雑なカーブを走行し、自転車、歩行者、ペットも参加しました。

その結果、車が過度に慎重になっていると感じて介入した数回を除いて、彼は一度もハンドルに触れなかった。

マスク氏は、ある時点ではシステムが彼よりも優れた解決策を思いついたとも語った。

テスト後のオートパイロットの週次会議では、ほとんどが黒いTシャツを着た20人のエンジニアが会議テーブルの周りに座って判定を聞いた。

最終的に、マスク氏は、このアプローチが未来への道であると信じており、テスラはこのプログラムを前進させるためにリソースを投入すべきだと発表した。

そして、その4ヵ月後、マスク氏は古い方式に代わるFSD V12を正式に発表したという話が伝えられている。

今は、リリース前に規制当局の承認を待つだけです(今年遅くなるか来年になる可能性があります)

しかし、規制当局が慎重に検討する必要がある疑問が 1 つあります。

新しい FSD V12 は完全に人間の運転を模倣して運転しますが、人間のドライバーは、たとえ優秀なドライバーであっても、交通ルールを破ることがあります。

自動運転車にも同じことを許可すべきでしょうか?

もう一つ

マスク氏がわずか2億5000万ドル(約18万人民元)のコストでテスラ車を製造する予定だというニュースは、かなり前からあった。

この伝記の中で、著者はついにいくつかの新しい情報をもたらしました。それは、サイバートラックピックアップに似た外観デザインを採用するというものです。

さらに、自動運転タクシーも依然としてマスク氏の構想の中にある。

マスク氏は次のように明らかにした。

その誕生により、テスラの価値はすぐに1兆ドルの領域に押し上げられることになる。

<<:  ジェネレーティブAIは企業にとって新たなリスクとなっているが、重要な問題を放置すべきではない

>>: 

ブログ    
ブログ    

推薦する

今後の企業イノベーションを牽引する10の優れたテクノロジー

エンタープライズ テクノロジーの将来は、業界を変えるほどの大きな革新をもたらすでしょう。 5G から...

...

...

人工知能とコンピュータービジョンの違いは何ですか?

人工知能 (AI) アプリケーションは、テクノロジーとの関わり方を変え始めており、私たちの生活をより...

2 ステップで 25 フレームの高品質アニメーションを生成 (SVD の 8% として計算) | オンラインでプレイ可能

消費されるコンピューティング リソースは、従来の Stable Video Diffusion (S...

Python アルゴリズムの時間計算量

アルゴリズムを実装する場合、アルゴリズムの複雑さは通常、時間の複雑さと空間の複雑さという 2 つの側...

Google AIの最新3Dデータセット、15,000枚のアニメーション画像、ARがあなたの生活を支配します

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

これらの比較的成功している人工知能アプリケーションを使用したことがありますか?

人工知能に関して言えば、人気の科学映画をいくつか挙げなければなりません。多くの映画では、人工知能ロボ...

この記事を読んで、人工知能に携わる私は、もう

機械学習とは何ですか?答えるのに 10 秒かかります。 …分からない?あなたはまだ人工知能業界で働き...

機械学習アルゴリズムの実践: 決定木

序文最近、欲張りになりすぎないように、機械学習の基本的なアルゴリズムを体系的に勉強しようと思っていま...

AGI(汎用人工知能)は数年のうちに実現されるでしょうか? 3つのテクノロジー大手が判決を下す

2011年、Google DeepMindの共同創設者であるシェーン・レッグは、2028年までにAI...

...

スタートアップにハイエンド AI を実装するにはどうすればよいでしょうか?

【51CTO.comオリジナル記事】 [[193891]] 人工知能は、1956 年のダートマス会...

...