Tesla FSD V12 はどのようにして誕生したのでしょうか?マスク氏:大画面に走行距離がリアルタイムで表示され、従業員は問題を解決するたびにゴングを鳴らす

Tesla FSD V12 はどのようにして誕生したのでしょうか?マスク氏:大画面に走行距離がリアルタイムで表示され、従業員は問題を解決するたびにゴングを鳴らす

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

マスク氏によるエンドツーエンドの自動運転に関する最新のライブ放送:

Tesla FSD V12 はどのようにして作られたのでしょうか?

伝記作家ウォルター・アイザックソンは、近々出版予定の著書『イーロン・マスク』でいくつかのネタバレをしています。

コード制御ではなく完全なニューラルネットワークを実現するために、システムは毎日、テスラの車両群から約1600億フレームのビデオを取得してトレーニングしていると報告されています。

しかし、奇妙で異常に混雑した交差点に関するデータなど、最も有用なビデオは1% 未満でした。

マスク氏は、彼らが構想するニューラルネットワークが機能するには、少なくとも100万本のビデオでトレーニングする必要があると述べた。

今年の初めまでに、FSD V12 は 1,000 万件のビデオ分析を完了しました。

これらの数字に加えて、マスク氏は実際の開発プロセス中にいくつかの特別な管理方法も確立しました。

たとえば、この本では、チームメンバーが作業する作業エリアに設置された 85 インチの巨大なモニターについて説明されており、そこには、何の介入もなく車が何マイル走行したかがリアルタイムで表示されます。

Lao Ma 氏は、数字が更新されるのを見ることで従業員のモチベーションを高めることを可能にしています。

さらに興味深いのは、彼は全員にゴングも渡し、エンジニアは介入問題を解決するたびにそれを鳴らさなければならなかったことです。

それで、Tesla FSD V12 の開発ストーリーは何でしょうか?早速見てみましょう。

毎日1600億フレームのビデオトレーニングが取得されます

FSD v12 より前は、Tesla の自動操縦システムは常にルール判断に依存していました。

つまり、車のカメラがまず車線、歩行者、車両、標識、信号などを識別し、その後、テスラのエンジニアが手作業で書いた数十万行の C++ コードを使用して、赤信号で停止する、青信号で進む、衝突するほどの速度の車両がない場合にのみ交差点を通過するなど、さまざまな状況に対処します。

すべてのアクションにはルールと条件付き判断コードがあります。

しかし現在、テスラの自動運転システムへの最も重要なアップグレードとして、FSD v12 は、人間が車を運転する様子を捉えた数十億フレームのビデオを分析するだけで、自ら運転を学習するようになった。

マスク氏は8か月前に従業員にこの新しいアプローチを全面的に採用し始めた。

チームの若手エンジニアであるダヴァル・シュロフ氏は次のように語る。

これは ChatGPT のトレーニングに似ていますが、車向けです。

では、彼らが構想したニューラル ネットワークが適切に機能するには、どの程度のトレーニングが必要になるのでしょうか?

答えは少なくとも 100 万本のビデオ クリップです。

マスク氏は、これは大きな問題ではないと述べた。

私たちには自然の利点があります。

他の自動車メーカーや AI 企業と比較すると、テスラは世界中で合計 200 万台近くの車両を保有しており、毎日運転クリップを収集できます。

この本ではまた、テスラが訓練のために毎日約1600億フレームのビデオを艦隊から取得していることも明らかにされている。

しかし、マスク氏はツイッターでこう反応した。

大量のデータを管理するのは困難であり、そのほとんどは破棄されてしまいます。重要なのは、奇妙な交差点や異常に交通量が多い交差点のデータなど、1% 未満を占める希少な動画です。

しかしいずれにせよ、今年の初めには、V12 のニューラル ネットワーク プランナーは 1,000 万本のビデオ クリップの分析を完了していました。

一つの疑問は次のとおりです。

あらゆる点で人間を模倣しているので、人間のドライバーの平均的なレベルにしか到達できないのでしょうか?

この点に関して、若いエンジニアのダヴァル・シュロフ氏は次のように語りました。

いいえ、テスラは人間が状況をうまく処理したときのデータのみを使用するためです。

そのため、データラベラーの仕事は不可欠です。

ニューヨーク州バッファローでは、マスク氏から「五つ星のUberドライバー」のような行動をするよう指示された。

「スコアのないビデオゲームはつまらない」

V12の開発中、マスク氏はテスラ本社に頻繁に出向き、最前線の作業現場に直接赴き、エンジニアたちと即興で議論を交わした。

本の説明によれば、彼は彼らの横にひざまずいていた。

マスク氏も「ハエを殺すのに巡航ミサイルを使うべきではない、ハエたたきで十分だ」と固く信じていたため、疑問を抱いていたことも言及する価値がある。

ニューラルネットワークは本当に必要でしょうか?それはちょっとやりすぎではないでしょうか?

研究チームは、ニューラルネットワークがコーディング手法よりも効果的であることを示す例を挙げて、彼の「気が散る考え」を払拭した。

そのデモンストレーションでは、道路にはゴミや倒れたコーンなどさまざまな障害物が散乱していたが、ニューラル ネットワーク プランナーはそれらの障害物を回避して車を誘導し、車線を横断し、必要に応じていくつかのルールを破って横断を成功させた。

従業員は実演しながら、マスク氏にこう語った。

コードからニューラル ネットワークに切り替えることで、構造化されていない環境でも車がクラッシュすることはなくなります。

これには老馬も大満足し、いくつかの「007風」の空想が生まれた。

爆弾が四方八方で爆発し、UFOが空から落ちてきて、車は何もぶつからずに猛スピードで通り過ぎていった。

「スコアのないビデオゲームはつまらない」というのと同じように、従業員のモチベーションを上げるために、マスク氏は全員に目標も設定した。

人間の介入なしに車が完全自動運転モードで走行したマイル数。

マスク氏は、従業員がこの指標を毎日見て、常に更新されることでモチベーションを高めたいと考えている。

そこで、全員が作業するエリアに85インチの巨大モニターを設置し、走行距離をリアルタイムで表示できるようにした。

介入事件が発生するたびに、従業員は問題の根本原因を解決しなければなりません。解決した後は、祝意を表すためにゴングを鳴らさなければなりません。

このゴングも机の近くに設置されています。

非常にユニークな経営手法といえるでしょう。

規制当局の承認後にのみリリース

V12は急速に進歩しています。

マスク氏は今年4月中旬に初めてこのシステムをテストした

彼に同行したのは、テスラの自動運転ソフトウェア担当ディレクターのアショク・エルスワミー氏と、後列に座っていた3人のチームメンバーだった。

ラオ・マーさんはハンドルから手を離し、地図から目的地の駐車場を選択し、テスラの本社ビルから出発した。

テストは25分間かかり、高速道路や生活道路を走行し、複雑なカーブを走行し、自転車、歩行者、ペットも参加しました。

その結果、車が過度に慎重になっていると感じて介入した数回を除いて、彼は一度もハンドルに触れなかった。

マスク氏は、ある時点ではシステムが彼よりも優れた解決策を思いついたとも語った。

テスト後のオートパイロットの週次会議では、ほとんどが黒いTシャツを着た20人のエンジニアが会議テーブルの周りに座って判定を聞いた。

最終的に、マスク氏は、このアプローチが未来への道であると信じており、テスラはこのプログラムを前進させるためにリソースを投入すべきだと発表した。

そして、その4ヵ月後、マスク氏は古い方式に代わるFSD V12を正式に発表したという話が伝えられている。

今は、リリース前に規制当局の承認を待つだけです(今年遅くなるか来年になる可能性があります)

しかし、規制当局が慎重に検討する必要がある疑問が 1 つあります。

新しい FSD V12 は完全に人間の運転を模倣して運転しますが、人間のドライバーは、たとえ優秀なドライバーであっても、交通ルールを破ることがあります。

自動運転車にも同じことを許可すべきでしょうか?

もう一つ

マスク氏がわずか2億5000万ドル(約18万人民元)のコストでテスラ車を製造する予定だというニュースは、かなり前からあった。

この伝記の中で、著者はついにいくつかの新しい情報をもたらしました。それは、サイバートラックピックアップに似た外観デザインを採用するというものです。

さらに、自動運転タクシーも依然としてマスク氏の構想の中にある。

マスク氏は次のように明らかにした。

その誕生により、テスラの価値はすぐに1兆ドルの領域に押し上げられることになる。

<<:  ジェネレーティブAIは企業にとって新たなリスクとなっているが、重要な問題を放置すべきではない

>>: 

ブログ    
ブログ    
ブログ    

推薦する

Boyaのディープラーニング製品がHuman Horizo​​nsの自動運転実現に貢献

ヒューマンホライゾンズテクノロジーズ株式会社は、新エネルギー車、インテリジェントネットワーク、共同交...

人工知能に関する 10 の質問: ますます普及する AI の将来はどこにあるのでしょうか?

近年、人工知能は爆発的な人気と発展を遂げ、その後、最近は人気が衰えています。人工知能は大企業だけが参...

追跡すべきマルチモーダル LLM が多すぎますか?まずは26のSOTAモデルを見てみましょう

現在、AI分野の焦点は大規模言語モデル(LLM)からマルチモーダルへと移行しており、その結果、LLM...

...

フォーブス誌の2020年AIに関するトップ10予測: 人工知能はますます「疎外」されつつある

人工知能 (AI) は間違いなく 2010 年代のテクノロジーのテーマであり、新しい 10 年が始ま...

...

ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される

Transformer アーキテクチャは、現代の機械学習で広く使用されています。 Attention...

2022年、人工知能が未来への新たなパスワードを開く

大型家電や自動車を購入するとき、インテリジェント音声機能が搭載されているかどうかを尋ねますか?はい、...

ディープニューラルネットワークのトレーニングが難しいのはなぜですか?

あなたがエンジニアであり、コンピューターをゼロから設計する任務を負っていると想像してください。ある日...

AI開発に最適なプログラミング言語トップ5

昨年、アルファ碁が世界中のチェスプレイヤー全員に勝利して以来、人工知能は注目を集めています。先日終了...

Haiyun Jiexun の Ren Zhongping 氏: アイデアから実現まで、AI はわずか 10 クリックで実現します。

[51CTO.comよりオリジナル記事] 10月13日、中関村スタートアップストリートで、中関村ス...

人工知能がメンタルヘルスの改善に役立つ4つの方法

[51CTO.com クイック翻訳] 私たちはメンタルヘルスの危機を経験しています。世界人口の約 1...

AI 初心者必読 | パラメーターとハイパーパラメーターの違いがまだよくわかりませんか?

[[244078]]コンピュータサイエンスには多くの用語があり、それらの多くは一貫して使用されてい...

スマートビルディングにおけるAIの活用

[[428910]]人工知能は、スマートビルディングパズルの最も重要なピースの 1 つです。これがな...

DES、3DES、AES、PBE対称暗号化アルゴリズムの実装と応用

[[272601]] 1. 対称暗号化アルゴリズムの概要対称暗号化アルゴリズムは、成熟した技術を備...