見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

あるユーザーが Tesla FSD v12 のビデオをインターネットに投稿し、誰かがそれを Bilibili にアップロードしました。

https://www.bilibili.com/video/BV1Z6421M797www.bilibili.com/video/BV1Z6421M797

今回は、純粋に視覚的に作成するのが比較的難しいシーンでした。雨の日に地面に水があり、水に反射したさまざまなパターンによって奇妙な占有が生じる可能性があります。テスラは昨年 AI Day を開催しなかったため (競合他社は常に PPT をフレームごとに編集していたため、開催しなかったと言われている)、詳細な情報がない中で、ビデオからエンドツーエンドの機能の一部を垣間見ることができます。以下は、興味深い点のいくつかを分析したものです。

01:57、車のドアが開いていると誤って検知され、運転手は大きく迂回しました。

ここは大きな問題はありません。左側に比較的広いスペースがあるので、もう少し回り込んでも問題ありません。

02:09、OCCの誤検知により車がほぼ停止しました。

ここの歩行者は既に立ち去っていたので出発できましたが、地面には水がたくさんあり、それが地上の物体を反射して OCC が誤検知したため、再び出発する前にしばらく停止する必要がありました。

04:40、車両接近禁止命令により検査を通過できず

ここでは、左側の非常に近い距離で後退して割り込んできた車両を見逃しましたが、計画では発進の意図を伝えていなかったようです。これは、エンドツーエンドの大きな利点を反映しています。上流のエラーの結果が必ずしも誤った運転行動につながるわけではありません。後で同様の例をさらに見ていきます。

05:37 OCCの誤検出

これは、地面の水によって引き起こされた OCC である可能性があります。End-to-end はこの結果を信じて、ハンドルを左右に、時には左に、時には右に回しました。

05:48、左右近距離OCC誤検出

OCC の誤検知は、左右の非常に近いところで発生しました。それでもルールに従うのであれば、テイクオーバーを報告しなければならない可能性があります (必ずしもそうとは限りません。結局のところ、それらは運転軌道上にありません)。ここでは、これら 2 つの OCC を単に無視して運転を続けました。

06:57、前方近距離の歩行者誤検知

これは本当にすごいです。歩行者が目の前に現れた場合、すべてのルールベースの制御は急ブレーキをかけ、警報を鳴らしますが、エンドツーエンドのモデルは上流の結果を認識しず、通常どおり運転を続けます。

14点: 民間駐車場に閉じ込められ、脱出できない

これはBEVの認知距離不足の問題かもしれません。出口を見つけるのに時間がかかり、駐車場でうろついていました。 。

その他のクリップはすべて幹線道路での運転に関するものです。幹線道路では、FSD v12のパフォーマンスは非常にスムーズで、大きな問題はありません。特に夜間は、車線検出も非常に安定しています。ただし、ほとんどのメーカーがこのレベルを達成できると思うので、多くは語りません。

駐車場セクションだけ見ると、上流の結果を無視すれば、前方のOCC誤検知によりハンドルが左右に振れることを除けば、FSD v12の軌跡は比較的スムーズであり、エラーがあっても動揺することはなかった。歩行者、不規則に動く障害物(カート)、地面に水があるシーンでは、パフォーマンスは確かに良好です。

Tesla は、中間モジュールからの監視により、エンドツーエンドでマルチタスクを引き続き使用するため、フロントエンドでは obj det と occ の結果を表示できます。ただし、エンドツーエンドの規制と制御では、必ずしも上流の結果が採用されるわけではありません。近距離での検出漏れは必ずしも衝突を意味するわけではなく、近距離での誤検出は必ずしも停止を意味するわけではありません。すべての結果は、総合的な判断のために PNC に入力されます。これは確かに興味深い点です。確かなのは、マスク氏が嘘をついていないということです。これはまさにエンドツーエンドのシステムのパフォーマンスです。

<<:  実行に少量の計算リソースとメモリリソースしか必要としないSmall Llama大規模モデル

>>:  UniVision: BEV 検出と Occ、デュアル SOTA の統合フレームワーク!

ブログ    
ブログ    

推薦する

世界初の「サイボーグ」が死んだ!さようなら、ピーター 2.0

2020年、ピーター・スコット・モーガン博士はインターネットで話題になりました。人気の検索タイトル...

Reddit で強く推奨: 20 時間の体系的なディープラーニングと強化学習コース | 無料

[[383847]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

機械学習をプログラマーにとってより身近なものにする方法

導入人々は長い間、人工的に生成されたコンテンツを理解するためにアルゴリズムを手動でコーディングしよう...

AI分野 | ゲームのルールを変える画期的なアイデア10選

[[357174]] AI の旅が始まって以来、私は無限の可能性を秘め、輝かしい歴史に足跡を残してき...

...

中国科学技術大学が提案したCNNとTransformerのデュアルネットワークモデルの精度は84.1%にも達する

[[416636]] Transformer と CNN はどちらも独自の利点を持ち、視覚表現を処理...

ディープラーニング GPU の最も包括的な比較: コスト パフォーマンスの点で最も優れているのはどれですか?

AI に関して言えば、「GPU の混乱」を感じない人はいないでしょう。 Tensor コア、メモリ...

OpenAI CLIPモデルポケット版、24MBでテキスト画像マッチングを実現、iPhoneでも実行可能

OpenAI の CLIP モデルは、画像とテキスト カテゴリのマッチングに非常に優れていますが、元...

ワイヤレス ネットワークと人工知能が出会うと何が起こるでしょうか?

人工知能(AI)は未来の技術ではなく、すでに存在している技術です。機械学習のイノベーションにより A...

...

世界中のロボットが1つの脳を共有する、Google DeepMindが第一歩を踏み出した

過去 1 年間、生成型人工知能の開発におけるキーワードは「ビッグ」でした。強化学習の先駆者であるリッ...

SaaS アプリケーションで AI スノーボールはどのように大きくなるのでしょうか?

Shopify の不正防止機械学習から Salesforce の Einstein まで、過去数年...