見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

あるユーザーが Tesla FSD v12 のビデオをインターネットに投稿し、誰かがそれを Bilibili にアップロードしました。

https://www.bilibili.com/video/BV1Z6421M797www.bilibili.com/video/BV1Z6421M797

今回は、純粋に視覚的に作成するのが比較的難しいシーンでした。雨の日に地面に水があり、水に反射したさまざまなパターンによって奇妙な占有が生じる可能性があります。テスラは昨年 AI Day を開催しなかったため (競合他社は常に PPT をフレームごとに編集していたため、開催しなかったと言われている)、詳細な情報がない中で、ビデオからエンドツーエンドの機能の一部を垣間見ることができます。以下は、興味深い点のいくつかを分析したものです。

01:57、車のドアが開いていると誤って検知され、運転手は大きく迂回しました。

ここは大きな問題はありません。左側に比較的広いスペースがあるので、もう少し回り込んでも問題ありません。

02:09、OCCの誤検知により車がほぼ停止しました。

ここの歩行者は既に立ち去っていたので出発できましたが、地面には水がたくさんあり、それが地上の物体を反射して OCC が誤検知したため、再び出発する前にしばらく停止する必要がありました。

04:40、車両接近禁止命令により検査を通過できず

ここでは、左側の非常に近い距離で後退して割り込んできた車両を見逃しましたが、計画では発進の意図を伝えていなかったようです。これは、エンドツーエンドの大きな利点を反映しています。上流のエラーの結果が必ずしも誤った運転行動につながるわけではありません。後で同様の例をさらに見ていきます。

05:37 OCCの誤検出

これは、地面の水によって引き起こされた OCC である可能性があります。End-to-end はこの結果を信じて、ハンドルを左右に、時には左に、時には右に回しました。

05:48、左右近距離OCC誤検出

OCC の誤検知は、左右の非常に近いところで発生しました。それでもルールに従うのであれば、テイクオーバーを報告しなければならない可能性があります (必ずしもそうとは限りません。結局のところ、それらは運転軌道上にありません)。ここでは、これら 2 つの OCC を単に無視して運転を続けました。

06:57、前方近距離の歩行者誤検知

これは本当にすごいです。歩行者が目の前に現れた場合、すべてのルールベースの制御は急ブレーキをかけ、警報を鳴らしますが、エンドツーエンドのモデルは上流の結果を認識しず、通常どおり運転を続けます。

14点: 民間駐車場に閉じ込められ、脱出できない

これはBEVの認知距離不足の問題かもしれません。出口を見つけるのに時間がかかり、駐車場でうろついていました。 。

その他のクリップはすべて幹線道路での運転に関するものです。幹線道路では、FSD v12のパフォーマンスは非常にスムーズで、大きな問題はありません。特に夜間は、車線検出も非常に安定しています。ただし、ほとんどのメーカーがこのレベルを達成できると思うので、多くは語りません。

駐車場セクションだけ見ると、上流の結果を無視すれば、前方のOCC誤検知によりハンドルが左右に振れることを除けば、FSD v12の軌跡は比較的スムーズであり、エラーがあっても動揺することはなかった。歩行者、不規則に動く障害物(カート)、地面に水があるシーンでは、パフォーマンスは確かに良好です。

Tesla は、中間モジュールからの監視により、エンドツーエンドでマルチタスクを引き続き使用するため、フロントエンドでは obj det と occ の結果を表示できます。ただし、エンドツーエンドの規制と制御では、必ずしも上流の結果が採用されるわけではありません。近距離での検出漏れは必ずしも衝突を意味するわけではなく、近距離での誤検出は必ずしも停止を意味するわけではありません。すべての結果は、総合的な判断のために PNC に入力されます。これは確かに興味深い点です。確かなのは、マスク氏が嘘をついていないということです。これはまさにエンドツーエンドのシステムのパフォーマンスです。

<<:  実行に少量の計算リソースとメモリリソースしか必要としないSmall Llama大規模モデル

>>:  UniVision: BEV 検出と Occ、デュアル SOTA の統合フレームワーク!

ブログ    
ブログ    
ブログ    

推薦する

AI導入によるエッジインテリジェンスの強化

エッジに AI を導入すると、強力なリアルタイム分析と処理を実現できる可能性があります。使用例には、...

基礎 | 機械学習におけるロジスティック回帰、決定木、ニューラル ネットワーク アルゴリズムの理解

1. ロジスティック回帰ロジスティック回帰。まず線形回帰から始めます。線形回帰の出力は実用的な意味を...

...

自動運転分野における機械学習アルゴリズムの応用に関する包括的なレビュー

機械学習は、車内外のセンサーからのデータを融合して、運転者の状態を評価し、運転シナリオを分類するため...

MIT の新しい研究: ゼロから設計? AIにより誰もが服をデザインできるようになる

[[273025]]海外メディアの報道によると、3Dプリンターの人気の高まりと、Thingivers...

2020 年に最も実用的な機械学習ツールは何ですか?

ミシュランの星付き料理を作るときと同じように、整理整頓されたキッチンを持つことは重要ですが、選択肢が...

図解による古典的なプロセススケジューリングアルゴリズム

[[382804]]この記事はWeChatの公開アカウント「Flying Veal」から転載したもの...

AIによる教育革命:自己主導型およびガイド型適応型学習の包括的分析

適応型学習は、人工知能などの高度なテクノロジーを活用して、パーソナライズされた学習体験を生み出す教育...

UiPath、業界初のエンドツーエンドのハイパーオートメーションプラットフォームを発表

[[326225]] 「すべての人にロボットを」というビジョンを掲げ、エンタープライズ向けロボティッ...

Python による顔認識 (ソースコード付き)

Python は画像やビデオから顔を検出して認識できます。顔の検出と認識は、コンピューター ビジョ...

人工知能が将来経験する7つの段階

2030年までに、人工知能のおかげで世界のGDPは15.7兆ドル増加するでしょう。企業の 84% は...

ChatGPTがついにオンラインになり、回答のソースを提供できるようになりました

たった今、OpenAI が重要なニュースを発表しました。ChatGPT が正式にインターネットに接続...

機械学習: 密度ベースの外れ値検出アルゴリズム

外れ値検出 (異常検出とも呼ばれる) は、機械学習において、予想とは大きく異なる動作をするデータ オ...

新しいソフトロボット:手足を再生し、自然にカモフラージュできるヒトデ

Science Fiction Network は 1 月 5 日に報じました (Liu Yazhu...