見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

見事な! ! !テスラのエンドツーエンドのデモンストレーションビデオ分析

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

あるユーザーが Tesla FSD v12 のビデオをインターネットに投稿し、誰かがそれを Bilibili にアップロードしました。

https://www.bilibili.com/video/BV1Z6421M797www.bilibili.com/video/BV1Z6421M797

今回は、純粋に視覚的に作成するのが比較的難しいシーンでした。雨の日に地面に水があり、水に反射したさまざまなパターンによって奇妙な占有が生じる可能性があります。テスラは昨年 AI Day を開催しなかったため (競合他社は常に PPT をフレームごとに編集していたため、開催しなかったと言われている)、詳細な情報がない中で、ビデオからエンドツーエンドの機能の一部を垣間見ることができます。以下は、興味深い点のいくつかを分析したものです。

01:57、車のドアが開いていると誤って検知され、運転手は大きく迂回しました。

ここは大きな問題はありません。左側に比較的広いスペースがあるので、もう少し回り込んでも問題ありません。

02:09、OCCの誤検知により車がほぼ停止しました。

ここの歩行者は既に立ち去っていたので出発できましたが、地面には水がたくさんあり、それが地上の物体を反射して OCC が誤検知したため、再び出発する前にしばらく停止する必要がありました。

04:40、車両接近禁止命令により検査を通過できず

ここでは、左側の非常に近い距離で後退して割り込んできた車両を見逃しましたが、計画では発進の意図を伝えていなかったようです。これは、エンドツーエンドの大きな利点を反映しています。上流のエラーの結果が必ずしも誤った運転行動につながるわけではありません。後で同様の例をさらに見ていきます。

05:37 OCCの誤検出

これは、地面の水によって引き起こされた OCC である可能性があります。End-to-end はこの結果を信じて、ハンドルを左右に、時には左に、時には右に回しました。

05:48、左右近距離OCC誤検出

OCC の誤検知は、左右の非常に近いところで発生しました。それでもルールに従うのであれば、テイクオーバーを報告しなければならない可能性があります (必ずしもそうとは限りません。結局のところ、それらは運転軌道上にありません)。ここでは、これら 2 つの OCC を単に無視して運転を続けました。

06:57、前方近距離の歩行者誤検知

これは本当にすごいです。歩行者が目の前に現れた場合、すべてのルールベースの制御は急ブレーキをかけ、警報を鳴らしますが、エンドツーエンドのモデルは上流の結果を認識しず、通常どおり運転を続けます。

14点: 民間駐車場に閉じ込められ、脱出できない

これはBEVの認知距離不足の問題かもしれません。出口を見つけるのに時間がかかり、駐車場でうろついていました。 。

その他のクリップはすべて幹線道路での運転に関するものです。幹線道路では、FSD v12のパフォーマンスは非常にスムーズで、大きな問題はありません。特に夜間は、車線検出も非常に安定しています。ただし、ほとんどのメーカーがこのレベルを達成できると思うので、多くは語りません。

駐車場セクションだけ見ると、上流の結果を無視すれば、前方のOCC誤検知によりハンドルが左右に振れることを除けば、FSD v12の軌跡は比較的スムーズであり、エラーがあっても動揺することはなかった。歩行者、不規則に動く障害物(カート)、地面に水があるシーンでは、パフォーマンスは確かに良好です。

Tesla は、中間モジュールからの監視により、エンドツーエンドでマルチタスクを引き続き使用するため、フロントエンドでは obj det と occ の結果を表示できます。ただし、エンドツーエンドの規制と制御では、必ずしも上流の結果が採用されるわけではありません。近距離での検出漏れは必ずしも衝突を意味するわけではなく、近距離での誤検出は必ずしも停止を意味するわけではありません。すべての結果は、総合的な判断のために PNC に入力されます。これは確かに興味深い点です。確かなのは、マスク氏が嘘をついていないということです。これはまさにエンドツーエンドのシステムのパフォーマンスです。

<<:  実行に少量の計算リソースとメモリリソースしか必要としないSmall Llama大規模モデル

>>:  UniVision: BEV 検出と Occ、デュアル SOTA の統合フレームワーク!

ブログ    

推薦する

Aurora の 1 億ドルの買収の背後にあるもの: RISC-V の創始者が「中国製チップ」を開発するという野望

2月27日、米国の著名な自動運転企業であるAuroraは、ライダーチップ企業OURSを1億ドルで買収...

...

AI + エッジコンピューティング - エッジ人工知能は本当に存在するのか?

EdgeAI はもはやブループリント段階ではありません。すでに主流として採用され、驚異的な速度で成...

テキスト生成画像は非常に人気があり、これらの技術の進化を理解する必要があります

OpenAIは最近、AIコミュニティに「地震」を引き起こしたDALL・E 2システムをリリースしま...

ヴィンセントの画像プロンプトはもう退屈でも長くもありません! LLM強化拡散モデル、簡単な文章で高品質の画像を生成できる

拡散モデルは、テキストプロンプトのガイダンスに基づいて高品質でコンテンツが豊富な画像を生成できる、主...

AIファースト戦略はどこから始まるのでしょうか?

[[393200]] [51CTO.com クイック翻訳]人工知能は企業に競争上の優位性をもたらし...

2020年にAIがビジネスにもたらす変化

導入産業革命は一度しか起こらないが、私たちは今、人工知能 (AI) 革命という大きな革命の過程にある...

ロボットがIoTアプリケーションの範囲を拡大する方法

ロボットの学習能力と IoT アプリケーションの相互接続性は、実りある未来を約束します。モノのインタ...

清華大学と中国気象局の大規模モデルがネイチャー誌に掲載:世界レベルの問題を解決、「幽霊天気」の予報時間が初めて3時間に到達

本当に「雨の日」に備えるために、清華大学の「幽霊天気」予報モデルが登場しました!世界の未解決の問題を...

AI は「彼ら」による盗聴を防ぐことができますか?

次のような状況に遭遇したことがあるかもしれません:携帯電話でアプリを開くと、最初に表示されるのは数分...

...

GoogleはColab上のディープフェイクプロジェクトをひそかに禁止した

最近、GoogleがColaboratory(Colab)サービス上のディープフェイクプロジェクトを...

初めて人間を超えた! 「絵を読んで意味を理解する」ことに関しては、AIは人間の目よりも優れている

[[417746]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

AI基盤を強化し、業界の実践に注力する---WOTグローバル人工知能技術サミット機械学習実践フォーラムの記録

[51CTO.comよりオリジナル記事] 6月21日、51CTO主催のWOT2019グローバル人工知...

Nature: 室温超伝導体はなぜ持続できないのか?

世界中で白熱した議論を巻き起こしたLK-99論争が終結した後、ネイチャー誌の見出しに再び「室温超伝導...