Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

CARLA v2 でエキスパートレベルの熟練度で実行されます。

タイトル: Think2Drive: 準現実的な自動運転のための潜在世界モデルでの思考による効率的な強化学習 (CARLA-v2 内)

著者所属:上海交通大学

現実世界の自動運転 (AD)、特に市街地運転には、多くのコーナーケースが伴います。最近リリースされた AD シミュレーター CARLA v2 では、運転シナリオに 39 の一般的なイベントが追加され、CARLA v1 よりも現実に近いテスト プラットフォームが提供されます。これにより、コミュニティに新たな課題が生じます。既存の研究のほとんどは計画に特定のルールに依存する必要があり、CARLA v2 のより複雑な状況に対応できないため、これまでのところ、CARLA v2 の新しいシナリオに関する成功を報告した文献はありません。この仕事は、コーナーケースに柔軟かつ効果的に対処できるようにプランナーを積極的かつ直接的に育成するものであり、これが AD の将来の方向性でもあると考えています。私たちの知る限り、私たちは、環境の遷移を学習する世界モデルを備え、プランナーをトレーニングするためのニューラルシミュレーターとして機能する、Think2Drive という AD 向けの初のモデルベースの強化学習アプローチを開発しました。このパラダイムは、世界モデルの低次元状態空間とテンソルの並列計算により、トレーニング効率を大幅に向上させます。

その結果、Think2Drive は、単一の A6000 GPU で 3 日間のトレーニングを行った後、CARLA v2 でエキスパート レベルの熟練度で実行できるようになりました。また、当社の知る限り、現在までに CARLA v2 で成功 (ルート完了率 100%) は報告されていません。また、シナリオ全体にわたる運転モデル​​の評価をサポートするベンチマークである CornerCase-Repository も提案します。さらに、ルート完了、違反数、シナリオ密度などのパフォーマンスを評価するための新しいバランスのとれたメトリックが提案されており、運転スコアによって実際の運転パフォーマンスに関するより多くの情報を提供できるようになります。

実験結果

最後に

BEV/マルチモーダル融合/占有/ミリ波レーダー視覚認識/車線検出/3D認識/マルチモーダル融合/オンラインマップ/マルチセンサーキャリブレーション/Nerf/大規模モデル/計画制御/軌道予測など、多くの技術レビューや論文を含むリポジトリにスターを付けてフォローしてください。

<<:  SLAM の新時代を切り開きましょう! NeRFと3D GS法のレビュー

>>:  Lightning AI Studioを無料で使う方法

ブログ    
ブログ    
ブログ    

推薦する

建設業界における人工知能のメリット

建設における AI は、設計、入札、資金調達、調達、建設、運用、資産管理、ビジネス モデルの変革など...

AI バイブル PRML「パターン認識と機械学習」が Microsoft によって正式にオープンソース化されました。

機械学習やディープラーニングに携わっている人なら誰でも、「パターン認識と機械学習」、略して PRML...

...

...

人工知能の終焉は人工性か?

先月外出した時、交差点の交通警察や補助警察の数が大幅に増えていることに気づきました。疑問に思わずには...

人工知能に関する10のよくある質問への回答

人工知能は今世紀の主要な話題の一つです。 AI の能力と無限の可能性は、多くの興味深い会話や議論を生...

MySQLインデックスの背後にあるデータ構造とアルゴリズムの原理

序文プログラミングの分野では、「プログラム = データ構造 + アルゴリズム」というよく知られたルー...

パナソニック、カナダ事業所への標的型サイバー攻撃を確認

「当社はサイバーセキュリティの専門家とサービスプロバイダーの協力を得て、問題解決に向けて直ちに行動を...

周明氏との対話: ラストマイルを解決するために大きなモデルを使用するときは、理想主義にならないでください。

ゲスト | 周明執筆者 | Yun Zhaoある夜、湘源の湧き水が、広大で無限に湧き出しました。 C...

...

...

人工知能は諸刃の剣です。EUは利益を促進し、害を避けるための規制を導入しました。

近年、交通と環境に対する要求が継続的に高まっており、わが国の新エネルギー自動車は急速な発展を遂げてい...

...

5G悪報セキュリティ管理プラットフォームにおけるディープラーニングに基づくテキスト感情認識技術の応用

著者: Sun Yue、所属部署: 中国移動 (杭州) 情報技術有限公司 | 中国移動杭州 R&am...