Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

CARLA v2 でエキスパートレベルの熟練度で実行されます。

タイトル: Think2Drive: 準現実的な自動運転のための潜在世界モデルでの思考による効率的な強化学習 (CARLA-v2 内)

著者所属:上海交通大学

現実世界の自動運転 (AD)、特に市街地運転には、多くのコーナーケースが伴います。最近リリースされた AD シミュレーター CARLA v2 では、運転シナリオに 39 の一般的なイベントが追加され、CARLA v1 よりも現実に近いテスト プラットフォームが提供されます。これにより、コミュニティに新たな課題が生じます。既存の研究のほとんどは計画に特定のルールに依存する必要があり、CARLA v2 のより複雑な状況に対応できないため、これまでのところ、CARLA v2 の新しいシナリオに関する成功を報告した文献はありません。この仕事は、コーナーケースに柔軟かつ効果的に対処できるようにプランナーを積極的かつ直接的に育成するものであり、これが AD の将来の方向性でもあると考えています。私たちの知る限り、私たちは、環境の遷移を学習する世界モデルを備え、プランナーをトレーニングするためのニューラルシミュレーターとして機能する、Think2Drive という AD 向けの初のモデルベースの強化学習アプローチを開発しました。このパラダイムは、世界モデルの低次元状態空間とテンソルの並列計算により、トレーニング効率を大幅に向上させます。

その結果、Think2Drive は、単一の A6000 GPU で 3 日間のトレーニングを行った後、CARLA v2 でエキスパート レベルの熟練度で実行できるようになりました。また、当社の知る限り、現在までに CARLA v2 で成功 (ルート完了率 100%) は報告されていません。また、シナリオ全体にわたる運転モデル​​の評価をサポートするベンチマークである CornerCase-Repository も提案します。さらに、ルート完了、違反数、シナリオ密度などのパフォーマンスを評価するための新しいバランスのとれたメトリックが提案されており、運転スコアによって実際の運転パフォーマンスに関するより多くの情報を提供できるようになります。

実験結果

最後に

BEV/マルチモーダル融合/占有/ミリ波レーダー視覚認識/車線検出/3D認識/マルチモーダル融合/オンラインマップ/マルチセンサーキャリブレーション/Nerf/大規模モデル/計画制御/軌道予測など、多くの技術レビューや論文を含むリポジトリにスターを付けてフォローしてください。

<<:  SLAM の新時代を切り開きましょう! NeRFと3D GS法のレビュー

>>:  Lightning AI Studioを無料で使う方法

ブログ    
ブログ    
ブログ    

推薦する

AIの大覚醒:チューリング賞受賞者のベンジオ氏は、AIは意識を持ち、将来の機械学習の核となるのは注意メカニズムであると語る

人工知能は意識を発達させることができるか?これはアメリカのテレビシリーズ「ウエストワールド」で取り上...

AIと機械学習を活用してビジネスを完全に自動化する5つの優れた方法

アプリケーションソフトウェアや機器の更新に伴い、製品の品質に対するユーザーの要求はますます高くなり、...

TensorFlow の最大の機械学習データセット 30 件

導入画像、ビデオ、オーディオ、テキストが含まれており、非常に包括的です。機械学習のための最大のTen...

ドローンはどうやって夏の「蚊との戦い」に勝つのでしょうか?これら3つのポイントを達成する必要があります。

夏が来ると、人類の最大の敵の一つである蚊が活発になります。彼らは2~3匹で「家に侵入」し、「ブンブン...

企業が機械学習を導入する際に直面する課題

機械学習は非常に重要な技術です。現在、50%以上の企業が機械学習の導入を検討または計画しており、企業...

ボストン大学の「Platypus-70B」がHugging Face大型模型ランキングでトップに!効率的なデータセットと独自のLoRA微調整が鍵

Hugging Faceのオープンソース大型モデルのランキングがまた更新されました。今回のランキング...

ディープラーニングAIを使用してマルウェアやAPTを検出し、防止する方法

[[163896]] [51CTO.com クイック翻訳] Deep Instinct は、最大 9...

ディープラーニング研究: コードと実験を効率的に管理するには?

回答1著者: イェ・シャオフェイリンク: https://www.zhihu.com/questio...

...

...

ランダム フォレスト分類アルゴリズムを使用して Iris データ分類をトレーニングするとどうなるでしょうか?

[[205745]] MLlib は、機械学習のエンジニアリング実践を簡素化し、大規模への拡張を容...

...

9 つのディープラーニング アルゴリズム、ご存知ですか?

[[439436]] 1フェーズまたは2フェーズのアルゴリズム2 段階アルゴリズムには、候補ボック...

業界: 過去数か月で、古い AI チップの価格が下がり、大規模モデルのトレーニングのコストが 60% 低下しました。

1月24日のニュースでは、大規模言語モデル(LLM)の開発にはコストがかかることがよく知られていま...

建物内の生体認証システム

新しい建物では、利用可能なリソースの最適化を最大限にしながら、セキュリティと有用かつ重要なデータを豊...