Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

CARLA v2 でエキスパートレベルの熟練度で実行されます。

タイトル: Think2Drive: 準現実的な自動運転のための潜在世界モデルでの思考による効率的な強化学習 (CARLA-v2 内)

著者所属：上海交通大学

現実世界の自動運転 (AD)、特に市街地運転には、多くのコーナーケースが伴います。最近リリースされた AD シミュレーター CARLA v2 では、運転シナリオに 39 の一般的なイベントが追加され、CARLA v1 よりも現実に近いテストプラットフォームが提供されます。これにより、コミュニティに新たな課題が生じます。既存の研究のほとんどは計画に特定のルールに依存する必要があり、CARLA v2 のより複雑な状況に対応できないため、これまでのところ、CARLA v2 の新しいシナリオに関する成功を報告した文献はありません。この仕事は、コーナーケースに柔軟かつ効果的に対処できるようにプランナーを積極的かつ直接的に育成するものであり、これが AD の将来の方向性でもあると考えています。私たちの知る限り、私たちは、環境の遷移を学習する世界モデルを備え、プランナーをトレーニングするためのニューラルシミュレーターとして機能する、Think2Drive という AD 向けの初のモデルベースの強化学習アプローチを開発しました。このパラダイムは、世界モデルの低次元状態空間とテンソルの並列計算により、トレーニング効率を大幅に向上させます。

その結果、Think2Drive は、単一の A6000 GPU で 3 日間のトレーニングを行った後、CARLA v2 でエキスパートレベルの熟練度で実行できるようになりました。また、当社の知る限り、現在までに CARLA v2 で成功 (ルート完了率 100%) は報告されていません。また、シナリオ全体にわたる運転モデルの評価をサポートするベンチマークである CornerCase-Repository も提案します。さらに、ルート完了、違反数、シナリオ密度などのパフォーマンスを評価するための新しいバランスのとれたメトリックが提案されており、運転スコアによって実際の運転パフォーマンスに関するより多くの情報を提供できるようになります。