BEV におけるデータセット間レーダーカメラ融合に関する実験的研究

BEV におけるデータセット間レーダーカメラ融合に関する実験的研究

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

原題: 鳥瞰図におけるレーダーとカメラの融合に関するデータセット間実験的研究
論文リンク: https://arxiv.org/pdf/2309.15465.pdf
著者所属機関: オペル自動車株式会社 ラインラント=プファルツ工科大学 カイザースラウテルン=ランダウ ドイツ人工知能研究センター

論文のアイデア:

mmWave レーダーとカメラの融合システムは、補完的なセンサー情報を活用することで、先進運転支援システムや自動運転機能に非常に堅牢で信頼性の高い認識システムを提供できる可能性があります。カメラベースの物体検出における最近の進歩により、ミリ波レーダーカメラと鳥瞰図の特徴マップを融合する新たな可能性が生まれています。本稿では、新しい柔軟な融合ネットワークを提案し、nuScenes と View-of-Delft の 2 つのデータセットでそのパフォーマンスを評価します。私たちの実験では、カメラ部門では大規模で多様なトレーニング データが必要であるのに対し、mmWave レーダー部門では高性能 mmWave レーダーからより多くのメリットが得られることがわかりました。この論文では転移学習を使用して、より小さなデータセットでのカメラのパフォーマンスを向上させます。さらに、私たちの結果は、mmWave レーダーとカメラの融合アプローチが、カメラのみおよび mmWave レーダーのみのベースラインを大幅に上回ることを示しています。

ネットワーク設計:

3D オブジェクト検出における最近の傾向は、画像の特徴を共通の鳥瞰図 (BEV) 表現に変換することです。これにより、複数のカメラ間の融合や距離センサーの使用に使用できる柔軟な融合アーキテクチャが提供されます。本研究では、もともとレーザーカメラ融合に使用されていた BEVFusion 法を拡張して、ミリ波レーダーカメラ融合を実行します。提案された融合方法は、選択された mmWave レーダー データセットでトレーニングおよび評価されます。いくつかの実験で、各データセットの長所と短所について説明します。最後に、本論文では移行を適用してさらなる改善を実現します。

図 1 BEVFusion に基づく BEV ミリ波レーダー カメラ融合フローチャート。生成されたカメラ画像には、投影された mmWave レーダー検出と地上真実境界ボックスが含まれます。

この記事では、BEVFusion の融合アーキテクチャについて説明します。図1は、本論文におけるBEVにおけるミリ波レーダーとカメラの融合のネットワーク概要を示しています。融合は、BEV 内でカメラと mmWave レーダー機能が接続されたときに発生することに注意してください。以下、この記事では各ブロックの詳細について説明します。

A. カメラエンコーダーとカメラからBEVへのビュー変換

カメラエンコーダとビュー変換は[15]のアイデアを採用しており、任意のカメラの外部パラメータと内部パラメータの画像BEV特徴を抽出できる柔軟なフレームワークである。まず、tiny-Swin Transformer ネットワークを使用して各画像から特徴を抽出します。次に、[14]のLiftとSplatのステップを使用して、画像の特徴をBEV平面に変換します。このため、高密度深度予測の後にルールベースのブロックが続き、そこで特徴が疑似ポイント クラウドに変換され、ラスタライズされて BEV グリッドに蓄積されます。

B. レーダーピラー特徴エンコーダ

このブロックの目的は、mmWave レーダー ポイント クラウドを、画像 BEV 機能と同じグリッド上の BEV 機能にエンコードすることです。この目的のために、本論文ではピラー特徴エンコーディング技術[16]を使用して、点群を無限に高いボクセル、いわゆるピラーにラスタライズします。

C. BEVエンコーダ

[5]と同様に、mmWaveレーダーとカメラのBEV機能はカスケード接続で融合されています。融合された特徴は、ジョイント畳み込み BEV エンコーダーによって処理され、ネットワークが空間的なずれを考慮し、異なるモダリティ間の相乗効果を活用できるようになります。

D. 検出ヘッド

この論文では、CenterPoint 検出ヘッドを使用して、各クラスのオブジェクト中心のヒートマップを予測します。さらに回帰ヘッドは、オブジェクトのサイズ、回転、高さ、および nuScenes の速度とクラス属性を予測します。ヒートマップはガウス焦点損失を使用してトレーニングされ、残りの検出ヘッドは L1 損失を使用してトレーニングされます。

実験結果:

引用:

Stäcker, L., Heidenreich, P., Rambach, J., & Stricker, D. (2023). 鳥瞰図におけるレーダーカメラ融合のデータセット間実験研究。ArXiv. /abs/2309.15465

オリジナルリンク: https://mp.weixin.qq.com/s/5mA5up5a4KJO2PBwUcuIdQ

<<:  はるか先へ! BEVHeight++: 道路脇の視覚的な 3D オブジェクト検出のための新しいソリューション!

>>:  Linux サーバー管理のヒント: 効率とセキュリティを向上させる

ブログ    
ブログ    
ブログ    

推薦する

自動車ドメインコントローラの統合アーキテクチャの背景、利点、設計を1つの記事で理解する

車両の電動化が徐々に進むにつれ、電子制御ユニット(ECU)が車全体を制御するようになりました。アンチ...

インターネットの大失敗: 破壊された破壊者

[[324391]]インターネットの破壊的イノベーションは、自らの業界から生まれることはありません...

AIを金融業界の傍観者と考えるのはやめよう

2019年には目を見張るようなAIイノベーションが数多く見られ、今後も金融業界におけるAIの影響は深...

マスク氏に敵対的買収の疑い!ツイッター株を受け取ったが取締役会には参加せず、訴訟を起こされている

これはすべて悪意のある計画ですか? ツイッター株を7000万株以上購入した後、マスク氏は取締役会への...

ソフトウェア開発における人工知能: 自動化と最適化

最先端技術である人工知能(AI)は、さまざまな分野で大きな可能性を見せています。ソフトウェア開発の分...

成都初の無人地下鉄が運行開始。列車の前方からの眺めはまるで時空を旅しているかのようだ

毎日地下鉄に乗るとき、トンネルを高速で走る列車の前方風景を見たことがありますか?11月13日、成都初...

対称暗号化アルゴリズムと非対称暗号化アルゴリズムの違いは何ですか?

Q: 対称暗号化アルゴリズムと非対称暗号化アルゴリズムの違いは何ですか? 特に暗号化、署名、ハッシ...

CIO 向けガイド: ジェネレーティブ AI の「ハイライト モーメント」を実現する 5 つの方法

あらゆる誇大宣伝と主流の採用率の高さにもかかわらず、生成 AI は生産性のピークに到達する前に、幻滅...

自動車の未来:スマート製造の採用

インテリジェント製造技術の出現は自動車製造業界に大きな影響を与えました。まず、スマート製造では、自動...

...

NASA、宇宙飛行士が宇宙船と自由に通信できるようにするChatGPTスタイルのAIを開発

6月26日のニュースでは、SF映画「2001年宇宙の旅」の中で、AIスーパーコンピュータHAL900...

オーディオ品質評価方法の簡単な分析

パート01 評価方法オーディオ品質の評価に関しては、オーディオの品質を完全に理解するために、主観的評...

転移学習とクロスドメイン推奨、およびクロスドメイン推奨のソリューション

この記事では、主にクロスドメインの推奨事項について詳しく紹介します。内容は以下のとおりですが、これら...

テンセントクラウドが7つの新製品をリリース、AIアプリケーションは洗練へ向かう

12月11日、テンセントクラウドは北京で新しいビッグデータAI製品発表会を開催した。テンセントクラウ...