ScalableMap: オンラインで長距離ベクトル化された高精度マップ構築のためのスケーラブルなマップ学習

ScalableMap: オンラインで長距離ベクトル化された高精度マップ構築のためのスケーラブルなマップ学習

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

元のタイトル: ScalableMap: オンライン長距離ベクトル化 HD マップ構築のためのスケーラブル マップ学習

論文リンク: https://arxiv.org/pdf/2310.13378.pdf

コードリンク: https://github.com/jingy1yu/ScalableMap

著者所属: 武漢大学

論文のアイデア:

本稿では、オンボードカメラセンサーを使用してオンラインの長距離ベクトル化高精度 (HD) マップを構築するための新しいエンドツーエンドのパイプラインを提案します。高精度マップのベクトル化された表現では、ポリラインとポリゴンを使用してマップ要素を表し、下流のタスクで広く使用されています。しかし、動的オブジェクト検出を参照して設計された従来の方式では、線形マップ要素内の構造的制約が無視されるため、長距離シーンではパフォーマンスが低下します。この論文では、マップ要素の特性を利用してマップ構築のパフォーマンスを向上させます。本論文では、線形構造のガイダンスの下でより正確な鳥瞰図 (BEV) の特徴を抽出し、ベクトル化されたグラフ要素のスケーラビリティをさらに活用するための階層的スパース グラフ表現を提案し、この表現に基づいて漸進的デコード メカニズムと監視戦略を設計します。私たちの方法 ScalableMap は、nuScenes データセット、特に長距離シーンで優れたパフォーマンスを発揮し、18.3 FPS を達成しながら、以前の最先端モデルを 6.5 mAP 上回りました。

主な貢献:

(i) この論文では、初のエンドツーエンドの長距離ベクトル化マップ構築パイプラインであるScalableMapを提案します。この論文では、マッピング要素の構造特性を利用してより正確な BEV 機能を抽出し、スケーラブルなベクトル化要素に基づく HSMR を提案し、それに応じてプログレッシブ デコーダーと監視戦略を設計します。これらすべてにより、優れた長距離地図認識が実現します。

(ii)ScalableMapのnuScenesデータセット[17]上でのパフォーマンスを評価するために広範な実験を実施しました。私たちが提案した方法は、長距離 HD マップ学習において最先端の結果を達成し、既存のマルチモーダル方法よりも 6.5 mAP 優れ、18.3 FPS を達成しました。

ネットワーク設計:

この論文の目的は、ベクトル化された地図要素の構造特性を活用して、より長い距離にある地図要素を正確に検出するという課題に対処することです。まず、本論文では、2 つのブランチを通じてそれぞれ位置認識 BEV 特徴とインスタンス認識 BEV 特徴を抽出し、線形構造のガイダンスの下でそれらを融合してハイブリッド BEV 特徴を取得します。次に、本論文では、マップ要素をスパースかつ正確に抽象化する階層的スパース マップ表現 (HSMR) を提案します。この表現をDETR[16]が提案したカスケードデコード層と統合し、ベクトル化されたマッピング要素のスケーラビリティと漸進的な監視戦略を活用して構造化情報の制約を強制し、推論の精度を向上させる漸進的デコーダーを設計します。当社のソリューション ScalableMap は、マップのサンプリング密度を動的に増加させてさまざまなスケールの推論結果を取得し、より正確なマップ情報をより早く取得できるようにします。

図 1: ScalableMap の概要。 (a) 構造ガイド付きハイブリッド BEV 特徴抽出器。 (b) 階層的スパースマップ表現とプログレッシブデコーダー。 (c)漸進的な監督。

図 2: 進行性ポリライン損失の視覚化。

実験結果:

引用:

Yu, J., Zhang, Z., Xia, S., & Sang, J. (2023). ScalableMap: オンライン長距離ベクトル化 HD マップ構築のためのスケーラブル マップ学習。ArXiv. /abs/2310.13378

オリジナルリンク: https://mp.weixin.qq.com/s/7VIS0B_Qbq7bmHSj6RIxOg

<<: 

>>:  Go-OpenAI を使用して ChatGPT を簡単に呼び出し、無限の創造性を解き放ちましょう。

ブログ    

推薦する

【他者から学ぶ】360 多面的関心の想起マインド実践的最適化

1. 事業背景ショートビデオや情報ストリームなどのシナリオの増加に伴い、ユーザーはこれらのシナリオで...

ChatGPTは30億ドルで訴えられました! OpenAIが相次いで訴訟される

ChatGPTが世界中で人気を博すにつれ、その開発元であるOpenAIはますます多くの疑問や批判に直...

人工知能とセキュリティ:繋がる双子

何十年もの間、セキュリティは重要であると考えられてきましたが、いわゆる「コアビジネス」機能に関与した...

失業は避けられないのでしょうか? AI時代、人類が将来やるべきことは2つだけ

Sinovation Venturesの李開復氏は「2017年中国企業100%年次大会」で講演し、「...

...

AI+不動産は10年後どうなるでしょうか?

[[274313]] [51CTO.com クイック翻訳] 周知のとおり、人工知能は継続的に発展し...

...

人工知能を活用した機械駆動型データ自動ラベル付け法

[[416242]]オブジェクト検出、オブジェクト認識、セグメンテーション タスク用の自動注釈ソリュ...

iOS 18 の新機能がついに公開されました!

今年は生成AI技術が大変人気です。ChatGPTの登場以来、多くの大規模な生成AIモデルが雨後の筍の...

多くの場所で顔認証の削除が通知されました!人工知能業界は衰退するのでしょうか?

[[356436]] 「ブラックテクノロジー」の顔スキャンマシンを大量に購入する人がいる一方で、顔...

重複ページの検索エンジンアルゴリズム分析

検索エンジンは一般的に、各 Web ページに対して一連の情報フィンガープリントが計算されるという考え...

ガートナー:持続可能性とデジタル主権がパブリッククラウドベースのAIサービスを選択する際の最重要基準となる

ガートナーは、2027 年までに、生成型人工知能 (生成型 AI) を導入する企業の 70% が、持...

...

人工知能が新素材の研究開発を支援

現在、海外では人工知能が新素材の開発に役立っている事例が報告されています。英国リバプール大学の研究者...

2017-2019 AIの3年間の浮き沈み

ガートナーが発表した2017年の「技術成熟度レポート」によると、5G、人工汎用知能、ディープラーニン...