この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。 自動運転の分野では、高精度の地図が測位、計画、衝突回避に重要な役割を果たし、運転の安全性と高品質のルート予測を保証します。しかし、高精度の地図の構築は、ハードウェアの構成とソフトウェア、および使用するアルゴリズムの両面で、高価で複雑であり、高度な専門性を必要とします。 上記の点については、複数の研究者が質の高いレビューをいくつか提供しています。 (1)機械学習 - 本稿では、物体認識、検出、セグメンテーション、モデリングなど、自動運転や高精度地図構築における機械学習、特にディープラーニングの進歩と応用についてレビューします。 (2)特定の入力ソース(LiDARまたは画像)への絞り込み、および(3)モーダル融合。 既存のレビュー論文では、一般的な道路設備の抽出方法に重点が置かれる傾向がありますが、一部の先行技術では、線路標示や車線線など、より具体的なタイプの設備の検出および抽出方法の調査に重点が置かれています。 この論文の主な目的は、HD マップに関する家具特有の観点から、最近の進歩についてより焦点を絞った概要を提供することです。一般的な HD マップは道路セグメントのレンダリングに重点を置いていますが、マップ ファニチャーは、車線、標識、柱、木、橋、急勾配など、道路セグメント上の重要なオブジェクトの意味情報と視覚情報に関する追加のコンテキストを提供します。 HD マップ家具が提供する機能について深く理解すると、次の 2 つの利点が得られます。 (1)マップ構築の品質とリアルタイム認識の両面から、マッピング家具検出・認識アルゴリズムの設計を改善します。 (2)より説明可能で堅牢な自動運転システムを構築する能力。 この記事は次のように構成されています。 (1)第2章では、 HDマップの背景知識から始め、HDマップ制作の歴史、用途、要件、HDマップ制作の高度な作業について簡単に紹介します。 (2)一般的なHDマップ構築作業の考え方に続いて、次のセクションでは、データの取得(セクション3)、家具の表現と分類(セクション4)、家具の構築(セクション5)に焦点を当てます。 (3)HDマップの実用性をより深く理解するために、著者らは利用可能なデータセット(第6節)と評価指標(第7節)についてもまとめている。 この論文の主な貢献は次のとおりです。
2. 背景このセクションでは、ナビゲーションや AV で使用されるデジタル マップと HD マップの歴史の概要を示し、センサーベースの AV の安全要件と課題、および一般的な HD マップ アプリケーションの仕様について説明します。 2.1 高精度地図(HDマップ)の3つの大きな特徴1.高精度、高レベルの詳細、高精度。 「HD」の意味は、より高い解像度(詳細レベル)を持つデータの種類に由来します。従来技術では、この用語は異なるタイプのエラーをひとまとめにするため、誤解を招きます。ただし、「HD」はより品質の尺度を表します。以下の 3 つの側面を含める必要があります (図 2 に詳細を示します)。
2.意味を超えた豊富な情報。従来の地図と比較すると、各道路設備に割り当てられる属性は、単純な意味ラベルに限定されるべきではありません。自動運転の目的とその潜在的な将来性に応えるためには、革新的な特性を提案する必要があります。たとえば、従来の地図上の速度制限標識は通常、「制限速度: 60」や「標識の色: 白」などの意味情報で構成されています。ただし、高速道路のシナリオでは、追加のコンテキストがあります。通常、「制限速度: 60」の下に「トラック用」と書かれたトラックのシンボルの標識があります。これらには補足情報として親子の速度制限が必要です。車両の位置を正確かつ確実に特定するために、有効期限と位置の信頼性を追加して、道路設備コンポーネントを記述することができます。 3.最新の。一般的に、最新とは、軌跡情報(天候など道路に関係のない要素を除く)が最新のものである必要があることを意味します。この場合、道路建設の進行中に地図(主にジオメトリとトポロジ)を更新できます。しかし、自律的な測位のために道路設備に依存する自動運転車は、運転の安全性を確保するために、真に最新の高精度の地図を必要とします。そのため、HD マップ プロバイダーは、現実世界の道路網におけるマクロおよびミクロの変化を検出し、すぐにマップを更新する必要があります。 2.2 高精度地図構築ワークフロー参考までに、図 3 に一般的なエンドツーエンドの HD マップ構築プロセスを示します。ワークフローは、データ取得(青色のステップ)、データ処理(黄色のステップ)、マップ更新(緑色のステップ) の 3 つの主要な段階に分かれています。 3. データ収集3.1 センサーの選択LiDAR ポイント クラウドと、LiDAR センサーおよびカメラによってキャプチャされた画像は、HD マップ構築の 2 つの主なソースです。 HD マップ構築における LiDAR とカメラのさまざまな側面の比較を表 1 に示します。 3.2 高精度地図におけるLiDARとカメラの論争LiDAR はランダムな形状の家具を処理するのが難しく、逆にカメラは雑然とした背景にある物体を処理するのが難しくなります。 図 4 に示すように、カメラと LiDAR 間の道路セグメントの視覚的な比較を示します。 3.3 センサーデータ取得とセンサーフュージョンの課題上で説明したさまざまな種類のセンサーには、道路設備、外部環境、システム設定のさまざまな組み合わせを扱う際に、独自の共通の利点と欠点があります。取得から意思決定までの情報(つまり、入力データ、中間データ、最終出力)を融合することで、さまざまなタイプのセンサー(およびアルゴリズム)の弱点をある程度軽減し、全体的なパフォーマンスを向上させることができます。 マルチセンサーデータ融合 (MSDF) の構造は 3 つのレベルに分かれています (図 5)。
ディープ ニューラル ネットワークの急速な発展により、抽象レイヤーは単純で直感的な機能に限定されなくなり、隠しレイヤーで構成することもできるようになりました。 LLF はこのセクションで説明する問題に直接関係していますが、MLT と HLF についてはセクション 5 で説明します。 4. 高精度地図上の道路設備通常、HD マップには、少なくとも車線、道路の境界/路肩、ガードレール、標識、ポール、標高モデルや建物のファサードなどの表面に関する情報が含まれています。セクション 1 で述べたように、各オブジェクトの仕様は、高精度の地理的位置、幾何学情報、およびその他の追加の意味情報で構成されます。このセクションでは、これらを 3 つのカテゴリ (1D 車線、2D サーフェス、3D オブジェクト) に分類し、各クラスの機能、幾何学情報、表現、特性について詳しく説明します。既存の技術の中には、道路設備が道路沿いの固定物体として定義されているため、車線と地形を道路設備から分離するものがあります。この論文では、著者は道路ファニチャーを使用して、特定の道路ネットワークの全体的な機能を構成するオブジェクトを表します。これは、道路コンポーネントと道路オブジェクトに相当します。対照的に、非道路設備とは、ナビゲーションに関連する共通エンティティのキャプチャに参加するが、空間エンティティ/表面としての道路ネットワークの機能に関するデータを一切持たないオブジェクトを指します。図 6 は、車線やその他の 3D 非道路オブジェクトを含む視覚化の例を示しています。 4.1 1D 車線ライン車線モデルには、運転中に車両がどこに行くべきかについての基本的なガイダンスを提供するために、描画された線と仮想の車線/道路境界(ガードレールや路肩などの物理的な境界とは別)が用意されています。車線ジオメトリは、車線タイプ (実線、破線など)、ID、色、幅などの追加の説明ラベルが付けられたポイント (通常はスプラインで表されます) で構成されます。 3D オブジェクトと比較すると、この家具のデータ サイズは非常に小さくなります。たとえば、HD マップ データセットのレポートでは、1 車線あたり 1 メートルあたりの (幾何制御) ポイントの数は通常 10 未満ですが、道路の曲率や実際の多項式補間方法に応じて多少の変動があります。通常、短い距離の線/曲線を記述するには、3 つの制御点だけが必要です。 車線標示は、世界で最も広く普及し、一般的に使用されている道路設備です。理論上、すべての車線は車線標示で構成されている必要があります。これを補完するために、画像ベースおよび LiDAR ベースの車線マーキング (リアルタイム) 検出方法が十分に研究されており、路面と比較した高い色のコントラストや不変の形状と幾何学など、その特性の多くが活用されています。これらすべてにより、車線マーキングは、ADAS などの低レベルの自動運転システムで広く使用される最初の HD 対応機能となります。 しかし、実際のシナリオに適用する場合、車線には依然として一定の制限があります。まず、塗装は、ひどい腐食や浸食により、時間の経過とともに必ず剥がれてしまいます。交通調査によると、車線標示(およびその他の塗装標示)は道路や悪天候の影響で摩耗し、使用される材料に応じて有効寿命は 1 年から 5 年になります。さらに、道路保守サービスでは車線をすぐに塗り直すことはできません。さらに、車線標示は天候の影響を受けやすいです。相関が低いため、雨天時には LiDAR センサーから見えない可能性があります。雪は車線や水平面上のその他の特徴も覆うことがあります。これらの制限により、高精度の地図とリアルタイムの認識に重大な曖昧さが生じます。補完的な観点から見ると、車両の自己位置特定におけるもう 1 つの重要な制限は、パターンが道路の方向 (縦方向) に沿って繰り返されるため、主に車両を横方向に位置特定するために使用されることです。 4.2 3DオブジェクトHD マップでは、3D オブジェクトは、元々は個別のポイント (LiDAR によって) としてキャプチャされていたとしても、通常は 3D 占有グリッドのローカル デカルト座標として表されます。この表現は、ベクトルや離散点などの他の 3D オブジェクト表現と比較して、データ サイズのコンパクトさ、比較的簡単な管理、レイヤー ベースの解像度、ロボット工学、視覚化、ディープラーニング、自己位置特定などで使用される多くの既存のアルゴリズムとの潜在的な互換性などの利点があります。ただし、元のポイントをラスタライズするときにボクセルの方向と解像度が混在するため、エイリアシングの問題、再利用性の低下、スケーラビリティの低下など、いくつかの欠点があります。 同時に、車線と同様に、HD マップ内のオブジェクトは占有グリッドの単なるクラスターではありません (ただし、現在の実装の多くは、車両の位置を特定するために占有グリッドに依存しています)。つまり、オブジェクトの種類、色、テキスト情報、機能などの一連の (追加の) プロパティも必要です。 アプリケーション レベルでは、ほとんどの 3D オブジェクトは車線に比べて耐久性があり、比較的長い時間その場所に留まり、元の情報を保持します (マップが構築されると)。たとえば、電柱の寿命は高速道路と都市環境、電柱の種類によって異なり、30 年から 60 年の範囲です。道路工事や事故が発生しない限り、物理的な路肩やガードレールは事実上不滅です。さらに、ポールなどの垂直に配置された家具は頑丈で、悪天候から保護します。これらすべての特性により、3D オブジェクトは HD マップ、特に自己位置特定、ADAS、衝突回避に関連するアプリケーションに最適なコンポーネントになります。 4.3 2D サーフェスHD マップの 2D サーフェスは、主に道路の表面 (デジタル地形モデル (DTM) の一部と見なすことができます) と建物のファサードを指します。これらの家具オブジェクトは、直感的には平らなオブジェクトであると考えられていますが、その用途や表現は大きく異なります。 4.3.1 地形デジタル地形モデル(DTM)はもともと地理学/地球科学の分野で提案され、水文地質学的分析/モデリング(流域モデルなど)、災害監視(血液モデルなど)、農業管理などで広く利用されてきました。これは通常、3 次元グリッドと 2 次元の直交グリッドで表され、各グリッドは標高情報を表します。 自動運転や高精度地図の分野では、高精度・高解像度の地形モデルが車両の自己測位に初めて応用されています。車両を横方向および縦方向に位置特定する際に、位置特定されたオブジェクトを区別する能力がないため、このアプローチは、歩道上の他の道路設備オブジェクト(ポールなど)と比較して、あまり人気がありません。現在、地形に関するいくつかの特性はデータベースに保存され、運転品質と乗り心地の向上に使用されています。たとえば、道路の傾斜角度は、カーブや曲がり角の前に車両に警告するために使用され、車両はサスペンションを調整して車体のロールを打ち消し、車両の安定性を向上させることができます。同様に、照明システムは死角や暗い場所を照らすように角度が付けられており、安全性が向上します。農村環境における UAV の場合、高解像度 DTM は測位と環境認識において依然として一定の応用価値を持っています。 4.3.2 ファサード/表面ファサードは、依然として HD マップ家具の小さなカテゴリと見なされています。これらの家具 (および 3D 建物モデル) を HD マップ データベースに組み込む動機は、視覚化に重点を置いたアプリケーションにあります。車両自己測位の大前提は、まず許容誤差範囲内で車両のGNSS測位を実行し、次にローカルサーチ自己測位によって車両を正確に位置決めすることです。残念ながら、都市環境におけるグローバル ナビゲーション システムは、マルチパス干渉や高層ビルやその他の構造物による障害物によって不正確になり、車両の位置の初期推定値が許容できない誤差にまでずれてしまいます。したがって、特定の都市環境における車両の自己位置特定には、建物、特にその 2D 表面/ファサードが導入されます。 これらの技術は通常、画像ベースです。データベースには高解像度の建物のファサード画像が保存されています。典型的なワークフローは、リアルタイムの画像キャプチャ、それに続くファサードのセグメンテーションとマッチング、そして姿勢の推定です。制限としては、位置特定パフォーマンスは更新された建物のファサード画像、高品質(リアルタイムキャプチャとデータベース)画像に大きく依存し、フレームごとの姿勢推定アルゴリズムのコストが非常に高いことが挙げられます。 4.3.2 ファサード/表面道路備品(一部には可動物を含む)の目的や機能に基づいて、さまざまな研究者がさまざまな分類を定義していますが、統一された基準はありません。道路設備の出発点は地図であり、その主な目的は位置決めアルゴリズムを提供することであるため、3 次元、2 次元、および 1 次元の次元表現に従って分類されます。運転シナリオで観察できる家具の種類は 150 種類以上あることを考慮すると、単一レベルの分類アプローチでは明らかに不十分です。既存の技術では、この単純な分類法に従って、特定のタスクの要件よりもデータの提供を優先しています[34、39、48、74、235、235]。物体認識の研究では、空、人、乗り物、建物など、物体の意味に基づいてカテゴリを形成する 2 レベルの分類法が使用される傾向があります。補完的分類法やハイブリッド分類法も使用されますが、その本来の目的はデータ指向分類法やタスク指向分類法に固定することはできません。 3 つの分類は図 7 に示されています。 5. HD家具の製造このセクションでは、ラベル付けプロセスや学習プロセスなど、HD マップ構築で使用されるセグメンテーション手法の概要を説明します。 5.1 道路設備タグ2D では、オブジェクトの形状/輪郭をピクセル レベルでラベル付けする (これにより位置/底点も決定されます) ことはコストと時間がかかり、3D ではさらにコストがかかります。たとえば、2012 年のオブジェクト検出データセットのうち、有名な KITTI データセットには境界ボックス付きのラベル付き画像が約 15,000 枚含まれていますが、2015 年のステレオおよびフロー ベンチマークには、ピクセルレベルのセマンティック注釈が付いた画像が 400 枚しか含まれていません。 3D ラベリングに関しては、チームは 2017 年にオリジナルの 2D バウンディング ボックス ラベルと一致する 3D バウンディング ボックス ラベルをリリースしましたが、現在のところ 3D ピクセル/ボクセル レベルのラベルは提供していません。 従来のラベリング ツールとプロセスでは、手動での微調整が必要になる可能性があるため、ピクセル レベルのラベリングは 2D 空間での境界ボックスのラベリングよりもコストがかかります。 3D ピクセル レベルのタグ付けでは、難易度がさらに上がります。より高い次元で作業する必要があるだけでなく、主なインタラクション ファニチャー (ディスプレイ) が 2D インタラクションしか処理できないという制限もあります。 ピクセルレベルのラベリング プロセスを高速化するために、ラベリング/微調整と学習ループで構成されるパイプラインが使用されます。これは、反復的なエンド ユーザー インタラクティブ コンセプト学習と呼ばれることがよくあります。近年、「ヒューマン・イン・ループ」という用語がより一般的に使用されるようになりました。このプロセスは本質的に、完璧なラベルを作成するコストを、平均品質のラベルの作成とラベルの改良のシーケンスに移行し、大規模に最大の利点を発揮します。 ワークフロー全体を図 8 に示します。ここでは、人間が関与するプロセスがオレンジ色でマークされています。 5.2 道路用家具の抽出著者らは、さまざまな学習方法を使用して、画像や LiDAR ポイント クラウド (またはその両方) から各代表的な道路設備を抽出する方法を概説します。学習された分類と命名法については普遍的なコンセンサスがないため、このセクションでは、人間による特徴エンジニアリングを使用して記述子を構築し、トレーニングがディープラーニングを使用して行われない学習フレームワークを指すために、古典的な機械学習 (CML) を使用します。対照的に、ニューラル ネットワーク ベース ラーニング (NNL) は、ディープラーニングに基づく手法を指します。なお、以下に述べる方法のいくつかは、高精度の地図構築とリアルタイム認識と組み合わせて使用できます。 5.2.1 車線標示セクション 4 と 3 で述べたように、車線標示は運転シーンで最も一般的な要素であるだけでなく、カメラと LiDAR センサーの両方で簡単に検出できます。これらの特性に着想を得て、CML ベースの方法は、背景から色、形状、LiDAR 強度の特徴を抽出することに重点を置いています。 これまでの研究のほとんどは地上画像と LiDAR を入力データ ソースとして使用していましたが、一部の研究者は、包括的なカバレッジ、低コスト、および更新の容易さを理由に、位置合わせの整った高解像度の画像 (航空写真、UAV など) を使用して、位置特定とナビゲーションの関連性の問題に対処しようと試みてきました。現在、画像の解像度はピクセルあたり 0.5 メートル以下に達するため、車線レベルの機能をモデル化する従来のアプローチに、より詳細な画像を活用できます。 車線マーキング検出に関連する出版物は多数あるため、車線マーキング研究論文の同様の概要を表 2 に示します。学習の焦点の列には、研究論文が焦点を当てている学習フレームワーク (CML または NNL) が示されます。調査論文が対象論文の詳細な評価や比較を提供していない場合、評価指標の列の値は「提供されていません」とマークされます(セクション 7 を参照)。最後の列「入力フォーカス」には、調査対象論文の(主に)入力データ ソースが表示されます。 5.2.2 棒状の物体車線標示とは異なり、ポール状の物体は遠近法の画像(遠くから)では観察が難しく、航空写真では(垂直投影が小さいため)ほとんど観察不可能ですが、地上の点群では非常によく見えます。さらに、棒状の物体の検出/セグメンテーションは、通常、点群における物体検出研究のごく一部であると考えられています。つまり、ニューラル ネットワークはより広範囲のオブジェクト向けに構築されているものの、この特定の家具向けに構築されたものはないということです。各機械学習分野の代表的な論文をいくつか表3に示します。 5.2.3 標識サイネージは、ADAS と自己位置特定に使用されるもう 1 つの注目すべきタイプの家具です。車線標示と同様に、標識検出技術も過去数十年にわたって広く研究されてきました。 CML ベースのソリューションが数多く提案されており、これらの作業はいくつかの調査論文にまとめられています。 5.3 課題と解決策高精度マップ家具を構築および管理し、その使用の効率と有効性を向上させるには、対処すべき課題がいくつかあります。特に問題となるのは、ストレージ テクノロジの管理に関するもので、これは LiDAR ポイント クラウドを生成中に変換するという問題と密接に関係しています。具体的には、モビリティの側面(時間によって変化する密度、効率的なルーティング、安全性など)と車両データ消費のコストを考慮して、複数のユーザーにデータをダウンロードするという観点から、さまざまなコンテキストをどのように割り当てるべきかを検討します。関連するもう 1 つの問題は、高精度のマップ ファニチャーでさまざまなコンテキストのバランスをとる方法です。都市環境では、頻繁な位置特定と制御/ナビゲーションの結合により、車線標示と標識は同じ重要性を持つ可能性がありますが、高速道路環境では、目的地がわかっていると仮定すると、特定の出口やその他の設備(近くの建物など)の標識データは、特定の自動運転車にとって重要ではない可能性があります。 6. データセットこのセクションでは、道路セグメントに取り付けられた家具で構成される HD マップ データセットに焦点を当てます。 HD マップ家具関連のデータセットは、検出/認識タイプの問題に重点を置いた他の文献レビューで見つけることができます。ご存知のとおり、高精度の地図を製作するには非常に費用がかかります。前述したように、プロセスの各ステップ (データの取得、データの調整、家具の抽出、品質保証) には、多大な労力とハードウェア コストがかかります。その結果、利用可能な HD マップ データセット、特に地域をまたがる大規模な道路網をカバーし、道路設備が充実しているデータセットの数は限られてしまいます。 6.1 高精度地図データセット6.2 その他の潜在的なデータセットHD マップ データセットに近いデータセットはいくつかありますが、それでも自動運転シナリオに関連する特性を研究するのに十分なコンテンツが提供されています。これらのデータセットは、さまざまなターゲット目的 (オブジェクトの認識や知覚など) 向けに作成されており、適切な空間の連続性や接続性のない別々のフレームまたはローカル コンテナーにデータとラベルを表示することに重点を置いています。代表的な作品としては、KITTI データセット、nuScenes データセット、The Oxford RobotCar データセット、KAIST データセットなどがあります。 6.3 合成データセット合成データセットは、HD マップ作成パイプライン全体のコストの点で大きな利点があり、道路設備をさらに生成することで簡単に拡張できます。研究者は通常、Synthia (Unity 3D 搭載)、CARLA (Unreal Engine 4 搭載)、NVIDIA DRIVE Sim (Omiverse 搭載)、DeepGTAV10 (Rockstar Advanced Game Engine 搭載) などの高忠実度シミュレーターを使用して合成データセットを生成します。 これらの高忠実度シミュレーターでは、道路設備や車両、歩行者などのその他のキャラクターに独自の 3D モデルがあります。仮想都市は、事前に決められたトポロジー/道路ネットワークから構築され、オブジェクト/アイテムの配置は現実世界の学習方法、つまり主観的な認知に基づいています。すべてのオブジェクトが作成されると、合成自律走行車を割り当てて動的に運転し、さまざまなカテゴリのデータ(人工ノイズを追加)を収集して、現実世界の取得をシミュレートできます。名前が示すように、低コストでスケーラブルであるにもかかわらず、合成データセットで提示される世界は通常、十分に現実的ではなく、実際のシーンとの明らかなギャップがあります。したがって、実際のデータの代わりとして使用することはできません。 6.4 課題と解決策HD マップ データセットを作成するために多くの貢献者によって多くの作業が行われてきましたが、最先端の技術に影響を与える 2 つの基本的な課題が依然として残っています。 最初の大きな課題は、データ形式の標準化が欠如していることです。データセットによって、生データの表示に異なるコンテナーが使用され、家具のラベル (特に 3D データとラベル) を整理するのに異なるモードが使用されます。これにより、パーサーが提供されている場合でも、データの理解と読み込みにコストがかかります。幸いなことに、それらはすべて階層型マークアップ言語(XML、JSON、protobufなど)を使用してデータを保存しているため、少なくともデータは意味的に読み取り可能になります。 2 番目の課題は品質管理の欠如です。前述したように、高精度のマップ データセットを構築するには、データの取得と注釈付けのステップだけでなく、品質管理の段階も含め、すべてのステップで非常にコストがかかります。一部のデータセットでは、フレーム間、データとラベル間、ポイントと画像間の不整合の問題が発生しています。さらに、グローバルな不整合、つまりデータセット自体と、それが整合されている他の GIS 関連データセット (OSM 道路ネットワーク、USGS 画像/LiDAR、Bing 画像など) との間の不整合により、複数の既存データセットのスケーラビリティが制限されます。 最初の課題に対処する 1 つの可能性は、(汎用かつパブリックな) オブジェクト リレーショナル マッピング プロトコルを使用してマップ ファニチャーを整理することです。このプロトコルはユーザーフレンドリー(JSON や GeoJSON に似た形式など)で、複雑で高精度なマップ家具ジオメトリと関連情報を処理できる必要があります。潜在的な解決策としては、HERE が提案するフォーマットされた GeoJSON である Map Object Model (MOM) があります。さらに、異種の空間データと環境データを統合する既存のアプローチの恩恵を受けることも可能です。 2 番目の課題に関しては、明らかに、業界と学界の連携を促進して、同じ関心領域で高品質の HD マップを作成し、効率的なマップ (コンテンツ) エラー修正/更新メカニズムを確立することが 1 つのアプローチです。 7. 品質評価図 9 に示すように、道路設備には多くの属性を割り当てることができます。各家具や各属性には、データの品質を表す評価指標が常に複数存在します。道路標識の分類や文字の正確さ、車線標示の色や線状の正確さ、ポールのポール形状の正確さなど。さまざまな家具の最も重要かつ共通の特性は、各オブジェクトの幾何学的精度と位置精度です。このセクションでは、まず幾何学的および位置的な評価メトリックを紹介し、最後に HD マップの全体的な品質について説明します。 7.1 家具の配置7.1.1 グローバル極座標と平面座標グローバル極座標と平面座標。家具オブジェクトを正しく配置することで、自己位置特定とルート計画のパフォーマンスが向上します。評価指標に入る前に、実務者が見落としがちな重要な前提として、地球上の距離と直交座標の距離の差は HD 要件に比べて極めて小さく、無視できるほど小さいということが挙げられます。 この記事では主に、GPS で使用される世界測地座標系 12 (WGS84) での地理的ポイントの表現と、距離を計算するときに発生する可能性のあるエラーと解決策について説明します。 WGS84 では、地理的な点は緯度、経度、高度で構成されます。距離を計算する場合、高度の影響が考慮されないため、直交座標系のように単純にユークリッド距離を使用することはできません。ただし、小さな領域を測定する場合、角度の差は非常に小さいため、デカルト近似を使用して計算を簡素化できます。これは、まず地理的なポイントをローカルの直交座標系に変換し、次に従来のユークリッド距離計算を適用することによって行われます。この変換プロセスは投影と呼ばれ、国サイズのユニバーサル横メルカトル (UTM) 投影や分割可能な Bing マップ タイル システムなど、多くの方法が開発されてきました。ただし、これらの投影はいずれも、より大きな表面積に適用すると、一定の誤差と形状の歪みが生じます。この記事では、高次関数の中間結果を繰り返し計算することで GS 距離を計算する、Vincenty の公式に基づく古典的な GS 計算アルゴリズムについても言及しています。最後に、この論文では、GS ベースのモデルをデカルトモデルに変換することによって生じる可能性のある歪みもグラフ形式で示しています。 図 10 の例を見ると、従来のアプリケーション (ルーティング/計画など) では高精度の位置決めは必要ないことがわかります。つまり、これらのアプリケーションでは、推定/計算エラーに対する許容度が高くなります。前述したように、参照グリッドを使用する平面座標系では、緯度、経度、高度に固有の歪みが生じます。 4 つの極座標点 (A、B、C、D) で定義される平面正方形参照グリッドを想定します。ここで、A は (緯度 A、経度 A)、B は (緯度 B、経度 B)、C は (緯度 C、経度 C)、D は (緯度 D、経度 D) であり、高度はそれぞれ h~A~、h~B~、h~C~、h~D~ です。点 P (緯度 p、経度 p) と点 Q (緯度 q、経度 q) がそれぞれ GS 距離と平面 (ユークリッド) 距離を表すと仮定すると、参照グリッドの歪みは次の式で表すことができます。 計算結果によると、より小さな領域で平面参照座標を使用する場合、最も厳しいHDマップ要件と比較しても、歪みは許容されます。高レベルのBingマップタイルシステム、およびその他の類似のグリッド座標(例:ローカルタンジェントプレーン(LTP)座標(北東ダウン(NED)など)は、適格な予測と見なされます。 したがって、検出されたポイントと真のグラウンドポイントの間の誤差は、e = d(a、a ')≈d〜p〜(a、a')として定義できます。図11(a)は、LTP座標系のポイントa〜1〜、a〜2〜、a〜4〜のE〜1〜、E〜2〜、およびE〜4〜のコンポーネントを示しています。 7.1.2道路座標RC座標(道路座標)は、オブジェクトのグローバルビューがないため、ポイントを変換するもう1つの方法ではありません。複数の隣接する道路接続には、個別のオブジェクトストレージが必要であるため、データの冗長性が発生します。車両のダイナミクス制御では、RCはもともと、車両の観点から車両の動きを推定する方法として使用されていました。より最近の研究では、ローカリゼーションのパフォーマンスと、車両の移動方向に対する垂直方向を説明するために縦方向および横方向の誤差を使用し始めています。今日、RCは、特に車線の維持とパフォーマンス評価のために、自律運転でより一般的に使用されており、メーカーにリアルタイムの観察/知覚データレコードを提供しています。 たとえば、図11(b)では、道路(ポリラインとLTPとして表される)l = l〜1〜、l〜2〜、...、ポイントa〜2〜は、最寄りのラインセグメント(l〜 k〜、l〜k+1〜)のポイントに割り当てられます。次に、ポイントa〜2〜の道路方向または縦方向はベクトル(l〜k〜、l〜k+1〜)として定義され、横方向は(l〜k+1〜、-l〜k〜)として定義されます。 LTPとRCの両方がデカルト座標系であることに注意してください。 このアプローチの最大の欠点は、オブジェクトが参照リンクに複数の最も近いポイントを持っている可能性があることです(例:リンクには急な曲線があります)、これがエラーに大きく影響する可能性があります。 7.2家具ジオメトリほとんどの検出アルゴリズムとグラウンドトゥルースラベルの出力は、大きな境界ボックスから小さなボクセルまで、ラスターデータの形で与えられます。これに関連して、組合(IOU)上の交差点とマルチクラスIou(MIOU)などのそのバリエーションは、これらのタスクで最も人気があり、直接使用される評価メトリックです。 IOUは、図13の青色の長方形に示すように、検出結果とグラウンドトゥルースを導入することにより、バイナリ分類問題に変換できます。他のメトリックには、真陽性(TP)、真のネガティブ(TN)、偽陽性(FP)、偽陰性(FN)、F1、精度、およびROCが含まれます。この場合、TNは常に0であることに注意してください。明らかに、ROCを除いて、他の高レベルのメトリックはしきい値に敏感であり、目標が異なる場合があります。たとえば、Kittiは、それぞれ15%、30%、および50%(3D車の70%)として簡単、中程度、および硬い制限を定義しています。 ただし、Iouとそのバリエーションにはいくつかの欠点があります。 3Dメッシュの表現に基づいて、IOUは不整合、スケール、および回転/視点の影響を受けず、さまざまなデータソース、フレーム、および座標の結果を評価するのに適していません。図12は、不整合((b)から(a))とスケール((c)から(a))がIOUスコアにどのように影響するかを示しています。したがって、研究者は、ピクセル/ボクセルまたはマスクのセットではなく、ラインセグメントなどのモデルに結果を蒸留し、グラウンドトゥルースモデルでさらに評価しました。 7.3包括的な評価HDマップは道路家具のコレクションで構成されており、全体的な品質を簡単なステートメントで要約することはできません - マップがどれほど正確であるか。このペーパーでは、3つの同様の基準、つまり絶対位置誤差、相対位置誤差、存在(精度とリコール)を提案し、家具分類の精度の精度を記述するための別の次元を追加します。 最も単純なシナリオ(すべてのオブジェクトは1つのカテゴリに属します)では、つまり、1つのグラウンドトゥルースと一致できる観測値は1つだけです。異なる企業には、HDの要件が異なります。たとえば、Atlatec [54]は4 cmの測定を使用しています。実際には、検出結果の不確実性は避けられないため、一致するプロセスが非常に複雑になります。 TN、TP、およびFNセットが決定されると、精度やリコールなどの他のメトリックを計算できます。 絶対誤差とオフセット。 式5に関しては、マップがグラウンドトゥルースと完全にオフセット/ミスアライインしている場合、e〜shift〜 = 0。さらに、エラーEおよびE〜シフト〜は、北のコンポーネントと東成分に分解できます。つまり、e =(e.north、e.east)、e〜shift〜 =(e〜shift〜.north、e〜shift〜.east)、詳細な品質分析など。 精度とリコールは人気がありますが、他のメトリックを使用できます。 F1での精度とリコールを組み合わせることに加えて、さまざまなタイプのメトリックを探索する価値があるかもしれません。 8. 結論このペーパーでは、HDMに関連するデータの問題、特にHDMの家具を体系的に要約します。(1)HDMおよびHDM家具の背景知識、基本的な方法、抽出方法。包括的な概要は、(1)既存のHDマップデータセット。さらに、HDマップ家具評価指標の分類が要約され、提供されます。それらに対処するための現在の課題と潜在的な手段について説明します。 |
<<: Adobe がインドのスタートアップ Rephrase.ai を買収、生成 AI 分野で初の買収となる
デジタル化の大きな波の中で、一見些細な失敗が、深い疑問を浮かび上がらせます。それは、企業が業務に人工...
AI チャットボットは、自然言語処理と機械学習を使用してユーザーとの人間の会話をシミュレートするソフ...
サポートベクターマシン (SVM) [[326874]]サポート ベクター マシンとは何ですか? サ...
マルチモーダル生体認証とは何ですか? マルチモーダル生体認証は、さまざまなシナリオやセキュリティ レ...
[[186749]]かつてはSF作家や脚本家の領域だった人工知能が、今や着実に現実世界に進出しつつあ...
コンピューター ビジョンは、写真やビデオなどのデジタル画像の側面に焦点を当てた人工知能のサブフィール...
こんにちは、みんな。今日も引き続き、興味深い AI プロジェクトを皆さんと共有したいと思います。前回...
顔認証と指紋認証は、携帯電話のロックを解除する主な 2 つの方法です。私たちは、日常の仕事でも公共の...
[[360029]]記者 | 趙孟近年、顔認識技術の普及に伴い、国民の個人情報のセキュリティに関する...
過去 10 年間で、食品業界では 3D プリント食品、食用センサー、ロボット調理、AR ダイニングな...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...