AmodalSynthDrive: 自動運転のための合成アモーダル知覚データセット

AmodalSynthDrive: 自動運転のための合成アモーダル知覚データセット

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

  • 論文リンク: https://arxiv.org/pdf/2309.06547.pdf
  • データセットリンク: http://amodalsynthdrive.cs.uni-freiburg.de

まとめ

この論文では、自動運転のための合成アモーダル知覚データセットである AmodalSynthDrive を紹介します。部分的に遮蔽されていても物体の全体を問題なく推定できる人間とは異なり、現代のコンピューター ビジョン アルゴリズムでは、この点が依然として非常に困難です。自動運転にこのタイプのモダリティフリー知覚を活用することは、適切なデータセットが不足しているため、ほとんど未開拓のままです。これらのデータセットの生成は、主に、高額な注釈コストと、遮蔽された領域に正確に注釈を付ける際の注釈者の主観によって引き起こされる干渉を軽減する必要性によって影響を受けます。これらの制限に対処するために、本論文では、合成マルチタスク非モーダル知覚データセットである AmodalSynthDrive を紹介します。このデータセットには、さまざまな交通、天候、照明条件下での 100 万を超えるオブジェクト注釈を含む、150 の運転シーケンスのマルチビュー カメラ画像、3D 境界ボックス、LIDAR データ、オドメトリが含まれています。 AmodalSynthDrive は、空間理解を強化するためのアモーダル深度推定の導入など、さまざまなアモーダルシーン理解タスクをサポートします。課題を明らかにするために、各タスクのいくつかのベースラインを評価し、パブリック ベンチマーク サーバーをセットアップします。

主な貢献

この論文の貢献は次のように要約されます。

1) 本論文では、複数のデータソースを持つ市街地運転シナリオ向けの包括的な合成アモーダル知覚データセットである AmodalSynthDrive データセットを提案します。

2) アモーダル知覚タスクのベンチマーク、すなわちアモーダルセマンティックセグメンテーション、アモーダルインスタンスセグメンテーション、アモーダルパノプティックセグメンテーションを提案する。

3) 新しい非モーダル深度推定タスクは、空間理解の向上を促進することを目的としています。私たちは、いくつかのベースラインを通じてこの新しいタスクの実現可能性を実証します。

紙の図表








要約する

知覚は自動運転車にとって非常に重要なタスクですが、現在のアプローチでは、複雑な交通シナリオを解釈するために必要な非モーダル理解がまだ欠けています。この目的のために、本論文では、自動運転のためのマルチモーダル合成知覚データセットである AmodalSynthDrive を提案します。合成画像と LiDAR ポイント クラウドを使用して、基本的なアモーダル知覚タスクのグラウンド トゥルース注釈付きデータを含む包括的なデータセットを提供するとともに、アモーダル深度推定と呼ばれる空間理解を強化するための新しいタスクも導入します。この論文では、60,000 を超える個別の画像セットが提供されており、それぞれがアモーダルインスタンスセグメンテーション、アモーダルセマンティックセグメンテーション、アモーダルパノプティックセグメンテーション、オプティカルフロー、2D および 3D 境界ボックス、アモーダル深度、鳥瞰図に関連付けられています。 AmodalSynthDrive を通じて、私たちはある種のベースラインを提供しており、この研究が動的な都市環境におけるアモーダルシーン理解の新たな研究への道を開くと信じています。

オリジナルリンク: https://mp.weixin.qq.com/s/7cXqFbMoljcs6dQOLU3SAQ

<<:  人工知能技術は建設業界をどのように変えるのでしょうか?

>>:  これは魔法ですか? ICCV 2023 の優秀な学生論文など、すべての情報を一度に追跡しましょう。 Githubには1.6Kのスターがあります

ブログ    

推薦する

2021年以降の人工知能トレンドに関する5つの予測

アンドリュー・ン教授(スタンフォード大学コンピュータサイエンスおよび電気工学准教授)は、「人工知能は...

...

モザイクから高精細画像まで、AIの画像作成能力は強化されてきましたが、美しさと歪みのバランスをどう実現するのでしょうか。

サスペンスやSF作品では、ぼやけた写真がコンピューターの画面に表示され、捜査官が画像を強調するように...

マスクのロボットが進化した!新たなスキルが解き放たれ、エンドツーエンドのニューラルネットワークが実現

マスク氏のロボットの大いなる進化。 1年前に初めて舞台に立ったときは動きが少しぎこちなかったが、今で...

工業生産は変化している:機械は人間よりも製造に優れている

最近、ロボットが人気になってきました。家庭生活、ホテル経営、学校教育、医療などさまざまな場面でロボッ...

顔認識は簡単に破られるのでしょうか?虐待と闘う方法

未来産業研究所は、顔認識市場規模は今後5年間で平均23%の複合成長率を維持し、2024年までに市場規...

MITはレーザー彫刻機にAIを搭載し、材料を自動的に識別し、98%の精度で彫刻の強度を判定した。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

IBM、GPUに匹敵する新しいニューラルネットワークチップを開発

本日 Nature 誌に掲載された論文で、IBM Research のポスドク研究員 Stefano...

「万能AI」GPT-3の中国版を作る方法

質問に答えたり、翻訳したり、記事を書いたり、コードを書いたり、数式を計算したり、アイコンを描いたりす...

私はAIロボットの何希2号です。私の話を聞きたいですか?

「インテリジェント ブレイン」センターの場所 - AIXO ビル、地下 21 階、タイムトラベル研...

...

ChatGPT は来週 6 つの主要なアップデートを予定しています。

公式発表では来週6つのメジャーアップデートが予定されているとのこと。早速見ていきましょう。写真1. ...

無効にします!小売業における顔認識が修正されます!一枚の写真で顔認識を可能に

画像ソース: unsplash 30秒で読める1.複数の人工知能技術サービスプロバイダーがIT Ti...

ディープラーニング:新興技術の限界を押し広げる

ビッグデータや人工知能などの新興技術は猛烈な勢いで発展しており、その一因はディープラーニングの驚異的...

2021 年に IT 自動化と AI はどこに向かうのでしょうか?

IT自動化と人工知能技術の進歩と発展により、IT担当者の働き方は大きく変化しました。今年に入って新...