2024年の世界モデルによって自動運転ラベリング業界は混乱するでしょうか?

2024年の世界モデルによって自動運転ラベリング業界は混乱するでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

1. データアノテーションで直面する問題(特にBEVタスクに基づく)

BEV トランスフォーマー タスクの増加に伴い、データへの依存度がますます高まり、BEV タスクのアノテーションがますます重要になってきました。現時点では、2D-3D ジョイント障害物ラベリングであれ、再構築されたポイント クラウド クリップに基づく車線ラインや占有タスク ラベリングであれ、まだコストが高すぎます (2D ラベリング タスクよりもはるかにコストがかかります)。もちろん、業界では、大規模なモデルに基づく半自動または自動のラベリングに関する研究も数多く行われています。もう 1 つの側面は、自動運転のデータ収集サイクルが長すぎることと、データのコンプライアンスとパフォーマンスに関連する一連の問題です。たとえば、平底トラックがカメラを横切るシーンや、都市の車線が濃くなったり濃くなったりするシーンをキャプチャしたい場合は、そのようなシーンを具体的に構築するためのデータ コレクターが必要になります。

2.24 は世界モデルの特異点となるのでしょうか?

世界モデルの概念は広すぎる、あるいはセンサーシミュレーションとも言える。シミュレーションがアノテーションに革命をもたらしたことを初めて目にしたのは、テスラAIデーでした。

図1: テスラの自動注釈効果 図2: 4D再構成効果

それを見たとき、私はショックを受けました、またショックを受けました!テスラのBEVと同様に、破壊的です。ますます多くの研究者がこの方向で研究を続けるにつれて、多くの優れた研究が生まれてきました。 UniSim の自動運転シミュレーション システムには、リプレイ、動的オブジェクト動作制御、自由視点レンダリングなどの機能があります (これは、モデルをトレーニングするすべての学生が望むものであるはずです)。

LIDARをシミュレーションすることも可能です。

詳細については、https://zhuanlan.zhihu.com/p/636695025 を参照してください。この方向での同様の研究は他にもあります。

NeuRAD: 自動運転のためのニューラルレンダリング

DrivingGaussian: 周囲の動的な自動運転シーンの複合ガウススプラッティング 上記の方法は主に Nerf に関連しており、パイプライン全体が比較的重いです。普及研究に基づいた別の方向性もあります。いくつか良い研究が行われました。

BEVControl: BEV スケッチレイアウトによる、複数の視点からの一貫性のあるストリートビュー要素の正確な制御

BEVControl: BEV スケッチレイアウトによる、複数の視点からの一貫性のあるストリートビュー要素の正確な制御

< MagDriver MAGIC DRIVE: 多様な 3D ジオメトリ制御によるストリートビュー生成 >

技術の発展が速く、センサーシミュレーションの敷居が下がりつつあります。24年後には自動運転のラベリング業界に破壊的な製品が登場するかもしれません。

<<:  ネットワーク管理における人工知能の役割

>>:  周紅一の2024年大模型予測は8つの点を検証し、ソラの出現は予想を超えていると述べている

ブログ    
ブログ    
ブログ    

推薦する

マイクロソフトCEOナデラ氏:私は4つの大きな変革を経験してきたが、AIは5番目だ

マイクロソフトのサティア・ナデラCEOは10月23日、メディアのインタビューで、同社はこれまで4つの...

...

マスク氏はテスラ向けにChatGPTをカスタマイズする予定

編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog) Chat...

【人工知能】人間と機械の対決知能技術の総合レビュー

[[359893]] 1 はじめに<br /> 人工知能は誕生以来、人間の知能と比較して...

多言語自然言語処理 (NLP) で言語の壁を打ち破ります!

自然言語処理は言語の壁を打ち破り、人間と機械間の相互作用とコミュニケーションを強化します。自然言語処...

...

烏鎮百度脳オープンデーが開催、EasyDL業界インテリジェンスイノベーションコンペティションを開始

顔認識技術はAI時代に利便性をもたらすだけでなく、効率も向上させます。 8月21日、百度ブレインオー...

人工知能の真の可能性

サイエンス フィクションや大衆文化では、人工知能 (AI) 技術に関する大胆な予測や説明がよく取り上...

シャンダイノベーション研究所とソゴウ研究者:自然言語処理の応用

【TechWeb Report】6月26日、山大創新研究所検索テーマ研究所研究員の賈文傑氏と捜狗自然...

DeepSense: モバイルセンサーの時系列データを処理するためのディープラーニングフレームワーク

DeepSense は、エンドデバイス上で実行されるディープラーニング フレームワークです。ローカル...

人工知能とは何かについて10分ほどお話ししましょう。

1999年、ハリウッドSF映画史上最も重要なSF映画『マトリックス』が公開されました。この映画は、...

...

倉庫の自動化は人気が高い。ソフトバンクは28億ドルを投じてオートストアの40%を買収した。

ソフトバンクグループは、ノルウェーの倉庫自動化企業オートストアの株式40%を28億ドルで買収すること...

GPT-4Vと人間のデモンストレーションによるロボットのトレーニング:目が学習し、手がそれに従う

言語/視覚入力をロボットの動作に変換するにはどうすればよいでしょうか?カスタムモデルをトレーニングす...