「データオープン化」の道で、百度アポロはウェイモをリード

「データオープン化」の道で、百度アポロはウェイモをリード

6月17日、世界最大のコンピュータービジョンカンファレンスであるCVPRの自動運転セミナーにおいて、Googleの自動運転企業であるWaymoは、完全なセンサー情報を含んだ注釈付き運転データの公開を発表した。クローズドかオープンか?これは自動運転業界で常に残る疑問です。 Waymo は、閉鎖的な状態からオープンなデータ共有へと移行するという選択をすることで、従来のやり方に反したが、これは大きな戦略的調整である。同社は閉鎖とオープンのスケールをオープンの方に傾け、「物事をより良くする」ことにしたと言える。しかし、データの公開に関しては、百度アポロは1年前に公開することを選択し、自動運転の加速開発の基礎を築きました。早くも2018年3月、百度アポロはアポロデータを公開し、ApolloScape大規模自動運転データセットを正式に公開しました。

Baidu Apollo が CVPR 2018 で自動運転データセット ApolloScape をリリース

今回Waymoが公開したデータセットには、平均20秒間の運転記録3,000件が含まれています。データセット全体には、60万フレームのデータ、約2,500万の3Dバウンディングボックス、2,200万の2Dバウンディングボックス、そしてさまざまな自動運転シナリオが含まれています。データが公開されると、ウェイモの無人運転車のセンサーの特性もはっきりとわかるようになる。

ウェイモが自動運転データセットを公開

しかし、ウェイモの公開データセットは、自動運転業界において初めてのものではない。 2018年3月8日、百度のApollo自動運転オープンプラットフォームは、カリフォルニア大学バークレー校のDeepDriveディープラーニング自動運転産業連盟に正式に加盟し、ApolloScape大規模自動運転データセットを正式に公開しました。この動きは、学界とビジネスを密接に結びつけ、無人運転車産業にも力を与えます。

ApolloScape データセットのピクセルレベルの注釈の例

自動運転の認識技術は数多くあり、難易度も高いですが、その主な目的はシーンの意味的理解を達成することです。検出技術を例にとると、その目的は、画像またはポイント クラウド内のオブジェクトを覆う 2 次元または 3 次元の長方形のボックスを見つけることです。 Waymo が公開したものも含め、既存のデータセットは主にこのタイプの検出技術を対象としています。比較的先進的なオープンデータセットである ApolloScape は、業界で最も複雑で正確にラベル付けされた 3 次元自動運転公開データセットです。さらに重要なのは、ApolloScape が、より自律的な運転認識技術の開発のためにさまざまなデータセットを提供していることです。これらのデータセットは、前述のオブジェクト検出技術に加えて、オブジェクトおよびインスタンスレベルのセグメンテーション技術、3D ポーズ推定、オブジェクト軌道追跡技術、カメラ自律位置決め技術、深度画像推定技術などにも役立ちます。 ApolloScape は現在、シーン解析、細分化された車線ライン、位置決め、3D 車両フィッティング、高密度軌道を含む 5 つの公開データセットをリリースしています。

ApolloScape のシーン解析データセットには、ピクセル単位のセマンティック注釈が付いた 147,000 フレームの画像が含まれています。長方形のボックス注釈のみを持つ Waymo などのデータセットと比較すると、ピクセルレベルの注釈は、オブジェクト間の遮蔽の影響を受けないより詳細なシーン情報を提供し、より正確なビデオシーンのセマンティック理解技術を促進することを目的としています。 2 次元のビデオ画像に加えて、各フレームに関連付けられた 3 次元のポイント クラウドにも、ポイントごとに意味情報が注釈付けされます。さらに、画像のピクセル単位の注釈付けにかかる時間は、長方形のボックスの注釈付けにかかる時間の 10 倍以上になります。

ApolloScapeデータセットからの道路線注釈と深度画像の例

道路線は、道路表面の基本要素です。ApolloScape の車線データセットは、ピクセル レベルと 3 次元ポイント レベルで 28 種類の道路線分類を提供します。これは、現在公開されているどのデータセットでも利用できない注釈情報です。

無人車両は、自身の位置、前方の状況、走行エリアなどの一連の情報を取得するために、正確な測位システムを必要とします。衝突や車線逸脱を避けるため、測位精度は通常 10 センチメートル以内に制御する必要があります。 ApolloScape 自己位置推定データセットは、高精度の GPU/IMU 情報を含む、約 28 キロメートルをカバーする約 30 万枚の画像を提供します。

さらに、画像を使って周囲の車両の3次元位置をいかに素早く認識するかも自動運転には重要です。 この問題に関する研究を進めるために、ApolloScapeCar3D データセットが誕生しました。このデータセットは中国のさまざまな都市から収集されたもので、5,277 を超える実際の運転シーンと 60,000 台を超える車両の 3D 注釈データが含まれています。百度は車両の3次元姿勢に加え、実際の3次元車両モデルと66個の3次元/2次元車両キーポイントデータも公開した。次に、コンポーネント レベルの高密度 3D 車両注釈をさらに拡張する予定です。

ApolloScape のオブジェクト軌跡追跡データセットは、さまざまな照明条件と、車、人、自転車の多数の混合交通流をカバーし、画像とポイントクラウド上のオブジェクトの動きの軌跡を提供し、オブジェクト追跡と動きの動作予測技術の促進を目指しています。軌道データは最大 2.5 時間の長さで、これは既存の最大の軌道データセット (NGSIM) の 3 倍の大きさです。

2018 年 3 月のリリース以来、ApolloScape データセットは世界中で何万回もダウンロードされています。その重要性から、コンピューター ビジョン分野のトップ ジャーナルである IEEE TPAMI に、このデータセットに関する科学論文が掲載されました。これは、私たちが知る限り、TPAMI に掲載された自動運転データセットに関する唯一の論文でもあります。 Baidu はこれらのデータセットに基づいて、世界クラスのカンファレンス (CVPR や ECCV など) やトップ プラットフォーム (Kaggle など) で複数のコンペティションを主催してきました。 これらのコンテストには、NVIDIA、スタンフォード大学、Megvii、UGraphics などの有名企業や大学を含む、世界中から何千もの参加チームが集まりました。

上記のデータセットに加え、より多くの種類と属性のデータがApolloScapeに継続的に追加されます。Baiduは現実世界のシーンを可能な限り復元し、自動運転のための最大規模のオープンプラットフォームを構築して、業界の発展を促進します。

Baidu は、ApolloScape の高精度データセットを最大限に活用し、拡張現実の自動運転シミュレーション システムも開発しました。これにより、自動運転車両に信頼性が高く、安価なシミュレーション方法が提供され、自動運転システムの認識、意思決定、経路計画アルゴリズムの大規模なトレーニングとテストに使用できます。このシステムは、既存のシミュレーションシステムと比較して、リアリティ、スケーラビリティなどにおいて画期的な技術的進歩を達成し、サイエンス誌のロボティクスサブジャーナルに掲載されました。サイエンス誌は世界で最も権威のある学術雑誌の一つであり、人類の自然科学研究の最高レベルを表しています。 『サイエンス・ロボティクス』誌は 5 つのサブジャーナルのうちの 1 つであり、1 号あたり平均 4 件以下の研究論文が掲載されるため、出版が非常に困難です。同時に、このシステムは国内外の70以上の主流メディアによって報道されました。

自動運転の開発とテストにおいて、高品質の実データは欠かせない「原材料」です。適切な自動運転プラットフォームを開発・維持し、定期的に調整して新しいデータを収集できるチームはほとんどありません。しかし、百度は業界発展の責任を引き受け、最終的に学界と業界が参照および学習するためのオープンデータセットを構築しました。これは業界発展の過程で特に貴重であり、国内外の無人車両研究に従事する学者や企業に大きな助けを提供してきました。

新興産業の健全な発展は、決して 1 つの企業によって支配されるのではなく、むしろ、互いの技術革新をオープンな心で共有し、あらゆる分野からの交流と協力を受け入れることによって実現されます。テクノロジーに国境はありません。百度は長年にわたりデータの公開と共有の波を起こし、世界中で協力関係を築いてきました。百度アポロは、自動運転産業の急速な発展のために尽力してきました。百度アポロオープンプラットフォームは、オープンコンセプトを堅持し、今後もその成果を共有し、広い視野で業界と開発戦略を提案していきます。データが公開されるだけでなく、百度は将来的に持続可能な産業エ​​コシステムの構築に向けて大きく前進していきます。

<<:  5G + AI はカスタマー サービス業界にどのような大きな影響を与えるでしょうか?

>>:  CVPR2019で、Baidu Apolloはレベル4自動運転向けの純粋なビジョンソリューションであるApollo Liteを発表しました。

ブログ    
ブログ    

推薦する

2023年の生成AIの包括的なレビュー

2023年には、生成AIが開発者のアプリケーション構築支援において飛躍的な進歩を遂げ、大手ツールベン...

地球外文明は人間ではなく、人工知能かもしれません!なぜ科学者はこう言うのでしょうか?

地球外文明が存在するかどうかという疑問は、常に科学者たちを深く悩ませてきました。現在に至るまで、私た...

...

GitHub トップ プロジェクト: 30 万語の図解アルゴリズム問題辞書、超実用的なリソース、6,000 個のスター

[[336071]]貴重なリソースをまとめましたので、ぜひご覧ください。アルゴリズムはコンピュータサ...

スタンフォード大学は4年連続でAIレポートを発表しています。今年はどんな内容が取り上げられたのでしょうか?

2021年スタンフォードAIインデックスレポートが正式にリリースされ、過去1年間のAIの全体的な発...

...

普及モデルはどのようにして新しい世代の意思決定エージェントを構築するのでしょうか?自己回帰を超えて長いシーケンス計画軌道を生成する

部屋の中に立っていて、ドアに向かって歩こうとしていると想像してください。自己回帰を使用して、一歩ずつ...

このレーシングAIはもはや短期的な楽しみを求めるのではなく、長期的な戦略を考慮することを学んだ。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

InnoDB ストレージ エンジンの 3 つの行ロック アルゴリズムの図解と例の分析

[[415025]]この記事はWeChatの公開アカウント「Flying Veal」から転載したもの...

人工知能とモノのインターネット:完璧な組み合わせ

IoT デバイスのデータ生成の基本的な能力と、さまざまなデバイスのインテリジェントな動作をシミュレー...

チャットボットをよりエレガントに設計する方法

AI アルゴリズムの人気により、近年会話型ロボットの人気が高まり、あらゆる分野で推進され、使用されて...

人工知能はどのように農業の発展を促進できるのでしょうか?

古代より、農業は人類の生存の基盤であり、国家経済の基盤となってきました。しかし、人口の急速な増加、耕...

...

人工知能は世界をどう変えるのか:BBCがAIのAからZまでをまとめる

今日、人工知能はもはや漠然とした研究室の技術ではなく、私たちの生活のあらゆる側面に組み込まれています...

AIと胚の融合?システム生物学者のパトリック・ミュラーは双子ネットワークを使ってゼブラフィッシュの胚を研究している

動物の発育過程において、胚は時間の経過とともに複雑な形態変化を遂げます。研究者は、発育の時間と速度を...