Baidu は、「同様のデータセットの 10 倍」のデータ量を持つ自動運転データセットをリリースしました。注目すべき点は何ですか?

Baidu は、「同様のデータセットの 10 倍」のデータ量を持つ自動運転データセットをリリースしました。注目すべき点は何ですか?

[[222004]]

常にオープンで、常に新しいメンバーを引き付けてきた百度のアポロ自動運転プラットフォームは、最近「常識を打ち破り」、カリフォルニア大学バークレー校のディープドライブ自動運転業界連合に加盟したことを率先して発表した。

米国時間3月8日、百度はアポロ自動運転オープンプラットフォームがDeepDriveディープラーニング自動運転業界アライアンスに正式に加盟し、アポロ自動運転データセット「ApolloScape」をリリースしたと発表した。

百度アポロプラットフォームがこの業界連合に積極的に参加するきっかけとなったのは、おそらく後者の自動運転における豊富な学術的成果と産業資源だろう。

UC Berkeley (カリフォルニア大学バークレー校) について十分にご存知であれば、DeepDrive が UC Berkeley の自動車インテリジェンス関連の 2 つの主要な研究所の 1 つ (もう 1 つは InterACT) であることをご存知でしょう。

DeepDrive の研究成果は研究室にとどまらず、業界と密接に連携しています。現在のパートナーには、Bosch や ZF などの一流サプライヤー、フォルクスワーゲン、ホンダ、ヒュンダイなどの自動車メーカー、NXP や NVIDIA などのチップメーカー、Huawei や UISEE などの中国企業が含まれています。

*ディープドライブ研究プロジェクトのパートナー

DeepDrive ディープラーニング自動運転業界連合は、カリフォルニア大学バークレー校が主導する業界連合であり、自動車分野で使用するための最先端のコンピューター ビジョンと機械学習技術を研究しています。

メンバーには、NVIDIA、Qualcomm、GM、Ford など、自動運転の分野で世界をリードする 20 社が含まれています。研究プロジェクトは、認識、計画と意思決定、ディープラーニングなど、自動運転の主要分野をカバーしています。

Baiduがこの提携に参加する目的は、世界有数の自動運転企業やトップクラスの学術研究機関と連携し、研究成果を共有し、自動運転の技術革新と応用プロセスを加速することで、自動運転の研究開発能力を強化することです。

ApolloScape: データ量は類似データセットの10倍以上

このリリースのもう一つのハイライトは、Baidu によって公開された ApolloScape データセットです。

データセットは一般的に 2 つのカテゴリに分けられます。1 つは一般データセットで、純粋なコンピューター ビジョン分野で提案されたデータセットです。このタイプのデータセットには「車」の要素のみが含まれます。もう 1 つは自動運転データセットで、コンピューター ビジョン情報だけでなく、IMU、GPS などの情報も含まれています。たとえば、KITTI は自動運転シナリオ向けの世界最大のコンピューター ビジョン アルゴリズム評価データセットであり、その地位を過小評価することはできません。

明らかに、Baidu も ApolloScape をそのようなデータセットに組み込むことを望んでいます。では、ApolloScape データセットのハイライトは何でしょうか?

Baidu は、大量かつ高品質の実データこそが自動運転の開発とテストに欠かせない「原材料」であると考えています。そのため、ApolloScape のデータ量は、同様のデータセット (Cityscapes など) の 10 倍以上となっています。

データ量には、知覚、シミュレーション シーン、道路ネットワーク データ、ピクセル単位のセマンティック セグメンテーションと注釈が付いた高解像度画像データの数十万フレームが含まれます。 Baiduは、データの難易度の観点から、ApolloScapeデータセットはより複雑な道路状況をカバーしていると述べた。たとえば、1 枚の画像に最大 162 台の車両または 80 人の歩行者が写ります。

さらに、このオープン データセットでは、ピクセル単位のセマンティック セグメンテーションと注釈が使用されています。Baidu は、これが「現在入手可能な最も複雑で、最も正確に注釈が付けられ、最大の自動運転データセット」であると主張しています。

ApolloScape 注釈付きデータの例

[[222006]]

ApolloScape 深度データの例

データインスタンスにおける Kitti、CityScapes、ApolloScape の比較

ApolloScape のもう 1 つの特徴は、ピクセル単位のセマンティック セグメンテーション注釈が付いた高解像度画像データのフレームが数十万個含まれていることです。

研究者がデータセットの価値をより有効に活用できるように、Baidu はデータセット内のさまざまなセマンティック項目 (車、自転車、歩行者、建物、街灯など) の合計 26 のデータ インスタンスを定義し、さらに複雑な環境、天候、交通状況をカバーします。

データに含まれる各インスタンスの種類に関する情報

シミュレーションもこのデータセットの重要なプロジェクトです。 Baidu の目標は、現実世界の最高レベルの再現と最も豊富なシナリオを備えたシミュレーション プラットフォームを作成することです。

Leifeng.comによると、ApolloScapeはApolloシミュレーションプラットフォームを基盤として、数十台の自動運転車両を同じ道路網に投入する計画だ。実際の複雑な運転シナリオや複数車両のゲームプロセスをシミュレーションすることで、研究開発担当者が予測、意思決定、経路計画などのアルゴリズムを効果的にテストして最適化し、自動運転テストの多様性を向上させるのに役立つ。

このデータセットを活性化し、より多くの開発者がApolloScapeデータセットを使用するように促すため、今年のCVPR期間中、Baidu Apolloはカリフォルニア大学バークレー校と共同で自動運転に関するワークショップを開催し、世界中の自動運転の開発者や研究者に技術革新とアプリケーション革新のプラットフォームを提供することを目指しています。

「大きなシステム」と「小さなモジュール」

これまで、コンピューター ビジョンが直面していた一般的な問題は、古いアルゴリズムが新しいデータセットでは機能しないことでした。

「我々は問題を解決したと主張しているが、解決したのはデータセットだけだ。これは本当に問題を解決したということではなく、このようなことはいつも起きている」と、国内の自動運転企業のCTOはLeiphone.com(公式アカウント:Leiphone.com)に語った。

たとえば、自動運転の「大きなシステム」を 100 個の小さなコンピューター ビジョンの問題に分解できます。

しかし、考えてみる価値のある点が 2 つあります。1 つ目は、これら 100 の問題のうちどれがより重要なのかがわからないことです。2 つ目は、自動運転の問題を完全に解決したと主張できるようになるまでに、どの問題をどの程度解決する必要があるのか​​がわからないことです。

したがって、自動運転の「大きなシステム」と「小さなモジュール」の間の問題をどのように解決するかは、Baidu ApolloScapeデータセットが確立する必要がある次の利点であり、実践者と開発者が必要とする自動運転データセットでもあります。

<<:  マイクロソフト:オープンソースソフトウェアとクラウドコンピューティングは人工知能と機械学習を推進する主な手段

>>:  Baidu のディープラーニング プラットフォーム PaddlePaddle フレームワークの分析

ブログ    

推薦する

人工知能の時代において、ロボットを超える子どもたちが身につけるべき能力とは何でしょうか?

[[428042]]今後予測できることは、人工知能の時代が徐々に深まり、私たちの生活がSF映画のリ...

360 が顔認識分野に参入。「セキュリティ」の壁をどう克服するか?

スマートフォンや駅で顔認識技術が大規模に導入され始めており、誰もがこの新しい技術に精通しているはずで...

2022 年の AI 開発とイノベーションのトップ 10 トレンド

イノベーションは終わりがなく、人工知能(AI) などのテクノロジーが静かに世界を変えています。人工知...

ScalableMap: オンラインで長距離ベクトル化された高精度マップ構築のためのスケーラブルなマップ学習

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

人工知能:創薬の厳しい時代に革命を起こすもの

業界の専門家は、人工知能(AI)の強力なサポートにより、医薬品の研究開発分野は大きな変化の波に見舞わ...

...

...

...

2大音声アシスタントであるAlexaとCortanaの融合の目的は何でしょうか?

[[201743]] BI中国語ウェブサイトが8月31日に報じた。水曜日、アマゾンとマイクロソフト...

AIの導入は増加しているが、障壁は残っている

AI の可能性は魅力的ですが、導入までの道のりには課題がないわけではありません。企業は、急速に変化す...

マッキンゼーのレポート: 2030 年までに 8 億人が機械に置き換えられ、約 1 億人の中国人が転職を余儀なくされる!

マッキンゼー・グローバル・インスティテュートは最近の報告書で、テクノロジーの進歩により、将来世界で約...

ディープラーニングの「記憶喪失」に応えて、科学者たちは類似性に基づく重み付けインターリーブ学習を提案し、PNASに掲載された。

人間とは異なり、人工ニューラル ネットワークは新しいことを学習するときに以前に学習した情報をすぐに忘...

大規模なモデルでプロンプト内のより多くの例を学習させたい場合は、この方法を使用すると、より多くの文字を入力できます。

GPT や LLaMA などの大規模な言語モデルを使用する場合、入力プロンプトに文字数制限があるこ...