6月に開催されるCVPR 2019は、マシンビジョン分野で最も重要な学術会議です。選考結果が発表されました。今年の論文数は56%増加しており、自動運転車に関する論文やプロジェクトも多数登場しています。ハイライトの 1 つは、自動運転ビジョンに焦点を当てた CVPR WAD チャレンジです。 今年のチャレンジでは、バークレーと滴滴出行がそれぞれ独自の超大規模運転ビデオデータセット BDD100K と D²-City を公開します。BDD100K には米国の公開運転ビデオ 10 万本が含まれており、D²-City は中国のいくつかの大都市のビデオ記録 1 万本以上を提供します。これらのデータセットには、道路上のすべてのオブジェクトに加え、天候、道路、交通状況などの主要なオブジェクトとデータがラベル付けされており、自動運転の安全性に関する懸念を変える可能性のあるアルゴリズムを生み出します。 バークレーの計画によれば、このチャレンジはターゲット検出とターゲット追跡タスクのドメイン適応に重点を置き、中国と米国のさまざまな都市シナリオでの自動移動を実現できるようになる。 では、ドメイン適応は自動運転の安全性にとってどれほど重要なのでしょうか? この記事で少し覗いてみましょう。 自動運転の衰退と復活について 「ドメイン適応」を説明する前に、まずは現在の自動運転技術がどのような課題に直面しているのかを理解する必要があります。 無人テスト車両の走行距離と引き継ぎデータはどんどん向上していますが、機械学習モデルが新しい未知の環境でテスト道路と同様に機能するかどうかは依然として未解決の問題です。 たとえば、自動運転車はシリコンバレーの道路テストデータセットを使用して、高性能な無人運転車モデルをトレーニングできます。しかし、同じモデルでも、ボストンのような雪が頻繁に降る地域に配備された場合、その機械はこれまで雪を見たことがないので、パフォーマンスが低下する可能性があります。差別化された環境で効果的な自律操作を実行し、学習した経験を再利用する方法は、機械学習において依然として難しい問題です。 ボストンとシリコンバレーは、気候や道路状況が大きく異なるため、年間を通じてシステムによって異なるドメインとしてマークされ、異なるモデルで解決できます。そのため、同じ街の街路風景であっても北京と重慶の道路設計が異なるなど、非常に類似した領域に直面すると、難易度がさらに高まります。 以前の解決策は「間違いから学ぶ」というものでした。トレーニング セット (失敗例を含む) からデータを収集し、特徴を抽出して、経験的誤差の最小基準に基づいて機械に分類子を学習させます。しかし、これは簡単に 3 つの問題を引き起こします。
3つ目は世論リスクが高いことです。自動運転車システムが失敗から学ぶためには、まず間違いを犯さなければなりません。しかし、一般住民が自動運転車の安全性に非常に懸念を抱いている現在の環境では、衝突、傷、自動運転車の認識の遅さなどの問題が疑問視されるでしょう。事故データに頼ってミスを避ける方法を学ぶことは間違いなく悲惨な結果になるでしょう。 当然のことながら、自動運転車が未知の環境で失敗する回数を減らすには、他の方法を使って自動運転車を訓練する必要があります。 「ドメイン適応」もその一つです。 では、ドメイン適応学習とは一体何なのでしょうか? まず、2 つの重要な概念について説明します。
ソースドメインデータセットで得られた事前知識を可能な限り再利用し、ターゲットドメインオブジェクトの検出や追跡などの学習タスクを可能な限り正確に実装する方法は、無人車両モデルが直面しなければならない大きな問題となっています。 タスクをカテゴリに分類してみましょう。 1. ドメイン適応の可能性。 簡単に言えば、ドメイン適応学習を実現するためにどのような条件を満たす必要があるかということです。これには、モデルの学習能力(アルゴリズムにも独自の違いがあります)、ソースドメインとターゲットドメインの相関関係(シリコンバレーと重慶の路面の違いなど)、アルゴリズムの誤差境界分析(ソースドメインとターゲットドメインは同時に最小近似誤差を満たす必要があります)、および学習タスクの事前知識に対する適切なソリューションが必要であり、これにより、機械がドメイン適応学習を効果的に実行できるようになります。 2. 堅牢性。 ドメイン適応学習では、トレーニング サンプルとテスト サンプル間の分布が一貫していないため、ソース ドメインでトレーニングされたモデルは、ターゲット ドメインでの学習に適さないことがよくあります。ドメイン適応学習の堅牢性により、トレーニング サンプルの変更に対するアルゴリズムの感度を測定できるため、ターゲット ドメイン内の一般化エラー境界の「障害」を克服できます。簡単に言えば、ドメイン適応型学習モデルは、エラーに対してより寛容な「温かい人」です。 3. 統計的推定値の一貫性。 モデルがターゲットドメインを学習できることを確認した後、ドメイン適応学習の有効性に対処する必要があります。 これは多くの場合、ソース ドメインとターゲット ドメインの有効な確率分布の判断に依存しており、これはマシンの IQ を最もテストする一貫性分析です。エラーの上限を最小にするには、できるだけ少ないサンプルを使用します。優れたドメイン適応型学習アルゴリズムは「偏り」があってはならず、非常に強力な一般化機能を備えている必要があります。 ここまで述べてきたように、ドメイン適応型学習は本質的に人間の学習モデルと非常に似ていることは容易に理解できます。つまり、授業で先人がまとめた科学的知識を学び、その後、現実とコミュニケーションする過程で常に新しい知識を拡大し、探求し、複雑な事柄の認識を完成させ、それによって自律学習の目的を達成し、新しい対象に適応するのです。 無人車のドメイン適応学習も同じロジックに従います。まず、既存のラベル付きデータを初期学習に使用し、次に大量のラベルなしデータから事前知識に基づいてサンプルを継続的にマイニングして、モデルを段階的に学習し、ラベルなしデータを適応させます。これにより、なじみのない道路環境でも学習タスクをうまく完了できます。 現在、ドメイン適応学習は、無人運転の視覚タスクを完了するための費用対効果の高い方法でもあります。 新しいアルゴリズムが登場 自動運転には「ドメイン適応」が非常に重要なので、注目する価値のあるアルゴリズムは何でしょうか? 現在、自動運転タスク自体の複雑さにより、複数のデータソースからの学習をターゲットドメインに転送する必要があることが多く、次の 2 つの問題を考慮する必要があります。
これらはすべて、アルゴリズムのパフォーマンスに多くの課題をもたらします。ここで、無人運転に関連する技術的な問題をどのように解決するかを確認するために、いくつかの代表的なアルゴリズムをリストしてみましょう。 1. 適応露出アルゴリズム。 前述のように、都市や道路環境によって光の強度は異なります。無人車両がさまざまな照明環境で信頼性の高い道路情報を取得できるようにするために、一部の研究者は適応露出アルゴリズムを提案しています。光学センサーを使用して、撮影した画像をグレースケール値に変換し、動的なしきい値比較処理をラインごとに実行して、次のサイクルの正しい露出ポイントをすばやく取得します。実際の道路テストでは、アルゴリズムは道路情報を迅速かつ効果的に取得でき、その後の境界処理がより明確になります。 2. 道路障害物の検出。 原理は、ソースドメイン画像から障害物の色、エッジ、テクスチャの特徴などを識別する学習などの既存の事前知識を使用し、ターゲットドメインの道路上のさまざまな車両を分析して、障害物をすばやく抽出することです。 この点に関しては多くのアルゴリズムが存在します。たとえば、Zielke らは道路端の対称性と顕著性を利用して道路端情報を抽出しています。 Kuehnle らは、画像内の車輪の対称性に基づいて自動車の後輪を識別しました。クリスマンらは、視覚画像の色情報を利用して道路追従などを実現し、無人運転の目標検出性能をさまざまな程度に向上させました。 3. マルチソースドメインデータ移行アルゴリズム。 SenseTimeの研究者は、複数のソースドメインのデータからターゲットドメインに知識を転送するという問題を解決するために、「Cocktail」と呼ばれるネットワークを提案し、無人運転車モデルが新しい環境をより効果的に識別できるように支援しました。 具体的なアプローチとしては、共有特徴ネットワークを使用してすべてのソースドメインとターゲットドメインの特徴をモデル化し、次に多方向敵対的ドメイン適応技術(GANジェネレータに類似)を使用して各ソースドメインとターゲットドメインに対してペアワイズ敵対的操作を実行し、学習ドメインの不変特徴を明らかにし、データバイアスによるシステムの環境の誤判断を大幅に削減します。 結局のところ、「ドメイン適応」方式はトレーニングのリスクを軽減するだけでなく、システムの学習パフォーマンスを効果的に向上させます。この観点から、CVPR 2019 チャレンジで新たなダークホースが現れるのがさらに楽しみです。 もっと言う 「無人運転」という言葉を見たとき、多くの人は何を思い浮かべるでしょうか。業界の人は「かっこいい」と感じるかもしれませんが、一般の人は「嫌悪感」を感じるかもしれません。 2019年の第1四半期が終わったばかりですが、自動運転車に関する否定的なニュースが次々と出ています。 昨年資金調達記録を樹立したRoadStar.aiは内部抗争で倒産し、無人運転車企業として初めて倒産した。アップルの自動運転部門は従業員190人を解雇し、無人運転車の数は62台にまで減少した。アンドリュー・ン氏が率いる米国の自動運転スタートアップDrive.aiも先月「売却」されたと報じられている。 自動運転車の安全性について国民を完全に納得させることが難しいため、業界は挫折を味わっている。 わずか2日前には、一部の研究者が道路にステッカーを貼るなどの「物理的な攻撃」を使ってテスラの自動運転車を反対車線に合流させたり、所有者の許可なくXboxのゲームコントローラーで制御したりした。 自動運転車が最も成熟しているベイエリアでも、多くの地元住民の車のタイヤがパンクしたり銃が盗まれたりしており、自動運転車の将来について人々は少し落胆している。そして、見通しが立たなくなったとき、テクノロジーの追求こそが寿命を延ばす究極の方法なのかもしれません。 コンピュータビジョンと機械学習の分野におけるこれまでの会議では、ドメイン適応に関する研究は画像分類とセマンティックセグメンテーションに重点が置かれており、自動運転にとってより重要であるにもかかわらず、ターゲットの検出や追跡などのインスタンスレベルのタスクへの応用はほとんど見られませんでした。 もちろん、「ドメイン適応」によって自動運転車のトレーニングをより効果的に行うには、バークレーと滴滴出行がCVPR 2019や特定のコンテストで発表したデータセットだけに頼るだけでは十分ではありません。研究チームと自動車会社のつながりを強化したり、実際のニーズを中心に支援研究開発を実施したりするなど、研究者にもっと多様なサポートを提供する必要があります。 それまでは、この複雑な技術は研究室と試験道路に留まることになる。 |
<<: 顔認識のグレーな業界チェーンを解明: あなたの顔情報にはどれくらいの価値があるのでしょうか?
>>: 2019 年に TensorFlow は王座から退いたのでしょうか?
サイバー攻撃の性質と標的が多様化するにつれて、サイバーセキュリティの専門家が脆弱性に対処する方法を決...
データ量とモデルパラメータの数を増やすことが、ニューラル ネットワークのパフォーマンスを向上させる最...
人工知能 (AI) が普及し、人生を変えるような意思決定に組み込まれるようになるにつれて、透明性の必...
中国語と英語のバイリンガル音声対話の最初のオープンソース モデルが登場しました。最近、arXivに音...
知っていましたか? LeNet 畳み込みニューラル ネットワークは iOS デバイス上で直接トレーニ...
[51CTO.com クイック翻訳] 人工知能は現在、さまざまなハイテク分野で話題になっています。初...
大晦日、家族が集まる夜。 1月28日、オンライン春節祝賀会(略称オンライン春節祝賀会)が予定通り開催...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
過去数年間、化学研究は、個人の経験と文献から得られた過去の研究結果を使用する実験方法のみに焦点を当て...
顔認識は、AI 研究が世界にもたらした数多くの驚異のうちの 1 つです。これは多くの技術者にとって興...
コンピューターに頼って悪者を即座に見つけることができれば素晴らしいのですが、問題は AI システムが...
ガートナーの予測によると、2025年までにクラウドデータセンターの半数が人工知能(AI)と機械学習(...