この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 今回、領域外物体検出の分野で新しいモデルVOSが発表されました。協力チームはウィスコンシン大学マディソン校で、論文はICLR 2022に掲載されています。 このモデルは、ターゲット検出と画像分類の両方で最高のパフォーマンスを達成し、FPR95 インデックスは以前の最高結果よりも 7.87% 低くなっています。 ディープネットワークにとって、未知の状況に対処することは常に難しい問題であったことを知っておくことは重要です。 たとえば、自動運転では、既知の物体(車、一時停止標識など)を認識する検出モデルが、馬をシマウマと間違えて、領域外(OOD)物体について高い信頼度の予測を行うことがよくあります。 たとえば、下の写真のヘラジカは、Faster-RCNN モデルによって 89% の信頼度で歩行者として識別されました。 したがって、ドメイン外オブジェクトの検出は、間違いなく AI セキュリティにおける非常に重要なトピックとなっています。 このモデルがドメイン外のオブジェクトについてどのように判断するかを見てみましょう。 VOSがドメイン外オブジェクトを検出する方法VOS を理解する前に、ドメイン外オブジェクトの検出が難しい理由について説明する必要があります。 実際、それは理解しやすいことです。結局のところ、ニューラル ネットワークはトレーニングとテスト中にデータを学習するだけで、これまで見たことのないものに遭遇したときには当然それを認識することはないのです。 この問題を解決するには、ネットワークに「未知の」ものを認識させる方法を見つける必要があります。これについてどうすればいいでしょうか? VOS が考え出した解決策は、モデルが学習するためのドメイン外のオブジェクトをシミュレートすることです。 たとえば、下の図の検出状況では、3 つの灰色の点がターゲットです。領域外のオブジェクトがシミュレートされていない場合(左) 、モデルは広い領域内でのみターゲットを囲むことができます。 シミュレートされたドメイン外オブジェクト(右)を使用してトレーニングした後、モデルはターゲットをコンパクトかつ正確にロックし、より合理的な決定境界を形成できます。 ターゲットがより正確にロックされると、この範囲外の他のオブジェクトはドメイン外オブジェクトとして判断できます。 この考えに基づいて、VOS チームは次のフレームワークを構築しました。 Faster-RCNN ネットワークに基づいて、シミュレートされたドメイン外オブジェクトのデータの一部が分類ヘッドに追加され、トレーニング セットのデータと組み合わせられ、標準化された不確実性損失関数が共同で構築されます。 これらのシミュレートされたドメイン外オブジェクトのデータはどこから来るのでしょうか?構造図を見ると、これらの点はすべて、可能性の低い領域であるターゲット領域(青い点、黄色の四角い点、緑の三角の点) の周囲からのものであることがわかります。 最後に、信頼度の計算に基づいて、青はターゲット検出データを表し、緑はドメイン外のオブジェクトを表します。 このようにして、画像内の車とヘラジカを識別できます。 他の多くの領域外オブジェクト検出方法と比較すると、VOS の利点がわかります。 各指標において、下向き矢印はデータが小さいほど良いことを意味し、逆に下向き矢印はデータが大きいほど良いことを意味します。 その中で最も有名なのは FPR95 で、OOD サンプルの分類精度が 95% の場合に OOD サンプルが ID サンプルに誤分類される確率を表します。 この結果は、これまでの最高結果から 7.87% 低下したものです。 他の既存の方法と比較しても、VOS には利点があります。 一般的な学習フレームワークとして、オブジェクト検出と画像分類の両方のタスクに適用できます。これまでの方法は主に画像分類によって行われていました。 このモデルは現在、GitHub でオープンソース化されています。 著者についてこのモデルは主にDu Xuefeng、Cai Muらによって提案されました。 Du Xuefeng 氏は西安交通大学で学士号を取得し、現在はウィスコンシン大学マディソン校でコンピューターサイエンスの博士号取得を目指しています。 主な研究方向は、ドメイン外オブジェクトの検出、敵対的堅牢性、ノイズラベル学習などを含む信頼できる機械学習です。 蔡穆氏も西安交通大学を卒業し、学士号を取得しており、現在はウィスコンシン大学マディソン校でコンピューターサイエンスの博士課程2年目に在籍しています。 彼の研究の関心は、ディープラーニング、コンピュータービジョン、特に 3D シーン理解(ポイントクラウド検出)と自己教師あり学習に焦点を当てています。 この論文の責任著者は、現在ウィスコンシン大学マディソン校のコンピューターサイエンスの助教授であり、以前はFacebook AIの研究員であったSharon Yixuan Li氏です。 |
<<: ICLRは深層生成モデルに関する大きな議論を開催し、ウェリングとAAAIの百万ドル賞受賞者が来場する。
>>: 機械学習の錬金術の理論的根拠はどれほど強固なのでしょうか?
[[436944]]この記事はWeChatの公開アカウント「Programmer Insider T...
これには、機械学習のサブフィールドの分類が含まれます。すべての分類において、最初に尋ねるべき質問は、...
明らかな理由から、ワクチンの開発が現在最優先事項となっています。安全で効果的なコロナウイルスワクチン...
ステージ上の1分、ステージ外の10年間の努力。ボストン・ダイナミクスのロボット「アトラス」は新たなス...
[[393110]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
昨日、Lao Huangが再び「勝利」しました!なぜ?最新の MLPerf ベンチマークでは、NVI...
近年、OpenAI、Microsoft、Google など多くの企業やスタートアップチームが独自のチ...
この記事の著者は、AI テクノロジーが私たちの生活にもたらす利便性と、それが持つ限界について、4 つ...
[[352688]]センサーの電源喪失は IoT の悩みの種です。数百万個のセンサーを導入しても、そ...
ディープラーニングは計算集約型の分野であり、GPU の選択によってディープラーニングの実験が根本的に...
[[189866]]私たちは皆、検証コードに精通しています。reCAPTCHA は、人間と機械を区別...
現在市販されている「手動運転」の自動車には、ナビゲーション、車載インフォテインメントシステム、道路監...