画像認識AIは敵対的な画像に遭遇すると「盲目」になり、精度が90%低下する

画像認識AIは敵対的な画像に遭遇すると「盲目」になり、精度が90%低下する

[[271243]]

視覚に関して、AIと人間の間にはどれくらいのギャップがあるのでしょうか?カリフォルニア大学バークレー校と他の大学の研究者は、7,500 個の「自然な敵対的サンプル」のデータセットを作成し、多数のマシン ビジョン システムをテストした結果、精度が 90% 低下したことを発見しました。場合によっては、ソフトウェアは画像の 2% ~ 3% しか認識できませんでした。この種の AI が自動運転車に使用された場合、その結果は想像を絶するでしょう。

近年、コンピュータービジョンは大きく進歩しましたが、依然として重大な間違いを犯す可能性があります。間違いは頻繁に起こるため、AI が誤認することが多い「敵対的画像」と呼ばれる画像を研究する研究分野が存在します。これをコンピューターの錯覚と考えてください。木の上に猫がいるのを見ると、AI はリスを見ているのです。

AIは木登りする猫をリスと間違える

これらの画像を研究する必要があります。 AI セキュリティ カメラや自動運転車などの新しいテクノロジーの中核にマシン ビジョン システムを導入すると、コンピューターが人間と同じように世界を見ていると信頼できるようになります。敵対的な画像はそうではないことを証明しています。

敵対的画像は機械学習システムの弱点を悪用する

しかし、この分野では、AI を騙すために特別に設計された画像(Google のアルゴリズムが 3D プリントされたカメを銃と間違えるなど)に注目が集まっていますが、こうした欺瞞的な画像は自然発生的にも発生しています。このタイプの画像は、私たちの視覚システムが意図的に間違いを犯していなくても間違いを犯す可能性があることを示しているため、さらに心配です。

これを実証するために、カリフォルニア大学バークレー校、ワシントン大学、シカゴ大学の研究者チームが 7,500 個の「自然な敵対的サンプル」のデータセットを作成し、それを使って多数のマシン ビジョン システムをテストしたところ、精度が 90% 低下し、ソフトウェアによっては画像の 2% ~ 3% しか認識できないことが判明しました。

「自然な敵対的サンプル」データセットの例をいくつか示します。

AIが「難破船」と認識しているものは、実際には枯れ葉の上を這う虫である

AIはトーチを見る

AIはてんとう虫を見る

AIは日時計を見る

AIが野球選手を観察

これらのデータは、より強力な視覚システムの開発に役立つことが期待されています。

研究者らは論文の中で、このデータはより強力な視覚システムの開発に役立つ可能性があると述べている。研究者らは、画像が、ソフトウェアが見たものを識別するために「色、質感、文脈の手がかりに過度に依存」することから生じる「重大な欠陥」を悪用していると説明した。

例えば、以下の画像では、画像の背景が木目調であるためか、AI は左側の画像を誤って釘と認識しました。右側の画像では、ハチドリの餌箱にしか気づかず、実際にハチドリがいないという事実を見逃しています。

次の 4 枚のトンボの写真では、AI が色と質感を分析し、左から右にスカンク、バナナ、アシカ、手袋であると識別しています。それぞれの画像で、AI がなぜ間違いを犯したのかがわかります。

AI システムがこのような間違いを犯す可能性があるというのは、目新しいことではありません。研究者たちは長年、ディープラーニングを使って作られた視覚システムは「浅薄」で「脆弱」であり、人間とほとんど同じようには世界を理解していないと警告してきた。

これらの AI システムは数万枚のサンプル画像でトレーニングされますが、AI が判断を下すために画像のどの要素を使用するかは正確にはわからないことがよくあります。

ある研究では、アルゴリズムは画像全体を見てその全体的な形状や内容を考慮するのではなく、特定のテクスチャや詳細に焦点を当てていることが示唆されています。このデータセットで提示された結果は、この解釈を支持しているように見えます。たとえば、明るい表面にはっきりとした影が写っている画像は、誤って日時計として識別されます。

AIビジョンシステムは本当に絶望的でしょうか?

しかし、これはこれらのマシンビジョンシステムが破滅することを意味するのでしょうか?全くない。一般的に、これらのシステムが犯す間違いは、排水口の蓋をマンホールと間違えたり、トラックを高級車と間違えたりするなど、軽微なものです。

研究者らは、これらの「自然な敵対的例」はさまざまな視覚システムを騙すことができると述べているが、それはすべての視覚システムを騙せるという意味ではない。多くのマシン ビジョン システムは、医療スキャンで病気を特定するために使用されるものなど、高度に専門化されています。これらのシステムには欠点があり、世界や人間を理解できない可能性もありますが、がんを検出し診断する能力には影響しません。

マシンビジョンシステムは、時には手早くて雑な作業になることもありますが、通常は結果が得られます。このような研究により、機械イメージング研究における盲点やギャップが明らかになります。私たちの次の課題は、これらの盲点を埋めることです。

論文の宛先:

出典: http://arxiv.org/pdf/1907.07174.pdf

コードとデータセット:

https://github.com/hendrycks/natural-adv-examples

<<:  5 分で年配の方に機械学習について説明しましょう。説明するのはとても簡単です!

>>:  レポート予測:Appleは2020年にSiriオペレーティングシステムをリリースする

ブログ    
ブログ    
ブログ    

推薦する

構築は簡単だが、維持は難しい! Googleの機械学習システムの苦い教訓

[[279958]] 2014年、機械学習の背後に隠れた高い技術的負債を調査したGoogleの論文が...

コンピュータービジョンにおける AI の役割は何ですか?

コンピュータービジョン技術を使用することで、コンピューターは視覚的に物を識別したり確認したりすること...

1 分以内に GPT アプリケーションを開発しましょう!さまざまな専門家が懸命に取り組んでおり、ネットユーザーは「ChatGPTは新しいiPhoneだ」と言っている

GPT はまだ正式にリリースされていませんが、誰かがすでに「先走って」いるのでしょうか? !ほら、社...

ディープラーニングを使用した音声分類のエンドツーエンドの例と説明

サウンド分類は、オーディオのディープラーニングで最も広く使用されている方法の 1 つです。音を分類し...

...

百度のCTO王海鋒が百度ブレイン7.0をリリース: イノベーションを統合し障壁を下げる

火星の環境について知りたいですか?たった一文であなた自身のデジタル人物を生成したいですか?こうした最...

このAIはレディー・ガガ風にベートーベンの音楽を演奏することができ、ネットユーザーは楽しんで遊んでいる。

編集者注: OpenAI は数日前に突然 Twitch でライブ放送を開始しました。これまで、Ope...

炭素系生物は排除されます! AIがクロスワードパズルで初勝利

先週のバーチャルクロスワードパズル「アメリカンクロスワードパズルトーナメント」には1,000人を超え...

...

あなたのお子さんは「顔スキャン」されましたか?顔認識技術がキャンパスに導入され物議を醸す

現在、顔認識の応用はますます深く広範囲になり、それが引き起こす論争もますます激しくなっています。まず...

...

...

GPT-4 MATHの精度は84.3%まで上昇しました!香港中文大学や清華大学を含むトップ7大学が新たなCSV方式を提案

大規模言語モデル (LLM) は常識理解やコード生成などのタスクでは大きな進歩を遂げていますが、数学...

4つの主要な応用分野が開拓され、外骨格ロボットのブルーオーシャンが出現している

現在、ロボット産業の急速な発展に伴い、ロボット製品システムはより完成度が高まり、その用途も多様化して...

...