CNN の弱点を見つけ、MNIST の「ルーチン」に注意する

CNN の弱点を見つけ、MNIST の「ルーチン」に注意する

[[191828]]

CNN は現在非常に人気のあるモデルです。多くの画像検索問題において、CNN モデルの効果が以前より大幅に向上しました。しかし、CNN は結局これらの問題を完全に解決したわけではなく、CNN にはまだ独自の弱点があります。この弱点は、この病気特有の問題とは言えませんが、その効能があまりにも優れているため、迷信的に信じる人も多く、この洗面器に冷水をかけているのです。

専門家たちは CNN モデルの威力を目の当たりにしましたが、次のような疑問を抱かずにはいられませんでした。CNN で処理できないものがあるのでしょうか? たとえば、CNN を使用して顔認識モデルを構築します。このモデルはトレーニング データ セットとテスト データ セットで優れたパフォーマンスを発揮しますが、誤判断するユース ケースはあるのでしょうか? また、こうしたユース ケースを生成するパターンを見つけることはできるのでしょうか?

以前正しく識別されたデータにわずかな変更を加えると、依然として正しく識別できる可能性があることが想像できます。そこで私たちは、ある計画を思いつきました。画像に少し変更を加えるたびに、その画像を CNN に渡してテストし、CNN の予測結果が変わったかどうかを確認します。変わっていない場合は、画像を保存して次の変更を行います。数回の変更が終わったら、生成された画像を出力して、画像がどのように見えるかを確認します。

ここでは MNIST を例にとり、次の変更計画を示します。

  1. MNIST トレーニング セットを使用して CNN モデルをトレーニングします。CNN モデルの構造は次のとおりです: conv32*3*3->relu->maxpool2*2->conv64*3*6->relu->maxpool2*2->fc256->dropout0.5->fc10。
  2. トレーニングデータセットを見つけ、そのデータ範囲を 0 から 1 に制限します。各ピクセルに対して -0.1 から 0.1 の間の数値をランダムに増減して、64 枚のランダム画像を取得します。次に、CNN モデルを使用して、これらの 64 枚の画像の予測ラベルを予測し、元のラベルと同じラベルを持つ画像を選択します。数回の反復処理を繰り返すと、ランダムに変更された数値がどのようになるかがわかります。

私たちは0番を選択しました:

50 回の反復後、次の画像が得られます。

100 回の反復後、次の画像が得られます。

150 回の反復後、次の画像が得られます。

200 回の反復処理の後、次の画像が得られます。

ここまでは、まだ数字がぼんやり見えていることがわかりますが、実際には画像がぼやけ、雑然とした情報が混ざり合って、元の数字とはまったく異なっています。

このルーチンは「CNNをだます」と呼ばれ、中国北東部の人々をだますことを意味します。繰り返し作業を続けることで、さらに魅力的な画像を生成できます。もちろん、これは CNN モデルを騙す 1 つの方法にすぎません。画像を生成する方法は他にもあります。他の方法についてはここでは紹介しません。こうした詐欺行為に関して、専門家は機械学習に関連した説明も行いました。

CNN モデルは究極的には識別モデルです。画像を X、ラベルを y に設定すると、CNN モデルは p(y|X) の値を見つけることと同等になります。判別モデルは「このラベルの画像はどのような画像であるか」を記述することと同等であり、これらの条件を満たす画像が必ずしも実際のラベルが付いた画像ではない場合があります。上記の詐欺はこの抜け穴を利用しています。

上記の例では、この fool メソッドを使用して、ぼやけた画像の元のラベルを保持し、それほどぼやけていない画像を CNN によって誤って別のラベルとして認識させることもできます。

たとえば、次の画像は 40 回の反復処理の後に 6 として認識されました。

こうしたルーチンの出現により、私たちは CNN を警戒するようになりました。CNN に手書きの数字を完全に保持させたいのであれば、他の補助手段が必要です。そうしないと、このような事故が常に発生します。

それで、この問題を解決する方法はあるのでしょうか?

<<:  AWS 上でディープラーニングホストを構築する (Windows 版)

>>:  ディープラーニングにおけるバッチ正規化の落とし穴

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ディープラーニング/コンピュータービジョンでよくある8つの間違いとその回避方法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

AI、5G、エッジテクノロジーが製造業をリード

オフィスから作業場、製品に至るまで、製造業はテクノロジーで溢れており、コネクテッドエコノミーの導入に...

「顔認識」は諸刃の剣です。どうすればそれを利用して被害を回避できるのでしょうか?

[[356811]]顔認識は人工知能の画期的な技術として、大規模に導入され始めています。顔認証ロッ...

靴下が山積みになっています。靴下をペアにするには、最も速くて効率的なアルゴリズムをどのように使用すればよいでしょうか?

[問題の説明]昨日、コインランドリーで靴下の山を整理していたのですが、自分が使っていた方法がとても...

AIセキュリティリスクの予防と管理を強化するには、技術統合と法的規制に重点を置く必要がある

人工知能は、新たな科学技術革命と産業変革をリードする戦略的技術として、世界の主要国が科学技術の飛躍的...

チャットテクノロジーと IoT セキュリティの将来はどうなるのでしょうか?

OpenAIは2022年11月30日にChatGPTをリリースしました。大規模言語モデル GPT3...

...

AIビッグモデルは今後も拡大し続けるのか?

人工知能は現在、ビジネスと金融のあらゆる側面に急速に導入されています。いくつかの刺激的な成功により、...

MIT教授が交通渋滞を解決するアルゴリズムを開発

交通渋滞は車をブロックするだけでなく、人々の心もブロックします。車の窓から頭を出して、目の前に無限に...

AIアライメントを徹底レビュー!北京大学などが800以上の文書から4万語を要約し、多くの著名な学者が執筆を担当した。

要点を一目でAI アライメントは、RLHF/RLAIF などの成熟した基本手法だけでなく、スケーラブ...

アメリカはAIイノベーションをリードしているのか?フォーブス誌のグローバルAIスタートアップトップ50

NetEase Intelligence News: 人工知能はまもなく私たちの世界を変えるでしょ...

...

空中でスクリーンに文字を書くのは魔法のようです。指をつまむだけで実現します。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

5G、自動運転、AIがどの段階に到達したかを示す曲線

最近、世界で最も権威のあるIT市場調査およびコンサルティング会社であるガートナーは、新しいテクノロジ...

どのようなタイプのスマートビルが AI の導入をリードするのでしょうか?

人工知能 (AI) は建物の避けられない未来ですが、過去 10 年間のスマート テクノロジーの採用と...