脆弱なニューラル ネットワーク: カリフォルニア大学バークレー校が敵対的サンプル生成のメカニズムを説明します。

脆弱なニューラル ネットワーク: カリフォルニア大学バークレー校が敵対的サンプル生成のメカニズムを説明します。

ニューラル ネットワークを「騙す」ために使用される敵対的サンプルは、コンピューター ビジョンと機械学習における注目の研究トピックです。敵対的サンプルを理解することによってのみ、安定した機械学習アルゴリズムを構築するためのアイデアを見つけることができます。この記事では、カリフォルニア大学バークレー校の研究者が敵対的サンプルを作成する 2 つの方法を実演し、その背後にある原理を説明しました。

ニューラルネットワークによる暗殺 – クレイジーに聞こえますか?いつか、これが実際に起こるかもしれないが、それはあなたが想像するような形ではないだろう。どうやら、ニューラル ネットワークはドローンを飛行させたり、その他の大量破壊兵器を操作したりするように訓練できるようです。しかし、無害な(そして現在利用可能な)ネットワーク、たとえば自動車の運転に使用されるネットワークであっても、自動車所有者の敵になる可能性があります。これは、ニューラル ネットワークが敵対的サンプルと呼ばれる攻撃に対して非常に脆弱であるためです。

ニューラルネットワークでは、ネットワークが誤った値を出力する原因となる入力は敵対的サンプルと呼ばれます。これは例によって最もよく説明されます。まずは左の写真から始めましょう。いくつかのニューラル ネットワークでは、この画像がパンダであると考えられる信頼度は 57.7% であり、パンダ カテゴリとして分類される信頼度はすべてのカテゴリの中で最も高いため、ネットワークは「画像にはパンダが含まれている」という結論に達します。ただし、慎重に作成されたノイズをごく少量追加すると、次のような画像 (右) が得られます。人間にとっては、左側の画像とほとんど同じに見えますが、ネットワークは 99.3% の信頼度で、これが「テナガザル」として分類されると考えています。これは本当にクレイジーだ!

上記の画像は、Goodfellow ら著「Explaining and Harnessing Adversarial Examples」からの引用です。

では、敵対的サンプルはどのようにして暗殺を実行するのでしょうか?一時停止の標識を敵対的サンプル、つまり人間は一時停止の標識だとすぐに認識できるが、ニューラル ネットワークは認識できないサンプルに置き換えることを想像してください。さて、この標識を交通量の多い交差点に設置するとします。自動運転車が交差点に近づくと、搭載されているニューラルネットワークが一時停止標識を認識できずに運転を続け、乗客が死亡する可能性がある(理論上)。

これは、敵対的事例がどのように害を及ぼすために使用されるかを示す、複雑でややセンセーショナルな多くの例のうちの 1 つにすぎません。たとえば、iPhone Xの「Face ID」ロック解除機能は、顔認識にニューラルネットワークに依存しているため、敵対的攻撃に対して脆弱です。敵対的な画像を作成することで、Face ID セキュリティ機能を回避することができます。他の生体認証セキュリティシステムも危険にさらされるでしょう。敵対的サンプルの使用により、違法または不適切なコンテンツがニューラルネットワークベースのコンテンツフィルターを回避する可能性があります。これらの敵対的サンプルの存在は、ディープラーニング モデルを含むシステムが実際には極めて高いセキュリティ リスクを抱えていることを意味します。

敵対的サンプルを理解するには、それをニューラル ネットワークに対する「幻覚」と考えることができます。幻覚が人間の脳を騙すのと同じように、敵対的事例もニューラル ネットワークを騙すことができます。

上記のパンダ敵対的サンプルは、ターゲットを絞った例です。慎重に作成された少量のノイズが画像に追加され、ニューラル ネットワークが画像を誤分類する原因となります。しかし、人間にとってはその画像は以前と同じように見えます。ニューラル ネットワークを騙す入力を単に見つけようとする非ターゲットの例もあります。人間にとって、この入力はホワイトノイズのように見えるかもしれません。ただし、人間に似た入力を見つけることに制約がないため、この問題ははるかに簡単です。

ほぼすべてのニューラル ネットワークで敵対的サンプルを見つけることができます。いわゆる「超人的な」能力を備えた最先端のモデルでさえ、この問題に多少悩まされています。実際、敵対的サンプルの作成は非常に簡単です。この記事では、その方法を説明します。独自の敵対的サンプルを生成するために必要なすべてのコードと資料は、この github にあります: https://github.com/dangeng/Simple_Adversarial_Examples

上の図は敵対的サンプルの効果を示している

MNIST における敵対的サンプル

このセクションのコードは、次のリンクにあります (ただし、この記事を読むためにコードをダウンロードする必要はありません)。https://github.com/dangeng/Simple_Adversarial_Examples

MNIST データセットでトレーニングされた通常のフィードフォワード ニューラル ネットワークを騙してみます。 MNIST は、次のような 28×28 ピクセルの手書き数字画像のデータセットです。

6つのMNIST画像を並べて表示

<<:  人工知能を活用して社会問題を解決する方法

>>:  ファーウェイ、次世代スマート製品戦略と新+AIシリーズ製品を発表

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2023年に最も注目すべきソフトウェアテスト業界のトレンドと動向の分析

2023年はソフトウェアテスト業界にとって変化とチャンスに満ちた年です。ソフトウェア業界の急速な発展...

50 以上の実用的な機械学習および予測 API (2018 年版)

[51CTO.com クイック翻訳] この記事では、顔認識や画像認識、テキスト分析、自然言語処理 ...

...

人工知能はマーケティング業界に破壊的な影響を及ぼすだろう

ビッグデータと人工知能の市場は現在、活況を呈しています。調査会社の最近の予測によると、これら2つの技...

ついに誰かがROSロボットオペレーティングシステムをわかりやすく説明しました

01 ROS入門多くの初心者は、ロボットのオペレーティングシステムと聞いて、「オペレーティングシス...

人工知能の発展方向と機会

[[358422]] 01 現段階における人工知能のボトルネック現在、人工知能、特にその応用分野では...

EU諸国の4分の1がAIによるサイバーセキュリティ管理を望んでいる

予想外かもしれませんが、消費者のかなりの部分は、サイバーセキュリティを生身のサイバーセキュリティ専門...

モザイクがワンクリックでHDになる?魔法のAI「ロスレス拡大」ツール

写真を鮮明に見るにはどうすればいいですか?サムネイルを何度も拡大すると、モザイクしか見えなくなる場合...

人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?

人工知能の発展は65年の歴史があり、厳しい冬も栄光も経験してきました。シンボリックエキスパートシステ...

3枚の写真からフィギュアの3Dモデルを生成!南カリフォルニア大学の中国人博士が、より現実的な新しいモデル「NeROIC」を提案しました。

ディープラーニングが加わったことで、コンピュータグラフィックスには多くの新しい分野が生まれました。 ...

詳細レポート: ビッグモデルが AI を全面的に加速させます!黄金の10年が始まる

過去70年間に「3つの上昇と2つの下降」を経験した後、基盤となるチップ、コンピューティングパワー、デ...

機械学習技術におけるアンサンブル学習とは何ですか?

[51CTO.com クイック翻訳] アンサンブル学習は強力な機械学習技術の 1 つです。アンサン...

スパイラルはリアルタイムの機械学習を使用してFacebookのサービスを自動調整します

[51CTO.com クイック翻訳] Facebook を利用する何十億もの人々にとって、私たちのサ...

信頼できるAIの基礎は、適切なタイミングで適切なデータを得ることです

私たちは人工知能の存在に慣れ始めており、生成型人工知能(GenAI)の普及により、人工知能が世界に与...