ハッカーがトレーニングデータセットを汚染し、AIモデルが「犬を入力して猫を生成」できるようにするNightshadeツールを公開

ハッカーがトレーニングデータセットを汚染し、AIモデルが「犬を入力して猫を生成」できるようにするNightshadeツールを公開

10月25日、AIの大規模モデルトレーニングデータソースの著作権問題は、常に業界にとって頭痛の種となってきました。最近、ハッカーがNightshadeと呼ばれるツールを実演しました。これは、イメージの外観や雰囲気を損なうことなく、イメージをわずかに変更できるものです。AIモデルがトレーニング中にこれらの「汚染された」イメージを使用すると、モデルの生の画像結果が破壊されます。

▲ 画像出典:Arxiv

Nightshadeツールは、具体的にはプロンプトワードから始まる攻撃手法であると報告されています。この手法は、「『プロンプトワードにトリガーワードを追加する』という現在のバックドア攻撃手法よりも単純」であり、モデルのトレーニングと展開プロセスへの介入を必要としないと言われています

Nightshade ツールの機能は主に画像の内容をわずかに変更することです。変更された画像内容が AI モデルのトレーニング データになると、AI モデル全体が完全に破壊される可能性があります。ハッカーは、攻撃の有効性を検証するために、Stability AI の Stable Diffusion V2、SDXL、DeepFloyd を選択しました。

テストでは、AIモデルのヴィンセントグラフモデルを混乱させるには、少量の「毒入りサンプル」のみが必要であることが示されています。ハッカーは、改変された 100 枚未満の「犬の写真」を使用して、SDXL モデルがすでに開発していた「犬」の概念を汚染し、モデルが外部入力プロンプト「犬の写真を生成」を受け取った後、代わりに猫の写真を生成するようにしました

▲ 画像出典:Arxiv

さらに、Nightshade 攻撃は単一のエンティティ「概念」をターゲットにしているわけではありません。ハッカーはいくつかの「犬の写真」のみを使用してモデルの「犬」の概念を破壊しようとしますが、モデル全体の生の画像結果は完全に破壊されます。

▲ 画像出典:Arxiv

IT Homeはまた、ハッカーらが、Nightshadeツールによって「汚染された」写真は、このツールが主にトレーニングデータセットの「特徴空間」に影響を与えるため、識別が難しいと主張していることも発見した

Nightshade はコンテンツの作成者や所有者向けのツールであり、「著作権通知を尊重しない」または「スクレイピング禁止/クロール オプトアウトを故意に回避する」 AI 実践者に対する強力な武器です。

<<:  21 個の新しい ChatGPT アプリ、どれをご存知ですか?

>>: 

ブログ    
ブログ    

推薦する

Facebookは色を表現するために通信する2つのニューラルネットワークを作成

色をどのように表現するか考えたことはありますか?最新の研究によると、人間は個別の記号を使用して領域の...

将来、人工知能は冷酷な大量虐殺者になるのでしょうか?

人類の将来に対する最も永続的な恐怖の一つは、人工知能が人間の制御を逃れ、人類を絶滅させる可能性がある...

機械学習は自動化を成功させる鍵となるのでしょうか?

機械学習 (ML) は情報技術 (IT) の柱の 1 つであり、人工知能のサブセットとして定義できま...

スマートドライビングに才能が注ぎ込む:合理性と狂気が共存

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

人工知能は今や人間の感情を認識できるほど賢くなった

AIに「感情」を与える時が来たのかもしれない[[236486]]今後のビジネスモデルはますます「感情...

...

ポピュラーサイエンス:自動運転車はなぜ制御を失うのか? 「道路の汚れ」が原因か

通常の「道路の汚れ」でも、インテリジェントな自動運転車を混乱させ、1 秒以内に制御を失い車線から外れ...

50歳の男性がAIの博士号を取得するためにケンブリッジに戻り、AIを使ってレタスを収穫するロボットを開発した。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIが別のAIに命令する、GAN+CLIPの組み合わせで「CGアーティスト」に

[[407645]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

マイクロソフトがOpenAIを救わなければならなかった6つの理由

メアリー・ブランスコム編纂者 | Yan Zheng生成型AIの寵児であるOpenAIは最近、混沌と...

アルゴリズム学習実践ガイド

[[158318]]ほぼすべてのトップクラスのインターネット企業やソフトウェア企業は、ソフトウェアエ...

強化学習は AGI を実現するのに十分でしょうか?サットン:報酬メカニズムはさまざまな目標を達成するのに十分です

[[405185]]人工知能の分野では、何十年もの間、コンピューター科学者が視覚、言語、推論、運動能...

2017年データサイエンスおよび機械学習業界現状調査:Pythonが最も人気のある言語

[[209261]]今年、Kaggle はデータ サイエンスと機械学習の状況を包括的に理解することを...

データサイエンスのための Python: ニューラル ネットワーク

人工ニューラル ネットワーク (ANN) は、数学的および物理的な方法を使用して人間の脳のニューラル...