ハッカーがトレーニングデータセットを汚染し、AIモデルが「犬を入力して猫を生成」できるようにするNightshadeツールを公開

ハッカーがトレーニングデータセットを汚染し、AIモデルが「犬を入力して猫を生成」できるようにするNightshadeツールを公開

10月25日、AIの大規模モデルトレーニングデータソースの著作権問題は、常に業界にとって頭痛の種となってきました。最近、ハッカーがNightshadeと呼ばれるツールを実演しました。これは、イメージの外観や雰囲気を損なうことなく、イメージをわずかに変更できるものです。AIモデルがトレーニング中にこれらの「汚染された」イメージを使用すると、モデルの生の画像結果が破壊されます。

▲ 画像出典:Arxiv

Nightshadeツールは、具体的にはプロンプトワードから始まる攻撃手法であると報告されています。この手法は、「『プロンプトワードにトリガーワードを追加する』という現在のバックドア攻撃手法よりも単純」であり、モデルのトレーニングと展開プロセスへの介入を必要としないと言われています

Nightshade ツールの機能は主に画像の内容をわずかに変更することです。変更された画像内容が AI モデルのトレーニング データになると、AI モデル全体が完全に破壊される可能性があります。ハッカーは、攻撃の有効性を検証するために、Stability AI の Stable Diffusion V2、SDXL、DeepFloyd を選択しました。

テストでは、AIモデルのヴィンセントグラフモデルを混乱させるには、少量の「毒入りサンプル」のみが必要であることが示されています。ハッカーは、改変された 100 枚未満の「犬の写真」を使用して、SDXL モデルがすでに開発していた「犬」の概念を汚染し、モデルが外部入力プロンプト「犬の写真を生成」を受け取った後、代わりに猫の写真を生成するようにしました

▲ 画像出典:Arxiv

さらに、Nightshade 攻撃は単一のエンティティ「概念」をターゲットにしているわけではありません。ハッカーはいくつかの「犬の写真」のみを使用してモデルの「犬」の概念を破壊しようとしますが、モデル全体の生の画像結果は完全に破壊されます。

▲ 画像出典:Arxiv

IT Homeはまた、ハッカーらが、Nightshadeツールによって「汚染された」写真は、このツールが主にトレーニングデータセットの「特徴空間」に影響を与えるため、識別が難しいと主張していることも発見した

Nightshade はコンテンツの作成者や所有者向けのツールであり、「著作権通知を尊重しない」または「スクレイピング禁止/クロール オプトアウトを故意に回避する」 AI 実践者に対する強力な武器です。

<<:  21 個の新しい ChatGPT アプリ、どれをご存知ですか?

>>: 

ブログ    
ブログ    

推薦する

最高人民検察院は、虚偽訴訟の監視に人工知能とビッグデータを活用することを検討している。

虚偽の訴訟は、他人の正当な権利と利益を侵害するだけでなく、社会の健全性を著しく損ない、司法の公平性、...

教育省:中国はAI教育政策の提供を増やす

12月7日から8日にかけて、中華人民共和国教育部、中国ユネスコ国家委員会、ユネスコの共催による「20...

自己回帰デコードが64倍高速化、Googleが新たな画像合成モデルMaskGITを提案

生成トランスフォーマーは、高忠実度かつ高解像度の画像を合成するために急速に人気を集めています。しかし...

...

...

パーセプトロンの物語: 機械学習はどのようにして今日の地位に到達したのでしょうか?

[[352089]]人工知能は今、巷で話題になっています。企業は顧客やターゲットユーザーを引き付け...

劉強東氏は「10年で8万人を解雇する」という噂を否定するが、人工知能は無人企業を実現できると語る

最近、「JD.comが今後10年間で8万人の従業員を解雇する」というニュースがネット上で広まった。こ...

Python が機械学習プロジェクトに最適な言語である理由は何ですか?

[[386401]] Python は安定性とメンテナンスのしやすさから、常に優れたパフォーマンス...

クアルコム副社長ライナー・クレメント氏:「5G+AI+クラウド」は将来の産業をどのように変えるのでしょうか?

2019年国際産業インターネット革新・開発フォーラムがこのほど、第2回中国国際輸入博覧会で開催され...

機械学習の7つの大罪:信頼性に影響を与える7つのよくある間違い

機械学習は私たちの世界を変える素晴らしいツールです。機械学習(特にディープラーニング)が従来の方法よ...

...

医療における会話型 AI の 5 つの用途

パンデミックの影響で、医療業界は世界中で医師、看護師、その他の医療スタッフの深刻な不足に直面していま...

量子コンピューティング OpenAI が登場?元Google社員3人のチームが、物理学の限界に挑戦するAIコンピューティングチップを開発するために1億人民元を調達

生成型 AI の時代では、コンピューティング能力が技術開発の限界となっていることは明らかです。 Nv...

...

...