研究者は特別な画像を使って人工知能を「毒する」

研究者は特別な画像を使って人工知能を「毒する」

DALL-E、Midjourney、Stable Diffusion などの AI 生成アート ツールの台頭により、激しい議論と論争が巻き起こっています。これらのシステムは、インターネット上で収集された膨大なデータセットでトレーニングされ、テキストプロンプトに基づいてフォトリアリスティックな画像やアートを作成できます。しかし、これにより著作権侵害やアーティストの作品の不正使用に関する大きな懸念が生じます。

そこで研究者たちは、クリエイターがデジタルアートに「毒」を加えることを可能にする、Nightshade と呼ばれる革新的な新技術を開発した。目的は、許可なく自分の作業を使用しようとする AI システムを妨害することです。

DALL-E 2 や Stable Diffusion などのツールは、ニューラル ネットワークと呼ばれる一種の人工知能技術を使用します。これらは、キャプションやテキストの説明とペアになった画像の大規模なデータセットでトレーニングされます。これにより、テキストの概念と視覚的特徴の関係を学ぶことができます。

たとえば、モデルが「犬」というラベルの付いた、毛皮、4 本の足、尻尾などが描かれた何百万もの画像を見ると、それらの視覚パターンを「犬」という言葉と関連付けることを学習します。次に、「草の上に座っているかわいい子犬」のようなテキストプロンプトを与えると、子犬の新しいリアルな画像をゼロから生成できます。

アーティストの作品の撮影に関する懸念

モデルはより多くのデータでトレーニングされるにつれて、より優れた能力を発揮します。その結果、背後にいるテクノロジー大手は、アーティストの同意なしにインターネットから何百万枚もの画像を取得するに至った。しかし、多くのクリエイターは、自分の作品が許可や報酬なしに AI トレーニングに使用されていることに不満を抱いています。

これはアーティストにとってジレンマを生み出します。作品を公開して AI トレーニングが悪用されるリスクを冒すか、非公開にして露出を失うか? Instagram、DeviantArt、ArtStation などのプラットフォームは、AI システムのトレーニング データの宝庫となっています。

Nightshade が AI モデルに毒を注入する方法

最近の研究論文によると、Nightshade は AI モデル自体を攻撃して破壊するという巧妙な解決策を提供しているとのことです。デジタルアートのピクセルにおけるこれらの微妙な変化は、人間には見えません。しかし、これらの調整により、AI が依存する画像の概念とテキストの手がかりが混乱します。

たとえば、Nightshade は犬の写真を修正して、AI モデルがそれを自転車や帽子と間違えるようにすることができます。十分な量の汚染された画像が AI のデータセットに入力されると、テキストと画像の間に奇妙なつながりがあるという錯覚が生じる可能性があります。

テストの結果、Nightshade によって Stable Diffusion などの AI モデルが完全にシュールかつ不条理なアートを生成できることが分かりました。例えば、50 個の毒物サンプルを採取した後、犬の画像が「タコ」のような多足の生き物に変わったり、漫画の顔が歪んだりした。 「毒を盛られた」犬の写真を 300 枚取り込んだ後、Stable Diffusion は犬を作成するように求められたときに猫を出力しました。

Nightshade の攻撃は、ニューラル ネットワークのブラック ボックス特性を悪用します。大量のデータセットでは中毒の原因を追跡するのは困難です。つまり、有害なデータを削除するのは、干し草の山から針を見つけるようなものです。

攻撃は関連する概念間でも伝播します。そのため、「ファンタジー アート」の画像に悪影響を与えると、「ドラゴン」や「城」などの関連用語についても AI が混乱することになります。これにより、Nightshade 効果を手動で大規模にクリーンアップすることはほぼ不可能になります。

<<:  OpenAI CEOアルトマン氏の突然の解任に関する分析

>>:  Google Deepmind、楽器とボーカルで音楽を生成するLyria AIオーディオモデルを発表

ブログ    
ブログ    
ブログ    

推薦する

...

速報です! ImageNetデータセット内のすべての顔はぼかされている

2012 年、AI 研究者はコンピューター ビジョンで大きな進歩を遂げ、ImageNet として知ら...

...

人工知能の現状を理解するための12枚の写真

スタンフォード大学の人間中心の AI 研究所 (HAI) は毎年、人工知能の現状をまとめた膨大なデー...

CV の世界における 3D ビジョンの究極の実現: コンピューターがこの 3 次元の世界を「見る」方法

携帯電話を開くと顔がロック解除されます。VR と AR 技術は、このような仮想でありながら現実のシー...

IoTとAIを活用して価値を加速させる4つの効果的な方法

Twitter、LinkedIn、そして多くの IoT 関連の Web サイトを見ると、モノのインタ...

自動運転には未来があるのでしょうか?

自動運転の定義この記事では、飛行機や船ではなく、自動車の自動運転について説明します。英語ではこれを自...

...

...

Python 機械学習でプログラミングスキルを向上させる方法

この記事では、Packt の『Python Machine Learning, 3rd Editio...

...

面接中にアルゴリズムの質問を解く際にプログラマーが知っておくべきこと

面接でアルゴリズムのみをテストする質問は、一般的に多くのプログラマーの友人から嫌われます。ここでは、...

...

烏鎮サミットから10年:呉永明が初めてアリババの新たな変化について言及

ノア著制作:51CTO テクノロジースタック(WeChat ID:blog) 「夜、烏鎮の橋のそばの...