警戒するのは困難：真剣な AI 研究がいかにしてコンピューター生成ポルノに変わったのか?

この記事は、公開アカウント「Reading the Core」（ID: AI_Discovery）から転載したものです。

10 年前、画像認識などの最も基本的な AI アルゴリズムの一部には、データセンターに通常備わっているような計算能力が必要でした。現在、これらのツールはスマートフォンでも利用可能であり、より強力で洗練されています。

原子力やロケット推進と同様に、AI は「二重使用」技術と見なされており、メリットとデメリットの両方をもたらす可能性があることを意味します。

[[356918]]

少し前、Vice は人工知能によって引き起こされる被害の最新例を報じました。プログラマーが性的虐待画像を使用して、ポルノを作成するアルゴリズムをトレーニングしているというものです。報告書では、匿名の博士課程の学生がどのようにして同意のない画像をデータセットにまとめ、それを既存のアルゴリズムと組み合わせてカスタムビデオを生成したかを詳しく説明しています。

人工知能を使ってポルノ作品を生成するクリエイターは、それらの作品をPornhubやOnlyFansなどのプラットフォームで公開しています。彼はViceに対し、Nvidiaが構築したオープンソースアルゴリズムであるStyleGAN2を使用したと語った。非常にリアルな偽の顔をオンラインで見たことがある場合（ThisPersonDoesNotExist.com などの Web サイト）、それらは StyleGAN2 によって生成された可能性が高いです。

この技術は一夜にして生まれたものではありません。 AI 生成ポルノというこの現象に至るまでには、いくつかの最も初期の現代的な画像生成アルゴリズムから始まる明確な道筋があります。

[[356919]]

画像出典: ゲッティイメージズ

生成的敵対ネットワーク (GAN) への飛躍

2014 年には、画像生成アルゴリズムの機能が飛躍的に進歩し、敵対的生成ネットワーク (GAN) が誕生しました。これは、イアン・グッドフェローという名の人工知能研究者が、バーで他の人々と議論しているときに思いついたアイデアです。アルゴリズム同士を競争させて、最良の結果を生み出すというものです。

画像を生成するには、「ジェネレータ」と「ディスクリミネーター」が必要です。ジェネレーターは画像を生成し、識別器はトレーニング中に表示された実際の画像に基づいて、画像が本物か偽物かを判断します。識別器は最もリアルな画像のみを受け入れるため、最終結果は AI によって生成された最高の画像になります。

テクノロジーを役立てる

グッドフェロー氏による生成的敵対ネットワークに関する初期の研究は、業界のベンチマークでは良好な結果を示しましたが、彼が作成した画像の多くは、依然として受け入れがたいほど乱雑に見えました (作成者のアイデアを抽象的かつ非人間的な方法で表現していた)。

2016年には、他の研究者らがこの技術の実験を開始し、低解像度ではあるもののリアルな画像を生成する方法を発見した。当時、研究者が寝室のリアルな画像をどのように生成したか、また人間の顔を生成する最初の試みについて説明した優れた論文がありました。

この研究は、生成的敵対ネットワークがトレーニング中にさらされるデータに基づいて適応できることを改めて実証しています。この技術により、寝室のリアルな画像や顔のリアルな画像を生成することができました。つまり、生成的敵対的ネットワークは、さまざまな種類の画像のパターンを実際に認識できるということです。

ディープフェイクは一般的になりつつある

生成的敵対ネットワークアーキテクチャに基づいて、人間の顔を合成するためのさまざまな無料およびオープンソースの方法が現在存在します。 Amazon Web Services (AWS) や Google Cloud などのクラウドサービスがより利用しやすくなるにつれて、これらのアルゴリズムをトレーニングする機能もより利用しやすくなりました。

人工知能研究の分野で最も有名なのは、Nvidia チームによって開発された StyleGAN です。このアプリは2018年12月にリリースされ、偽の顔の非常に高品質な画像を生成できたものの、奇妙なぼやけやデジタルアーティファクトが残っていました。それから1年も経たないうちに、Nvidia チームは StyleGAN2 をリリースしました。

これらのぼやけやアーティファクトを防ぎ、画像の忠実度を向上させるために、このリリースでは、さまざまなドメインに適応できるアルゴリズムのアーキテクチャが修正されています。アルゴリズムをポルノ画像（顔だけではなく）でトレーニングすることで、システムはおそらく生成するつもりのなかったものを生成できるようになります。

生成的敵対的ネットワークは、DeepFaceLab や Wav2Lip などのオープンソースプロジェクトを通じてディープフェイクを専門にするためにも使用されてきました。これらのサービスを使用するのは非常に簡単です。Wav2Lip プロジェクトの Web サイトから、たった 1 行のコードでビデオキャラクターを任意のオーディオファイルに自動的にリップシンクする方法を学ぶことができます。

これらの技術はまだ初期段階ですが、今後さらに洗練され、説得力のあるものになるでしょう。確かに興味深いアプリケーションもありますが、これらのアルゴリズムは、悪事を企む隠れた動機を持つ人々によって簡単に悪用されるようになっているようです。何も対策を講じなければ、ディープフェイクの害が娯楽としての価値を上回る可能性がある。

<<: UiPath Carnivalは職場の自動化におけるイノベーションを探るために近日開催されます

>>: NLP の学習を始める準備ができました。体系的に読むべき本やコースは何ですか?