警戒するのは困難:真剣な AI 研究がいかにしてコンピューター生成ポルノに変わったのか?

警戒するのは困難:真剣な AI 研究がいかにしてコンピューター生成ポルノに変わったのか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)から転載したものです。

10 年前、画像認識などの最も基本的な AI アルゴリズムの一部には、データ センターに通常備わっているような計算能力が必要でした。現在、これらのツールはスマートフォンでも利用可能であり、より強力で洗練されています。

原子力やロケット推進と同様に、AI は「二重使用」技術と見なされており、メリットとデメリットの両方をもたらす可能性があることを意味します。

[[356918]]

少し前、Vice は人工知能によって引き起こされる被害の最新例を報じました。プログラマーが性的虐待画像を使用して、ポルノを作成するアルゴリズムをトレーニングしているというものです。報告書では、匿名の博士課程の学生がどのようにして同意のない画像をデータセットにまとめ、それを既存のアルゴリズムと組み合わせてカスタムビデオを生成したかを詳しく説明しています。

人工知能を使ってポルノ作品を生成するクリエイターは、それらの作品をPornhubやOnlyFansなどのプラットフォームで公開しています。彼はViceに対し、Nvidiaが構築したオープンソースアルゴリズムであるStyleGAN2を使用したと語った。非常にリアルな偽の顔をオンラインで見たことがある場合(ThisPersonDoesNotExist.com などの Web サイト)、それらは StyleGAN2 によって生成された可能性が高いです。

この技術は一夜にして生まれたものではありません。 AI 生成ポルノというこの現象に至るまでには、いくつかの最も初期の現代的な画像生成アルゴリズムから始まる明確な道筋があります。

[[356919]]

画像出典: ゲッティイメージズ

生成的敵対ネットワーク (GAN) への飛躍

2014 年には、画像生成アルゴリズムの機能が飛躍的に進歩し、敵対的生成ネットワーク (GAN) が誕生しました。これは、イアン・グッドフェローという名の人工知能研究者が、バーで他の人々と議論しているときに思いついたアイデアです。アルゴリズム同士を競争させて、最良の結果を生み出すというものです。

画像を生成するには、「ジェネレータ」と「ディスクリミネーター」が必要です。ジェネレーターは画像を生成し、識別器はトレーニング中に表示された実際の画像に基づいて、画像が本物か偽物かを判断します。識別器は最もリアルな画像のみを受け入れるため、最終結果は AI によって生成された最高の画像になります。

テクノロジーを役立てる

グッドフェロー氏による生成的敵対ネットワークに関する初期の研究は、業界のベンチマークでは良好な結果を示しましたが、彼が作成した画像の多くは、依然として受け入れがたいほど乱雑に見えました (作成者のアイデアを抽象的かつ非人間的な方法で表現していた)。

2016年には、他の研究者らがこの技術の実験を開始し、低解像度ではあるもののリアルな画像を生成する方法を発見した。当時、研究者が寝室のリアルな画像をどのように生成したか、また人間の顔を生成する最初の試みについて説明した優れた論文がありました。

この研究は、生成的敵対ネットワークがトレーニング中にさらされるデータに基づいて適応できることを改めて実証しています。この技術により、寝室のリアルな画像や顔のリアルな画像を生成することができました。つまり、生成的敵対的ネットワークは、さまざまな種類の画像のパターンを実際に認識できるということです。

ディープフェイクは一般的になりつつある

生成的敵対ネットワーク アーキテクチャに基づいて、人間の顔を合成するためのさまざまな無料およびオープン ソースの方法が現在存在します。 Amazon Web Services (AWS) や Google Cloud などのクラウド サービスがより利用しやすくなるにつれて、これらのアルゴリズムをトレーニングする機能もより利用しやすくなりました。

人工知能研究の分野で最も有名なのは、Nvidia チームによって開発された StyleGAN です。このアプリは2018年12月にリリースされ、偽の顔の非常に高品質な画像を生成できたものの、奇妙なぼやけやデジタルアーティファクトが残っていました。それから1年も経たないうちに、Nvidia チームは StyleGAN2 をリリースしました。

これらのぼやけやアーティファクトを防ぎ、画像の忠実度を向上させるために、このリリースでは、さまざまなドメインに適応できるアルゴリズムのアーキテクチャが修正されています。アルゴリズムをポルノ画像(顔だけではなく)でトレーニングすることで、システムはおそらく生成するつもりのなかったものを生成できるようになります。

生成的敵対的ネットワークは、DeepFaceLab や Wav2Lip などのオープンソース プロジェクトを通じてディープフェイクを専門にするためにも使用されてきました。これらのサービスを使用するのは非常に簡単です。Wav2Lip プロジェクトの Web サイトから、たった 1 行のコードでビデオ キャラクターを任意のオーディオ ファイルに自動的にリップシンクする方法を学ぶことができます。

これらの技術はまだ初期段階ですが、今後さらに洗練され、説得力のあるものになるでしょう。確かに興味深いアプリケーションもありますが、これらのアルゴリズムは、悪事を企む隠れた動機を持つ人々によって簡単に悪用されるようになっているようです。何も対策を講じなければ、ディープフェイクの害が娯楽としての価値を上回る可能性がある。

<<:  UiPath Carnivalは職場の自動化におけるイノベーションを探るために近日開催されます

>>:  NLP の学習を始める準備ができました。体系的に読むべき本やコースは何ですか?

ブログ    
ブログ    

推薦する

ロボットは痛みを恐れる:これは技術的な進歩なのか、それとも倫理的な課題なのか?

時代の発展と科学技術の進歩に伴い、ロボットは人々の生活の場にますます入り込んできましたが、私たちの従...

インドのチームが人間のように考えることができる自動運転アルゴリズムを開発

[51CTO.com クイック翻訳]インド工科大学 (IIT マドラス) の研究者らは、人間のように...

2026年までに、AIを活用したARアプリケーションのユーザー数は2億人を超える

ABI Research は、2026 年までに、何らかの形で人工知能 (AI) を活用した拡張現実...

調査と市場:2025年までに世界のヘルスケア人工知能市場は272億ドルに達する

市場調査会社リサーチ・アンド・マーケッツが最近発表したレポートによると、人工知能の世界のヘルスケア市...

...

自動運転車の意思決定制御システム技術を分析した記事

自動運転システムは、環境認識、意思決定制御、行動実行を統合した総合的なシステムであり、車両と交通環境...

...

...

スマートシティGPT?ジェネレーティブAIがスマートシティにどのように役立つか

生成AIとは何ですか?生成 AI は、データを分析し、パターンと傾向を識別し、都市計画と管理に関する...

清華大学の朱俊氏のチームは、拡散モデルを打ち破り、シュレーディンガー橋に基づく新しい音声合成システムを開発した。

最近、清華大学コンピュータサイエンス学部の朱軍教授の研究グループが発表したシュレーディンガー橋[1]...

NVIDIA は、わずか 5 行のコードで画像を 3D モデルに変換する 3D ディープラーニング ツール Kaolin をリリースしました。

近年、3D コンピューター ビジョンと人工知能はともに急速に進歩していますが、両者の効果的な組み合わ...

...

ChatGPTは人間よりも優れているか? - チューリングテストの観点からの議論

翻訳者|朱 仙中レビュー | Chonglou概要:機械は考えることができるか?この論文では、この問...

AIシステムのグレーディングを通じて企業のコスト管理を支援

翻訳者 | 張毅校正 | 梁哲、孫淑娟自動車技術協会(SAE)が自動運転車を分類しているのと同じよう...