顔を変える技術の悪用に対抗するため、Googleはディープフェイクと戦うための大規模なデータセットを公開

顔を変える技術の悪用に対抗するため、Googleはディープフェイクと戦うための大規模なデータセットを公開

ディープフェイクの出現以来、多くの論争を引き起こし、多くの倫理的、社会的問題を引き起こしてきました。最近、FacebookやMicrosoftなどの大企業はディープフェイクの悪用と闘い始めており、ディープフェイク検出チャレンジを主催するために1,000万ドル以上を費やしている。 Google は遅れをとるつもりはない。最近、このテクノロジー大手は、ディープフェイク検出に関するコミュニティの研究をサポートするために、大規模なディープフェイク ビデオ データセットをオープン ソース化すると発表した。

ディープラーニングは、数年前には想像もできなかった多くのテクノロジーを生み出しました。一例として、超リアルな画像、音声、音楽、さらにはビデオを合成できる最新の生成モデルが挙げられます。これらのモデルは、テキストから直接人間のような音声を生成したり、医療画像研究用のトレーニング データを生成するなど、幅広い目的で広く使用されています。

他の革新的なテクノロジーと同様に、生成モデルも「ディープフェイク」などの新たな課題をもたらします。ディープフェイクは2017年後半に登場し、それ以来、多くのオープンソースのディープフェイク生成方法が登場し、合成ビデオクリップが大量に流入しました。これらのビデオの多くは面白おかしく作られていますが、ディープフェイクビデオの中には個人や社会に悪影響を及ぼすものもあります。

Google はこれらの問題を真剣に受け止めています。昨年、Google は「AI 原則」を発表し、AI の悪用や AI による危害を軽減するための AI のベストプラクティスを探求することを約束しました。昨年 1 月、Google は、高性能な偽音声検出器の開発を支援するために、ASVspoof 2019 チャレンジをサポートする合成音声データセットをリリースしました。このデータセットはコンペティション用のデータベースとして、150以上の研究機関や業界団体にダウンロードされており、現在は無料で一般公開されています。

最近、Google AI は Jigsaw (旧 Google Ideas) と共同で、ミュンヘン工科大学とナポリ フェデリコ 2 世大学 (Google が共同スポンサー) が作成した FaceForensics ベンチマークに組み込まれた大規模なビジュアル ディープフェイク データセットをリリースしました。

FaceForensics ベンチマーク データセット アドレス: https://github.com/ondyari/FaceForensics/

Google が公開したディープフェイク データセットからのビデオ例。生成プロセス中に、俳優のペアがランダムに選択され、ディープニューラルネットワークがそれらの俳優に対して顔の交換操作を実行します。

このデータセットを作成するために、Google は複数の有償および無償の俳優と協力し、過去 1 年間で数百本のビデオを撮影しました。その後、Google は、公開されているディープフェイク生成方法を使用して、これらのビデオに基づいて何千ものディープフェイク ビデオを作成しました。これらの本物の動画と偽物の動画を合わせてこのデータセットを構成しており、Google はディープフェイク検出の研究を支援するためにこのデータセットを作成しました。このデータセットは現在、FaceForensics ベンチマークの一部としてオープンソース化されており、研究コミュニティが自由に利用できるようになり、合成ビデオ検出方法の開発に役立ちます。

さまざまなシナリオで俳優たちを撮影します。上の画像は実際の俳優で、下の画像はそれに対応するディープフェイクの例です。2 つの画像の違いの度合いは、ディープフェイクの作成に使用されたもう 1 人の俳優によって異なります。

ディープフェイク技術は急速に発展しており、Googleはデータセットにデータを追加し続け、この分野で協力を続けていくと述べた。このデータセットの公開は、合成メディアの誤用によって引き起こされる潜在的な危害を軽減するために研究コミュニティを支援するという Google の取り組みにおける重要な一歩です。

<<:  あなたの顔データはどこに保存されますか?

>>:  シンプルなアルゴリズムで分散システムのパフォーマンスが瞬時に10倍以上向上

ブログ    
ブログ    

推薦する

TFserving によるディープラーニング モデルの導入

1. TFservingとは何かモデルをトレーニングし、それを外部の関係者に提供する必要がある場合は...

Llama 2 第 2 波のハイライト: 慎重すぎるため、コード生成には改善の余地が大いにある

有用か無害かLlama-2-chat は、セキュリティ フィルターに関して過度に敏感な動作を示すこと...

人工知能トレーナーという職業は魅力的ですか?

人工知能については誰もが知っていますが、人工知能トレーナーについてはどのくらい知っていますか? [[...

eMule プロトコルの DHT アルゴリズム

BT プロトコルと eMule プロトコルのアルゴリズムにはいくつかの違いがあり、この 2 つを併用...

AI戦争が近づく中、ChatGPTが軍事禁止を解除

先週末、大手人工知能企業OpenAIは、ChatGPTの使用ポリシーから軍事利用を禁止する条項をひっ...

MapReduceアルゴリズムをわかりやすく説明する方法

Hackbright でメンターをしているときに、技術的な背景が限られている学生に MapReduc...

将来のシステム設計のための機械学習

エリアス・ファロン氏は、電子設計自動化技術の大手プロバイダーである Cadence Design S...

「人工知能」の発展を合理的に扱う

現在の人工知能の発展は、主にディープラーニングに代表される機械学習技術の恩恵を受けています。ディープ...

...

キロメートル認識誤差5%未満の世界最先端の超長距離精密3Dセンシング技術をリリース。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

GenAI時代のサイバー軍拡競争を生き残る方法

GenAIの急速な出現はすでにサイバーセキュリティに大きな変化をもたらし、各国政府に対策を取らせてお...

...

...

テスラは最初にこの問題の矢面に立たされ、自動運転の安全性の問題が再び話題となっている。

今日、自動運転は自動車産業の発展と変革の重要な方向性の一つとなっています。自動運転技術が成熟するにつ...