顔を変える技術の悪用に対抗するため、Googleはディープフェイクと戦うための大規模なデータセットを公開

顔を変える技術の悪用に対抗するため、Googleはディープフェイクと戦うための大規模なデータセットを公開

ディープフェイクの出現以来、多くの論争を引き起こし、多くの倫理的、社会的問題を引き起こしてきました。最近、FacebookやMicrosoftなどの大企業はディープフェイクの悪用と闘い始めており、ディープフェイク検出チャレンジを主催するために1,000万ドル以上を費やしている。 Google は遅れをとるつもりはない。最近、このテクノロジー大手は、ディープフェイク検出に関するコミュニティの研究をサポートするために、大規模なディープフェイク ビデオ データセットをオープン ソース化すると発表した。

ディープラーニングは、数年前には想像もできなかった多くのテクノロジーを生み出しました。一例として、超リアルな画像、音声、音楽、さらにはビデオを合成できる最新の生成モデルが挙げられます。これらのモデルは、テキストから直接人間のような音声を生成したり、医療画像研究用のトレーニング データを生成するなど、幅広い目的で広く使用されています。

他の革新的なテクノロジーと同様に、生成モデルも「ディープフェイク」などの新たな課題をもたらします。ディープフェイクは2017年後半に登場し、それ以来、多くのオープンソースのディープフェイク生成方法が登場し、合成ビデオクリップが大量に流入しました。これらのビデオの多くは面白おかしく作られていますが、ディープフェイクビデオの中には個人や社会に悪影響を及ぼすものもあります。

Google はこれらの問題を真剣に受け止めています。昨年、Google は「AI 原則」を発表し、AI の悪用や AI による危害を軽減するための AI のベストプラクティスを探求することを約束しました。昨年 1 月、Google は、高性能な偽音声検出器の開発を支援するために、ASVspoof 2019 チャレンジをサポートする合成音声データセットをリリースしました。このデータセットはコンペティション用のデータベースとして、150以上の研究機関や業界団体にダウンロードされており、現在は無料で一般公開されています。

最近、Google AI は Jigsaw (旧 Google Ideas) と共同で、ミュンヘン工科大学とナポリ フェデリコ 2 世大学 (Google が共同スポンサー) が作成した FaceForensics ベンチマークに組み込まれた大規模なビジュアル ディープフェイク データセットをリリースしました。

FaceForensics ベンチマーク データセット アドレス: https://github.com/ondyari/FaceForensics/

Google が公開したディープフェイク データセットからのビデオ例。生成プロセス中に、俳優のペアがランダムに選択され、ディープニューラルネットワークがそれらの俳優に対して顔の交換操作を実行します。

このデータセットを作成するために、Google は複数の有償および無償の俳優と協力し、過去 1 年間で数百本のビデオを撮影しました。その後、Google は、公開されているディープフェイク生成方法を使用して、これらのビデオに基づいて何千ものディープフェイク ビデオを作成しました。これらの本物の動画と偽物の動画を合わせてこのデータセットを構成しており、Google はディープフェイク検出の研究を支援するためにこのデータセットを作成しました。このデータセットは現在、FaceForensics ベンチマークの一部としてオープンソース化されており、研究コミュニティが自由に利用できるようになり、合成ビデオ検出方法の開発に役立ちます。

さまざまなシナリオで俳優たちを撮影します。上の画像は実際の俳優で、下の画像はそれに対応するディープフェイクの例です。2 つの画像の違いの度合いは、ディープフェイクの作成に使用されたもう 1 人の俳優によって異なります。

ディープフェイク技術は急速に発展しており、Googleはデータセットにデータを追加し続け、この分野で協力を続けていくと述べた。このデータセットの公開は、合成メディアの誤用によって引き起こされる潜在的な危害を軽減するために研究コミュニティを支援するという Google の取り組みにおける重要な一歩です。

<<:  あなたの顔データはどこに保存されますか?

>>:  シンプルなアルゴリズムで分散システムのパフォーマンスが瞬時に10倍以上向上

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

新しい機械学習アプローチによりエネルギー消費を20%削減

エンジニアは、エネルギー消費を20%以上削減できる新しい機械学習手法を開発した。このアプローチにより...

機械学習の運用はクラウドコンピューティングの運用には適していない

クラウド コンピューティング サービス チームに機械学習機能を備えたシステムを提供することは間違いで...

家主は、あなたに賃貸するかどうかを決める前に、AIを使ってあなたの犯罪歴を審査しているかもしれない。

[[351784]]ビッグデータダイジェスト制作著者: miggyようやく気に入った家が見つかり、...

2018年に「ブロックチェーン+人工知能」について知っておくべきこと

現在、ビジネス界、テクノロジー界、金融界を問わず、最もホットな言葉は「ブロックチェーン」に他なりませ...

...

情報の流れの中のゲーム:「易典子心」の探求と思考

[51CTO.comより引用] 「易典子訓」アプリを開くと、オープニング画面に「良質なコンテンツ、価...

...

...

AIとビッグデータ2017「成長痛」

2017 年、人工知能とビッグデータの開発では次の 10 の成長痛が発生しました。 [[21567...

...

...

人間の髪の毛のわずか200分の1の太さ!科学者たちは脳のように電気を生成できる「ナノワイヤーネットワーク」を構築した

今日の主流の人工知能技術は、ある意味では脳の構造にヒントを得たものです。しかし、コンピュータの計算能...

...

Google Brain の最新研究: AutoML メソッドが Dropout モードを自動的に学習

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

公正な AI システムを構築するにはどうすればよいでしょうか?

人工知能はあらゆる業界の企業で急速に導入されており、企業は今後 3 年間で AI システムへの支出を...