AIが生成したPS動画は本物と見分けがつかないほどに進化している。昨年、ミシェル・オバマに似せるために顔を移植したポルノ動画がRedditに登場して以来、偽の有名人の肖像を使った「ディープフェイク」動画がインターネット上に登場し続けている。 無料の偽ビデオソフトウェアも多数あります。画像モデルのトレーニングプロセスは、GoogleのオープンソースプロジェクトTensor Flowに依存しており、偽造コストは高くありません。匿名の開発者による FakeApp が Reddit に無料でダウンロードできるように投稿され、わずか 2 か月で 12 万回ダウンロードされました。 このソフトウェアツールは当初、悪意を持って作られたものではなかった。開発者はニューヨークタイムズ紙に対し、FakeAppはもともと創造的な実験として作られたものだが、フェイク動画が広く悪用されるのを防ぐことはできず、フェイクニュース、暴動、犯罪をめぐる論争につながったと語った。アトランティック誌の記事では、フェイク動画が現実に対する私たちの認識を破壊していると書かれている。 偽動画の中には完璧に見えるものもあるが、それでも網をすり抜けてしまうものもある。ニューヨークのアルバニー大学の研究チームが抜け穴を発見し、それを動画の識別方法として利用した。偽動画の登場人物は、呼吸、脈拍、目の動きなど、実際の人間の生理的動きを完璧に再現できないことが多いのだ。 研究チームは、瞬き認識の最新の進歩について言及した論文を発表しました。平均的な成人は 1 分間に 17 回、つまり 1 秒間に 0.283 回まばたきをします。話しているとき、人間のまばたきの回数は 1 分間に 26 回に増加し、読んでいるときは 1 分間に 4.5 回になります。 偽の動画は画像を通じてアルゴリズムをトレーニングしますが、モデルのトレーニングに使用される画像は主にインターネット上の公開画像です。たとえば、オバマの動画を偽造するには、まずオバマの顔写真を見つける必要があります。しかし、目を閉じている写真を見つけるのは難しく、その結果、ビデオ内の偽の顔には瞬きの動きが欠けているか、少なくとも不自然な瞬きが見られることになる。 「ネット上に写真を投稿する際、人々は『見た目が良い』写真、つまり通常は目が開いた写真だけを投稿するため、AIアルゴリズムは目を閉じた画像を見つけることはほとんどない」と、このプロジェクトを率いたシウェイ・リュウ氏は語った。 具体的には、リュウ氏のチームは、瞬きを自動的に認識してラベル付けするようにアルゴリズムをトレーニングしました。このプロセスには、アルゴリズムを分析および判断して、最初にビデオ内の顔を検出し、その後、ビデオ内のすべての画像を継続的に整列させ、各画像の目の領域を分析して瞬きの動作があるかどうかを判断し、これらの画像にマークを付けることが含まれます。 つまり、このアルゴリズムは、ビデオ内の点滅部分を自動的に識別し、ビデオ内の被写体が点滅したかどうか、点滅パターンが何であるかを判断して、ビデオの真正性を判別します。論文によれば、彼らのモデルは目の状態を効果的に判断し、99%の精度で偽の動画を識別することができるという。 しかし、リュウ氏の方法にも限界がある。よくできたフェイク動画にはまばたきの動きが含まれており、人間のまばたきの仕方を完全にシミュレートすることは不可能ではない。ただ、フレームごとに調整するには少し手間がかかるだけだ。 リュウ氏は、彼らの技術は少なくとも偽造者の進歩を遅らせることができる「第一防衛線」を形成すると述べた。彼らはまた、まばたきの頻度や持続時間など、より複雑な問題にも取り組んでいます。 他にもフェイク動画に対抗する方法に取り組んでいる企業がある。カリフォルニアのスタートアップ企業、Truepicもオフラインの画像・動画分析技術に投資しており、髪の毛や耳、目の反射率などの詳細からディープフェイクを検出する。 Adobe は、PS 画像に関する経験を活かして、画像内の加工の兆候を識別するモデルをトレーニングしました。論文では、機械学習を使用して偽の写真を識別する方法が紹介されています。 |
<<: 中国のAI企業は世界の資金の70%を占めているが、その巨大なブームの裏には隠れた懸念がある
>>: WeChatモーメンツを席巻しているGoogleのAI版「Draw and Guess」の原理はこうだ。
それ以来、電子メール マーケティングは存在し続けています。私たちは皆、Google で電子メール マ...
この記事では、GCN と呼ばれるよく知られたグラフ ニューラル ネットワークについて詳しく説明します...
先日開幕した ICCAD 2023 カンファレンスで、NVIDIA チームは AI モデルを使用して...
Nvidia は最近、TensorRT-LLM と呼ばれる新しいオープンソース ソフトウェア スイ...
[[430915]]ガールフレンドの感情は株式市場と同じくらい予測不可能です。違いは、多くの専門家...
12月11日、テンセントクラウドは北京で新しいビッグデータAI製品発表会を開催した。テンセントクラウ...
Google は、人生アドバイスや予算作成などのタスクを実行できるさまざまな生成 AI 機能を開発し...
今日は線形回帰モデルの実装を続けます。ただし、今回はすべての関数を自分で実装するのではなく、Pyto...
【原文は51CTO.comより】2020年1月6日、51CTOが主催した「IT印象◆ビジネスモデル...
[[330426]]ビッグデータダイジェスト制作出典: towarddatascience著者: ...
2019 IEEE 自動音声認識および理解ワークショップ (ASRU) は、2019 年 12 月 ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...