まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!

まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!

AIが生成したPS動画は本物と見分けがつかないほどに進化している。昨年、ミシェル・オバマに似せるために顔を移植したポルノ動画がRedditに登場して以来、偽の有名人の肖像を使った「ディープフェイク」動画がインターネット上に登場し続けている。

無料の偽ビデオソフトウェアも多数あります。画像モデルのトレーニングプロセスは、GoogleのオープンソースプロジェクトTensor Flowに依存しており、偽造コストは高くありません。匿名の開発者による FakeApp が Reddit に無料でダウンロードできるように投稿され、わずか 2 か月で 12 万回ダウンロードされました。

このソフトウェアツールは当初、悪意を持って作られたものではなかった。開発者はニューヨークタイムズ紙に対し、FakeAppはもともと創造的な実験として作られたものだが、フェイク動画が広く悪用されるのを防ぐことはできず、フェイクニュース、暴動、犯罪をめぐる論争につながったと語った。アトランティック誌の記事では、フェイク動画が現実に対する私たちの認識を破壊していると書かれている。

偽動画の中には完璧に見えるものもあるが、それでも網をすり抜けてしまうものもある。ニューヨークのアルバニー大学の研究チームが抜け穴を発見し、それを動画の識別方法として利用した。偽動画の登場人物は、呼吸、脈拍、目の動きなど、実際の人間の生理的動きを完璧に再現できないことが多いのだ。

研究チームは、瞬き認識の最新の進歩について言及した論文を発表しました。平均的な成人は 1 分間に 17 回、つまり 1 秒間に 0.283 回まばたきをします。話しているとき、人間のまばたきの回数は 1 分間に 26 回に増加し、読んでいるときは 1 分間に 4.5 回になります。

偽の動画は画像を通じてアルゴリズムをトレーニングしますが、モデルのトレーニングに使用される画像は主にインターネット上の公開画像です。たとえば、オバマの動画を偽造するには、まずオバマの顔写真を見つける必要があります。しかし、目を閉じている写真を見つけるのは難しく、その結果、ビデオ内の偽の顔には瞬きの動きが欠けているか、少なくとも不自然な瞬きが見られることになる。

「ネット上に写真を投稿する際、人々は『見た目が良い』写真、つまり通常は目が開いた写真だけを投稿するため、AIアルゴリズムは目を閉じた画像を見つけることはほとんどない」と、このプロジェクトを率いたシウェイ・リュウ氏は語った。

具体的には、リュウ氏のチームは、瞬きを自動的に認識してラベル付けするようにアルゴリズムをトレーニングしました。このプロセスには、アルゴリズムを分析および判断して、最初にビデオ内の顔を検出し、その後、ビデオ内のすべての画像を継続的に整列させ、各画像の目の領域を分析して瞬きの動作があるかどうかを判断し、これらの画像にマークを付けることが含まれます。

つまり、このアルゴリズムは、ビデオ内の点滅部分を自動的に識別し、ビデオ内の被写体が点滅したかどうか、点滅パターンが何であるかを判断して、ビデオの真正性を判別します。論文によれば、彼らのモデルは目の状態を効果的に判断し、99%の精度で偽の動画を識別することができるという。

しかし、リュウ氏の方法にも限界がある。よくできたフェイク動画にはまばたきの動きが含まれており、人間のまばたきの仕方を完全にシミュレートすることは不可能ではない。ただ、フレームごとに調整するには少し手間がかかるだけだ。

リュウ氏は、彼らの技術は少なくとも偽造者の進歩を遅らせることができる「第一防衛線」を形成すると述べた。彼らはまた、まばたきの頻度や持続時間など、より複雑な問題にも取り組んでいます。

他にもフェイク動画に対抗する方法に取り組んでいる企業がある。カリフォルニアのスタートアップ企業、Truepicもオフラインの画像・動画分析技術に投資しており、髪の毛や耳、目の反射率などの詳細からディープフェイクを検出する。

Adobe は、PS 画像に関する経験を活かして、画像内の加工の兆候を識別するモデルをトレーニングしました。論文では、機械学習を使用して偽の写真を識別する方法が紹介されています。

<<:  中国のAI企業は世界の資金の70%を占めているが、その巨大なブームの裏には隠れた懸念がある

>>:  WeChatモーメンツを席巻しているGoogleのAI版「Draw and Guess」の原理はこうだ。

ブログ    
ブログ    
ブログ    

推薦する

人工知能を使って手作業を置き換え、コストを削減し、効率を高めることは、まさに賢いことだ

「大丈夫ですよ。」 15年間工場で働いてきた「古い」労働者として、今日は人工知能についての私の見解を...

2020 年に台頭する AI と機械学習の 6 つのトレンド

人工知能ソリューションの市場は急速に成長を続けており、数百億ドルの収益をもたらしています。調査会社I...

量子コンピューティングとブロックチェーンの未来

量子コンピューティングはブロックチェーンを破壊するのか、それともより安全にするのか? 01 序文コン...

...

[NCTS サミット レビュー] Ele.me Qiu Huafeng: バグの検出における人工知能の応用

2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...

Σco Time | AIセキュリティ、インテリジェンスの新時代における双方にメリット

[原文は51CTO.comより]先日、#Σcotimebetween#ライブブロードキャストプラット...

...

...

...

...

LLM評価レビュー論文が出版され、3つの側面から包括的にまとめられ、データベースも掲載されている

大規模言語モデル (LLM) は、学界や産業界から幅広い注目を集めています。有用な LLM を開発す...

人工知能システムが薬剤耐性菌を殺す新しい抗生物質を発見

海外メディアの報道によると、人工知能技術を利用した新薬の発見は成果を上げているようだ。マサチューセッ...

...

...