まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!

まばたきが正常かどうか判断し、フェイク動画対策にも人工知能が活用されています!

AIが生成したPS動画は本物と見分けがつかないほどに進化している。昨年、ミシェル・オバマに似せるために顔を移植したポルノ動画がRedditに登場して以来、偽の有名人の肖像を使った「ディープフェイク」動画がインターネット上に登場し続けている。

無料の偽ビデオソフトウェアも多数あります。画像モデルのトレーニングプロセスは、GoogleのオープンソースプロジェクトTensor Flowに依存しており、偽造コストは高くありません。匿名の開発者による FakeApp が Reddit に無料でダウンロードできるように投稿され、わずか 2 か月で 12 万回ダウンロードされました。

このソフトウェアツールは当初、悪意を持って作られたものではなかった。開発者はニューヨークタイムズ紙に対し、FakeAppはもともと創造的な実験として作られたものだが、フェイク動画が広く悪用されるのを防ぐことはできず、フェイクニュース、暴動、犯罪をめぐる論争につながったと語った。アトランティック誌の記事では、フェイク動画が現実に対する私たちの認識を破壊していると書かれている。

偽動画の中には完璧に見えるものもあるが、それでも網をすり抜けてしまうものもある。ニューヨークのアルバニー大学の研究チームが抜け穴を発見し、それを動画の識別方法として利用した。偽動画の登場人物は、呼吸、脈拍、目の動きなど、実際の人間の生理的動きを完璧に再現できないことが多いのだ。

研究チームは、瞬き認識の最新の進歩について言及した論文を発表しました。平均的な成人は 1 分間に 17 回、つまり 1 秒間に 0.283 回まばたきをします。話しているとき、人間のまばたきの回数は 1 分間に 26 回に増加し、読んでいるときは 1 分間に 4.5 回になります。

偽の動画は画像を通じてアルゴリズムをトレーニングしますが、モデルのトレーニングに使用される画像は主にインターネット上の公開画像です。たとえば、オバマの動画を偽造するには、まずオバマの顔写真を見つける必要があります。しかし、目を閉じている写真を見つけるのは難しく、その結果、ビデオ内の偽の顔には瞬きの動きが欠けているか、少なくとも不自然な瞬きが見られることになる。

「ネット上に写真を投稿する際、人々は『見た目が良い』写真、つまり通常は目が開いた写真だけを投稿するため、AIアルゴリズムは目を閉じた画像を見つけることはほとんどない」と、このプロジェクトを率いたシウェイ・リュウ氏は語った。

具体的には、リュウ氏のチームは、瞬きを自動的に認識してラベル付けするようにアルゴリズムをトレーニングしました。このプロセスには、アルゴリズムを分析および判断して、最初にビデオ内の顔を検出し、その後、ビデオ内のすべての画像を継続的に整列させ、各画像の目の領域を分析して瞬きの動作があるかどうかを判断し、これらの画像にマークを付けることが含まれます。

つまり、このアルゴリズムは、ビデオ内の点滅部分を自動的に識別し、ビデオ内の被写体が点滅したかどうか、点滅パターンが何であるかを判断して、ビデオの真正性を判別します。論文によれば、彼らのモデルは目の状態を効果的に判断し、99%の精度で偽の動画を識別することができるという。

しかし、リュウ氏の方法にも限界がある。よくできたフェイク動画にはまばたきの動きが含まれており、人間のまばたきの仕方を完全にシミュレートすることは不可能ではない。ただ、フレームごとに調整するには少し手間がかかるだけだ。

リュウ氏は、彼らの技術は少なくとも偽造者の進歩を遅らせることができる「第一防衛線」を形成すると述べた。彼らはまた、まばたきの頻度や持続時間など、より複雑な問題にも取り組んでいます。

他にもフェイク動画に対抗する方法に取り組んでいる企業がある。カリフォルニアのスタートアップ企業、Truepicもオフラインの画像・動画分析技術に投資しており、髪の毛や耳、目の反射率などの詳細からディープフェイクを検出する。

Adobe は、PS 画像に関する経験を活かして、画像内の加工の兆候を識別するモデルをトレーニングしました。論文では、機械学習を使用して偽の写真を識別する方法が紹介されています。

<<:  中国のAI企業は世界の資金の70%を占めているが、その巨大なブームの裏には隠れた懸念がある

>>:  WeChatモーメンツを席巻しているGoogleのAI版「Draw and Guess」の原理はこうだ。

ブログ    

推薦する

大学入試特集:AI出願ガイド

大学入試はすでに始まっています。分厚いノートを開いて専攻を選ぶ日はまだまだ遠いのでしょうか。この季節...

スマートビルにはスマートクリーニングが必要な理由

スマートビルへの移行はヨーロッパ全土で加速しています。あらゆる業界の組織が顧客と従業員のエクスペリエ...

Rocket Launch: 効率的で軽量なネットワーク トレーニング フレームワーク

まとめクリックスルー率の推定などのオンラインリアルタイム応答システムでは、応答時間に関して非常に厳し...

人気の機械学習や人工知能が金融業界で障害にぶつかるのはなぜでしょうか?

[[211551]]機械学習と人工知能は、過去数年間で精度において驚異的な進歩を遂げました。 しか...

安全なパスワード保存の業界標準: bcrypt アルゴリズム

パスワードを安全に保護するための標準アルゴリズムである bcrypt アルゴリズムについて説明します...

IBMとNASAが炭素排出量追跡のためのオープンソースAIモデルを発表

IBM は最近、NASA と提携して、炭素排出量の追跡を改善し、気候変動の影響を監視するための新しい...

AIOps 実装をスムーズに開始するための 3 つのヒント

[[386134]]企業は、激しい市場競争に直面して、ビジネスと IT の間にスムーズな「リンク」を...

...

準備はできたか? GNN グラフ ニューラル ネットワーク 2021 年の主要なアプリケーション ホットスポット 5 つ

[[378224]]今年から始めます。グラフニューラルネットワークは研究者の間で話題になっており、こ...

スマートからレスポンシブへ: 人工知能で建築の未来を探る

未来の建築: AIが新たな現実を構築する人工知能 (AI) は、未来的な概念という見せかけを超えて、...

自然言語処理のためのオープンソースツールトップ12

私たちの生活に浸透しているすべてのチャットボット、音声アシスタント、予測テキスト、その他の音声/テキ...

TSN タイムセンシティブネットワークテクノロジーの簡単な分析

産業インテリジェンスの継続的な発展に伴い、産業インターネットは産業インテリジェンス発展のための重要な...

機械学習システムの弱点: 保護が必要な 5 つの理由

[[345683]]日々の努力の究極の目的は、生活をより楽に、より便利にすることです。これが人類の歴...

ディープラーニングとニューラルネットワーク: 複雑なタスクのための AI モデル

人工知能の分野では、ディープラーニングとニューラルネットワークが最も注目を集める技術の一つとなってい...

AIの奇妙な使い方:マクドナルドはゴミ箱の監視にAIを活用

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...