本物と見間違えるほどリアルなAI変顔技術は本当に完璧なのか?

本物と見間違えるほどリアルなAI変顔技術は本当に完璧なのか?

囲碁界の無敵の「アルファ碁」から、どこにでもある「顔認識」まで、機械学習は人々の生活に驚異的な変化をもたらしました。しかし、AI技術の継続的な発展に伴い、主に「知的な顔の変化」を表現するディープフェイク技術は、人々の生活にさらなる問題をもたらしています。

2018年、ガボンのアリー・ボンゴ大統領は脳卒中により数か月間公の場から姿を消した。国民をなだめるため、政府は大統領の新年の演説の録音を公開した。この新年の演説はディープフェイク技術を使って作成されたが、国民を落ち着かせるどころか、この動画は軍の上級指導者に異常を発見させ、最終的には反乱につながった。この事件では、「AIによる変顔」技術が政治選挙への干渉や政府の信頼性低下の大きな力となっている。

多くの人の印象では、ディープフェイク技術は、AIによって顔を変えられたポルノ動画を必要な人が視聴できるようにする以外は、社会の影に隠れているようだ。

図 1 ディープフェイク画像 (出典: http://zkres1.myzaker.com/)

一般人にとって、ディープフェイク技術は非常にリアルで、本物と区別がつかず、欠陥もありません。では、ネット上で真実と虚偽の両方の動画が出回っている場合、私たちは本当にそれらを区別することができないのでしょうか?

心配しないでください。諺にあるように、「悪魔は1フィートの高さだが、道は10フィート高い」のです。専門家の手による綿密なコンピューター分析により、写真やビデオの真正性を判別し、ディープフェイク技術で処理されたコンテンツの本質を明らかにすることが可能です。

ディープフェイク技術の原理は、学び、学び、そしてまた学ぶことだ

ディープフェイク技術を検出する方法を理解するには、まずディープフェイク技術とは何かを理解する必要があります。ディープフェイクとは、ディープラーニングとフェイク写真を組み合わせた言葉です。ディープラーニングによって機械が作り出すフェイク写真やフェイク動画などの偽物と捉えることができます。最も一般的な応用は「AI顔変換」であり、ある人の顔を別の人の顔に移植するものである。

顔の交換を実行する場合、機械はまず顔の位置を特定する必要があります。顔認識や顔補正は自動運転などの分野でも広く利用されており、現在の開発は非常に成熟しており、認識率は98%を超えています。

顔を変える際に使用する素材の顔の向きや表情は、入れ替える動画の人物の顔の向きや表情と異なる場合が多いです。したがって、顔の位置を特定した後、機械は顔をさらに調整する必要があります。顔の特徴的な部分を見つけることで、機械は各フレームの顔の向きや表情を判断し、動画に挿入する顔を素材と照合することができます。

マッチングが完了した後、顔を変える技術は、単に顔を変える素材を、変えたい人の顔に貼り付けるだけではありません。写真を貼り付けるだけでは肉眼で簡単に認識でき、「偽物だけど本物」という効果を出すのは困難です。ディープフェイク技術のさらなる学習原理は、人間の行動に例えることができます。

顔 A を 100 時間見つめた後、顔 B の写真を見て、記憶を頼りに顔 B の顔を描くように言われた場合、どれだけ優れたスキルを持っていても、最終的に描いた顔は顔 A と非常に似たものになります。したがって、機械をトレーニングし、顔 A の要素を使用して顔 B を描くように機械に学習させると、顔 B の上に顔 A をリアルに「ペイント」できるようになります。

[[404454]]

図 2 B を見て A を描く (出典: オリジナル)

リアルなディープフェイク技術にも小さな欠陥がある

機械学習によって生成された顔を変えるビデオや写真は非常にリアルですが、ディープフェイク技術の欠陥は何でしょうか?

「他人に知られたくないなら、自分でやらないことだ」という古い中国のことわざがあります。顔を変える技術の欠陥は、顔の素材の細部にあります。ディープフェイク技術は、顔 A の要素を使用して顔 B を描画します。このプロセスは、顔 A の要素を繊細につなぎ合わせるものです。しかし、このスプライシングプロセスは実際の状況と完全に一致するとは限りません。

ニューヨーク州バッファロー大学のコンピューター科学者たちは、人の顔の中で最も繊細な要素である「目」から始めて、ディープフェイク技術の特定に成功した。

この技術の基本原理は眼球の反射に基づいています。外部環境からの光が目に当たると、光は反射され、角膜上に像が形成されます。実際の写真では、同じ物体を見ている 2 つの目は非常によく似た反射パターンを示します。しかし、ディープフェイク写真では、両目の反射が一致しないことがよくあります。おそらく、あなたの左目は子犬を「見て」、右目はトラックを「見て」いるでしょう。検出機はまず両目で反射した内容を抽出し、次に左右の目の反射内容、反射光強度などのパラメータが調整され統一されているかどうかを検出し、写真やビデオが合成されているかどうかを識別します。この方法は実験的に 94% の有効性があることが証明されています。

さらに、一般的な検出方法には次のものがあります。

(1)動画内の2D画像から3Dポーズを推定する。ディープフェイク技術を用いて合成された動画では、立体的な姿勢が突然大きく変化することがあります。例えば、動画内の人物が前のフレームでは胸を膨らませて息を吸っているのに、次のフレームでは胸がへこみ息を吐く状態に急激に変化した場合、その動画は間違いなく合成された動画であることを意味します。

(2)動画処理時に画像を歪ませることで、ディープフェイク技術が環境に作り出す「アーティファクト」を捉える。

(3)左右の虹彩の色の違い、照明や影の不一致、幾何学的モデリングのエラーなどの欠陥を捉える。

(4)著名人の行動習慣に基づいて、ビデオ内に対応する独特の行動特性(鼻を触る、口をひねるなど)があるかどうかを検出します。

図3 ディープフェイク動画における虹彩異色症(画像提供:Zhihu)

ディープフェイク検出における猫とネズミのゲーム

ディープフェイク検出技術は継続的な開発の過程で、依然として多くの課題に直面するでしょう。

1 点目は、一部のテクノロジー自体に一定量の情報が必要であるということです。例えば、前述の眼反射検出技術は、ビデオ内に同時に 2 つの目が映っていない場合には適用できません。ビデオ品質が低い場合、虹彩色検出も使用が困難です。

2点目は、検出技術と顔を変える技術は「互いに絶えず発展し、競争し合う」プロセスであるという点です。たとえば、照明と影のキャプチャ間の不一致の問題を解決するために、フェイスチェンジャーは、顔を変更するときに照明シミュレーションとレンダリングにさらに多くのリソースを使用して、影の生成の品質を確保できます。この観点から見ると、検出技術と顔を変える技術は、両者が絶えず繰り返し追いかけ合う「猫とネズミのゲーム」のようなものだ。現在、検出技術では、眼球の反射光を検出に使用することが提案されています。将来、顔を変える技術では、学習コンテンツに眼球の反射光のシミュレーションを含めることができます。ディープフェイク技術の発展に対応するために、検出技術を常に更新する必要があります。

3 つ目のポイントは、検出技術が自動化にはまだ程遠いということです。既存の検出技術は時間がかかり、ユーザーが動画をアップロードしている間に短時間で自動的に検出とレビューを完了することは困難です。実用的な自動ディープフェイク検出ソフトウェアが登場するまでには、まだ道のりは長い。

4つ目のポイントは、ディープフェイク技術に関して現時点では完全な規制が存在しないということです。各ビデオ プラットフォームには、どのようなディープフェイク ビデオが悪質で違法であるかを定義する独自のルールがあります。同時に、ディープフェイク技術に関する関連法は現在存在しません。これにより、ディープフェイク動画の検出と制御に多くの困難が生じます。

ディープフェイク検出技術は依然として多くの課題に直面していますが、AI技術の継続的な発展により、関連する法律や規制が徐々に改善され、ディープフェイク検出技術はますます正確で効率的になると信じなければなりません。ある日、すべての偽のビデオは検出技術の鋭い目によって暴露されるでしょう。技術的な抜け穴を悪用し、ディープフェイク技術を悪用する者は遅かれ早かれ罰せられることになるだろう。

参考文献

( Hu S 、 Li Y 、 Lyu S 。不一致な角膜鏡面ハイライトを使用したGAN生成顔の露出[J]。2020年。)

<<:  Go 言語 - データ構造とアルゴリズム プロジェクト

>>:  スマートフォンを使用して、物体検出と同等の速度で、画像上にリアルタイムで直線を描くことができます。オンラインデモをご利用いただけます

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

人工知能はどれくらい普及しているのでしょうか?国内初となる人工知能講座が小中学校で実施されました!

5月5日、教育部が主催する第3回全国基礎教育情報化応用展示会・交流活動において、北京市朝陽区で人工...

AIが皮膚がんの診断で17カ国の皮膚科医58人に勝利

現代医学の発展は、病気の診断と治療のための新しいツール、テクノロジー、方法を開発してきた医師と科学者...

2019年に人工知能をマスターするには?世界のAI専門家が答えを教えます

[[265422]]人工知能はビジネスを変えています。自然言語処理やインテリジェント音声からモノのイ...

...

...

世界の自動運転事故を比較し、そのデータと真実を明らかにした

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

AIの民主化:ローコードおよびノー​​コードソリューションの台頭

今年初め、イノベーション、リサーチ、インキュベーションのグローバルディレクターであるルネ・シュルテ氏...

Googleの研究は数学の問題をコードに変換することで、機械証明の精度を大幅に向上させた。

コンピュータは以前から数学の証明を検証するために使用されてきましたが、特別に設計された証明言語を使用...

Google の大きな暴露: 謎の AI ツールが明らかに、Gemini が PaLM 2 に取って代わる

「大リーク:コードネームStubbsというGoogleの謎のAIツールが暴露された」と、Xという名の...

テンセントクラウドの「AIスーパーベース」特別セッションがWOTカンファレンスで発表され、技術革新がAIインフラの新たな章を導く

過去2年間、「百機種戦争」は中国で人気の技術トピックになりました。 2020年以降、中国は大型モデル...

人工知能の未来は人類にとって何を意味するのでしょうか?

人工知能(AI)について多くの人が最初に尋ねる質問は、「それは良いものか、悪いものか?」です。答えは...

AIは生産性を低下させるでしょうか?今のところは出演はありません!

[[286440]] ▲ イラスト出典:エドモン・デ・ハロ2016年、ロンドンに拠点を置くアルファ...

2021年第2四半期の人工知能へのベンチャーキャピタル投資は200億ドルを超え、新たな記録を樹立した。

CB Insightsが発表した2021年第2四半期のAI(人工知能)レポートによると、疫病の刺激...