翻訳者 |陳俊 レビュー | Chonglou Deepfakesと呼ばれる詐欺アプリをご存知ですか?そこから生み出される様々な虚偽の情報は、人類社会のあらゆる側面を脅かしています。人工知能技術が進歩するにつれ、虚偽のコンテンツを識別する能力を早急に向上させる必要があります。では、フェイクニュースの信憑性をテストするといった実際の使用例になると、人間と機械のどちらがそのようなタスクに適しているのでしょうか? ディープフェイクの危険性人工知能技術の急速な発展に伴い、ディープフェイクの危険性が高まっていることは否定できません。その害悪を大まかにまとめると次のようになります。
ますます説得力のあるディープフェイク情報に直面して、それを検出して識別するための強力なツールとプロセスが必要であることがわかります。 AI によって生成されたコンテンツを識別するように設計されたアルゴリズムは、この分野では検出ツールとして、また人間の判断を強力に補助するものとして使用できます。 アルゴリズムは人間よりも優れたディープフェイク検出が可能か?現在、さまざまな国のテクノロジー大手や研究グループは、ディープフェイクがもたらす深刻な脅威に対する対策の研究開発に多大なリソースを投入しています。 2019年には、 Meta 、Microsoft、Amazonなどの企業がディープフェイク検出コンテストで最も正確な検出モデルに100万ドルの賞金を提供した。 公開されているビデオ データセットでテストした結果、最高のパフォーマンスを発揮したモデルは82.56%の精度を達成しました。しかし、同じモデルを新たに生成された10,000 本のビデオで構成される「ブラックボックス データセット」でテストしたところ、最高のパフォーマンスを発揮したモデルでも精度はわずか65.18%にとどまりました。対照的に、一般的に、人間の検出の精度は、AI ディープ検出ツールの精度と同等かそれ以上です。 2021年に米国科学アカデミー紀要(PNAS)に掲載された研究によると、一般的な人間検出器の精度は、業界をリードするディープフェイク検出ツールよりもわずかに高いことが判明しました。しかし、この研究では、人間の検出器と AI モデルが犯しやすい間違いの種類は同じではないことも判明しました。 さらに、シドニー大学の興味深い研究によると、私たちの脳は意識的よりも無意識的にディープフェイクを識別する方が効果的だということが分かりました。 ディープフェイクの視覚的手がかりを検出する新興科学であるため、ディープフェイク検出の原理は比較的複雑であり、必要な分析方法はビデオの性質によって異なります。例えば、 2020年には、北朝鮮の指導者をターゲットにした偽のディープフェイク動画が世界中で広まりました。最も効果的な検出方法は、口の動き (ビゼーム) と音声 (音素) を分析して矛盾を見つけることです。 マサチューセッツ工科大学 (MIT) は、人間の専門家、一般ユーザー、AI アルゴリズムによる分析を容易にするために、ディープフェイク動画の識別に役立つ 8 つの推奨事項を定義しました。
実際、最新の人工知能による深層偽造防止検出ツールは、上記の要素を総合的に分析したものに過ぎず、製品によって成功率は異なります。もちろん、データ サイエンティストは、画面上のスピーカーの顔の自然な血流を検出するなど、新しい手法を常に開発しています。そして、これらの新しい方法は、明らかに人間の専門家には一目では認識できないか、少なくとも気づかれない。 ディープフェイクにおける音声の手がかりの検出前述の視覚的な手がかりと比較すると、ディープフェイク音声の検出はまったく異なる課題です。動画によって提供される視覚的な手がかりに加えて、ディープフェイクの検出は音声分析にも大きく依存しています。もちろん、場合によっては、メタデータ検証などの他の方法でも関連するヘルプが提供されることがあります。 ユニバーシティ・カレッジ・ロンドンが2023年に発表した研究によると、人間の専門家は英語と中国語のディープフェイク音声を73%の精度で検出できることが判明した。ディープフェイク動画と同様に、人間の専門家は、具体的に何が間違っているのか明確に説明できない場合でも、AI が生成した音声の不自然な発話パターンを直感的に検出できることが多いです。最も一般的な音声サインと手がかりを以下にまとめました。
同様に、さまざまなアルゴリズムは、上記の側面に基づいて音声のディープフェイク信号を効果的に分析することもできます。 USENIX の調査により、人工知能による声道再構築では自然な発話パターンをシミュレートできないことが判明しました。研究では、AI音声生成器によって生成された音声は狭い声道(ストロー程度の大きさ)にしか適合せず、人間の発話の自然な動きが再現されていないと結論づけられた。一方、ホルスト・ゲルツ研究所による以前の研究では、英語と日本語の本物と偽物の音声を混ぜたものを分析し、本物の音声と偽物の音声の高周波数の微妙な違いを明らかにした。 人間の専門家と AI 検出モデルはどちらも声帯と高周波数の不一致を検出できますが、高周波数の違いに関しては AI モデルの方が理論的にはより正確です。 人間もアルゴリズムもディープフェイクに騙されるが、騙される方法は異なる研究によると、人間と最新の人工知能検出ツールの認識精度は、テストパラメータに応じて通常50%から90%の間であることがわかっています。つまり、人間も機械もディープフェイクに騙される可能性があるが、主な違いは、それらが混乱の影響を受けやすいかどうかである。たとえば、マサチューセッツ工科大学(MIT)の研究では、認知能力の違いにより、人間は世界の指導者や著名人のディープフェイク画像を識別する能力が AI モデルよりも優れていることが判明しました。この研究では、複数の人物が登場する映像シーンを扱う場合、AI モデルは人間に比べて大幅に劣ることも判明した。この研究は、根本的には、アルゴリズムが単一の話者の映像の基本的な特徴に基づいてトレーニングされることが多いためである可能性があると考えている。 逆に、同じ研究では、人間の視聴者を意図的に欺くために使用される可能性のある低品質の映像(ぼやけた、粗い、薄暗い環境など)を処理する場合、AI モデルが人間よりも優れたパフォーマンスを発揮することがわかりました。同様に、前述の最新の AI 検出方法では、特定の顔の領域の血流状態を監視することもできます。これは人間にはない分析能力なのかもしれません。 まとめご覧のとおり、AI ディープフェイク検出ツールが進化し続けるにつれて、ディープフェイク コンテンツ自体の品質も向上し続けるでしょう。極端なシナリオでは、AI の欺瞞能力が人間の現在の検出能力を超えると、人間の判断力がディープフェイクに対抗する唯一の手段になるかもしれません。 今日、誤った情報の兆候を理解し、それをどのように認識するかは私たち一人ひとりの責任です。 AI 詐欺やセキュリティの脅威から身を守ることに加え、オンライン上の虚偽の情報についての洞察や調査結果を議論し、共有する義務もあります。 翻訳者紹介51CTO コミュニティの編集者である Julian Chen 氏は、IT プロジェクトの実装で 10 年以上の経験があります。社内外のリソースとリスクの管理に長けており、ネットワークと情報セキュリティの知識と経験の普及に重点を置いています。 原題:ディープフェイクをうまく検出できるのは人間か機械か? 、著者: アーロン・ブルックス |
<<: WAVE SUMMITが今年もやって来ました! AI 開発者の饗宴がこの寒い冬を盛り上げます!
>>: 6つのトラックと10のテクノロジー: インテリジェントボディと3D生成がAIを活性化し、空間コンピューティングがターミナル変革を切り開く
最近、GitHub で非常に包括的なアルゴリズム リソースが人気を集めています。対応する原理の紹介と...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
一般的に、大規模なモデルを事前トレーニングする場合、テキストの長さは固定されます。より長いテキストを...
[[417713]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
サム・アルマンが解雇され、最新の内幕が明らかに!ロイター通信によると、彼が解雇されるわずか4日前に、...
[[430430]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...
2月22日のニュース:昨日、権威あるアメリカの科学雑誌「MITテクノロジーレビュー」は、2018年の...
[[257748]]近年、ビジネスにおける人工知能 (AI) の重要性が急速に高まり、今では主要なテ...
月収8万元の美しいネットセレブは、わずか数か月でインスタグラムのフォロワーが15万人を超えた。有名人...
最近、AI(人工知能)同時通訳詐欺事件をめぐる議論がテクノロジーや翻訳界で話題となり、「AIは人間を...
人工知能が実際の応用に入ると、遭遇する問題のほとんどは複雑になります。 しかし、現段階では、人工知能...
[[385956]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
[[253100]]映画「ターミネーター」を見たことがある人は多いでしょう。実は、ターミネーターに似...