ZAOは一夜にして人気者になった。 一昨夜、文翁の友人の輪には、さまざまな名作映画やテレビシリーズのクリップが溢れかえっていた。興味深いのは、これらの動画の男性と女性の主人公が友人の「顔」に置き換えられていたことだ。 例えば、女装した自分と共演するなど👇 または、ダニエル・ウーや金城武のような体型に変身しましょう👇 ZAOと呼ばれるシナリオベースの顔変更ソフトウェアはこれを達成し、iQiyiなどのビデオソフトウェアを追い抜いて、一夜にしてアプリ無料エンターテイメントリストで2位に急上昇しました。 「#Zao AI 顔を変える」というトピックは、Weibo のホット検索リストですぐに 7 位にランクインしました。 文在寅さんとその友人たちも早速試してみた。「ZAO」で顔を変えたい動画や絵文字パッケージを選択し、自撮り写真や現地の写真をアップロードすれば、ワンクリックで「顔変え」が完了する。簡単で早く、写真が鮮明であれば効果はかなり良いです。 使用プロセス全体を通して、Wen Zhaijun はいくつかの興味深い点を発見しました。 まず、アプリに写真ライブラリへのアクセスを許可すると、アプリはすべての写真をすばやく検索し、適切な鮮明度でポートレートを自動的に見つけます。 また、十分に鮮明な写真から様々な動画を合成することができ、合成速度も非常に速く、ピーク時でも基本的に10秒を超えることはありません。 このアプリを開発した会社は、すでに皆さんによく知られているMomoです。しかし、Sinaの報道によると、ZAOの公式声明では、その本質は友達追加にあり、顔を変えるツールというよりも主にソーシャルインタラクションを目的としているとのことだ。 実は今年4月には、海外でも同様のAIによる顔変えが流行していた。今年4月、顔や性別を変更できるFacetifyというアプリが世界中で人気を博した。このアプリは顔の変更に特化しており、「30年後の自分の姿」を見ることができると主張している。 このような技術やシナリオは新しいように思えるかもしれないが、文在寅に精通している読者は、その背後にある「顔を変える」技術がしばらく前から人気があったことを知っているはずだ。 ZAO は自社の技術がディープフェイクから生まれたものであるとは直接述べていないが、両者には大きな類似点がある。 このアプリは大ヒットとなった一方で、ディープフェイク技術とそれが直面する法的、倫理的ジレンマに国内の人々の注目をさらに集めることとなった。 古いワインを新しいボトルに: 顔交換の背後にある技術的サポート - ディープフェイク 顔を変える技術の成熟は、ディープフェイクと呼ばれるソフトウェアの匿名のオープンソースリリースと切り離せないものです。本質的には、AI ディープラーニングを使用して、ある写真に写っている人物の顔を別の人物の顔に置き換える技術です。この技術により、非常にリアルな「偽の」ビデオや写真を作成できるため、「フェイススワッピング」という名前が付けられています。 この技術は、ハードウェア、ビデオ、顔を入れ替えた写真の品質と量に対して非常に高い要件があります。ハードウェアに関しては、1060 以上、少なくとも 8G のメモリを備えたものを入手してください。これは標準的な構成です。もちろん、これよりも低い構成でも実行できますが、どれほど効果的であるかはわかりません。また、標準構成では、画像のトレーニング時間は少なくとも 6 時間です。 実は、この技術を使うと動画も写真に分割されるので、要件は基本的に顔が置き換えられる人物の写真と同じです。動画は鮮明でなければなりませんが、鮮明すぎてもいけません。動画には、顔が置き換えられる人物の顔だけが映っている必要があります。他の顔がある場合は、削除する必要があります。 データと品質の要件を踏まえて、AI 顔変換モデルを自分でトレーニングする場合、1 つ目はデータの抽出、2 つ目はトレーニング、3 つ目は変換という 3 つのステップがあります。最初のステップと 3 番目のステップはどちらもデータの前処理が必要であり、3 番目のステップでは画像融合テクノロジも使用されます。主な内容としては、画像の前処理、ネットワーク モデル、画像の融合などがあります。 具体的な原理は、顔ごとに、エンコーダーのセットと対応するデコード ニューラル ネットワークがトレーニングされることです。エンコード時には一人目の人物の写真が使用されます。デコード時には、2 番目のパーソナル デコーダーが使用されます。 つまり、2 つの顔を交換したいので、2 つの異なるデコード ネットワークを設計できます。つまり、1 つのエンコーディング ネットワークを使用して 2 つの異なる顔の共通の特徴を学習し、2 つのデコーダーを使用してそれらを個別に生成します。 上の図に示すように、2 つの異なる顔をそれぞれ入力するための入力端またはエンコーダーを設計し、次に 2 つの出力端または 2 つのデコーダーを設計して、隠れ層を通じてそれぞれ 2 つの異なる顔を生成できるようにします。 トレーニングの部分に関しては、インターネット上に公開されている写真やビデオが多数あるため、このウェブサイトでアベンジャーズのスターたちをトレーニングに使用するのは簡単です。 画像が不十分な場合は、既存の動画から抽出することもできます。ニューラル ネットワークがトレーニングされ、各人の顔の特徴を学習すると、その人がまだとっていないポーズを自ら予測できるようになります。 たとえば、John Oliver を生成するためのトレーニング。 この技術が登場する前は、顔を変えたい人は手動のPSに頼るしかありませんでした。これには多くの人手と時間が必要であり、すべてのフレームを変更する必要があるため、ビデオ内の顔を変更するのはさらに困難です。 しかし、「ディープフェイク」と呼ばれるソフトウェアが匿名でオープンソースとしてリリースされて以来、すべてが変わった。 同様の顔を変えるソフトウェア「DeepFaceLab」もある。 Github でオープンソースを公開 👇 リンク: https://github.com/iperov/DeepFaceLab DeepFaceLabは機械学習を利用して動画内の顔を置き換えるツールです。スクリプトを実行することで直接使用できます。元の画像と置換画像のビデオと画像の素材を大量に収集し、素材をビデオセグメントに編集し、data_src.mp4とdata_dst.mp4を置き換えてから、いくつかのスクリプトを使用してパラメータを変更し、トレーニング済みモデルを取得します。最後に、顔が変更された写真がビデオに合成されます。 法的優位性のテスト: 顔を変える技術に関する一連の著作権とユーザーのプライバシー問題 ディープフェイクが人気を博した後、プライバシー侵害などの一連の法的問題を引き起こしました。 ディープフェイクのより物議を醸す例は、最近インターネットで人気が出ているワンクリックヌード写真生成ソフトウェア「DeepNude」です。女性の全身写真を入力するだけで、対応するヌード写真を自動的に生成できます。このソフトウェアが広く普及したため、予期せぬ結果を引き起こし、開発者は最終的にこのアプリを店頭から撤去しました。 テイラー・スウィフトはクリック1つで裸になった これらの例の背後にはディープフェイク技術が使われています。これは、AI プログラムとディープラーニング アルゴリズムを使用して、ビデオやオーディオをシミュレートして偽造する技術です。ディープラーニングに投資されたコンテンツ ライブラリが大きいほど、合成されたビデオやオーディオは本物と区別がつかないほど本物らしくなります。 さらに注目すべきは、ディープフェイク技術は顔の入れ替えだけでなく、ディープラーニングを通じて現実の声をシミュレートし、現実には存在しない人物の肖像画を作成することもできるようになったことです。この技術を使用すると、ビデオというより信憑性の高い方法で、誰かに一度も言ったことのないことを言わせたり、一度もしたことのないことをさせたりして、視聴者を混乱させることが可能です。ディープフェイクは極めて欺瞞性が高く、楊冪の顔の改変、AIソフトウェアによるヌード写真の自動生成、オバマやプーチンなどの政治家のディープフェイク動画など、多くの論争を引き起こしており、個人や社会にリスクと課題をもたらしている。 少し前に、ナンシー・ペロシ米下院議長のディープフェイク会話動画がソーシャルメディアに登場した。この動画はトランプ大統領によってシェアされ、フェイスブックで250万回以上再生された。これに先立ち、オバマ前米大統領の顔がトランプ大統領を攻撃するために「借りられ」、その動画もウェブサイトで480万回再生された。トランプ大統領自身もこの災難から逃れることはできなかった。シアトルのテレビ局はかつてトランプ大統領の演説のディープフェイク動画を放送した。動画の中でトランプ大統領の顔は赤くなり、時折おかしな表情を見せていた。ディープフェイク技術は大統領を含むあらゆる公務員に対して使用できるため、米国の両党は、この技術が米国や他の西側諸国に対する偽情報戦争の最新兵器となることを懸念し始めている。 2019年6月13日、米国下院情報委員会はAIディープフェイクに関する公聴会を開催し、ディープフェイク技術が国家、社会、個人に及ぼすリスクや予防・対応策について公開討論した。 ディープフェイクと同様に、ZAOの人気により、この「偽」技術に対する中国人の認識も高まっています。それが関連する問題を引き起こすかどうかはまだわかりません。 しかし、さらに重要なのは、ビデオ編集機能を備えたソフトウェアとして、ZAO はビデオ素材の著作権とユーザーのプライバシーという 2 つの法的問題にも直面する必要があることです。 ZAO APPの公式著作権声明では、ZAO製品上のショートビデオ、絵文字、その他の素材は、ZAOとそのパートナー間の著作権協力であると明記されているものを除き、すべてZAOユーザーによって自発的にアップロードされており、ZAOは素材の商業著作権を享受していないと記載されています。 ZAOにはネットユーザーの間で「人気」のある動画素材が多数あります。ユーザーは写真をアップロードし、これらの素材のキャラクターを自分または他の人の顔に置き換えることができます。これはZAOが公式の著作権協力と呼ぶものであるはずです。 しかし、文翁が偶然「武林外伝」の動画をクリックし、動画の右下にある著作権ボタンをクリックすると、「404 見つかりません」と表示された。 もう1つは、ユーザーがアップロードした動画素材です。ZAOの公式声明によると、著作権はアップロードした人に帰属し、ZAOは素材の商業著作権を享受していません。ただし、アプリの登録時に同意する必要がある「ユーザー契約」では、ユーザーがアップロードした動画の所有権を持ち、責任を負うとされています。ただし、ZAOとそのユーザーは、世界中で完全に無料、取り消し不能、永久、再印刷可能、更新可能な権利を享受しています。つまり、ユーザーがアップロードした動画素材の著作権はユーザーに帰属しますが、他の誰でもそれを変更および編集し、配布することができます。 これはネットユーザーの間で大きな懸念を引き起こしています。これは新たなオンライン詐欺の手法につながるのでしょうか? 画像出典: Zhihu ユーザーのプライバシーに関しては、ZAO は他のアプリの契約とそれほど変わらない別のプライバシー契約を結んでいます。これには、ユーザーのプロファイリングとプッシュ通知を実行するために、一部の閲覧情報、デバイス情報、および位置情報の収集が含まれます。 しかし、ZAOの主な機能はビデオの顔交換であるため、プライバシー保護はユーザーデータの漏洩だけでなく、ユーザーの写真、声紋などの情報が不正に利用されないかどうかも考慮する必要があります。何しろ、これはAlipayが顔をスキャンして支払いができる時代なのですから。 画像出典: Zhihu 実は、我が国の関係部門もこれを十分に認識しており、数日前、全国人民代表大会常務委員会が審議した「民法典の個人権益編(草案)」に正式に「いかなる組織や個人も、情報技術を利用して他人の肖像権を偽造し、侵害してはならない」という条項が追加された。 草案の第803条も次のように改正された:「その他の人格権の許可された行使および自然人の発言権の保護は、この章の関連規定に従うものとする。」 この法案が正式な立法審査プロセスを通過し、民法が正式に公布・施行されれば、著名人や公人の肖像を本人の同意なく恣意的に加工することは間違いなく法律違反となる。また、顔だけでなく、声も草案第803条により、気軽に変えることはできません! 状況が深刻な場合、刑法に違反する可能性があります。たとえば、刑法第246条には、「公然と他人を侮辱し、または事実を捏造して暴力やその他の手段で他人を中傷した者は、状況が深刻な場合は、3年以下の有期懲役、拘留、釈放または政治的権利の剥奪に処せられる」と規定されています。 つまり、ディープフェイクやゴーストアニマルなどの方法を使って他人の顔を加工する場合、その人の同意を得ていないことになります。 「悪質な名誉毀損」「悪質な編集」「名誉権の侵害」など、刑法の範疇に触れる可能性が高いです。 この観点から、ZAO がユーザー契約に関してこれほど複雑な規定を設けている理由が理解できます。 最後に、文在寅は皆にこう言い残した。何百万枚もの写真を撮るときは、用心深くするのが一番だ。顔を変えるのは、しばらくは気分がいいかもしれないが、愛する人たちに涙をもたらすかもしれない。 関連レポート: https://blog.csdn.net/qq_41173453/article/details/79598461https://www.jianshu.com/p/dd7df75c5679https://baijiahao.baidu.com/s?id=1630965686026976511&wfr=spider&for=pc [この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です] この著者の他の記事を読むにはここをクリックしてください |
>>: AI による顔を変える動画が何百万人ものユーザーを獲得。たった 1 ステップで楽しさから恐怖感まで
機械学習の基本的な概念を説明するとき、私はいつも限られた数の図に戻ってしまいます。以下は、私が最も啓...
3D ポートレート合成は、常に AIGC の注目を浴びている分野です。 NeRF と 3D 対応 ...
同じ場所で二度失敗することがないように、そして他の人の役に立つために、私は自分の情熱に従ってデータ ...
[[407987]]過去 10 年間、コンピューター ビジョン認識タスクは畳み込みニューラル ネッ...
最近、視覚合成というタスクが大きな注目を集めています。 NVIDIA の GauGAN は数日前にバ...
教育省は最近、「高等教育機関における人工知能イノベーションのための行動計画」を発行しました。計画によ...
人工知能(AI)はあらゆる業界に浸透しています。構想から改修まで、AI は建築環境に影響を与えること...
これは、カーネギーメロン大学とカリフォルニア大学バークレー校の Eric Xing 氏と Trevo...
人工知能の破壊的応用の増加、危機時のネットワークの役割の拡大、ポリシーとテクノロジー間の依存関係の高...
Aisle50 の共同創設者であるクリストファー・シュタイナー氏は、新著の中で、デジタルが優位性を...
本日、Xiaomi は、弾性探索 (マクロ + ミクロ) に基づく超解像で驚くべき結果を達成した新し...
人工知能と機械学習は私たちに利益をもたらしますが、そのセキュリティには注意が必要です。どれくらい安全...
サイエンス フィクションや大衆文化では、人工知能 (AI) 技術に関する大胆な予測や説明がよく取り上...