写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

最近、動画サイトをよく見ている人は、とても不思議でワクワクするものを見たことがあるかもしれません。具体的には、以下の動画のように、孫悟空やモナリザなどのさまざまなキャラクターが実際に歌い始めました。

[[343106]]

このビデオはオリジナルのものではない、明らかに加工されている。それで、このビデオはどのように作られたのでしょうか?

実際、これは「Yanderify」と呼ばれるオープンソースの AI プロジェクトを使用しています。これは、Yanderify プロジェクト ページにあるこのアニメーション画像で示されているように、ビデオと写真を組み合わせて、ビデオ内の顔と同じ表情で写真を動かすことができる魔法のプロジェクトです。

[[343107]]

左から、元の写真、元のビデオ、合成ビデオです。では、Yanderify はどのように機能するのでしょうか?今日はそれについてお話ししましょう!

まず、Yanderify は Python ベースのプロジェクトなので、まず Python をインストールする必要があります。以下のリンクをクリックして Python の公式サイトにアクセスし、ダウンロードしてインストールしてください。

Python公式サイト: https://www.python.org

オペレーティング システムが 64 ビットの場合は、64 ビット Python をダウンロードするのが最適です。 Windows システムを例にとると、Python 公式サイトのダウンロード ボタンでは、デフォルトで 32 ビットのインストール パッケージが提供される場合があります。この場合、Download-Windows ページに移動して、ダウンロードする 64 ビットのインストール パッケージを見つけることができます。

次に、Yanderify の GitHub ページに移動します。

ヤンデリファイ: https://github.com/dunnousername/yanderifier

「リリース」リンクを見つけて、最新のリリースされた Zip パッケージをダウンロードします。

Yanderify はインストールしなくても実行できます。解凍後、「Start Yanderify」をダブルクリックしてください。

「Yanderifyを開始」を実行します

Yanderify のインターフェースは非常にシンプルで、コマンドライン ウィンドウとシンプルな GUI で構成されています。必要なのは、画像素材とビデオ素材を選択し、出力パスを設定することだけです。さらに、Yanderify にはいくつかのハードウェア要件があります。

Yanderify は N カードの GPU アクセラレーションをサポートしていますが、モデルは GTX750 より高く、ビデオ メモリが 2G 以上である必要があります。A カードを使用している場合、Yanderify は GPU アクセラレーションを使用できないため、「CPU を使用する」オプションをオンにする必要があります。

Yanderifyのインターフェース

素材としてビデオまたは写真を選択してください

素材を選択する際は、解像度が高すぎる画像や動画を選択しないように注意してください。解像度が高すぎると、ソフトウェアがクラッシュする可能性があります。

「Go」をクリックすると、Yanderify が映像の合成を開始します。ただし、Yanderify を初めて使用する場合は、最初に 2 つのファイルがダウンロードされます。これら 2 つのファイルのダウンロード速度は比較的遅いです。これら 2 つのファイルのダウンロード アドレスは次のとおりです。ダウンロード ツールを使用してダウンロードできます。

初めて使う場合は2つのファイルをダウンロードする必要があり、時間がかかります

https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth

https://www.adrianbulat.com/downloads/python-fan/2DFAN4-11f355bf06.pth.tar

ダウンロード後、Yanderify を閉じて、2 つのファイルを次のディレクトリに配置します。

C:\Users\ユーザー名\.torch\models

これら2つのファイルを手動でダウンロードし、対応するフォルダに置くことができます。

その後、Yanderify をオンにすると、通常どおり使用できるようになります。

作曲中...

この時点で合成は完了する

Yanderify はどれくらい効果的ですか?作者は参考のために短いビデオを合成しただけです...

[[343108]]

[[343109]]

オリジナル画像と合成

さて、チュートリアルはこれで終わりです。このAIの原理は、機械学習を使用してビデオや画像内の顔の動きを識別し、ビデオに応じて写真をアニメーションに処理することです。

楽しいと思ったら、自分でもやってみたらいいでしょう。友達にいたずらをするのは楽しいですが、偽の情報を広めるために使用しないでください。

<<:  AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

>>:  髪の毛のような精度で画像を切り取り、Adobeは6000×6000の高解像度画像を処理します

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

人工知能とはいったい何でしょうか?人工知能の主要なテクノロジーと概念について学びましょう。

現在、人工知能が何であるかをまだよく理解していない人がたくさんいます。今日は、人工知能の主要な技術と...

顔認証闇市場:実在人物認証ビデオは1セット100元、アプリで検証可能

「1セット100元で、身分証明書の表裏の写真、身分証明書を持っている写真、うなずいたり首を振ったり口...

顔認証は必見!顔のなりすまし防止、クロスポーズ認識などを実現する方法を学ぶための 5 つの論文 (リンク付き)

[[281197]] [はじめに] 顔認識はコンピュータビジョンにおける最大の研究分野の一つです。...

AI、エッジコンピューティング、IoT、クラウドコンピューティングが車両管理をどのように変えるのか

毎日生成されるデータの量は増加し続けています。その結果、これらの企業はこれまで以上に多くのデータを保...

...

年次指数レポートではAIが「産業化」しているが、より優れた指標とテストが必要とされている

海外メディアVentureBeatによると、中国は人工知能の研究論文の総数で米国を上回り、資金提供を...

安全なパスワード保存の業界標準: bcrypt アルゴリズム

パスワードを安全に保護するための標準アルゴリズムである bcrypt アルゴリズムについて説明します...

...

ネットワーク人工知能とは何ですか?

今日、ますます多くの企業が人工知能 (AI) とネットワークの相乗効果を活用しています。ユーザーデバ...

5Gで「選ばれる」分野!自動運転バスがあなたのところにやって来ます

自動運転タクシー、バス、道路清掃車、物流配送車... 自動運転技術の急速な発展により、これらの無人車...

小売業界におけるRPA活用事例11選

世界各国がインダストリー4.0の時代を迎える中、多くの業界団体がプロセス自動化の重要性を認識し始め、...

AmodalSynthDrive: 自動運転のための合成アモーダル知覚データセット

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

知っておくべき 8 つのニューラル ネットワーク アーキテクチャ

ニューラル ネットワークは機械学習におけるモデルの一種です。ニューラル ネットワークは、機械学習の分...

光と闇:人工知能と人類の未来

今日、人工知能 (AI) はほぼすべての業界とすべての人に影響を及ぼしています。この驚くべき技術は、...

ICLR 2022|スピードこそすべて!完全なバイナリ化 BiBERT による超圧縮

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...