写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

最近、動画サイトをよく見ている人は、とても不思議でワクワクするものを見たことがあるかもしれません。具体的には、以下の動画のように、孫悟空やモナリザなどのさまざまなキャラクターが実際に歌い始めました。

[[343106]]

このビデオはオリジナルのものではない、明らかに加工されている。それで、このビデオはどのように作られたのでしょうか?

実際、これは「Yanderify」と呼ばれるオープンソースの AI プロジェクトを使用しています。これは、Yanderify プロジェクト ページにあるこのアニメーション画像で示されているように、ビデオと写真を組み合わせて、ビデオ内の顔と同じ表情で写真を動かすことができる魔法のプロジェクトです。

[[343107]]

左から、元の写真、元のビデオ、合成ビデオです。では、Yanderify はどのように機能するのでしょうか?今日はそれについてお話ししましょう!

まず、Yanderify は Python ベースのプロジェクトなので、まず Python をインストールする必要があります。以下のリンクをクリックして Python の公式サイトにアクセスし、ダウンロードしてインストールしてください。

Python公式サイト: https://www.python.org

オペレーティング システムが 64 ビットの場合は、64 ビット Python をダウンロードするのが最適です。 Windows システムを例にとると、Python 公式サイトのダウンロード ボタンでは、デフォルトで 32 ビットのインストール パッケージが提供される場合があります。この場合、Download-Windows ページに移動して、ダウンロードする 64 ビットのインストール パッケージを見つけることができます。

次に、Yanderify の GitHub ページに移動します。

ヤンデリファイ: https://github.com/dunnousername/yanderifier

「リリース」リンクを見つけて、最新のリリースされた Zip パッケージをダウンロードします。

Yanderify はインストールしなくても実行できます。解凍後、「Start Yanderify」をダブルクリックしてください。

「Yanderifyを開始」を実行します

Yanderify のインターフェースは非常にシンプルで、コマンドライン ウィンドウとシンプルな GUI で構成されています。必要なのは、画像素材とビデオ素材を選択し、出力パスを設定することだけです。さらに、Yanderify にはいくつかのハードウェア要件があります。

Yanderify は N カードの GPU アクセラレーションをサポートしていますが、モデルは GTX750 より高く、ビデオ メモリが 2G 以上である必要があります。A カードを使用している場合、Yanderify は GPU アクセラレーションを使用できないため、「CPU を使用する」オプションをオンにする必要があります。

Yanderifyのインターフェース

素材としてビデオまたは写真を選択してください

素材を選択する際は、解像度が高すぎる画像や動画を選択しないように注意してください。解像度が高すぎると、ソフトウェアがクラッシュする可能性があります。

「Go」をクリックすると、Yanderify が映像の合成を開始します。ただし、Yanderify を初めて使用する場合は、最初に 2 つのファイルがダウンロードされます。これら 2 つのファイルのダウンロード速度は比較的遅いです。これら 2 つのファイルのダウンロード アドレスは次のとおりです。ダウンロード ツールを使用してダウンロードできます。

初めて使う場合は2つのファイルをダウンロードする必要があり、時間がかかります

https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth

https://www.adrianbulat.com/downloads/python-fan/2DFAN4-11f355bf06.pth.tar

ダウンロード後、Yanderify を閉じて、2 つのファイルを次のディレクトリに配置します。

C:\Users\ユーザー名\.torch\models

これら2つのファイルを手動でダウンロードし、対応するフォルダに置くことができます。

その後、Yanderify をオンにすると、通常どおり使用できるようになります。

作曲中...

この時点で合成は完了する

Yanderify はどれくらい効果的ですか?作者は参考のために短いビデオを合成しただけです...

[[343108]]

[[343109]]

オリジナル画像と合成

さて、チュートリアルはこれで終わりです。このAIの原理は、機械学習を使用してビデオや画像内の顔の動きを識別し、ビデオに応じて写真をアニメーションに処理することです。

楽しいと思ったら、自分でもやってみたらいいでしょう。友達にいたずらをするのは楽しいですが、偽の情報を広めるために使用しないでください。

<<:  AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

>>:  髪の毛のような精度で画像を切り取り、Adobeは6000×6000の高解像度画像を処理します

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

形状精度の高い 3D 認識画像合成のためのシェーディング ガイド付き生成暗黙モデル

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

2019年人工知能サバイバルガイド

「資本の冬は業界のマシュー効果と適者生存を加速させており、AI分野も例外ではありません。」Infer...

Flask を使用して機械学習モデルを簡単にデプロイするにはどうすればよいですか?

[51CTO.com クイック翻訳] データ サイエンティスト/機械学習エンジニアが Scikit...

...

李徳義:自動運転のバブルを破るには、技術、市場、エコロジー、コストを無視することはできない

[[277858]] 「自動運転は長い間宣伝されてきたが、なぜ一般の人々は自動運転車に乗らないのか?...

...

調査によると、人工知能ソフトウェア市場は2025年までに370億ドルに達すると予想されている。

Forrester は、2025 年までの市場規模をより現実的に把握するために、AI ソフトウェア...

...

データ構造と区間マージアルゴリズム、貪欲

[[439314]]マージ間隔LeetCode の問題へのリンク: https://leetcode...

CMU のポスドクらが NLP データ処理ツールを発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

「初の顔認証事件」の最終判決がこちら

[[392244]] 4月9日午後3時、「初の顔認識事件」は杭州市中級人民法院で二審判決を受けた。こ...

遺伝的アルゴリズムに基づく高周波タグアンテナの最適設計

無線周波数識別技術は、無線、非接触の自動識別技術であり、近年開発された最先端の技術プロジェクトです。...

医療業界における人工知能の5つの主要な応用シナリオと典型的な事例

近年、スマートヘルスケアの開発は国内外で人気を集めています。 「セキュリティやスマート投資アドバイザ...