写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

最近、動画サイトをよく見ている人は、とても不思議でワクワクするものを見たことがあるかもしれません。具体的には、以下の動画のように、孫悟空やモナリザなどのさまざまなキャラクターが実際に歌い始めました。

[[343106]]

このビデオはオリジナルのものではない、明らかに加工されている。それで、このビデオはどのように作られたのでしょうか?

実際、これは「Yanderify」と呼ばれるオープンソースの AI プロジェクトを使用しています。これは、Yanderify プロジェクト ページにあるこのアニメーション画像で示されているように、ビデオと写真を組み合わせて、ビデオ内の顔と同じ表情で写真を動かすことができる魔法のプロジェクトです。

[[343107]]

左から、元の写真、元のビデオ、合成ビデオです。では、Yanderify はどのように機能するのでしょうか?今日はそれについてお話ししましょう!

まず、Yanderify は Python ベースのプロジェクトなので、まず Python をインストールする必要があります。以下のリンクをクリックして Python の公式サイトにアクセスし、ダウンロードしてインストールしてください。

Python公式サイト: https://www.python.org

オペレーティング システムが 64 ビットの場合は、64 ビット Python をダウンロードするのが最適です。 Windows システムを例にとると、Python 公式サイトのダウンロード ボタンでは、デフォルトで 32 ビットのインストール パッケージが提供される場合があります。この場合、Download-Windows ページに移動して、ダウンロードする 64 ビットのインストール パッケージを見つけることができます。

次に、Yanderify の GitHub ページに移動します。

ヤンデリファイ: https://github.com/dunnousername/yanderifier

「リリース」リンクを見つけて、最新のリリースされた Zip パッケージをダウンロードします。

Yanderify はインストールしなくても実行できます。解凍後、「Start Yanderify」をダブルクリックしてください。

「Yanderifyを開始」を実行します

Yanderify のインターフェースは非常にシンプルで、コマンドライン ウィンドウとシンプルな GUI で構成されています。必要なのは、画像素材とビデオ素材を選択し、出力パスを設定することだけです。さらに、Yanderify にはいくつかのハードウェア要件があります。

Yanderify は N カードの GPU アクセラレーションをサポートしていますが、モデルは GTX750 より高く、ビデオ メモリが 2G 以上である必要があります。A カードを使用している場合、Yanderify は GPU アクセラレーションを使用できないため、「CPU を使用する」オプションをオンにする必要があります。

Yanderifyのインターフェース

素材としてビデオまたは写真を選択してください

素材を選択する際は、解像度が高すぎる画像や動画を選択しないように注意してください。解像度が高すぎると、ソフトウェアがクラッシュする可能性があります。

「Go」をクリックすると、Yanderify が映像の合成を開始します。ただし、Yanderify を初めて使用する場合は、最初に 2 つのファイルがダウンロードされます。これら 2 つのファイルのダウンロード速度は比較的遅いです。これら 2 つのファイルのダウンロード アドレスは次のとおりです。ダウンロード ツールを使用してダウンロードできます。

初めて使う場合は2つのファイルをダウンロードする必要があり、時間がかかります

https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth

https://www.adrianbulat.com/downloads/python-fan/2DFAN4-11f355bf06.pth.tar

ダウンロード後、Yanderify を閉じて、2 つのファイルを次のディレクトリに配置します。

C:\Users\ユーザー名\.torch\models

これら2つのファイルを手動でダウンロードし、対応するフォルダに置くことができます。

その後、Yanderify をオンにすると、通常どおり使用できるようになります。

作曲中...

この時点で合成は完了する

Yanderify はどれくらい効果的ですか?作者は参考のために短いビデオを合成しただけです...

[[343108]]

[[343109]]

オリジナル画像と合成

さて、チュートリアルはこれで終わりです。このAIの原理は、機械学習を使用してビデオや画像内の顔の動きを識別し、ビデオに応じて写真をアニメーションに処理することです。

楽しいと思ったら、自分でもやってみたらいいでしょう。友達にいたずらをするのは楽しいですが、偽の情報を広めるために使用しないでください。

<<:  AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

>>:  髪の毛のような精度で画像を切り取り、Adobeは6000×6000の高解像度画像を処理します

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

AIガバナンスがリスクを軽減しながら利益を獲得する方法

[[389556]] AI ガバナンスは、データ プライバシー、アルゴリズムのバイアス、コンプライア...

...

...

AIエンジニアの成長ストーリー~働き方編~

[[409282]]この記事では、特に仕事の方法について取り上げます。エンジニアの中には非常に頭の...

...

...

ネットワークセキュリティ運用保守サービスにおける人工知能の応用

近年、国内外のサイバーセキュリティ情勢はますます複雑化しており、従来のモデルでは国民経済の生命線に関...

中国のAI研究は米国を上回る?専門家:例えば、ディープラーニングに関する論文の発表数

現在、世界の人工知能分野には、業界で「神のような存在」とみなされるトップの専門家が3人いる。そのうち...

...

ディープラーニングフレームワークの競争: TNN vs. MNN、NCNNは依然として定番

近年、「オープンソース」は開発者コミュニティにおける新たなトレンドとなっています。特にディープラーニ...

コード生成のためのツリーベースのTransformerアーキテクチャ

導入:コード生成は、プログラマーの生産性を大幅に向上させる可能性を秘めた重要な AI 問題です。自然...

Karpathy の新しいビデオが再び人気に: GPT Tokenizer をゼロから構築

技術の第一人者カパシー氏がOpenAIを去った後、彼のビジネスは非常に活発になっています。新しいプロ...

さまざまなソートアルゴリズムの概要

ソート アルゴリズムは、最も基本的で一般的に使用されるアルゴリズムです。ソート アルゴリズムは、シナ...

ChatGPTは故意に嘘をついたのでしょうか?ハーバード大学がITIを提案: モデルの信頼性を2倍にし、計算オーバーヘッドをほぼゼロにする

ChatGPT などの大規模な言語モデルは、回答に誤った情報を出力することが多く、ユーザーを誤解させ...