写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

写真の中のキャラクターを動かしたり歌わせたりできます!このAIブラックテクノロジーは台無しになった

最近、動画サイトをよく見ている人は、とても不思議でワクワクするものを見たことがあるかもしれません。具体的には、以下の動画のように、孫悟空やモナリザなどのさまざまなキャラクターが実際に歌い始めました。

[[343106]]

このビデオはオリジナルのものではない、明らかに加工されている。それで、このビデオはどのように作られたのでしょうか?

実際、これは「Yanderify」と呼ばれるオープンソースの AI プロジェクトを使用しています。これは、Yanderify プロジェクト ページにあるこのアニメーション画像で示されているように、ビデオと写真を組み合わせて、ビデオ内の顔と同じ表情で写真を動かすことができる魔法のプロジェクトです。

[[343107]]

左から、元の写真、元のビデオ、合成ビデオです。では、Yanderify はどのように機能するのでしょうか?今日はそれについてお話ししましょう!

まず、Yanderify は Python ベースのプロジェクトなので、まず Python をインストールする必要があります。以下のリンクをクリックして Python の公式サイトにアクセスし、ダウンロードしてインストールしてください。

Python公式サイト: https://www.python.org

オペレーティング システムが 64 ビットの場合は、64 ビット Python をダウンロードするのが最適です。 Windows システムを例にとると、Python 公式サイトのダウンロード ボタンでは、デフォルトで 32 ビットのインストール パッケージが提供される場合があります。この場合、Download-Windows ページに移動して、ダウンロードする 64 ビットのインストール パッケージを見つけることができます。

次に、Yanderify の GitHub ページに移動します。

ヤンデリファイ: https://github.com/dunnousername/yanderifier

「リリース」リンクを見つけて、最新のリリースされた Zip パッケージをダウンロードします。

Yanderify はインストールしなくても実行できます。解凍後、「Start Yanderify」をダブルクリックしてください。

「Yanderifyを開始」を実行します

Yanderify のインターフェースは非常にシンプルで、コマンドライン ウィンドウとシンプルな GUI で構成されています。必要なのは、画像素材とビデオ素材を選択し、出力パスを設定することだけです。さらに、Yanderify にはいくつかのハードウェア要件があります。

Yanderify は N カードの GPU アクセラレーションをサポートしていますが、モデルは GTX750 より高く、ビデオ メモリが 2G 以上である必要があります。A カードを使用している場合、Yanderify は GPU アクセラレーションを使用できないため、「CPU を使用する」オプションをオンにする必要があります。

Yanderifyのインターフェース

素材としてビデオまたは写真を選択してください

素材を選択する際は、解像度が高すぎる画像や動画を選択しないように注意してください。解像度が高すぎると、ソフトウェアがクラッシュする可能性があります。

「Go」をクリックすると、Yanderify が映像の合成を開始します。ただし、Yanderify を初めて使用する場合は、最初に 2 つのファイルがダウンロードされます。これら 2 つのファイルのダウンロード速度は比較的遅いです。これら 2 つのファイルのダウンロード アドレスは次のとおりです。ダウンロード ツールを使用してダウンロードできます。

初めて使う場合は2つのファイルをダウンロードする必要があり、時間がかかります

https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth

https://www.adrianbulat.com/downloads/python-fan/2DFAN4-11f355bf06.pth.tar

ダウンロード後、Yanderify を閉じて、2 つのファイルを次のディレクトリに配置します。

C:\Users\ユーザー名\.torch\models

これら2つのファイルを手動でダウンロードし、対応するフォルダに置くことができます。

その後、Yanderify をオンにすると、通常どおり使用できるようになります。

作曲中...

この時点で合成は完了する

Yanderify はどれくらい効果的ですか?作者は参考のために短いビデオを合成しただけです...

[[343108]]

[[343109]]

オリジナル画像と合成

さて、チュートリアルはこれで終わりです。このAIの原理は、機械学習を使用してビデオや画像内の顔の動きを識別し、ビデオに応じて写真をアニメーションに処理することです。

楽しいと思ったら、自分でもやってみたらいいでしょう。友達にいたずらをするのは楽しいですが、偽の情報を広めるために使用しないでください。

<<:  AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

>>:  髪の毛のような精度で画像を切り取り、Adobeは6000×6000の高解像度画像を処理します

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Apple、Google Play ランキングアルゴリズム

すべてのアプリにおいて、製品自体が登場する前、アイデアが生まれた時点で、すでに製品マーケティングの問...

顔認証の過去と現在の徹底分析

​​ [[211140]]​​人工知能は、まず知覚段階、次に認知段階の 2 つの段階に分かれています...

Llama 2 第 2 波のハイライト: 慎重すぎるため、コード生成には改善の余地が大いにある

有用か無害かLlama-2-chat は、セキュリティ フィルターに関して過度に敏感な動作を示すこと...

...

ByteDanceのLi Hang: 言語ビッグモデルに関するいくつかの観察と考察

この記事は、LLM に関する著者の見解を詳しく説明しています。主なポイントは次のとおりです。 Cha...

金融ビジネスイノベーションを実現する自社開発グラフデータベースに基づくナレッジグラフ実装

人工知能の急速な発展に伴い、ナレッジグラフの実装と商業化の可能性は継続的に強化され、社内のデータ分析...

...

Sparkに代わると期待されるリアルタイム機械学習フレームワークRay

新しいプロジェクトは、Python で記述された機械学習アプリケーションをサポートするために使用でき...

アルゴリズムの改善とハードウェアの反復、どちらがより収益性が高いでしょうか? MITの最新の研究結果がこの答えを提供している

コンピューターが登場する前には、アルゴリズムがありました。コンピュータの誕生により、コンピュータの強...

AI、自動化、そして仕事の未来: 取り組むべき10の課題

[[236355]]職場で機械が人間の労働に取って代わるにつれ、その恩恵を受けるためには私たち全員が...

「人工知能のゴッドファーザー」ジェフリー・ヒントン氏は再び警告した。AIが人間に取って代わるかもしれない

10月10日、「人工知能のゴッドファーザー」として知られるジェフリー・ヒントン氏は、人工知能は危険で...

...

...