Python+AIで静止画像を動かす

Python+AIで静止画像を動かす

こんにちは、みんな。

短い動画を見ているときに、こんな動画を見たことはありませんか?動画の中で、人物の静止画が、首を傾げたり、瞬きをしたりと、動いていることがあります。

次のような効果に類似

一番左の図が本来の動作で、上の図が静止画です。 AI技術により、一番左のキャラクターの動きを上の静止画に適用し、すべての画像で同じ動きを実現できます。

この技術は、一般的に GAN (生成的敵対的ネットワーク) に基づいて実装されます。今日は、上記の効果を再現できるオープンソース プロジェクトを紹介します。興味深いプロジェクトを実行したり、古い友人を思い出したりすることができます。

1. プロジェクトを実行する

プロジェクトアドレス: https://github.com/AliaksandrSiarohin/first-order-model

まず、git clone はプロジェクトをローカル コンピューターにダウンロードし、プロジェクトに入って依存関係をインストールします。

 git クローン https://github.com/AliaksandrSiarohin/first-order-model.git
cd 一次モデル
pip インストール -r 要件.txt

次に、プロジェクトのホームページの「事前トレーニング済みチェックポイント」の見出しの下にあるモデルのダウンロード リンクを見つけて、モデル ファイルをダウンロードします。モデルは多数あります。私は vox-adv-cpk.pth.tar を使用しました。

モデルファイルを準備したら、プロジェクトのルートディレクトリで以下のコマンドを実行します。

 python デモ.py \
--config config/vox-adv-256.yaml \
--運転ビデオ src_video.mp4 \
--ソースイメージ src_img.jpg \
--チェックポイント重み/vox-adv-cpk.pth.tar

パラメータを説明します。

  • --config: ソースファイル内のモデル構成ファイル
  • --driving_video: アクションのビデオを提供します
  • --source_image: アニメーション化する必要がある静止画像
  • --checkpoint: ダウンロードしたモデルファイル

実行が完了すると、次の入力が表示されます。

このプロジェクトは PyTorch を使用してニューラル ネットワークを構築し、GPU と CPU の操作をサポートしているため、コンピューターに CPU しかない場合は実行速度が遅くなります。

CPU で実行しています。上の図からわかるように、 driving_video には 31 フレームしかありません。 CPU でも実行している場合は、 driving_video ビデオの継続時間を制御するのが最適です。そうしないと、実行時間が長くなります。

このプロジェクトでは、自分で興味深い試みをいくつか行うことができます。

2. Python API

上記では、公式 Web サイトに従って、コマンド ラインでプロジェクトを実行する方法を説明しています。

友人の中には、これを Python プロジェクトで呼び出したい人もいるかもしれないので、demo.py のコア コードを抽出し、Python API をカプセル化しました。

困っている友人は、このファイルをダウンロードし、first-order-model と同じディレクトリに置き、次のコードに従って呼び出すことができます。

フォム = FOM()
# ドライバー ビデオを表示します。ドライバー ビデオは 480 x 640 のサイズにトリミングするのが最適です。
運転ビデオ = ''
# 駆動スクリーン
ソース画像 = ''
# ビデオを出力する
結果ビデオ = ''
# 運転画面
fom.img_to_video(運転中のビデオ、ソース画像、結果のビデオ)

<<:  2022年の5つの新しいテクノロジートレンド

>>:  電子鼻のウイスキー識別精度は96%にも達する。ネットユーザー:茅台酒にも作ってみよう

ブログ    
ブログ    
ブログ    

推薦する

ディープラーニングタスクに最適な GPU を選択するにはどうすればよいでしょうか?

ディープラーニングは計算集約型の分野であり、GPU の選択によってディープラーニングの実験が根本的に...

...

ディープラーニング + OpenCV、Python でリアルタイムのビデオ オブジェクト検出を実現

OpenCV と Python を使用してライブ ビデオ ストリームでディープラーニング オブジェク...

...

ドイツのセキュリティ専門家がGPRS暗号化アルゴリズムの解読に成功

セキュリティ・リサーチ・ラボのディレクター、カーステン・ノール氏は、このクラックによりGPRSの盗聴...

インターネット上の無料データサイエンス、機械学習、人工知能のMOOCベスト20

21 世紀において、伝統的な教育は人生において必要な段階ではなく、選択肢となっています。インターネ...

AAAI 2024 フェロー発表、清華大学の朱軍教授が選出

AAAI(人工知能振興協会)は、人工知能分野で国際的に最も権威のある学術団体の一つです。フェローは協...

CCTV、春節に初めてバーチャル司会者サ・ベイニン氏を迎える

AIブロックチェーン企業の技術が中国の重要な国家夜会で正式に使用された。 2019年のオンライン春節...

スマートホームは私たちを監視しているのでしょうか?

スマートテクノロジーをどのように活用するのでしょうか?ほとんどのテクノロジー製品は、特にワイヤレス接...

投票の未来: AI、ブロックチェーン、生体認証

投票攻撃は止まらない2016年の米国大統領選挙は紆余曲折を経て、最終的にトランプ氏が米国大統領に選出...

...

皇帝の側室選定と推薦アルゴリズムの仕組み

[[393467]]この記事はWeChatの公開アカウント「Shu Shixiong」から転載したも...

AI分野に新たな学者が加わりました!清華大学の胡世民が選出され、「Jitu」フレームワークは彼の研究室から生まれた

清華大学の胡世民教授が中国科学院の院士に選出されました! 2023年に両アカデミーから新たに選出され...

ハリバートンのチーフデータサイエンティスト兼テクニカルフェローがエネルギー業界における AI アプリケーションの現状について語る

エネルギー産業はハイテク主導の産業です。石油・ガス業界では、過酷な条件下で大型機器を使用してさまざま...