この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 有名人にあなたのスピーチを真似してもらいたい場合はどうすればいいでしょうか? とても簡単です。有名人の写真とあなたが話しているビデオがあれば、数分で完了します。 効果を見てみましょう: あなたが顔をしかめたり首を振ったりすると、写真の中の有名人があなたとシンクロします! イタリアのトレント大学の研究では次のように述べられています。
もちろん、このような興味深いプロジェクトがオープンソース化されました! トランプが演説し、スターク家の一団も何か言いたいことがある実際、この研究は数か月前に発表されました。 当時使われた入力ビデオはトランプ建国同志のもので、静止画はスターク家や『氷と炎の歌』の登場人物の写真一式だった。 効果は次のようになります。 川建国同志が瞬きをしても首を振っても、劇中の登場人物は完璧に同期していることがわかります。 象徴的なO型の口も鮮やかに「模倣」されました。 数か月後、この技術はRedditで再び人気を博しました。 考えられる理由の 1 つは、今回の入力ビデオが人気の短編ビデオ プラットフォームからのものであるため、自分で録画したビデオも使用できるということです。 リアルで興味深い効果を考えると、短編動画コンテンツ プラットフォームがこの機能を導入するのもそう遠くないかもしれません。 もちろん、このモデルの魅力はそれだけではありません。 モデルがポーズを変える動画を入力し、衣服の静止写真を複数枚追加することで、衣服を動的に表示する動画を一括出力できます。 顔を変えるのも簡単です。 ただし、注意点があります。静止写真は注意して使用してください。そうしないと、結果が「生きている世界から来たもの」のようには見えなくなる可能性があります... 一次運動モデルトレーニング段階では、研究者は同じカテゴリーのオブジェクトを含むビデオシーケンスの大規模なコレクションを使用しました。モデルは、ビデオの単一フレームと学習した潜在的な動きの表現を組み合わせてビデオを再構築するようにトレーニングされます。 テスト段階では、研究者らはソース画像と運転ビデオの各フレームからなるペアにモデルを適用し、ソースオブジェクトの画像アニメーションを実行しました。 モデルのフレームワークを下の図に示します。 フレームワークは主に、動き推定モジュールと画像生成モジュールの 2 つの部分で構成されています。 動き推定モジュールの目的は、密な動きフィールドを予測することです。研究者らは抽象的な参照フレームの存在を仮定し、「参照からソースへ」と「参照からドライバーへ」という 2 つの変換を独立して推定しました。これにより、ソース フレームとドライバー フレームを個別に処理できるようになります。 研究者らは、テスト時にモデルがさまざまなビデオからサンプリングされたソース画像と駆動フレームのペアを受け取るため、視覚的に大きく異なる可能性があるため、このステップが必要であると主張している。 最初のステップでは、自己教師方式で学習されたキーポイントを使用して取得された軌道のスパース セットから、これら 2 つの変換を近似します。各キーポイントの周囲の動きは、ローカルアフィン変換を使用してモデル化されます。 2 番目のステップでは、密なモーション ネットワークをローカル近似と組み合わせて、密なモーション フィールドを取得します。とりわけ、このネットワークはオクルージョン マスクを出力し、ソース イメージをワープすることでイメージのどの駆動部分を再構築できるか、およびどの部分を描画する必要があるか (コンテキストから推測) を示します。 3 番目のステップでは、生成モジュールが、運転ビデオで提供されるソース オブジェクトの動きに応じて画像をレンダリングします。ここで、研究者らはジェネレーター ネットワークを使用して、密な動きに基づいてソース画像をワープし、ソース画像内の遮蔽された画像部分をカラー化しました。 最後に、このモデルは GitHub でオープンソース化されており、「ポータル」にアドレス リンクが用意されています。 今すぐ試してみて〜 ポータル GitHub プロジェクト アドレス: 論文の宛先: |
<<: トランプの「猫と犬バージョン」を生成、偽顔ツールStarGANv2が壊れており、アルゴリズムがオープンソース化されている
>>: 速報です!画像AI企業「Huiyi Huiying」がハッキングされ、COVID-19研究成果が公開された
[[439859]]近年、モデルの規模はどんどん大きくなっています。例えば、2018年に登場したGP...
[[426884]]モデルのパフォーマンスを向上させるには、パラメータを調整し、活性化関数を変更する...
多くの人が理解していない点の 1 つは、機械学習アルゴリズムが舞台裏でどのように機能するかということ...
ウルトラマンの新たな動きが多くの開発者を怒らせた。これらの開発者は、プラグインの開発許可を待つのでは...
8月6日、今年初めから、生成型人工知能への熱狂がテクノロジー業界全体を席巻しているというニュースが...
ちょうど本日、上海人工知能研究所とSenseTimeは、香港中文大学および復旦大学と共同で、次世代大...
変分量子分類器 (VQC) は、量子コンピューティング技術を使用して分類タスクを実行する機械学習アル...
ChatGPTの最新の脆弱性が明らかになり、たった1つの文でトレーニングデータがそのまま漏洩してしま...
最近、アリババは軽量ディープラーニングエッジ推論エンジン「MNN」を正式にオープンソース化しました。...
間違った AI ストレージ プラットフォームを選択すると、ビジネスに深刻な結果をもたらす可能性があり...
ニューラル ネットワークでは、活性化関数によって、指定された入力セットからノードの出力が決定されます...
時代の発展と科学技術の進歩に伴い、ロボットは人々の生活の場にますます入り込んできましたが、私たちの従...
最近、「遺伝的アルゴリズムの紹介とデータ サイエンスにおけるその応用」というタイトルの記事が Ana...