デュアルスタイルGAN高解像度のポートレートスタイル転送アルゴリズム 実在の人物の写真 画像A これは変更するスタイルである別の画像 写真B アルゴリズムは画像 画像C この効果はかなり良いですよね? このようにして、お気に入りのアニメキャラクターに合わせて、自分の肖像画のスタイルを転送することができます。 アルゴリズムの影響をさらに見てみましょう。 最初の列は元の画像、2 番目の列は参照スタイル、3 番目の列はアルゴリズムによって生成された効果です。 このアルゴリズムは、アバターが必要ないくつかのシナリオに適用でき、ユーザーにオプションのコミック スタイルを提供して、お気に入りのポートレートを生成できます。
公式アルゴリズムでは 3 つの方法が提供されています。 プログラミングの知識がない友達でもWebページを体験できます。
試すには写真をアップロードしてください。 他の 2 つは、Colab 環境とローカル ビルドです。 Colab では、サードパーティの依存関係を自分でインストールする必要はなく、直接開いて実行できる「ラダー」があります。
ローカルでテストしたい友人もローカルにデプロイできます。公式のConda環境が提供されており、仮想環境を直接作成できます。 conda env 作成-f ./environment/dualstylegan_env.yaml 詳しい情報については、 最後に、素晴らしいエフェクトのセットをご紹介します。 RQ-VAEトランス私の記事をよく読んでいる友人は、私が書いた NÜWA (Nu Wa) と DALL-E アルゴリズムを読んでいるはずです。 今日紹介するアルゴリズム タスクは、テキストの説明に基づいて、説明に対応する画像を生成することです。 例えば: 雪山を前にチーズバーガー。 アルゴリズムは、テキストの説明に基づいて対応する画像を生成します。 例えば: 青い海に咲く桜。 アルゴリズムは主に RQ-VAE と RQ-Transformer の 2 つの段階に分かれています。 前者はエンコードを担当し、後者は生成を担当します。 このアルゴリズムはオープンソース化されました:
このプロジェクトはローカル環境のみをサポートします。サードパーティのライブラリは、 pip インストール-r要件.txt ぜひ試してみてください。いくつかの効果は非常に興味深いものです。 蛍光表示管ディープフェイクの顔を変える技術はますます一般的になりつつあります。 顔交換の写真やビデオは非常にリアルなので、肉眼では判別が難しい場合があります。 これも CVPR 2022 であり、オープンソース化されたばかりです。 効果については、ご自身でテストしていただけます。
チャッター2022年のCVPRを見ると、3D再構築やTransformerに関する内容が多かったですね。 状況に応じて、後ほど 3D 再構築を共有します。 |
<<: トレーニングは不要、自動的にスケーラブルなビジュアルトランスフォーマーが登場
10月10日、海外メディアの報道によると、Google Cloudは最近、医療従事者がさまざまな種類...
(1)要素が0から65535までの任意の数値であり、同じ値が繰り返し出現しない整数列。 0 は例外で...
俊敏性、効率性、コスト管理性に優れたデジタル変革手法として、中国市場に参入後、高い注目と幅広い受け入...
絶えず進化するデジタル環境において、「人工知能」(AI)という用語はもはや馴染みのない概念ではありま...
[51CTO.com クイック翻訳]ビジネスの世界では、デジタルトランスフォーメーションという言葉を...
誰もが知っているように、コンピューティング能力とデータは非常に重要ですが、それだけで十分でしょうか?...
ニューラルネットワークの説明不可能性は、AI の分野では常に「長年の」問題となってきました。しかし、...
強化学習 (RL) は、エージェントが試行錯誤を通じて環境内でどのように動作するかを学習できるように...
実行している機械学習の種類に応じて、モデルのパフォーマンスを測定するために使用できるメトリックは多数...