デュアルスタイルGAN高解像度のポートレートスタイル転送アルゴリズム 実在の人物の写真 画像A これは変更するスタイルである別の画像 写真B アルゴリズムは画像 画像C この効果はかなり良いですよね? このようにして、お気に入りのアニメキャラクターに合わせて、自分の肖像画のスタイルを転送することができます。 アルゴリズムの影響をさらに見てみましょう。 最初の列は元の画像、2 番目の列は参照スタイル、3 番目の列はアルゴリズムによって生成された効果です。 このアルゴリズムは、アバターが必要ないくつかのシナリオに適用でき、ユーザーにオプションのコミック スタイルを提供して、お気に入りのポートレートを生成できます。
公式アルゴリズムでは 3 つの方法が提供されています。 プログラミングの知識がない友達でもWebページを体験できます。
試すには写真をアップロードしてください。 他の 2 つは、Colab 環境とローカル ビルドです。 Colab では、サードパーティの依存関係を自分でインストールする必要はなく、直接開いて実行できる「ラダー」があります。
ローカルでテストしたい友人もローカルにデプロイできます。公式のConda環境が提供されており、仮想環境を直接作成できます。 conda env 作成-f ./environment/dualstylegan_env.yaml 詳しい情報については、 最後に、素晴らしいエフェクトのセットをご紹介します。 RQ-VAEトランス私の記事をよく読んでいる友人は、私が書いた NÜWA (Nu Wa) と DALL-E アルゴリズムを読んでいるはずです。 今日紹介するアルゴリズム タスクは、テキストの説明に基づいて、説明に対応する画像を生成することです。 例えば: 雪山を前にチーズバーガー。 アルゴリズムは、テキストの説明に基づいて対応する画像を生成します。 例えば: 青い海に咲く桜。 アルゴリズムは主に RQ-VAE と RQ-Transformer の 2 つの段階に分かれています。 前者はエンコードを担当し、後者は生成を担当します。 このアルゴリズムはオープンソース化されました:
このプロジェクトはローカル環境のみをサポートします。サードパーティのライブラリは、 pip インストール-r要件.txt ぜひ試してみてください。いくつかの効果は非常に興味深いものです。 蛍光表示管ディープフェイクの顔を変える技術はますます一般的になりつつあります。 顔交換の写真やビデオは非常にリアルなので、肉眼では判別が難しい場合があります。 これも CVPR 2022 であり、オープンソース化されたばかりです。 効果については、ご自身でテストしていただけます。
チャッター2022年のCVPRを見ると、3D再構築やTransformerに関する内容が多かったですね。 状況に応じて、後ほど 3D 再構築を共有します。 |
<<: トレーニングは不要、自動的にスケーラブルなビジュアルトランスフォーマーが登場
2017 年に最も価値のある機械学習スキルはどれでしょうか? Quora の 2 つの回答では、最...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
今年 7 月、OpenAI は強力なプラグインである Code Interpreter をリリースし...
7月26日のニュースによると、将来、人工知能はマイクロソフトやアルファベットなどのテクノロジー大手に...
移動ロボットは、環境認識、動的意思決定と計画、行動制御と実行などの複数の機能を統合した総合システムで...
ロボット学習における典型的な問題の 1 つは、分類、つまり乱雑に積み重なったアイテムの山から目的のア...
過去数か月間の AI の爆発的な成長を追ってきた方なら、おそらく LangChain について聞いた...
最近、北京同仁病院の警報システムが作動し、職員は北京天壇病院で活動していたチケット転売業者が北京同仁...
2022年秋、OpenAIがChatGPTをリリースした後、わずか数か月で数千万人のユーザーを獲得し...
[[357814]]これを読んでいるあなたは、目の前のウェブサイトから CT スキャンの読み取りまで...
2020年、突然の公衆衛生事件により、医療用ロボットに大きな注目が集まりました。医療用ロボットは、...