すべてがジョジョになる:このGANはマスクを人間ではないものにする

すべてがジョジョになる:このGANはマスクを人間ではないものにする

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

これで何でもジョジョ化できる!

すでに意気揚々としていたマスク氏は、「私はもう人間じゃない!」と言いそうだった。

世界的に有名な絵画「モナ・リザ」の神秘的で優雅な微笑みが、さらに魅力的になったようです…

同じ次元からもう一人がやって来ます...キャプテン、何をしているんですか、キャプテン!

上記の効果は、Web デモを開いてクリックし、ローカル画像をアップロードするだけで実現できます。

これはすぐに多くのネットユーザーの注目を集め、Twitterでの人気は800を超えただけでなく、「Hugging Face」のオンライン試写会には長い行列ができ、1枚の写真の待ち時間は最大4〜5分にもなりました。

JOJO スタイルだけでなく、ディズニー スタイル、リーグ オブ レジェンド スタイルなどもあります...任意のスタイルの画像を入力すると、そのスタイルを新しい画像にすばやく適用できます。

キャロラインの哀れな大きな瞳と、王女としての無邪気な笑顔を見て、私はただこう言いたいのです...老媽よ、どうか魔法の力をしまって下さい!

オンラインであらゆるポートレートをJO化

上記のデモンストレーションを見て、あなたもJO顔になりたくなりましたか?

開発者が提供するHugging FaceとColabを使って試してみましょう。

まず、Hugging Face のオンライン バージョンです。左側のフレームの空白部分をクリックして、任意のローカル写真をドロップします。

もう一度「送信」をクリックして 10 秒以上待ちます...目の前に立っているのは、KO NO の筋肉質な Jinlun Da Sima その人です!

この方法では、リンクをクリックするだけですぐにプレイできます。シンプルで高速ですが、時々数分間列に並んで待つ必要があります。

したがって、colab バージョンを強くお勧めします。任意の画像を test_input フォルダーにインポートします。たとえば、ここに Bingbing の写真を配置し、[実行] をクリックします。

次に、次の生成モジュールを引き続き実行します。

私の氷の女神をジョジョに変えることも、GANさんの計画の一部ですか!

さらに、colab では別の遊び方も提供されています。任意のスタイルの画像をインポートし、自分で XX スタイル ジェネレーターを作成するのです。

うーん...これはテイワット版のムスクではないでしょうか?

老馬の真剣な写真をアップロード:

次に、style_images フォルダに Genshin Impact スタイルのポートレートをアップロードします。

(2D スタイルの画像をアップロードすると、「顔が見つかりません」という結果になる可能性があるため、さらにいくつかの画像を試す必要があります)

次に微調整を行い、数分待ってからもう一度「実行」をクリックします。

この決意に満ちた表情と、元の写真で腕を組んで遠くを見つめる老馬の姿勢を合わせると、次の瞬間には「天地が揺れる」などと言いそうな気がします。

GAN反転による近似スタイルの取得

では、この方法はどのようにして、単一の画像の芸術的なスタイルを完璧に学習し、それを他の画像に適用するという目標を達成するのでしょうか?

JoJoGanというモデルを見てみましょう。

主にGAN反転を通じて近似スタイルを取得します。主なワークフローは4つのステップに分かれています。

  1. GAN を通じて、参照スタイル画像は近似ペアのトレーニング データに変換され、対応する様式化されたコードが取得されます。
  2. 様式化されたコードに基づいて実際の顔画像を生成し、それを参照スタイルの画像と照合して、ペアのトレーニング セットとしてペア データを形成します。
  3. これらのペアになったトレーニング データに基づいて、StyleGAN が微調整されます。
  4. 微調整された StyleGAN を使用して新しいサンプルを生成します。

開発者らは、このモデルはゼロ監督下でスタイルの詳細に細心の注意を払っており、さまざまなスタイルで優れた汎用性を備え、他のスタイルの画像にも簡単に一般化できると述べています。

二次元からテクノロジーオタクへ

開発者のミン・ジン・チョン氏も私たちの古い知り合いです。彼は以前にも二次元妻ジェネレーターを作ったことがあります。

Min Jin Chong はイリノイ大学アーバナ・シャンペーン校 (UIUC) で学士号を取得し、その後博士号取得を目指して同大学に在籍しました。彼の主な研究分野は、機械学習、コンピューター ビジョン、画像生成です。

彼は以前、バイトダンスで3か月間インターンをしており、現在は同じ学校の学生2人とともに、ユーザーが仮想空間で商品を試したり購入したりできる「Style Space」というファッションショッピングアプリを設立した。

[[442230]]

彼の指導者である David Forsyth 氏は、CV 分野の大物です。彼と Jean Ponce 氏は、コンピューター ビジョンの古典的な教科書「Computer Vision: A Modern Approach」を執筆しました。

Hugging Faceオンライントライアル:
https://huggingface.co/spaces/akhaliq/JoJoGAN

Colabオンライントライアル:
https://colab.research.google.com/github/mchong6/JoJoGAN/blob/main/stylize.ipynb#scrollTo=LCLWiXoXwcJb

論文リンク:
https://arxiv.org/abs/2112.11641

<<:  Google 中国人がタイムクリスタルを使って何十年も昔の謎を解く!永久機関が再び自然界に出現

>>:  3分レビュー! 2021年12月の自動運転業界の開発動向を簡単に概観

ブログ    
ブログ    

推薦する

人間はAIに勝てるか?私たちは機械に置き換えられるのでしょうか?

2017年、中国の囲碁棋士である柯潔はAI AlphaGoとの対戦で惨敗し、コート上で涙を流し、人...

2019 年に注目すべき 11 の JavaScript 機械学習ライブラリ

ほとんどの機械学習は Python などの言語で行われますが、フロントエンドとバックエンドの両方にお...

...

教師なし機械学習の基本ガイド

[51CTO.com クイック翻訳] 教師なし機械学習と人工知能は、組織のビジネス成長に役立つことは...

...

AIはローカルアプリケーションから大規模な「AI主導」企業へと進化しました

最近、デロイト人工知能研究所は、「企業向け人工知能アプリケーションの現状レポート」と「厳選された A...

顔認識がまた失敗しました。アクセス制御システムは引き続き使用できますか?

旅行がますます便利になるにつれ、旅行の際には携帯電話だけを持って行けばよくなります。これは、モバイル...

...

人工知能は現代のテクノロジー業界をさまざまな形で変えている

AIは現代のビジネスとテクノロジーのエコシステムをさまざまな形で大きく変えてきました。過去数年間に...

Tongji と Alibaba は CVPR 2022 最優秀学生論文賞のためにどのような研究を行いましたか?これは、

この記事では、CVPR 2022 最優秀学生論文賞を受賞した私たちの研究「EPro-PnP: 単眼物...

鶏が先か卵が先か: ニューラルアーキテクチャ探索手法の概要

Google のプログレッシブ アーキテクチャ検索から CMU の微分化可能アーキテクチャ検索まで、...

企業は適切なAI推論を得る方法を知る必要がある

人工知能は、Amazon、Google、Microsoft、Netflix、Spotify などの大...

ChatGPT「コードインタープリター」が正式リリースされました! 30秒で写真を動画に変え、口を動かしてショーを作りましょう

家族よ、ついに来たぞ!先ほど、ChatGPT「コードインタープリター」ベータ版がすべてのPlusユー...

専門家:歩行者の安全問題を解決するために都市は自動運転だけに頼ることはできない

自動運転技術が業界全体で開発のマイルストーンに到達し続ける一方で、都市は自動運転車(AV)の目標を補...

杭州市の100以上の交差点で無人信号制御が実現し、杭州シティブレイン1.0が正式にリリースされました

10月11日、アリババは2017年杭州雲奇大会で、人類のテクノロジーの未来を探求する実験室「大墨学院...