トランプの「猫と犬バージョン」を生成、偽顔ツールStarGANv2が壊れており、アルゴリズムがオープンソース化されている

トランプの「猫と犬バージョン」を生成、偽顔ツールStarGANv2が壊れており、アルゴリズムがオープンソース化されている

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AIを使ってトランプ大統領の顔を猫に変えたり、自分の顔を美しいオルセンと組み合わせたりしたいとしたら、どうしますか?

おそらく、2 つの AI ツールを思い浮かべるでしょう。しかし、Deepfake で生成された顔は不自然すぎる上、GAN で生成された偽の顔は深くカスタマイズすることが困難です。

現在、韓国のチームによって開発されたスタイル転送モデル StarGANv2 は、この問題を完璧に解決できます。

GANに以前から注目してきた学生であれば、2017年末に高麗大学とClova AI研究所が立ち上げたスタイル転送モデルであるStarGANを覚えているはずです。

顔写真を入力するだけで、StarGAN は髪型、性別、年齢を変更した後のあなたの姿を教えてくれます。

StarGANv2は同じ研究チームによってリリースされたアップグレード版であり、CVPR 2020に含まれています。最近、彼らは公式の実装コードを GitHub でリリースし、ネットユーザーによってすぐに試されました。

StarGANv2 には、人間の顔用と動物の顔用の 2 つのトレーニング データセットがあります。

もともとこの2つは「別々」だったが、一部の人々はこの2つを混ぜて、トランプ氏の顔を動物の顔の事前トレーニングモデルに入力することを主張した。その結果、猫に変わったトランプ氏の顔は次のようになります。

犬の顔と合成するとこうなります。モデルさんは犬にスーツまで着せています。

インストールと使用方法

このような興味深いモデルをインストールするにはどうすればいいでしょうか?幸いなことに、StarGANv2 開発チームは完全なコードと事前トレーニング済みのモデルを提供しました。

まず、プロジェクトをローカルにクローンします。

  1. git クローンhttps://github.com/clovaai/stargan-v2.git
  2. cd スターガン-v2/

依存関係をインストールします:

  1. conda create -n スターガン- v2 python = 3.6.7
  2. conda をアクティブ化 stargan-v2
  3. conda インストール -y pytorch= 1.4 . 0 torchvision= 0.5 . 0 cudatoolkit= 10.0 -c pytorch
  4. conda インストール x264==' 1 ! 152.20180717 ' ffmpeg= 4.0 . 2 -c conda-forge
  5. pip で opencv-python== 4.1 . 2.30 ffmpeg-python== 0.2 . 0 scikit-image== 0.16 . 2 をインストールします
  6. pip インストール pillow== 7.0 . 0 scipy== 1.2 . 1 tqdm== 4.43 . 0 munch== 2.5 . 0

次に、事前トレーニング済みのデータセットをダウンロードします。最初の 2 つは顔データセットと事前トレーニング済みのモデルで、後者は動物の顔です。

  1. bash download.sh 事前トレーニング済みネットワーク-celeba-hq
  2. bash ダウンロード.sh ウィング
  3. bash ダウンロード.sh 事前トレーニング済みネットワーク-afhq

最後に、変換する写真をデータセット内の画像と同じアスペクト比にトリミングし、次のコマンドを入力して画像を変換します。

  1. python main.py --mode サンプル --num_domains 2 --resume_iter 100000 --w_hpf 1 \
  2. --checkpoint_dir expr/checkpoints/celeba_hq \
  3. --result_dir expr/results/celeba_hq \
  4. —src_dir 資産/代表者/celeba_hq/src \
  5. --ref_dir 資産/代表者/celeba_hq/ref

その効果は他のGANよりもはるかに優れている

StarGANv2 は 4 つのモジュールで構成されています。

  1. ジェネレーターは、入力画像を特定のドメインのスタイル エンコーディングを反映した出力画像に変換します。
  2. マッピング ネットワークは、潜在コードをトレーニング中にランダムに選択された複数のドメインのスタイル エンコーディングに変換します。
  3. スタイル エンコーダーは画像のスタイル エンコーディングを抽出し、ジェネレーターが参照ガイド付き画像合成を実行できるようにします。
  4. 識別器は、複数のドメインから本物の画像と偽の画像を区別します。

著者はスタイル転送実験のためにランダムに 10 枚の画像を選択しましたが、結果として得られた FID は他の同様のモデルよりもはるかに小さくなりました。

また、4 つのモデルによって生成された画像を A​​MT プラットフォームにアップロードして手動で選択しました。テスターの大多数は、StarGANv2 によって生成された画像の方が高品質であると考えました。

手動選択の結果からも、StarGANv2 は動物の顔を生成するのに優れていることがわかります。ネットユーザーがトランプ氏のアバターを動物モデルで作り変えたいと思うのも不思議ではありません。

ポータル

論文アドレス: https://arxiv.org/abs/1912.01865v2

公式実装コード: https://github.com/clovaai/stargan-v2

<<:  安全な生産を守り、ロボット、IoTなどの技術サポートを提供します。

>>:  モンローとドラゴンマザーがあなたと話すことを学びましょう。静止画とビデオだけです

ブログ    
ブログ    

推薦する

...

...

ADAPT: エンドツーエンドの自動運転の説明可能性を徹底的に探求する、理解の夜明け!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

機械学習をよりスマートにする 5 つの成功事例

人工知能と機械学習は企業の世界で注目を集めており、組織はますますこれらのテクノロジーを活用して顧客の...

フロンティアモデルフォーラムは責任あるAIの創造を目指している

政府や社会からの監視が強まる中、人工知能(AI)の責任ある開発を促進し、業界標準を確立することを目的...

Reddit ユーザーが「泣く」: 私はアルゴリズム エンジニアではなく、「パラメータ調整者」です

[[387580]]まず最初に質問させてください。あなたは自分が「スイッチャー」だと思いますか、それ...

...

人工知能によって作られた、素晴らしい美しさと能力を持つ美しいロボット

我が国初の自主開発人工知能美容ロボットも誕生しました。その皮膚は先進的なシリコンで作られており、まる...

謎の企業が米国で初めて「脳コンピューターインターフェース」の人体実験を承認された。頭蓋骨を開けずに2時間で埋め込むことができる。

マスクは嫉妬しているのか?彼のニューラリンクは技術的にははるかに進んでおり、豚やサルを使った実験では...

...

AIをやりたいなら高校でデータサイエンスを勉強するな:ウルトラマンとマスクがついに合意

AIの発展には基礎教育を強化しなければ手遅れになります。大規模モデル技術が急速に発展し、企業間の競争...

ネイチャー、サイエンス、セルが参加し、80の学術機関がCOVID-19研究を無料で提供する

[[314283]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

人材獲得におけるAIの台頭

[[405721]]過去 10 年間で採用手法が進化するにつれ、人材獲得における人工知能の活用がます...

...

...