この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 AIを使ってトランプ大統領の顔を猫に変えたり、自分の顔を美しいオルセンと組み合わせたりしたいとしたら、どうしますか? おそらく、2 つの AI ツールを思い浮かべるでしょう。しかし、Deepfake で生成された顔は不自然すぎる上、GAN で生成された偽の顔は深くカスタマイズすることが困難です。 現在、韓国のチームによって開発されたスタイル転送モデル StarGANv2 は、この問題を完璧に解決できます。 GANに以前から注目してきた学生であれば、2017年末に高麗大学とClova AI研究所が立ち上げたスタイル転送モデルであるStarGANを覚えているはずです。 顔写真を入力するだけで、StarGAN は髪型、性別、年齢を変更した後のあなたの姿を教えてくれます。 StarGANv2は同じ研究チームによってリリースされたアップグレード版であり、CVPR 2020に含まれています。最近、彼らは公式の実装コードを GitHub でリリースし、ネットユーザーによってすぐに試されました。 StarGANv2 には、人間の顔用と動物の顔用の 2 つのトレーニング データセットがあります。 もともとこの2つは「別々」だったが、一部の人々はこの2つを混ぜて、トランプ氏の顔を動物の顔の事前トレーニングモデルに入力することを主張した。その結果、猫に変わったトランプ氏の顔は次のようになります。 犬の顔と合成するとこうなります。モデルさんは犬にスーツまで着せています。 インストールと使用方法このような興味深いモデルをインストールするにはどうすればいいでしょうか?幸いなことに、StarGANv2 開発チームは完全なコードと事前トレーニング済みのモデルを提供しました。 まず、プロジェクトをローカルにクローンします。
依存関係をインストールします:
次に、事前トレーニング済みのデータセットをダウンロードします。最初の 2 つは顔データセットと事前トレーニング済みのモデルで、後者は動物の顔です。
最後に、変換する写真をデータセット内の画像と同じアスペクト比にトリミングし、次のコマンドを入力して画像を変換します。
その効果は他のGANよりもはるかに優れているStarGANv2 は 4 つのモジュールで構成されています。
著者はスタイル転送実験のためにランダムに 10 枚の画像を選択しましたが、結果として得られた FID は他の同様のモデルよりもはるかに小さくなりました。 また、4 つのモデルによって生成された画像を AMT プラットフォームにアップロードして手動で選択しました。テスターの大多数は、StarGANv2 によって生成された画像の方が高品質であると考えました。 手動選択の結果からも、StarGANv2 は動物の顔を生成するのに優れていることがわかります。ネットユーザーがトランプ氏のアバターを動物モデルで作り変えたいと思うのも不思議ではありません。 ポータル論文アドレス: https://arxiv.org/abs/1912.01865v2 公式実装コード: https://github.com/clovaai/stargan-v2 |
<<: 安全な生産を守り、ロボット、IoTなどの技術サポートを提供します。
>>: モンローとドラゴンマザーがあなたと話すことを学びましょう。静止画とビデオだけです
アルパカファミリーの「最強のオープンソースコードモデル」が「スーパーカップ」を発売しました——今朝、...
概要勾配降下法は、ニューラル ネットワークでよく使われる最適化アルゴリズムの 1 つです。一般的に、...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
現実世界のシミュレーターが登場!トレーニングされた大規模モデルが現実の物理世界に適応できないのではな...
実践により、人工知能 (AI) が適切に導入されなければ多くのリスクをもたらすことがわかっているため...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
パート01 GPT-3.5との違い1.1 GPT-4が入力できる単語数は25,000語に大幅に増加写...
概要: 顔認識を実現するための 1 行のコード、1. まず、システムに認識させたいすべての人の写真が...
Statistaの最近のレポートによると、「AI市場の世界的価値は2025年までに年間890億ドル...
Apple による最近の研究により、高解像度画像における拡散モデルのパフォーマンスが大幅に向上しま...