漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

[[436077]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

1,241人が列に並び、2,600秒待ちました...」

——ネットユーザーは、アニメで自分がどのように見えるかを知るために本当に一生懸命努力しています!

「The Originator」は肖像画を漫画に変換できるジェネレーターです。

たった一枚の写真や動画で、老若男女、有名人やアマチュアを問わず、誰もが自分だけの「アニメスタイル」を見ることができます~

「国民の妻」王冰冰とは:

「国民の妹」 IUとは:

テクノロジー界の大物、EDGのメンバー、金髪美女、ロンママ…

髪の毛や眉毛、目に宿る感情までもが鮮やかに「描かれて」います…

△ ビデオエフェクト

ネットユーザーがサーバーを圧倒したのも不思議ではない。

皆さんの作品をパラパラとめくるだけでも、終わりがないほど奥が深い作品ばかりです。

GitHub 上の関連プロジェクトを見ると、確かにトレンドリストのトップにありました。

このAnimeGANは本当にすごいです!

アニメのような顔を作るにはどうすればいいですか?

表示されたエフェクトを確認した後、あなたも自分の漫画の顔を作成してみませんか?

これは可能です。今からステップごとにお教えします。

最初の方法は非常に簡単です。写真をアップロードするだけです。

オンラインゲームプレイを提供するウェブサイト(記事末尾のリンクを参照)は有名なHugging Faceです。

特別にオンライン AnimeGANv2 アプリがオープンし、そこに写真を「投げ込む」だけで済みます。

しかし! ! !

先ほども述べたように、AI は現在非常に普及しており、単純なオンライン方式はキューイングと同等です。

ほら、 5259秒待った後でも、まだ15人が先にいるよ...

列に並びたくない場合はどうすればいいですか?

次に、2 番目の方法であるcodeを使用します。

3時間待った後、熱心なネットユーザーはついに我慢できなくなり、 Colabバージョンを強く推奨しました(記事の最後にあるリンクを参照)。

まずドキュメント内の最初の 2 つのコード スニペットを実行し、次に写真のパスを変更します。

もちろん、チャレンジの難易度を上げたい場合は、AnimeGANv2 の GitHub プロジェクトもあります。

上記の方法はすべて画像変換に基づいています。ビデオを使用する場合は、AnimeGANv2 プロジェクトで次の 2 つのコマンドを実行します。

もちろん、このプロジェクトの Pytorch 実装もありますが、 Pytorch バージョンは現在画像変換のみをサポートしています。ビデオを変換したい場合は、当面は自分でスクリプトを作成する必要があります。

スタイル転送 + GAN

では、この効果の原理は何でしょうか?

AnimeGAN は、ニューラル スタイル転送と生成的敵対ネットワーク (GAN) の組み合わせを使用する、武漢大学と湖北理工大学の研究です。

これは実際にはCartoonGANをベースにした改良版であり、より軽量なジェネレーターアーキテクチャを提案しています。

AnimeGAN のジェネレーターは、標準畳み込み、深さ方向に分離可能な畳み込み、逆残差ブロック、アップサンプリング、およびダウンサンプリング モジュールで構成される対称エンコーダー/デコーダー ネットワークとして考えることができます。

ジェネレーターのパラメータ数を効果的に削減するために、AnimeGAN ネットワークでは 8 つの連続した同一の IRB (反転残差ブロック) が使用されます。

ジェネレーターでは、1×1 カーネルを持つ最後の畳み込み層は正規化層を使用せず、その後に tanh 非線形活性化関数が続きます。

上図で、K はカーネルサイズ、C は特徴マップの数、S は各畳み込み層の範囲、H は特徴マップの高さ、W は特徴マップの幅、Resize 値は特徴マップサイズの補間方法を設定するために使用されます。⊕ は要素ごとの追加を表します。

この V2 バージョンは AnimeGAN の第 1 世代に基づくアップグレードであり、主にモデルによって生成された画像の高周波アーティファクトの問題を解決します。

具体的には、生成された画像にネットワークが高周波アーティファクトを生成するのを防ぐために、特徴のレイヤー正規化を使用するという対策が取られます。

著者は、レイヤー正規化により、特徴マップ内の異なるチャネルに同じ特徴属性分布を持たせることができ、局所的なノイズの発生を効果的に防ぐことができると考えています。

AnimeGANv2 のジェネレータパラメータのサイズは 8.6MB ですが、AnimeGAN の場合は 15.8MB です。

2 つで使用される識別器はほぼ同じですが、違いは AnimeGANv2 がインスタンス正規化ではなくレイヤー正規化を使用することです。

ネットユーザー:私はより美しくなった

このAIは多くのファンを魅了しました。

一部のネットユーザーが「二次元に突入」した後、その驚くべき美しさを発見した。

私を美しくしてくれます!

そして彼は誇らしげに漫画の顔を披露しました。

ビル・ゲイツの影響を見て、一部のネットユーザーは次のように叫んだ。

空!ゲイツはスマートでセクシーに見えます。

著者: より優れた生成効果を備えた AnimeGANv3 が近日登場予定

AnimeGANのオリジナル作者は、湖北理工大学のLiu Gang准教授とChen Jie博士、そして彼らの学生Xin Chenの3人です。

このプロジェクトの誕生は、主にチームメンバーの個人的な興味、つまり二次元オタク文化と芸術への愛情によるものです。

著者の一人であるChen氏によると、AnimeGANとAnimeGANv2はそれぞれ完成までに2〜3か月かかり、その過程で多くの困難に遭遇したという。

これには、ハードウェア リソースの極端な不足も含まれていました。たとえば、AnimeGAN に使用された NVIDIA シングル カード サーバーは、同校の芸術デザイン学部の学部長である Rao Jian 教授によって提供されたものであり、同教授が担当する研究でも、実験を実行するために他の学生からマシンを借りることに依存していました。

AnimeGANv2 の時点では、シングル カード 2080ti サーバーは 1 つしかありませんでした。

しかし、すべての努力が無駄になったわけではありません。現在、AnimeGAN は多くの注目を集め、多くの人に好かれており、Chen 氏と彼のメンター チームは大きな達成感を感じています。

ご存知、新海誠監督もAnimeGANの作品をリポストしています。

しかし、この興味主導の科学研究プロジェクトは単なる楽しみのためではありません。

チームとの会話の中で、彼らはこう言いました。

主な目標は、学術論文をマイルストーンとして使用することであり、最大の期待は、プロジェクトが設計され、実際のアプリケーションで実装できることです。

そして次はAnimeGANv3が間もなく登場します

次に、ネットワーク サイズをより小さくし、おそらく 4M 程度にまで縮小します。同時に、AnimeGANv2 のいくつかの欠点 (たとえば、v2 では元の画像の詳細が保持されすぎている) を解決し、生成されるアニメーション効果の品質を高めます。

これは、AnimeGANv3 が商業的に実行可能であることも意味します。

AnimeGANv3が完成した後も、人間の顔をアニメーションに変換するためのアルゴリズムの最適化を継続していく予定です。

もう一つ

最後に、始める前に、AnimeGAN によって示される効果は比較的良好であるものの、大きな前提があることに注意する必要があります。

写真は高解像度で、顔の特徴が可能な限り鮮明である必要があります。

そうしないと画風がおかしくなるかもしれない(作者が実際に試してみたところ、泣きそうになったが涙は出なかった)...

それで、漫画の中であなたはどんな感じですか?

今すぐ試してみて〜

オンラインデモ:

https://huggingface.co/spaces/akhaliq/AnimeGANv2

Colabバージョン:

https://colab.research.google.com/drive/1jCqcKekdtKzW7cxiw_bjbbfLsPh-dEds?usp=sharing#scrollTo=niSP_i7FVC3c

GitHub アドレス:

https://github.com/TachibanaYoshino/AnimeGANv2

https://github.com/bryandlee/animegan2-pytorch

<<:  画像はさまざまな方法で変更できます。NVIDIAはGANを使用して高精度のディテールレタッチを実現

>>:  また一人の科学者が学界に復帰、AI産業の発展は冷え込みつつあるのか?

ブログ    

推薦する

フォーブス誌の2020年のAIに関するトップ10予測: 人工知能はますます「疎外」されつつある!

人工知能 (AI) は間違いなく 2010 年代のテクノロジーのテーマであり、新しい 10 年が始ま...

...

...

エッジAI: インテリジェンスをソースに近づける

人工知能の発展により、データをアルゴリズムに渡すのではなく、アルゴリズムがデータを処理するようになり...

機械学習に基づくユーザーエンティティ行動分析技術のアカウント異常検知への応用

企業ビジネスの継続的な拡大と電子化の発展に伴い、企業独自のデータや負荷データが急増し始めています。し...

...

ハイテクロボット: すでに世界に存在する 5 つの驚くべきハイテクロボット

テクノロジー時代の到来とともに、ロボットは人間の世界の一部になったようです。これらは私たちの生活に多...

どこにでもAI?小売業における 10 のエキサイティングな AI アプリケーション

[[311856]]小売業における当社の中核的な経験は、近年ほとんど変わっていません。店舗(またはオ...

人工知能を活用した機械駆動型データ自動ラベル付け法

[[416242]]オブジェクト検出、オブジェクト認識、セグメンテーション タスク用の自動注釈ソリュ...

A100よりもコストパフォーマンスに優れています! FlightLLM により、大規模モデル推論でパフォーマンスとコストを同時に心配する必要がなくなりました。

端末側での大規模言語モデルの適用により、コンピューティング性能とエネルギー効率の需要が「引き出され」...

これから「顔認証」の時代がやって来ますが、あなたの顔は安全でしょうか?

[[206222]] 【TechWebレポート】10月13日、Appleの携帯電話はバッテリー膨張...

...

TensorFlow が新旧 Mac 向けに新バージョンをリリース、最大 7 倍高速化

Apple の「1 回の呼び出しで 100 の応答」というアピールは、機械学習の分野でも例外ではない...

有名な文系大学が人工知能の分野に参入すると、何をもたらすことができるのでしょうか?

[[263482]]老舗の文系大学が人工知能人材育成分野への参入を正式に発表した。 「中国人民大学...

アルゴリズム問題演習 - 大規模ブラックリスト IP マッチング

多くの IT 企業では、アルゴリズムは面接で非常に重要な部分を占めていますが、実際の仕事でアルゴリズ...