漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

[[436077]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

1,241人が列に並び、2,600秒待ちました...」

——ネットユーザーは、アニメで自分がどのように見えるかを知るために本当に一生懸命努力しています!

「The Originator」は肖像画を漫画に変換できるジェネレーターです。

たった一枚の写真や動画で、老若男女、有名人やアマチュアを問わず、誰もが自分だけの「アニメスタイル」を見ることができます~

「国民の妻」王冰冰とは:

「国民の妹」 IUとは:

テクノロジー界の大物、EDGのメンバー、金髪美女、ロンママ…

髪の毛や眉毛、目に宿る感情までもが鮮やかに「描かれて」います…

△ ビデオエフェクト

ネットユーザーがサーバーを圧倒したのも不思議ではない。

皆さんの作品をパラパラとめくるだけでも、終わりがないほど奥が深い作品ばかりです。

GitHub 上の関連プロジェクトを見ると、確かにトレンドリストのトップにありました。

このAnimeGANは本当にすごいです!

アニメのような顔を作るにはどうすればいいですか?

表示されたエフェクトを確認した後、あなたも自分の漫画の顔を作成してみませんか?

これは可能です。今からステップごとにお教えします。

最初の方法は非常に簡単です。写真をアップロードするだけです。

オンラインゲームプレイを提供するウェブサイト(記事末尾のリンクを参照)は有名なHugging Faceです。

特別にオンライン AnimeGANv2 アプリがオープンし、そこに写真を「投げ込む」だけで済みます。

しかし! ! !

先ほども述べたように、AI は現在非常に普及しており、単純なオンライン方式はキューイングと同等です。

ほら、 5259秒待った後でも、まだ15人が先にいるよ...

列に並びたくない場合はどうすればいいですか?

次に、2 番目の方法であるcodeを使用します。

3時間待った後、熱心なネットユーザーはついに我慢できなくなり、 Colabバージョンを強く推奨しました(記事の最後にあるリンクを参照)。

まずドキュメント内の最初の 2 つのコード スニペットを実行し、次に写真のパスを変更します。

もちろん、チャレンジの難易度を上げたい場合は、AnimeGANv2 の GitHub プロジェクトもあります。

上記の方法はすべて画像変換に基づいています。ビデオを使用する場合は、AnimeGANv2 プロジェクトで次の 2 つのコマンドを実行します。

もちろん、このプロジェクトの Pytorch 実装もありますが、 Pytorch バージョンは現在画像変換のみをサポートしています。ビデオを変換したい場合は、当面は自分でスクリプトを作成する必要があります。

スタイル転送 + GAN

では、この効果の原理は何でしょうか?

AnimeGAN は、ニューラル スタイル転送と生成的敵対ネットワーク (GAN) の組み合わせを使用する、武漢大学と湖北理工大学の研究です。

これは実際にはCartoonGANをベースにした改良版であり、より軽量なジェネレーターアーキテクチャを提案しています。

AnimeGAN のジェネレーターは、標準畳み込み、深さ方向に分離可能な畳み込み、逆残差ブロック、アップサンプリング、およびダウンサンプリング モジュールで構成される対称エンコーダー/デコーダー ネットワークとして考えることができます。

ジェネレーターのパラメータ数を効果的に削減するために、AnimeGAN ネットワークでは 8 つの連続した同一の IRB (反転残差ブロック) が使用されます。

ジェネレーターでは、1×1 カーネルを持つ最後の畳み込み層は正規化層を使用せず、その後に tanh 非線形活性化関数が続きます。

上図で、K はカーネルサイズ、C は特徴マップの数、S は各畳み込み層の範囲、H は特徴マップの高さ、W は特徴マップの幅、Resize 値は特徴マップサイズの補間方法を設定するために使用されます。⊕ は要素ごとの追加を表します。

この V2 バージョンは AnimeGAN の第 1 世代に基づくアップグレードであり、主にモデルによって生成された画像の高周波アーティファクトの問題を解決します。

具体的には、生成された画像にネットワークが高周波アーティファクトを生成するのを防ぐために、特徴のレイヤー正規化を使用するという対策が取られます。

著者は、レイヤー正規化により、特徴マップ内の異なるチャネルに同じ特徴属性分布を持たせることができ、局所的なノイズの発生を効果的に防ぐことができると考えています。

AnimeGANv2 のジェネレータパラメータのサイズは 8.6MB ですが、AnimeGAN の場合は 15.8MB です。

2 つで使用される識別器はほぼ同じですが、違いは AnimeGANv2 がインスタンス正規化ではなくレイヤー正規化を使用することです。

ネットユーザー:私はより美しくなった

このAIは多くのファンを魅了しました。

一部のネットユーザーが「二次元に突入」した後、その驚くべき美しさを発見した。

私を美しくしてくれます!

そして彼は誇らしげに漫画の顔を披露しました。

ビル・ゲイツの影響を見て、一部のネットユーザーは次のように叫んだ。

空!ゲイツはスマートでセクシーに見えます。

著者: より優れた生成効果を備えた AnimeGANv3 が近日登場予定

AnimeGANのオリジナル作者は、湖北理工大学のLiu Gang准教授とChen Jie博士、そして彼らの学生Xin Chenの3人です。

このプロジェクトの誕生は、主にチームメンバーの個人的な興味、つまり二次元オタク文化と芸術への愛情によるものです。

著者の一人であるChen氏によると、AnimeGANとAnimeGANv2はそれぞれ完成までに2〜3か月かかり、その過程で多くの困難に遭遇したという。

これには、ハードウェア リソースの極端な不足も含まれていました。たとえば、AnimeGAN に使用された NVIDIA シングル カード サーバーは、同校の芸術デザイン学部の学部長である Rao Jian 教授によって提供されたものであり、同教授が担当する研究でも、実験を実行するために他の学生からマシンを借りることに依存していました。

AnimeGANv2 の時点では、シングル カード 2080ti サーバーは 1 つしかありませんでした。

しかし、すべての努力が無駄になったわけではありません。現在、AnimeGAN は多くの注目を集め、多くの人に好かれており、Chen 氏と彼のメンター チームは大きな達成感を感じています。

ご存知、新海誠監督もAnimeGANの作品をリポストしています。

しかし、この興味主導の科学研究プロジェクトは単なる楽しみのためではありません。

チームとの会話の中で、彼らはこう言いました。

主な目標は、学術論文をマイルストーンとして使用することであり、最大の期待は、プロジェクトが設計され、実際のアプリケーションで実装できることです。

そして次はAnimeGANv3が間もなく登場します

次に、ネットワーク サイズをより小さくし、おそらく 4M 程度にまで縮小します。同時に、AnimeGANv2 のいくつかの欠点 (たとえば、v2 では元の画像の詳細が保持されすぎている) を解決し、生成されるアニメーション効果の品質を高めます。

これは、AnimeGANv3 が商業的に実行可能であることも意味します。

AnimeGANv3が完成した後も、人間の顔をアニメーションに変換するためのアルゴリズムの最適化を継続していく予定です。

もう一つ

最後に、始める前に、AnimeGAN によって示される効果は比較的良好であるものの、大きな前提があることに注意する必要があります。

写真は高解像度で、顔の特徴が可能な限り鮮明である必要があります。

そうしないと画風がおかしくなるかもしれない(作者が実際に試してみたところ、泣きそうになったが涙は出なかった)...

それで、漫画の中であなたはどんな感じですか?

今すぐ試してみて〜

オンラインデモ:

https://huggingface.co/spaces/akhaliq/AnimeGANv2

Colabバージョン:

https://colab.research.google.com/drive/1jCqcKekdtKzW7cxiw_bjbbfLsPh-dEds?usp=sharing#scrollTo=niSP_i7FVC3c

GitHub アドレス:

https://github.com/TachibanaYoshino/AnimeGANv2

https://github.com/bryandlee/animegan2-pytorch

<<:  画像はさまざまな方法で変更できます。NVIDIAはGANを使用して高精度のディテールレタッチを実現

>>:  また一人の科学者が学界に復帰、AI産業の発展は冷え込みつつあるのか?

ブログ    

推薦する

...

Google、写真を撮るだけで皮膚疾患を検出するAIツールの新機能を発表

5月19日、Googleの開発者会議I/O 2021が開幕した。完全オンライン形式を採用し、Goog...

機械学習ソートLTR:線形モデルを簡単に始める

[[207297]] LTR のエントリーレベルのモデルは線形モデルです。この記事では線形モデルを例...

...

...

英国メディア:シリコンバレーの一部の人々はAIに熱心すぎて「学習は無意味だ」と言っている

6月13日のニュース、人工知能の急速な発展に伴い、シリコンバレーは、人間の行動は予測可能であり、スキ...

Java プログラミング スキル - データ構造とアルゴリズム「バイナリ検索」

[[395207]]必要順序付けられた配列 {1,8,10,89,1000,1234} に対してバ...

再現可能なロボット合成のために化学者とロボットが理解できる汎用化学プログラミング言語

化学合成に関する文献の量は急速に増加していますが、新しいプロセスを研究室間で共有し評価するには長い時...

初心者に適した機械学習アルゴリズムの選び方

この記事の主な対象読者は、機械学習の愛好家やデータサイエンスの初心者、そして機械学習アルゴリズムを学...

AIと機械学習における暗黙のアルゴリズムバイアス

[[226077]]オープンソースコミュニティを通じて何ができるでしょうか?アルゴリズムは私たちの世...

...

Python は R を抜いて、データ サイエンスと機械学習プラットフォームで最も人気のある言語になるのでしょうか?

最近、kdnuggets はデータ サイエンスと機械学習言語の使用に関するアンケート調査を実施しまし...

AI 導入を迅速に進める 5 つの方法

重要な実現技術である AI の急速な成功により、より広範なデジタル変革とイノベーションの取り組みへの...

LLM の 3 つの大きな欠点のうちどれをご存知ですか?

科学: 未来の知覚を持つ汎用 AI は、永遠に慈悲深い存在とはほど遠く、個人データをすべて貪り尽くし...

2020 DIGIXグローバルキャンパスAIアルゴリズムエリートコンペティションが成功裏に終了し、キャンパスのイノベーションを刺激

11月13日〜14日、江蘇省人工知能学会、ファーウェイ端末クラウドサービス、ファーウェイ南京研究所が...