漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

漫画は爆発的な効果でAIに変身し、サーバーが何度も圧倒された

[[436077]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

1,241人が列に並び、2,600秒待ちました...」

——ネットユーザーは、アニメで自分がどのように見えるかを知るために本当に一生懸命努力しています!

「The Originator」は肖像画を漫画に変換できるジェネレーターです。

たった一枚の写真や動画で、老若男女、有名人やアマチュアを問わず、誰もが自分だけの「アニメスタイル」を見ることができます~

「国民の妻」王冰冰とは:

「国民の妹」 IUとは:

テクノロジー界の大物、EDGのメンバー、金髪美女、ロンママ…

髪の毛や眉毛、目に宿る感情までもが鮮やかに「描かれて」います…

△ ビデオエフェクト

ネットユーザーがサーバーを圧倒したのも不思議ではない。

皆さんの作品をパラパラとめくるだけでも、終わりがないほど奥が深い作品ばかりです。

GitHub 上の関連プロジェクトを見ると、確かにトレンドリストのトップにありました。

このAnimeGANは本当にすごいです!

アニメのような顔を作るにはどうすればいいですか?

表示されたエフェクトを確認した後、あなたも自分の漫画の顔を作成してみませんか?

これは可能です。今からステップごとにお教えします。

最初の方法は非常に簡単です。写真をアップロードするだけです。

オンラインゲームプレイを提供するウェブサイト(記事末尾のリンクを参照)は有名なHugging Faceです。

特別にオンライン AnimeGANv2 アプリがオープンし、そこに写真を「投げ込む」だけで済みます。

しかし! ! !

先ほども述べたように、AI は現在非常に普及しており、単純なオンライン方式はキューイングと同等です。

ほら、 5259秒待った後でも、まだ15人が先にいるよ...

列に並びたくない場合はどうすればいいですか?

次に、2 番目の方法であるcodeを使用します。

3時間待った後、熱心なネットユーザーはついに我慢できなくなり、 Colabバージョンを強く推奨しました(記事の最後にあるリンクを参照)。

まずドキュメント内の最初の 2 つのコード スニペットを実行し、次に写真のパスを変更します。

もちろん、チャレンジの難易度を上げたい場合は、AnimeGANv2 の GitHub プロジェクトもあります。

上記の方法はすべて画像変換に基づいています。ビデオを使用する場合は、AnimeGANv2 プロジェクトで次の 2 つのコマンドを実行します。

もちろん、このプロジェクトの Pytorch 実装もありますが、 Pytorch バージョンは現在画像変換のみをサポートしています。ビデオを変換したい場合は、当面は自分でスクリプトを作成する必要があります。

スタイル転送 + GAN

では、この効果の原理は何でしょうか?

AnimeGAN は、ニューラル スタイル転送と生成的敵対ネットワーク (GAN) の組み合わせを使用する、武漢大学と湖北理工大学の研究です。

これは実際にはCartoonGANをベースにした改良版であり、より軽量なジェネレーターアーキテクチャを提案しています。

AnimeGAN のジェネレーターは、標準畳み込み、深さ方向に分離可能な畳み込み、逆残差ブロック、アップサンプリング、およびダウンサンプリング モジュールで構成される対称エンコーダー/デコーダー ネットワークとして考えることができます。

ジェネレーターのパラメータ数を効果的に削減するために、AnimeGAN ネットワークでは 8 つの連続した同一の IRB (反転残差ブロック) が使用されます。

ジェネレーターでは、1×1 カーネルを持つ最後の畳み込み層は正規化層を使用せず、その後に tanh 非線形活性化関数が続きます。

上図で、K はカーネルサイズ、C は特徴マップの数、S は各畳み込み層の範囲、H は特徴マップの高さ、W は特徴マップの幅、Resize 値は特徴マップサイズの補間方法を設定するために使用されます。⊕ は要素ごとの追加を表します。

この V2 バージョンは AnimeGAN の第 1 世代に基づくアップグレードであり、主にモデルによって生成された画像の高周波アーティファクトの問題を解決します。

具体的には、生成された画像にネットワークが高周波アーティファクトを生成するのを防ぐために、特徴のレイヤー正規化を使用するという対策が取られます。

著者は、レイヤー正規化により、特徴マップ内の異なるチャネルに同じ特徴属性分布を持たせることができ、局所的なノイズの発生を効果的に防ぐことができると考えています。

AnimeGANv2 のジェネレータパラメータのサイズは 8.6MB ですが、AnimeGAN の場合は 15.8MB です。

2 つで使用される識別器はほぼ同じですが、違いは AnimeGANv2 がインスタンス正規化ではなくレイヤー正規化を使用することです。

ネットユーザー:私はより美しくなった

このAIは多くのファンを魅了しました。

一部のネットユーザーが「二次元に突入」した後、その驚くべき美しさを発見した。

私を美しくしてくれます!

そして彼は誇らしげに漫画の顔を披露しました。

ビル・ゲイツの影響を見て、一部のネットユーザーは次のように叫んだ。

空!ゲイツはスマートでセクシーに見えます。

著者: より優れた生成効果を備えた AnimeGANv3 が近日登場予定

AnimeGANのオリジナル作者は、湖北理工大学のLiu Gang准教授とChen Jie博士、そして彼らの学生Xin Chenの3人です。

このプロジェクトの誕生は、主にチームメンバーの個人的な興味、つまり二次元オタク文化と芸術への愛情によるものです。

著者の一人であるChen氏によると、AnimeGANとAnimeGANv2はそれぞれ完成までに2〜3か月かかり、その過程で多くの困難に遭遇したという。

これには、ハードウェア リソースの極端な不足も含まれていました。たとえば、AnimeGAN に使用された NVIDIA シングル カード サーバーは、同校の芸術デザイン学部の学部長である Rao Jian 教授によって提供されたものであり、同教授が担当する研究でも、実験を実行するために他の学生からマシンを借りることに依存していました。

AnimeGANv2 の時点では、シングル カード 2080ti サーバーは 1 つしかありませんでした。

しかし、すべての努力が無駄になったわけではありません。現在、AnimeGAN は多くの注目を集め、多くの人に好かれており、Chen 氏と彼のメンター チームは大きな達成感を感じています。

ご存知、新海誠監督もAnimeGANの作品をリポストしています。

しかし、この興味主導の科学研究プロジェクトは単なる楽しみのためではありません。

チームとの会話の中で、彼らはこう言いました。

主な目標は、学術論文をマイルストーンとして使用することであり、最大の期待は、プロジェクトが設計され、実際のアプリケーションで実装できることです。

そして次はAnimeGANv3が間もなく登場します

次に、ネットワーク サイズをより小さくし、おそらく 4M 程度にまで縮小します。同時に、AnimeGANv2 のいくつかの欠点 (たとえば、v2 では元の画像の詳細が保持されすぎている) を解決し、生成されるアニメーション効果の品質を高めます。

これは、AnimeGANv3 が商業的に実行可能であることも意味します。

AnimeGANv3が完成した後も、人間の顔をアニメーションに変換するためのアルゴリズムの最適化を継続していく予定です。

もう一つ

最後に、始める前に、AnimeGAN によって示される効果は比較的良好であるものの、大きな前提があることに注意する必要があります。

写真は高解像度で、顔の特徴が可能な限り鮮明である必要があります。

そうしないと画風がおかしくなるかもしれない(作者が実際に試してみたところ、泣きそうになったが涙は出なかった)...

それで、漫画の中であなたはどんな感じですか?

今すぐ試してみて〜

オンラインデモ:

https://huggingface.co/spaces/akhaliq/AnimeGANv2

Colabバージョン:

https://colab.research.google.com/drive/1jCqcKekdtKzW7cxiw_bjbbfLsPh-dEds?usp=sharing#scrollTo=niSP_i7FVC3c

GitHub アドレス:

https://github.com/TachibanaYoshino/AnimeGANv2

https://github.com/bryandlee/animegan2-pytorch

<<:  画像はさまざまな方法で変更できます。NVIDIAはGANを使用して高精度のディテールレタッチを実現

>>:  また一人の科学者が学界に復帰、AI産業の発展は冷え込みつつあるのか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

デザイナーに必須の AI ツール 11 選

翻訳者 |ブガッティレビュー | Chonglou急速に進化する今日のデザイン環境において、人工知能...

...

人工知能専攻にはどのような専攻が含まれますか?見通しはどうですか?

人工知能にはどのような専攻が含まれますか?人工知能に関連する研究方向には、パターン認識とインテリジェ...

このモデルはGAN、ETH超解像モデルSRFlowよりも想像能力が強い

最近、ETH チューリッヒのコンピューター ビジョン研究所の研究者が超解像度モデル SRFlow を...

...

5つのユニークで興味深いChatGPTコマンド

今日は、非常に実用的な 5 つの指示を紹介します。これらの指示は、出力コンテンツの一貫性、記事のスタ...

ディープニューラルネットワークを使用してNER固有表現抽出の問題を解決する

この記事は次のように構成されています。固有表現抽出 (NER) とはどのように識別しますか? cs2...

GPT-3 の推論高速化は NVIDIA のソリューションを 50% 上回ります。大規模モデル推論システムEnergon-AIオープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能時代に対応するための知識と技術の蓄積を向上させる

記者がインタビューした専門家によると、人工知能などの知能化技術の応用が加速するにつれ、雇用への構造的...

AIがフィンテックを変える4つの方法

[[432805]]金融業界の企業は、人工知能 (AI) を使用して複数のソースからのデータを分析お...

...

マスク氏はSpaceXの有能なインターンを称賛した。彼は放課後にAIを使ってElder Scrollsを解読し、Nature誌の表紙を飾った。

ネイチャーの公式サイトのトップページには、世界に衝撃を与えた最新の考古学的発見が掲載された。 200...

製造バリューチェーンにおいて RPA に真のチャンスはあるのでしょうか?

製造業における自動化の推進力は非常に単純です。自動化は人間の作業をシミュレートするため、人間は製造バ...

マスク氏は世界一の富豪の称号を失い、4000億ドルの高額報酬計画は却下され、テスラの登録地をテキサスに変更する予定

マスク氏は怒り、残酷なことを言った。 決してデラウェア州に法人を登録しないでください。 州裁判所はテ...