AIが別のAIに命令する、GAN+CLIPの組み合わせで「CGアーティスト」に

AIが別のAIに命令する、GAN+CLIPの組み合わせで「CGアーティスト」に

[[407645]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

GAN によって生成された画像は十分クールだと思いませんか?

データセットを変更する必要はありません。CLIP に与えるコマンドに「 Unreal Engine 」という文字を追加し、CLIP に GAN にコマンドを実行させるだけで、画像がすぐにハイエンドの CG アート スタイルになります。

テキストにUnreal Engineを追加する手法は、Aran Komatsuzaki氏がTwitterで最初に投稿し、CV界隈で多くの注目を集めました。

その後、誰かがこのプロセスをColabに投稿したところ、ネットユーザーは大騒ぎになりました。

「色鉛筆スタイル」も指定できます

あるいは「ジブリスタイル」:

最も驚くべきことは、「3D写真修復」を追加することで、実際に3次元の構成を生成できることです。

CLIP は OpenAI によって開発された、画像の並べ替えを行うモデルです。GAN と連携する方法も非常にシンプルです。

次のように、単純なランダム パターンをシードとして開始します。

このように、CLIP はテキストの説明との類似度スコアを計算し、それを GAN にフィードバックすることで、GAN はスコアの向上を目的として継続的に反復処理を行うことができます。

こうしてAIアーティスト集団が誕生したのです。

プロンプトにスタイル要件を追加するだけでなく、AI に人の名前を直接伝えて、AI の目にその人がどのように見えるかを確認することもできます。

これは、ビットコインの謎の父、サトシ・ナカモトのような、これまで一度も姿を現したことのない大物たちを推測するのにも使えます。

[[407650]]

これは AI の頭の中の Satoshi Nakamoto です。あなたが信じるかどうかは別として、私はとにかく信じます。

オンライントライアル

Colab には VQGAN+CLIP の多くのバージョンがあります。比較した結果、速度と品質の点でより優れた、追加の最適化とプーリング技術を追加したものを選択しました (記事の最後にリンクがあります)。

手順 1 と 2 を順番に実行してください。

ステップ 3 : 使用するモデルを選択します。デフォルトでは、ImageNet でトレーニングされています。

ステップ 4ではパラメータを設定します。通常は、生成するコンテンツを「|」で区切ったテキスト形式で入力するだけです。

高さは生成される画像の解像度を制御し、モデルは使用するモデルを選択できます (手順 3 でダウンロードする必要があります)。

シード番号を変更すると、ランダム画像シードが変更されます。

init_imageで初期イメージを指定することもできます。Colab 環境にイメージをアップロードしてから、リンクを入力する必要があります。

例えば、ある人はそのような画像をイメージシードとして使用し、ポケモンを生成するという新しい遊び方を考案しました。

5 番目のステップが実行され、300 x 300 解像度のグラフを 500 回繰り返すのに数分しかかかりません。

最後に、生成されたプロセスをビデオに合成できます。

とても簡単です。ぜひお試しください。

オンライントライアル:
https://colab.research.google.com/drive/1ZAus_gn2RhTZWzOWUpPERNC0Q8OhZRTZ

VQGAN:
https://github.com/CompVis/taming-transformers

クリップ:
https://openai.com/blog/clip/

<<:  MITとマイクロソフトはAI向けにLeetCodeプログラミング問題集をカスタマイズした

>>:  毛沢東選集と魯迅全集をAIに与えたところ、AIが書いた大学入試のエッセイは非常に適切だった。

ブログ    
ブログ    

推薦する

ハイエンドチップはインテリジェント運転の問題を解決できるでしょうか?

この数か月の「影響」を経て、誰もが半導体不足の事実を十分に認識したと思います。2020年12月以来、...

IDC:2026年までに国内市場の端末のほぼ半数がハードウェアレベルのAIエンジン技術を搭載

市場調査会社IDCは7月25日、近年の人工知能の急速な進化と発展により、ビッグデータモデルはますます...

...

...

ドローンによる配達は近づいているが、商業利用にはまだ問題点を解決する必要がある

都市から農村まで、わが国の宅配便や電子商取引企業がドローン物流と配達に注力したことで、国産ドローンの...

パンデミックの間、AI はどのようにして工場の安全な運営を維持するのに役立つのでしょうか?

[[377897]]新型コロナウイルスの感染拡大が世界中で続く中、多くの企業が業務をリモートワーク...

逆転!清華大学の卒業生の死はグーグルのレイオフとは無関係、家庭内暴力の詳細が明らかに、男性は殺人罪で起訴された

地元警察は、ここ数日話題になっている「グーグルの人員削減により清華大学の夫婦が自殺」事件の詳細を発表...

SparseOcc: 完全にスパースな 3D パノラマ占有予測 (セマンティック + インスタンス デュアル タスク)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ますます大きく、さらに大きく:AI 研究は長期的には行き詰まりに陥るのでしょうか?

[[286629]]ビッグデータダイジェスト制作出典: techtalks編纂者:穆金、曹培鑫、銭...

人工知能の応用、開発、影響についての考察

ケンブリッジ大学人工知能研究センターは、人工知能によってもたらされる新しい能力とそれが直面するリスク...

韓国中央銀行が警告:AIが国内で400万の雇用を奪う可能性

IT Homeは11月16日、韓国銀行が最近、人工知能(AI)が労働市場に与える影響に関する調査報告...

粒子ロボットの出現はロボットの自己認識覚醒の危機をもたらすかもしれない

11月3日、2019年テンセントサイエンスWEカンファレンスで、世界中の科学者が細胞治療、脳チップ、...

非常に効率的な人工知能チームを構築するにはどうすればよいでしょうか?

翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟導入この記事では、機械学習のインフラ、従業員、プロセスを統...