この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 GAN によって生成された画像は十分クールだと思いませんか? データセットを変更する必要はありません。CLIP に与えるコマンドに「 Unreal Engine 」という文字を追加し、CLIP に GAN にコマンドを実行させるだけで、画像がすぐにハイエンドの CG アート スタイルになります。 テキストにUnreal Engineを追加する手法は、Aran Komatsuzaki氏がTwitterで最初に投稿し、CV界隈で多くの注目を集めました。 その後、誰かがこのプロセスをColabに投稿したところ、ネットユーザーは大騒ぎになりました。 「色鉛筆スタイル」も指定できます あるいは「ジブリスタイル」: 最も驚くべきことは、「3D写真修復」を追加することで、実際に3次元の構成を生成できることです。 CLIP は OpenAI によって開発された、画像の並べ替えを行うモデルです。GAN と連携する方法も非常にシンプルです。 次のように、単純なランダム パターンをシードとして開始します。 このように、CLIP はテキストの説明との類似度スコアを計算し、それを GAN にフィードバックすることで、GAN はスコアの向上を目的として継続的に反復処理を行うことができます。 こうしてAIアーティスト集団が誕生したのです。 プロンプトにスタイル要件を追加するだけでなく、AI に人の名前を直接伝えて、AI の目にその人がどのように見えるかを確認することもできます。 これは、ビットコインの謎の父、サトシ・ナカモトのような、これまで一度も姿を現したことのない大物たちを推測するのにも使えます。 これは AI の頭の中の Satoshi Nakamoto です。あなたが信じるかどうかは別として、私はとにかく信じます。 オンライントライアルColab には VQGAN+CLIP の多くのバージョンがあります。比較した結果、速度と品質の点でより優れた、追加の最適化とプーリング技術を追加したものを選択しました (記事の最後にリンクがあります)。 手順 1 と 2 を順番に実行してください。 ステップ 3 : 使用するモデルを選択します。デフォルトでは、ImageNet でトレーニングされています。 ステップ 4ではパラメータを設定します。通常は、生成するコンテンツを「|」で区切ったテキスト形式で入力するだけです。 幅と高さは生成される画像の解像度を制御し、モデルは使用するモデルを選択できます (手順 3 でダウンロードする必要があります)。 シード番号を変更すると、ランダム画像シードが変更されます。 init_imageで初期イメージを指定することもできます。Colab 環境にイメージをアップロードしてから、リンクを入力する必要があります。 例えば、ある人はそのような画像をイメージシードとして使用し、ポケモンを生成するという新しい遊び方を考案しました。 5 番目のステップが実行され、300 x 300 解像度のグラフを 500 回繰り返すのに数分しかかかりません。 最後に、生成されたプロセスをビデオに合成できます。 とても簡単です。ぜひお試しください。 オンライントライアル: VQGAN: クリップ: |
<<: MITとマイクロソフトはAI向けにLeetCodeプログラミング問題集をカスタマイズした
>>: 毛沢東選集と魯迅全集をAIに与えたところ、AIが書いた大学入試のエッセイは非常に適切だった。
ディープラーニングの歴史において、ニューラルネットワーク方式が有効になり始めたのは1980~1990...
導入ノートパソコン、スマートフォン、センサーはすべて、モノのインターネット向けに大量のデータを生成し...
経済学者が懸念している大きな問題は、人工知能が雇用にどのような影響を与えるかということです。人工知能...
今日のデジタル化が進む世界では、人工知能は私たちの日常生活に欠かせないものとなっています。特に、プロ...
Google はブログ投稿で、同社の AI がさまざまな要素を分析して、こうした更新を行うべきかどう...
2021年、国内の新エネルギー乗用車市場はチップ不足や電池原材料価格の高騰など予想外の事態に見舞わ...
「汎用人工知能」に関しては、OpenAIの科学者カルパシー氏が説明を行った。数日前、Karpathy...
AIベースの機密情報検出サービスプロバイダーであるText IQのCEO、Apoorv Agarwa...
人工知能の計算能力に対する需要は弾力性と拡張性があり、ピーク需要に耐える能力と日常使用中に調整する能...
[[404075]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
最近、NVIDIA Blog は「ライト、カメラ、AI: Cambridge Consultants...
多項式回帰は線形回帰の改良版です。線形回帰を知っていれば、簡単に理解できるでしょう。そうでない場合は...
自動運転技術が業界全体で開発のマイルストーンに到達し続ける一方で、都市は自動運転車(AV)の目標を補...