AIは50個の三角形を使って、ポストモダンな雰囲気を持つモナリザの抽象版を描きます

AIは50個の三角形を使って、ポストモダンな雰囲気を持つモナリザの抽象版を描きます

[[425382]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

さて、AI にフレーズと 50 個の三角形を与えると、ミニマリストの抽象画を作成できます。

「猫の絵」と入力するだけで、角張ったクールな抽象的な猫が生成されます。

この一般的な概念だけでなく、特定の語彙が与えられれば、この AI は絵画を指定することもできます。

例えば、「ウォルト・ディズニー・ワールド」と入力すると、50 個の三角形が即座に再配置され、まったく異なるスタイルのディズニー城の抽象バージョンが目の前に現れます。

まさにディズニーキャッスルの真髄を捉えていると言えるでしょう。

上記の「傑作」はすべて、実際には進化戦略(ES) とCLIPの組み合わせによって生成された結果であり、Google Brain チームによって制作されています。

彼らは2つのAIを連携させ、テキストプロンプトと特定の画像に基づいて、多数の三角形を使用して一連の特徴的な抽象画を作成しました。

抽象化された Google ビルは次のようになります。

それらは互いに無関係であるとは言えませんが、全く同じであるとしか言えません。

[[425387]]

今回は、本当にポストモダンアートの雰囲気が少しあります。

三角形のみで描かれた抽象画

生成された効果から、ES アルゴリズム + CLIP が実際に多数のランダムな三角形を再配置し、サイズ、位置、色を調整することで、指定された語彙に一致するイメージに徐々に構築していることがわかります。

具体的には、最初に、ES アルゴリズムは三角形の座標と RGBA 値をパラメーターとして使用し、キャンバス上にいくつかの三角形をランダムに割り当てます。

進化戦略(ES) アルゴリズムの原理は進化理論に似ています。与えられた情報に基づいて、最適なソリューションが得られるまで継続的に最適化することができます。

CLIP は、OpenAI によって開発された、画像の並べ替えを担当するモデルです。

ES アルゴリズムによって与えられた三角形の画像とテキストの説明の類似性をスコア化し、その結果を ES アルゴリズムにフィードバックします。ES アルゴリズムは繰り返し処理を行ってスコアを改善し、最終的に芸術的な絵画を完成させます。

テキストによる指示だけでなく、初期情報として画像を与え、ES アルゴリズムのみを使用して描画することもできます。

50 個の三角形を使用し、10,000 回繰り返した後、モナリザのポストモダン抽象バージョンが誕生しました。

三角形をさらに追加すると、アルゴリズムはより良い結果をもたらします。

以下の比較では、三角形の数が 200 に達すると、生成された画像にすぐに多くの詳細が追加されます。

ダーウィンとモナリザの場合、適応度はほぼ100%に達しました。

さらに、より良い結果を得るために、研究者らはClipUp オプティマイザーも採用しました。

比較すると、オプティマイザーを使用した10,000回の反復後の効果は、基本アルゴリズムの560,000回の反復後の効果よりも優れていることがわかります。

同時に、グラデーションベースのレンダリング方法と比較して、ES アルゴリズムのパフォーマンスも顕著です。

レンダリング方法はテクスチャと色の改良に重点を置きますが、ES アルゴリズムはこれらの三角形をどのようにレイアウトするかに重点を置きます。

では、テキストによる指示を与えるとどのような効果があるのでしょうか?

「自分」、「人間」、「ウォルト・ディズニー・ワールド」の場合でも、アルゴリズムのパフォーマンスは非常に良好でした。

三角形の数が増えるにつれて、アルゴリズムはキーワードテーマの本質を捉えながら、より詳細な結果を生成します。

しかし、「東京の写真」の場合、それほど良い結果は出ません。

研究者たちは、これはアルゴリズムが暗い影のある三角形を生成するのが難しいためだと考えている。

さらに、命題割り当てに直面した場合、アルゴリズムは異なる答えを出そうとします。

これらのケースの 4 つの繰り返しテストでは、生成された画像に明らかな違いがあることがわかります。

デモ版はお試しいただけます

実は、CLIP が他の AI にペイントを「指示」したのはこれが初めてではありません。

以前はGANと連携することで、画像をCGアートスタイルに変換していました。

実は今回も抽象画効果を体験できます。

チームはコードをオープンソース化しており、Colab で試すことができます (リンクは記事の最後に添付されています)。

これはネットユーザーがアップロードした画像です。効果は実に素晴らしいです。これが誰だかわかりますか?

論文リンク:
https://arxiv.org/abs/2109.08857

GitHub オープンソース アドレス:
https://github.com/google/brain-tokyo-workshop/

トライアルリンク:
https://colab.research.google.com/drive/1DGNxs8E4cA_ZUwPQdusxDArCWj-JX5TG#scrollTo=7AkoGodQw8kr&uniqifier=4

<<:  リザーブプールコンピューティングにおける新たなブレークスルー:ニューロン数が少なくなり、コンピューティング速度が最大100万倍に高速化

>>:  AIがIT業界とAV業界にもたらす変化

推薦する

2027年のAIはどのようになっているでしょうか?ヒントは、あなたの脳の中にあります。

やっていることをやめて、窓の外の鳥やリス、昆虫などを眺めてみましょう。これらの生物は、食物を見つけた...

人間の敵の99.8%を圧倒する星間AIがネイチャー誌に登場、その技術が初めて完全公開された

StarCraft 2 のプレイヤーのうち、AI にまだ負けていないのはわずか 0.2% です。これ...

WebGPT について簡単に説明してください。学びましたか?

原作者: エベネザー・ドン元のアドレス: https://blog.logrocket.com/in...

米軍のAIブラックテクノロジー:暗闇でも正確に顔を認識できる。これに不安を感じる人はいるだろうか?

[[227002]]今日お話しするのは、「そんな手術があるの?」と第一印象でとても驚く内容ですが、...

ニッチから人気へ: 世界的な AI イノベーションが「ソフト」になった理由

この人工知能の波が出現したとき、世界中の AI 研究所が競争を重視していたことを今でも覚えています。...

マスク氏の最新インタビュー:自動運転、AI、テスラのヒューマノイドロボットについて

最近、世界一の富豪イーロン・マスク氏がTEDディレクターのクリス・アンダーソン氏が主催する独占インタ...

アイティ族テクニカルクリニック第6回

【51CTO.comオリジナル記事】 [51CTO オリジナル記事、パートナーサイトに転載する場合は...

ドローンは電力網を守り、点検や障害物の除去も可能!

[[412066]]現在、全国的に気温が上昇し続けているため、私の国では電力消費のピークの新たな波...

エンタープライズ ネットワーク セキュリティにおける AI アプリケーションについてご存知ですか?

企業のセキュリティ システム開発のペースが加速するにつれて、より高度な新しいタイプのサイバー攻撃が出...

10分で多言語チャットボットを作成する方法

[51CTO.com クイック翻訳]チャットボットは、人間との会話を自動的に行い、組織と顧客間のビジ...

ローコード自動化が銀行業務をどう変えるか

基本的な当座預金口座の機能に関しては銀行間でほとんど違いがないため、各銀行は顧客にさらに多くの機能を...

EU、生成AIツールの規制について暫定合意に達する:これまでで最も包括的な規則

12月9日、ワシントンポスト紙やエンガジェットなどの海外メディアの報道によると、世界各国がAIの急速...

RPA 導入が失敗する 7 つの理由

ロボティック・プロセス・オートメーションは現在、業界全体のデジタル化を推進するデジタル変革の中核とな...

...