AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

[[417713]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AIはすでに油絵の描き方を教えることができます。

任意の画像を入力すると、数秒以内にストロークのシーケンスが表示されます。

たとえば、世界的に有名な絵画「モナ・リザ」。

あるいはリアルな鳥。

雰囲気を盛り上げる川灯籠もあります。

つまり、どんなスタイルでもコントロールできるのです。

このテクニックは、21 時間以内に Reddit で 600 件以上のいいねを獲得しました。

どうやって作られたのですか?

フィードフォワードネットワークによるストロークの予測

ニューラル ペインティングは、与えられた画像に対して一連のストロークを生成し、ニューラル ネットワークを使用して絵画のような方法でリアルな再現プロセスを実行するプロセスです。

研究チームは、フィードフォワード ネットワークを使用してストロークのパラメーターを予測する、Paint Transformer と呼ばれるトランスフォーマー ベースのフレームワークを提案しました。

現在、Paint Transformer をトレーニングするためのデータセットがないため、研究者はオブジェクト検出にヒントを得た自己トレーニング パイプラインを設計しました。

モデル全体は、ストローク予測モジュールとストローク レンダラーの 2 つのモジュールで構成されています。

ストローク予測子は、ターゲット イメージと中間キャンバス イメージが指定されると、現在のストローク セットを決定するための一連のパラメーターを生成します。

予測子は、特徴埋め込み用の 2 つの CNN ネットワークと、パラメータ予測用のトランスフォーマーで構成されます。

次に、ストローク レンダラーはストローク セット内の各ストロークのストローク イメージを生成し、キャンバスに描画して、サイズが512 x 512の結果イメージを生成します。

DETR (Object Detection with Transformer) に基づいて、ストロークを保持する必要があるかどうかを予測するためのバイナリ ニューロンが追加されます。

これにより、既存のデータセットがなくてもトレーニングが可能になり、優れた一般化機能を実現できます。

実験では、このアプローチは、トレーニングと推論のコストが低く、従来の方法よりも優れたペイント パフォーマンスを実現することが示されています。

Baidu NDUチームによって作成

この技術は、百度、南京大学、ラトガース大学が共同で開発した。

コードはオープンソース化され、Yike フォトアルバム アプリに適用されました。

論文の宛先:
https://arxiv.org/abs/2108.03798
GitHubのURL:
https://github.com/wzmsltw/PaintTransformer

<<:  人工知能によって破壊される可能性のある7つの業界

>>:  人工知能が高齢者の日常生活に影響を与えないようにする

ブログ    

推薦する

...

...

マイクロソフトはBing Chatを今後も無料のままにすると約束

近年、OpenAI、Microsoft、Google など多くの企業やスタートアップチームが独自のチ...

機械学習の謎を解く: プログラムはどのようにして自分自身を作成するのか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

AI、ブロックチェーン、IoT、5Gの未来は統合だ

企業は業務を最適化し、現在の誇大宣伝サイクルを活用するために AI の導入に躍起になっています。報告...

ロシアの国家人工知能戦略についての考察

各国は独自の野心的な国家人工知能戦略を発表しており、ロシアも例外ではない。ロシアが今後10年間に人工...

Google Bard が中国語をサポートするようになりました!レベル10をクリアして、ミームを理解し、無料で試してみましょう

数日前、ChatGPTの最も強力なライバルであるClaudeが第2世代にアップグレードされ、Goog...

興味深い微表情とAI技術

イギリスの企業が、人が正直に話しているかどうかを識別できるシステムを発明したと言われています。また、...

...

人工知能(AI)と機械学習(ML)の最新動向

[[422288]]人工知能 (AI) には、分析モデルの構築を自動化する機械学習 (ML) を含む...

ナノロボットは本当に伝説通り魔法の力を持つのでしょうか?

「ナノロボット」は映画やSF小説に頻繁に登場するキャラクターで、何度も登場して驚くべきスキルを発揮...

階段を登るための最小コストを使用するデータ構造とアルゴリズム

[[443068]]最小限のコストで階段を登るLeetCode の問題へのリンク: https://...

...

サービスロボットは驚異的なユニコーンを生み出すことができるか?

サービスロボットはニッチな領域を超えつつあるようだ。まず、2018年の世界ロボット産業の市場規模は2...

あなたは「オアシス」からどれくらい離れていますか? テクノロジーオタクが世界を救う方法をご覧ください

【元記事は51CTO.comより】最近、VR熱血ゲームを題材にした映画『レディ・プレイヤー1』が主要...