AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

[[417713]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AIはすでに油絵の描き方を教えることができます。

任意の画像を入力すると、数秒以内にストロークのシーケンスが表示されます。

たとえば、世界的に有名な絵画「モナ・リザ」。

あるいはリアルな鳥。

雰囲気を盛り上げる川灯籠もあります。

つまり、どんなスタイルでもコントロールできるのです。

このテクニックは、21 時間以内に Reddit で 600 件以上のいいねを獲得しました。

どうやって作られたのですか?

フィードフォワードネットワークによるストロークの予測

ニューラル ペインティングは、与えられた画像に対して一連のストロークを生成し、ニューラル ネットワークを使用して絵画のような方法でリアルな再現プロセスを実行するプロセスです。

研究チームは、フィードフォワード ネットワークを使用してストロークのパラメーターを予測する、Paint Transformer と呼ばれるトランスフォーマー ベースのフレームワークを提案しました。

現在、Paint Transformer をトレーニングするためのデータセットがないため、研究者はオブジェクト検出にヒントを得た自己トレーニング パイプラインを設計しました。

モデル全体は、ストローク予測モジュールとストローク レンダラーの 2 つのモジュールで構成されています。

ストローク予測子は、ターゲット イメージと中間キャンバス イメージが指定されると、現在のストローク セットを決定するための一連のパラメーターを生成します。

予測子は、特徴埋め込み用の 2 つの CNN ネットワークと、パラメータ予測用のトランスフォーマーで構成されます。

次に、ストローク レンダラーはストローク セット内の各ストロークのストローク イメージを生成し、キャンバスに描画して、サイズが512 x 512の結果イメージを生成します。

DETR (Object Detection with Transformer) に基づいて、ストロークを保持する必要があるかどうかを予測するためのバイナリ ニューロンが追加されます。

これにより、既存のデータセットがなくてもトレーニングが可能になり、優れた一般化機能を実現できます。

実験では、このアプローチは、トレーニングと推論のコストが低く、従来の方法よりも優れたペイント パフォーマンスを実現することが示されています。

Baidu NDUチームによって作成

この技術は、百度、南京大学、ラトガース大学が共同で開発した。

コードはオープンソース化され、Yike フォトアルバム アプリに適用されました。

論文の宛先:
https://arxiv.org/abs/2108.03798
GitHubのURL:
https://github.com/wzmsltw/PaintTransformer

<<:  人工知能によって破壊される可能性のある7つの業界

>>:  人工知能が高齢者の日常生活に影響を与えないようにする

ブログ    
ブログ    
ブログ    

推薦する

...

...

「スマートストア」のAIカメラは何ができるのか?

スマートシティが理論的な概念から正式な計画と建設へと進化するにつれて、スマートストアはスマートシティ...

AIアーキテクトとはどのような人達でしょうか?

アシュトーシュ・グプタ翻訳者: ブガッティ企画丨孫淑娥亮策要するに:人工知能 (AI) プロジェクト...

IoTセキュリティ戦略における機械学習の重要性

機械学習は、自動化と異常な動作の検出を通じて、よりスケーラブルかつ効率的に IoT デバイスを保護す...

...

MITは、大規模な問題を解決するにはアルゴリズムがハードウェアよりも有用であることを証明した。

[[425167]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

Meta はヘッドマウントディスプレイを使用して全身のモーショントラッキングを実現します。脚の情報なしで正確な姿勢推定

ヘッドセットにより、Meta は新たな命を吹き込まれます! SIGGRAPH 2023 カンファレン...

自分の写真がディープフェイクに使われるのではないかと心配ですか?ボストン大学の新しい研究を試してみてください

顔を入れ替えた動画は、DL を悪用した大きな結果です。インターネット上にあなたの写真がある限り、あな...

...

暗号化アルゴリズムの将来と現状の簡単な分析

[[357912]]現在最も一般的に使用されている暗号化アルゴリズムは、一方向暗号化と双方向暗号化に...

LLaMAが使用するオープンソースデータセットは棚から削除されました。これには約20万冊の本が含まれており、OpenAIデータセットに匹敵します。

オープンソースのデータセットは著作権侵害のため棚から削除されました。例えば、LLaMA、GPT-J ...

AIはソフトウェアテスターの仕事を「奪う」のでしょうか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

人工知能が社会にもっと役立つように

[[355038]]ビッグデータ時代には、「顔」が重要なデータ情報です。顔認識技術は、その独自性と優...

「初の顔認証事件」の最終判決がこちら

[[392244]] 4月9日午後3時、「初の顔認識事件」は杭州市中級人民法院で二審判決を受けた。こ...