サーバーが過負荷状態です! GANで生成された肖像油絵は人気があり、一瞬でルネッサンス時代に戻ることができます

サーバーが過負荷状態です! GANで生成された肖像油絵は人気があり、一瞬でルネッサンス時代に戻ることができます

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

GAN に写真を与えると、ルネッサンス時代に戻って肖像画に変えることができます。

いいえ、それはスタイル、移行です。この絵はGAN自身が描いたものです。

ご覧の通り、チェック柄のシャツを着たウディ・アレンは、元々の学者風の見た目を保ちながら、瞬く間に貴族的な気質を獲得しています。

MITとIBM Watson Joint Laboratoryは、オンラインでプレイできる「AI Portraits Ars」というペインターをリリースしました。

しかし、生成された肖像画があまりにもリアルで生き生きしていたため、オンラインに公開されるとすぐにネットユーザーからのコメントが殺到し、3日も経たないうちにサーバーがクラッシュした。

[[271646]]

この高性能 AI は、写真で絵を描くだけでなく、ビデオを見ることもできます。

それは1960年の映画『サイコ』だった。怯えたヒロインは、画家の筆によってずっと落ち着いて見えるようになった。

瞬きをしたり頭を動かしたりしても、AI が生成したポートレートは自然なままです。姿勢の変化によって他の人が描かれることはありません。

人種の境界と次元の壁を突破する

様式化されたAIはたくさんあるのに、なぜこの自画像AIが人気なのでしょうか?

AI Portrait Arsの他の作品も見てみましょう。

威厳のある顔としっかりした目を持つ AI の筆は、この有名な女性の気質をまったく損なうことはなかった。

女性を描くのが得意な AI は、男性を描くときも同様に優れたパフォーマンスを発揮します。

この憂鬱で深みのある顔は、若い頃のプーチン大統領とまったく同じだ。

ルネッサンス時代、有色人種は自分の絵画を残すことができませんでしたが、ここAI Portrait Arsでは、芸術にはまったく境界がありません。

アフリカ系アメリカ人の兄弟の肖像画は非常に表現力豊かです。

我々のアジアの同胞も例外ではありません。

青い男、問題ない:

AI Portrait Ars は、3 次元の人間を平等に扱うだけでなく、2 次元のキャラクターをルネッサンス時代に戻すこともできます。

シムズ4

ファイナルファンタジーXIV

AIのペンの下で、二次元の人間の目も話すことができるようになるとは思いませんでした。

公式紹介によると、AI Portrait Ars は現在、人間向けにペイントすることしかできないそうです。

しかし、ネットユーザーによるテストによると、犬の肖像画も生成されることがあるそうです。

それどころか、ちょっとしたトラブルに遭遇した人間もいました。

顔が検出されませんでしたハハハハハ

面白いのは、幸せそうに笑っている自分の写真を入力しても、AI Portrait Ars はあなたをより真剣な顔に仕上げる傾向があることです。

それはデータセットの問題に違いありません。貴族は絵画の中で笑うことは許されていません。

その効果は素晴らしいので、世界中の友人がその虜になっているのも不思議ではありません。しかし、別の人気の顔を変えるアプリ「FaceApp」がプライバシーの懸念から警告を受けたことを考えると、人々が少し心配するのも無理はありません。

AI Portrait Ars の著者たちはすでにこの問題について考えていました。ユーザーがアップロードした写真は、画像が生成されるとすぐにサーバーから削除されることを保証します。

さらに、AI によって生成された画像には追加の識別情報は含まれません。

The Vergeは次のようにコメントした。

AI Portrait Ars はあなたのデータを盗むことはありませんが、あなたの魂を盗む可能性があります。

これはGANであり、スタイル転送ではない

研究チームは4万5000枚の肖像画を使ってAI画家を訓練したという。

さまざまなスタイルの絵画とさまざまなレベルの抽象化を習得します。

たとえば、髪の毛が(おそらく)どんどん薄くなってきているこの男性が空を見上げて笑うと、その笑顔は油絵からスケッチに変わります。

たくさんの人間の絵を栄養として、GAN はどうやって独自の絵を生成するのでしょうか?

GAN には、画家であるジェネレーターと、ジェネレーターの絵画が人間の作品であるかどうかを識別する役割を担う鑑定家である識別器があります。

ジェネレーターには潜在的な空間があり、そこには何千もの AI 肖像画が含まれており、それらはすべて異なるベクトルを使用して人間の絵画から変更されています。

そして、写真を元に肖像画を生成するために、数千万枚のAI肖像画の中から写真に最も近いものにベクトル(潜在ベクトル)をマッピングします。

では、ベクトルと写真が類似しているかどうかを確認するにはどうすればよいでしょうか?チームは、写真からベクトルを近似し、それを使用して潜在空間内で最も適切なベクトルを見つけることができるインバーターを設計しました。

チームは、これはスタイルの転送ではないことも特に強調しました。

GAN によって生成された画像では、顔のラインが再設計されています。

どのスタイルを使用するかはモデル自体が決定します。だから、油絵を描く人もいれば、スケッチを描く人もいるのです。

AIが絵画スタイルを選択する方法について。研究者らは、顔の詳細だけでなく背景の詳細​​もAIの判断に役立つだろうと述べている。

対照的に、スタイル転送では通常、色が大きく変化しますが、写真の他の特徴はほとんど変化しません

例えば、スタイルが転写されると、女の子は次のようになります。

これをAI Portraits Arsに渡すと、女の子は次のようになります。

さらに、油絵であっても、時代や画家によって筆致が異なります。

たとえば、「AI Portraits Ars」の各作者は、それぞれ異なるスタイルで、AI に自分自身を絵画に変えてもらいます。

もう一つ

ただし、この AI は非常に人気があったため、メンテナンスのためにオフラインにする必要がありました。

でも心配しないでください。ウェブサイトでは「すぐに戻る」と発表されています。

なので、最初にマークを付けておく方が良いでしょう。

ポータル:

https://aiportraits.com/

<<:  プログラマーが夜遅くにPythonでニューラルネットワークを実行し、中学生のようにデスクランプを消す

>>:  Face-api.jsフレームワークに基づいて、顔認識はフロントエンドで完了します

ブログ    
ブログ    

推薦する

...

テクノロジーから製品まで、Apple Siriのディープラーニング音声合成技術の秘密が明らかに

[[201603]] Siri は、音声合成技術を使用して人間とコミュニケーションをとるパーソナルア...

NLP モデルは人間の言語を理解できないのでしょうか? Microsoft AdaTestはエラーの検出効率が5倍向上

自然言語処理 (NLP) モデルは人間の言語を理解できず、テキストを反対の意味として解釈しますが、こ...

C++開発におけるデータ構造とアルゴリズムの分離についての簡単な説明

Windows でプログラムを書いたことがある人なら、誰でも多かれ少なかれビットマップを使ったことが...

もう感情を隠せない?歩く姿勢からAIがわかる!

歩き方は人それぞれ違います。歩き方は、その時々の気分など、あなたに関する秘密を明らかにします。たとえ...

人工知能とブロックチェーン技術は芸術をどのように解放できるのでしょうか?

2022年において、アートがテクノロジーから切り離されていることを想像するのは難しいです。 AI、...

マイクロソフトは財務部門向けに特化されたAIツールをカスタマイズ

3月1日木曜日の米国時間のニュースで、マイクロソフトは企業顧客の財務部門向けの人工知能ツールを披露し...

...

人工知能をゼロから学ぶのは難しくない

「人工知能」という用語は、1956年にダートマス協会で初めて提案されました。それ以来、研究者は多くの...

人工知能の時代では、次の7つの重要な要素を念頭に置く必要があります

政府は、他の経済的、社会的進歩と同様に、AI とデータの競争力を重視すべきです。研究への投資や技術リ...

AI はプラットフォーム エンジニアリングと DevEx をどのように強化するのでしょうか?

ヘザー・ジョスリン編纂者:Xing Xuan DevOps を導入している多くの企業にとって、開発者...

AI人材が500万人不足!文部省、高等職業教育に人工知能専攻を追加

教育部は最近、浙江大学を含む35の大学の学部課程に人工知能専攻科目を追加したことに続き、大学の職業教...

転移学習により、ディープラーニングは難しくなくなりました...

それほど遠くない過去には、データ サイエンス チームがディープラーニングを効果的に活用するには、いく...

AI、BI、データ: 2020 年までに勝利するのは誰か?

10 年前、データと分析の市場には大手企業が存在しませんでした。実際、業界では「クラウド」、「ビッ...

[Dry Goods] グラフニューラルネットワークの学習リソーストップ10の共有

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...