スケッチが本物の顔に変わる? AI: はい、草はいくらでも大丈夫です。

スケッチが本物の顔に変わる? AI: はい、草はいくらでも大丈夫です。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

絵が苦手でも、リアルな肖像画を描きたいと思いませんか?

それは可能です。

YouTube のある人が、簡単な小さなプログラムでそれを実現しました!

効果はかなり良いです!解像度とリアリティがすべて揃っています。

スケッチはこんな感じです...

くそ。

AIによる顔生成は絵が下手な人でも使える

最初のグループが最初の戦いに勝利し、その男性は性別を変えてみることにしました。

はい、性別認識は成功しました✅、でもちょっと「不気味」に見えます。

誰かを責めたいなら、その人の「魂」の絵画技術を責めればいいのです…

次のグループ——

著者は顔、髪、目などを徐々に描き、AI が段階的に肖像画を生成する様子を皆さんに示します。

細部が充実するとともに、顔も豊かになるように訓練されているようです。

次に、作者は想像力を豊かにして、実際に三角形/マンゴー型/四角形/洋ナシ型の顔を描いてみました...

故障するのでしょうか?

いいえ!

顔の形がどうであろうと、耳が曲がっていようと、目がつり上がっていようと、彼は成功した。結果には非常に満足しました。写真の 1 枚は実際にかなり良く見えました。

さて、ナルトを描いてみるのはどうでしょうか?

ナルトは現実世界ではどのように見えるでしょうか?

[[393649]]

ヘルプ! 🆘! ! !

その後、兄弟はさらに 2 つのグループを作りました。

△マインクラフトのスティーブのAIポートレート:ファンファンの髪の毛が復元される

△漫画キャラクター、リック・サンチェスのAIポートレート:マイケル・ジャクソンに似てる?

AI は基本的に元のキャラクターのしわや肌の色を再現できることに気付きましたか? さらに、上のナルトの AI アバターも「偶然」黄色い髪をしています。

とても魔法のようですね?

しかし著者は冗談を言った。「それは魔法だよ…」

論文に触発されて

このアイデアを提案し、プログラムを実装したのは、オンライン名「Stochastic Machine」(ランダムマシン?)を持つ人物です。

ある論文に触発されて——

《スタイルでエンコード: 画像から画像への変換のための StyleGAN エンコーダー》

この論文では、技術者が styleGAN 上でディープ ニューラル ネットワークをトレーニングし、ソース画像を styleGAN モデルの入力にマッピングして、最終的に高品質のターゲット画像を出力する方法を学習させる方法について説明します。

興味深い例が3つあります。

1. 横顔を対応する正面顔として出力する(顔の正面化)

2. ぼやけた顔を高解像度の顔に生成する(超解像度)

しかし、最も近い外観を復元する方法は複数あります。

3. 条件付き画像合成。これはpix2pixに非常に似ています。

エンコーダーは手描きまたは顔のマスクを入力し、一連の高解像度の実物の肖像画を生成できます。

Pix2pixはGANに基づいて設計されたアルゴリズムです。ペア画像の変換を完了し、より鮮明な結果を得ることができます。

生成的敵対ネットワークである GAN (Generative Adversarial Networks) は、ディープラーニング モデルであり、近年の複雑な分布に対する教師なし学習の最も有望な方法の 1 つです。

若者は最後の効果に大いに満足し、興味を示した。そしてこう考えました。

落書きするだけで非常にリアルな AI の顔を生成する簡単なプログラムを作成できるかもしれません。

彼はすぐにそれを実行しました。彼は以前、pix2pix 技術に基づいてスケッチから顔を生成するプログラムを開発していました。

残念ながら、その効果はそれとは程遠いものです。まったく人間ではありません!

彼は、オリジナルのコードとこの論文の技術を組み合わせて、このようなシンプルなアプリケーションを作成しました。絵を描くスキルがどんなに下手でも、リアルな AI の顔を生成できます。

AI顔生成技術:ぼやけたものから本物と偽物の区別がつかないものまで

当初、多くの AI 顔生成作業 (GAN テクノロジに基づく) は、人間の顔の全体的な外観をかろうじて模倣することしかできず、多かれ少なかれ「曖昧」(品質が欠けている) でした。

言うまでもなく、生成されたポートレートの一部は単なる白黒です。

2019年、StyleGANの登場により、AI画像生成技術は大きく前進しました。

この技術によって生成された肖像画は、ついに「言わなければ、私が AI だとは分からない」ほどリアルになりました。

StyleGANはGANをベースに開発されたモデルです。

StyleGANにおける「スタイル」とは、顔の形や髪型など人間の顔のさまざまな属性のほか、顔の肌の色やシワの有無などの詳細を指します。異なる「ペイント方法」により、顔の異なる「スタイル」を正確に制御できます。

上記の「ランダム マシン」の人が使用した StyleGAN2 は、StyleGAN の改良版です。

この技術に基づく顔生成のアプリケーションは無数にあります。このツールの最大の違いは、ベースマップに従ってコピーして処理する必要がなく、優れたペイントスキルも必要ないことです。より多くの「魂」が、対応する非常にリアルな肖像画を生成できます。

しかし、このプログラムによって生成された肖像画は、インド(亜大陸)で一般的な顔の特徴をほとんど備えていると言う人もいます。

もちろん、これらはすべて対応するデータセット (CelebA-HQ) でのトレーニングの結果であると彼は言いました。

<<:  人工知能は気候変動に対する新時代の解決策である

>>:  ディープラーニングアルゴリズム

ブログ    
ブログ    

推薦する

なぜ人間はヒューマノイドロボットを恐れるのでしょうか?心の奥底から湧き上がる恐怖

科学者たちは、人間が常に人型ロボットに対して不可解な恐怖を抱いているという不可解な現象を発見した。 ...

...

...

ビル・ゲイツ:この伝染病は[諸刃の剣]であり、人工知能はエイズとCOVID-19を治すと期待されています!

序文:科学技術界の頂点に立つビル・ゲイツ氏は、2015年にTEDで「今後数十年のうちに、核戦争よりも...

ChatGPT、画像や動画コンテンツを生成するCanvaプラグインをリリース

9月4日、ChatGPT Plusサブスクリプションサービスで独自のCanvaプラグインがリリースさ...

貢献度が最も高い GitHub コレクションとディープラーニング フレームワーク 16 選

ビッグデータ概要編纂者:Jingzhe、Shijintian、Jiang Baoshangディープラ...

20年後には、すべての仕事の半分が人工知能に置き換えられるのでしょうか?これらの「高リスク産業」とは何でしょうか?

「アイ、ロボット」は蔡蔡が子供の頃に特に好きだった映画であり、今でも古びていない。子どもの頃は、映...

PaddlePaddle と TensorFlow の比較分析

この記事では主に、フレームワークの概要、システム アーキテクチャ、プログラミング モデル、分散アーキ...

人工知能の時代において、結核を根絶するまでにどれくらい時間がかかるのでしょうか?

結核は古代の呼吸器感染症として人類の歴史を通じて存在し、何億人もの命を奪い、「白ペスト」として知られ...

コビオニクス、針を使わずにワクチンを投与する新しいロボットを開発

BGR によれば、注射針に対する恐怖は人口の少なくとも 10% を悩ませており、あらゆる種類のワクチ...

ひどい、顔認識の練習のための40行のコード

最近、恐れることなく赤信号を無視していた人々が交通警察署に電話し、交通警察のおじさんに自分の写真を削...

認知システムが機械学習とセマンティック技術を組み合わせるべき理由

ワインとチーズの組み合わせを識別するのに役立つアプリケーションを構築したいとします。最も優れたパフォ...

研究によると、AppleのCSAMスキャンアルゴリズムは簡単に騙される可能性がある

最近、インペリアル・カレッジ・ロンドンの研究チームは、画像の内容を変えずに画像内容をスキャンするアル...

AIとコネクテッドデバイスの急成長が新たなデジタル格差を生み出している理由

接続デバイスと AI 言語モデルの急速な成長により、私たちの生活、仕事、コミュニケーションの方法が変...

PenFedは人工知能を活用して高度なパーソナライゼーションを実現

米国第2位の信用組合であるPenFedは、人工知能を活用して顧客とのやり取りの方法を変えようとしてい...