このAIはマスクをハゲにし、テスラの設計を手伝った

このAIはマスクをハゲにし、テスラの設計を手伝った

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

若い頃のマスク氏が女性の服を着たときの姿はこんな感じです。

なんて可愛い女の子なんだろう〜

しかし、ひげを加えると、すぐに別の「味」が生まれます。

数年後にマスク氏が禿げ頭になったらどんな姿になるかも見ることができます。 (手動犬頭)

まあ、マスク氏は依然としてマスク氏であり、依然として「地球上で最も裕福な新人」だ。

これは、指定された条件に従って顔を生成できる StyleGAN2 - StyleFlowをベースにした新しいテクノロジーを使用して実現されます。

女性の服を着替える、ハゲになる、ヒゲを描くなどの上記機能に加え、姿勢を変える、照明を調整する、表情を変えるなどのエフェクトも統合されており、車内でも使用できます。

条件に基づいて顔を生成する

1 つの属性条件を編集すると、GAN 潜在空間内での相互作用により、他の属性に不要な変更が簡単に発生する可能性があることがわかっています。この背景に基づいて、本論文では StyleFlow を提案します。

具体的には、属性条件付きサンプリングと属性制御編集という 2 つの側面を検討します。

まず、属性条件付きサンプリングを行います。特定の特性を持つ高品質の実画像をサンプリングします。

次に、プロパティは編集を制御します。特定の画像は、ソース画像の特性を最大限に保持しながら、編集後の画像がターゲット プロパティを持つように編集されます。

StyleFlow によって推測されるパスは入力画像に基づいているため、各顔の独自性に適応できます。

まず、ソース イメージから始まる逆方向推論を使用し、次に一連の CNF ブロックを通じて順方向推論を実行して、属性条件編集をサポートします。

図中、zは事前分布の変数を表し、wはStyleGANの中間重みベクトルを表します。

また、後方および前方推論は、時間変数の CNF 関数を評価する ODE ソルバーによって実装されることにも注意してください。

その中で、属性ベクトルは条件学習機能の鍵となり、順方向推論と逆方向推論の両方に使用できます。

次に、StyleFlow の属性条件付きサンプリングを使用して、Z0 を再サンプリングして属性を定義します。

最後に、StyleGAN の顔と車の潜在空間を使用してアプローチを評価し、実際の写真と StyleGAN で生成された画像の両方で、さまざまな属性に沿った編集のきめ細かい分離を示します。

たとえば、人間の顔の場合、カメラのポーズ、照明の変化、表情、顔の毛、性別、年齢はさまざまでした。

1対多のバッチ操作も可能です。

[[375383]]

最後に、研究者らは、多数の定性的および定量的比較、ならびに既存の技術との比較を通じて、StyleFlow の優位性を実証しました。

その背後にいるチーム

この技術はキング・アブドラ科学技術大学(KAUST)とAdobeが共同で開発し、第一著者はKAUSTのRameen Abdal氏です。

R&D チームにはもう 1 人の中国人がいます。Zhu Peihaoです。

[[375384]]

彼はノースイースタン大学でオートメーションの学士号を取得し、その後中国科学院大学に進学してコンピューターサイエンスを学びました。

修士号を取得した後、彼はキング・アブドラ科学技術大学のコンピュテーショナル・ビジョン・センターに入学し、博士号を取得しました。

顔を生成するだけでなく、車も作れるのでしょうか?

最後に、この技術が「クルマづくり」に及ぼす影響についてお話ししますね〜

色を変更します。

任意の角度に回転します。

普通の車が数秒でSUVに変身します〜

これらのデモにはテスラ効果はありませんが、それでも私は尋ねなければなりません:

それで、マスク氏は興味があるのでしょうか? (手動犬頭)

GitHub:
https://github.com/RameenAbdal/StyleFlow
デモビデオ:
https://www.youtube.com/watch?v=LRAUJUn3EqQ&feature=youtu.be
論文の宛先:
出典: http://arxiv.org/pdf/2008.02401.pdf
プロジェクトアドレス:
https://rameenabdal.github.io/StyleFlow/

<<:  AIを使って人間の子どもを「飼い慣らす」: ハードコアな子育ての楽しさを発見した父親

>>:  強化学習と3Dビジョンを組み合わせた新たなブレークスルー:高性能オンラインパレタイジングロボット

ブログ    

推薦する

スマート製品はどこにでもあります。人工知能と通常の知能の違いは何でしょうか?

多くの一般消費者にとって、どれが本物の人工知能でどれが単なる普通の知能なのかを区別することは不可能で...

...

インタビュアー: 一般的なソートアルゴリズムは何ですか?違い?

[[426795]]この記事はWeChatの公開アカウント「JS Daily Question」か...

2024 年にソフトウェア開発の生産性を向上させる 10 のベスト AI ツール

2023年までに、AIは複数の業界で広く採用されるようになります。 2024 年までに、ソフトウェア...

...

OPPO 広告想起アルゴリズムの実践と調査

1. 背景1. 古いリコールアーキテクチャ上の図の左上部分は、最初にリコールしてからソートする一般的...

猫=チューリングマシン? 4つのテストにより、「猫コンピューター」が任意の計算を実行できることが証明された

柔らかくてかわいい猫は、いつも私たちに「猫を撫でたい」「猫を抱きしめたい」という衝動を掻き立てます。...

ChatGPTはプログラミングの楽しさを殺している

長年にわたり、プログラミングは私の人生における最も重要な喜びの源の 1 つでしたが、この喜びがどれだ...

ハッカーの天敵! AI はサイバー攻撃の防御にどのように役立つのでしょうか?

最近、ハッカーがサイバー攻撃を仕掛けてデータ漏洩を引き起こしているというニュースをよく耳にすると思い...

Azure ML Service を使用して機械学習モデルを構築およびデプロイする

[[256196]] [51CTO.com クイック翻訳] このチュートリアルでは、Stackove...

人工知能はどこにでもありますが、計画とコーディングは始めましたか?

人々は「ソフトウェア 2.0」の時代に入りつつあります。人工知能、ディープラーニング、機械学習、高度...

53ページのPDFがOpenAIの「AGIタイムライン」を公開、内部告発者:マスクの訴訟が状況を混乱させた

OpenAI の謎の Q* プロジェクトに関する新たな情報があります。今朝早く、54ページに及ぶGo...

NTTとシスコがAR技術を活用して生産性を向上

[[400946]]距離がチームワークを制限するべきではないメンテナンスの問題をより早く解決世界中の...

OpenAIとAppleの分岐点、アルトマンとジョブズが排除された日

何の警告もなく、OpenAIのCEOサム・アルトマンは解雇された。一つの石が千の波紋を呼ぶ。ウルトラ...

次世代スマートビルディング:データ駆動型施設はより安価で環境に優しいものになる

今日のスマート ビルは、各部屋や各階で何が起こっているかを把握し、エネルギー使用を最適化して持続可能...