このAIはマスクをハゲにし、テスラの設計を手伝った

このAIはマスクをハゲにし、テスラの設計を手伝った

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

若い頃のマスク氏が女性の服を着たときの姿はこんな感じです。

なんて可愛い女の子なんだろう〜

しかし、ひげを加えると、すぐに別の「味」が生まれます。

数年後にマスク氏が禿げ頭になったらどんな姿になるかも見ることができます。 (手動犬頭)

まあ、マスク氏は依然としてマスク氏であり、依然として「地球上で最も裕福な新人」だ。

これは、指定された条件に従って顔を生成できる StyleGAN2 - StyleFlowをベースにした新しいテクノロジーを使用して実現されます。

女性の服を着替える、ハゲになる、ヒゲを描くなどの上記機能に加え、姿勢を変える、照明を調整する、表情を変えるなどのエフェクトも統合されており、車内でも使用できます。

条件に基づいて顔を生成する

1 つの属性条件を編集すると、GAN 潜在空間内での相互作用により、他の属性に不要な変更が簡単に発生する可能性があることがわかっています。この背景に基づいて、本論文では StyleFlow を提案します。

具体的には、属性条件付きサンプリングと属性制御編集という 2 つの側面を検討します。

まず、属性条件付きサンプリングを行います。特定の特性を持つ高品質の実画像をサンプリングします。

次に、プロパティは編集を制御します。特定の画像は、ソース画像の特性を最大限に保持しながら、編集後の画像がターゲット プロパティを持つように編集されます。

StyleFlow によって推測されるパスは入力画像に基づいているため、各顔の独自性に適応できます。

まず、ソース イメージから始まる逆方向推論を使用し、次に一連の CNF ブロックを通じて順方向推論を実行して、属性条件編集をサポートします。

図中、zは事前分布の変数を表し、wはStyleGANの中間重みベクトルを表します。

また、後方および前方推論は、時間変数の CNF 関数を評価する ODE ソルバーによって実装されることにも注意してください。

その中で、属性ベクトルは条件学習機能の鍵となり、順方向推論と逆方向推論の両方に使用できます。

次に、StyleFlow の属性条件付きサンプリングを使用して、Z0 を再サンプリングして属性を定義します。

最後に、StyleGAN の顔と車の潜在空間を使用してアプローチを評価し、実際の写真と StyleGAN で生成された画像の両方で、さまざまな属性に沿った編集のきめ細かい分離を示します。

たとえば、人間の顔の場合、カメラのポーズ、照明の変化、表情、顔の毛、性別、年齢はさまざまでした。

1対多のバッチ操作も可能です。

[[375383]]

最後に、研究者らは、多数の定性的および定量的比較、ならびに既存の技術との比較を通じて、StyleFlow の優位性を実証しました。

その背後にいるチーム

この技術はキング・アブドラ科学技術大学(KAUST)とAdobeが共同で開発し、第一著者はKAUSTのRameen Abdal氏です。

R&D チームにはもう 1 人の中国人がいます。Zhu Peihaoです。

[[375384]]

彼はノースイースタン大学でオートメーションの学士号を取得し、その後中国科学院大学に進学してコンピューターサイエンスを学びました。

修士号を取得した後、彼はキング・アブドラ科学技術大学のコンピュテーショナル・ビジョン・センターに入学し、博士号を取得しました。

顔を生成するだけでなく、車も作れるのでしょうか?

最後に、この技術が「クルマづくり」に及ぼす影響についてお話ししますね〜

色を変更します。

任意の角度に回転します。

普通の車が数秒でSUVに変身します〜

これらのデモにはテスラ効果はありませんが、それでも私は尋ねなければなりません:

それで、マスク氏は興味があるのでしょうか? (手動犬頭)

GitHub:
https://github.com/RameenAbdal/StyleFlow
デモビデオ:
https://www.youtube.com/watch?v=LRAUJUn3EqQ&feature=youtu.be
論文の宛先:
出典: http://arxiv.org/pdf/2008.02401.pdf
プロジェクトアドレス:
https://rameenabdal.github.io/StyleFlow/

<<:  AIを使って人間の子どもを「飼い慣らす」: ハードコアな子育ての楽しさを発見した父親

>>:  強化学習と3Dビジョンを組み合わせた新たなブレークスルー:高性能オンラインパレタイジングロボット

ブログ    
ブログ    

推薦する

米軍は市街戦環境向けの人工知能システムを開発中

米陸軍研究所は、都市環境における兵士の状況認識力と戦闘能力を向上させるために、認知・神経工学共同技術...

ChatGPT が「Paper Artifact」プラグインをリリースしました。キーワードなしで2億件の記事を検索、リンクは完全に本物です

ChatGPT には、「Consensus」と呼ばれる新しい「論文検索アーティファクト」プラグインが...

...

AIの「心の目」が透けて見える!ニューラルネットワークに大きな変化、モデル生成の背後にあるロジックが初めて明らかに

エイリアンの小さな頭の中で何が起こっているのか、そしてエイリアンは世界をどのように認識しているのか疑...

...

Anthropic が「GPT-4 のライバル」言語モデル Claude 2 をリリース: パフォーマンスが向上し、長いテキストもサポート

7 月 12 日のニュース、Anthropic は最近、新しい Claude 2 言語モデルをリリー...

...

無人バスに乗ってみませんか?テクノロジーは未来を変えることができるでしょうか?

無人運転車の概念は古くから存在し、無人運転車は時折ニュースの見出しにも登場します。しかし、無人運転車...

Kuaishouは、技術的な実践を共有する最初のFlutter交換会を開催しました

Flutter はますます多くの開発者や組織で使用されており、Kuaishou も Flutter ...

軽量ディープラーニングフレームワーク Tinygrad

Tinygrad は、ニューラル ネットワークを理解して実装するためのシンプルで直感的なアプローチ...

...

...

ビッグモデルの「錯覚」、この記事を読んでください

ビッグモデルの「幻想」がついに体系的にレビューされました! 49 ページの記事では、幻覚の定義、分類...

GPT-4を粉砕せよ! Google DeepMind CEOが明かす:次世代の大規模モデルはAlphaGoと統合される

Googleは本当に全力を尽くしています。 AlphaGoとGPT-4に似た大規模モデルを組み合わせ...