この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 「公式だよ、公式だよ、私の彼氏はハンサムだよね?」昨日は520インターネットバレンタインデーで、何万人もの人がKuaishouで独身ではないことを宣言しました。彼らはどうやってそれを実現したのでしょうか?結局、快手は独身者が瞬時に素敵なクローンを手に入れ、「独身から抜け出す道を見つける」ことができるビデオ特殊効果をリリースしたことが判明した。これは、Kuaishou がユーザー向けに用意した 520 種類の特殊効果シリーズの 1 つであり、ユーザーの間で人気があります。 「快手が彼氏を送ってくれてありがとう、すごくイケメン!」「二人は長く一緒にいるとどんどん似てくるって聞いたけど、私の彼氏は私によく似ている」「公式発表、公式発表、パートナーが発表された」。 「チェンジカップル」アプリがリリースされて以来、快手ユーザーはパートナーとハートの形を作ったり、手をつないだり、フィンガーダンスをしたり、一緒にミルクティーを飲んだりするなど、さまざまなアバターを考案した。この特殊効果を使って赤ちゃんのビデオを撮影し、瞬く間に男の子と女の子の双子が生まれる母親もいます。 快手が発売した520シリーズの魔法時計には、「男神に変身」や「女神に変身」などの特殊効果もあり、性別を変える効果が得られます。 「男神に変身」では、女性ユーザーが男神に変身し、変身後のハンサムなヘアスタイルを鑑賞することができます。 「女神に変身」の特殊効果により、男性ユーザーは一瞬にして色白で美しい女性に変身することができます。 GAN 生成的敵対ネットワークが独身者の独身脱出を支援 このような楽しく斬新な体験の裏には、どんなハイテクが使われているのでしょうか?Kuaishou Y-techのアルゴリズムエンジニアによると、この効果の背後にあるコアテクノロジーはGAN(Generative Adversarial Network)です。 GAN はユーザーのオリジナル画像に基づいてリアルな画像を生成することができ、これらの画像を注意深く調べても偽造の兆候が見つからない場合があります。 生成的敵対ネットワーク 携帯電話でリアルタイムの性転換効果を実現するには、次の 3 つの主要な問題を解決する必要があります。 まず、GAN によって生成される顔の特徴は、ユーザーの性別とは明らかに正反対である必要がありますが、同時に、ユーザーに非常に似ていて、血縁関係が近いものでなければなりません。女の子を男の子に変えた後、男性的な特徴が非常に顕著である場合、ユーザーのID情報の一部が失われ、ユーザーが自分とは違って見えるようになり、必然的に楽しさが減少します。したがって、GAN モデルでは、性別特性の変更とユーザー ID の保持の間でバランスを取る必要があります。 2 番目に、GAN は対象の性別に一致する髪を生成しますが、生成された髪はリアルタイム撮影中のユーザーの姿勢に関係なく安定して連続している必要があります。生成されたヘアスタイルを制御するという目的を達成するために、Kuaishou Y-techのアルゴリズムエンジニアはGANとグラフィックスを組み合わせ、グラフィックスの3D理論とGANのテクスチャ学習能力を最大限に活用しました。最終的な効果は、ユーザーに斬新で素晴らしい体験をもたらします。 髪の毛は、人の性別を判断する上で非常に重要な役割を果たします。生成された髪の毛がリアルでない場合、ユーザーはすぐに効果が良くないと考えます。人間の顔とは異なり、髪の毛は自由度が高いです。髪の毛の形、色、方向は、人によって、あるいは同じ人の間でも大きく異なります。 GANはAI技術として、データに基づいて一定の分布を学習するため、データ内の多様な髪を利用して髪の固定パターンを学習し、すべてのユーザーに対して安定した継続的な特定のヘアスタイルを生成する必要があります。 第三に、性別の変更は、さまざまなモデルやコンピューティング機能を備えた携帯電話でリアルタイムに実現される必要があります。 GAN モデルは一般に多くの計算作業を必要としますが、Kuaishou のユーザーベースは広く、ユーザーが使用する携帯電話の計算能力は大きく異なります。すべてのユーザーが新しいテクノロジーのメリットを体験できるように、Kuaishou Y-tech は体系的なソリューションを採用しました。基盤となるエンジンの加速からモデルの圧縮、そして後処理の最適化まで、各部分には大きな課題と能力が伴います。 快手Yテックは、性転換以外にも、若返りや老化などの他の生成技術においても豊富な経験を積んできました。 2019年8月、快手は「ベビーフェイス」特殊効果を発表しました。これは中国初の端末向けリアルタイムGANであるだけでなく、世界初のiOSとAndroidの全モデルと複数のプラットフォームをカバーする動画向けリアルタイムGANでもあります。 |
<<: 機械学習アルゴリズムのコレクション: ベイズ学習からディープラーニングまで、それぞれの長所と短所
>>: TFserving によるディープラーニング モデルの導入
[[204846]] 1. 人工知能の応用と価値Andrew Ng 氏は、AI は新しい電気であると...
今では、ほとんどの人が人工知能の概念をよく知っています。 AI は今日最も人気のあるテクノロジーの ...
GPT-4 コードインタープリターをベンチマークし、CUHK の最新の研究では「大きな動き」が発表さ...
一拍遅ければそれは「人工的な愚かさ」であり、一歩遅れればそれは「知的な人工性」であり、一歩速ければそ...
英国ラフバラー大学とチェルシー・フットボール・クラブの研究者らが共同で、最近のシーズンの選手のデータ...
データ ポイントを特定の数の定義済みクラスに分類するように ML モデルをトレーニングすることがタス...
多くの企業が GPU コンピューティング能力の開発を組み合わせて、自社の機械学習の問題に対するソリュ...
翻訳者 | イェ・ウェイミンレビュー | Chonglou効率、コードの品質、生産性はすべてプログラ...
シスコが実施した調査によると、データプライバシーの面で生成AIに欠点があることを理解しているにもかか...
最近、山西省太原でインテリジェント炭鉱・安全生産フォーラムが盛大に開催され、炭鉱のインテリジェント建...