このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

人間のロールプレイングへの熱意は決して衰えることがなく、だからこそ AI による顔の変形が人気を博しているのです。

3か月前、SyncedはAvatarifyと呼ばれる顔を変えるプロジェクトを発表しました。この技術により、自分の顔を他の人の顔にリアルタイムで置き換えることができるため、ビデオ会議でのパフォーマンスが非常にスムーズになります。これまでのところ、このプロジェクトは GitHub で 8.5k 個のスターを獲得しています。

このプロジェクトは、主に今年3月に発表されたarXiv論文「First Order Motion」に基づいています。対象画像に対する事前のトレーニングなしで、自分の画像を他の人のビデオに置き換えることができます。

Avatarify を使用する場合、アルゴリズムは、ディープフェイクなどの他の顔交換技術を使用して、交換する顔画像でトレーニングされます。対象画像の類似カテゴリでアルゴリズムをトレーニングすることにより、モデルはリアルタイムの顔交換操作を可能にします。

一次運動モデルの全体的な枠組み

具体的な操作手順も非常に簡単です。

まず静止画像をインポートすると、眉を上げる、瞬きする、話すなど、ビデオ内の実際の人物の動作に応じて写真の顔の特徴が変化し、別の人が会議に参加しているように見えます。

さらに便利なのは、開発者がすでにアプリ化しており、現在 Apple Store からダウンロードできるということです。

Avatarify は現在 APP Store で入手可能です。

このアプリの使い方は非常に簡単です。アプリで写真を選択し、表情を操作するだけで、最終的に希望する顔のビデオが作成されます。

トランプ大統領が、友人に「お誕生日おめでとう、ジョー!」と誕生日のお祝いを個人的に送れるような家庭環境がどんなものなのか、私にはわかりません。

[[336425]]

あなたは人間になることを選ぶことも、人間であることを諦めることもできます。

そして、変顔の世界で最も人気の高いモナ・リザは、

モナリザ:「私の笑顔が好きですか?」

裁判効果

当社は責任を持って製品をテストしました。次の画像は、特殊効果なしの実際の効果を示しています。アイコンタクトと笑顔の弧がうまく捉えられていることがわかります。

アプリが提供する画像に加えて、ターゲットアバターをカスタマイズすることもできますが、ターゲットアバターを正方形にトリミングし、距離が遠すぎたり近すぎたりしないように注意する必要があります。復元の歪みを最小限に抑えるには、単一の背景を選択するのが最適です。

多くのユーザーがソーシャルプラットフォーム上でトライアル結果を示しました。顔の特徴は正確にキャプチャされますが、ユーザーが見上げるなどの動きを加えると、生成された結果は依然として歪んでしまいます。

下の写真では、マスク氏の顔の下半分が少しずれています。

もちろん、これはユーザーのアクションにも左右されます。表情をコントロールする能力が強ければ強いほど、よりリアルになります。

プロジェクト作成から製品発売まで3か月

GitHub プロジェクトの紹介によると、このプロジェクトは作成以来継続的に更新されており、具体的なスケジュールは次のとおりです。

2020.04.13: Windowsサポートを追加しました。

2020.04.15: StyleGAN (ThisPersonDoesNotExist) で生成されたアバターを追加しました。 Q キーを押すと、存在しない人物の画像が表示されます。ワンクリックで簡単にアバターを変更できます。

2020.04.17: Slackコミュニティを作成しました。

2020.04.24: Windowsインストールチュートリアルを追加しました。

2020.05.07: すべてのプラットフォームにリモート GPU サポートが追加されました。

2020.05.22: Google Colab モードが追加され、ユーザーは GPU のないコンピューターでも Avatarify を実行できるようになりました。

2020.07.11: Docker サポートが追加され、ユーザーは Linux 上で Docker を使用して Avatarify を実行できるようになりました。

数日前、Avatarify アプリが Apple APP Store でリリースされました。

Avatarify の作者は、プロジェクトの作成からソフトウェアの商品化まで、わずか 3 か月強を要しました。

おそらく、退屈こそが生産力の原動力なのでしょう。

参考リンク:

https://github.com/alievk/avatarify#configure-video-meeting-app

<<:  2020年のAI目視検査の応用価値

>>:  アルゴリズム博士の平均月収は4万元、データ可視化スキルは世界中で需要が高い

ブログ    
ブログ    
ブログ    

推薦する

快手八卦についての噂: TensorFlow と PyTorch の並列ボトルネックを打破する分散トレーニング フレームワーク

最近、KuaishouとETH Zurichはオープンソースの分散トレーニングフレームワークBagu...

モノのインターネット – インド国防軍にとっての可能性

世界がインダストリー4.0へと向かうにつれ、モノのインターネットへの世界的な支出は2022年までに1...

2011 コンピュータソフトウェア試験プログラマー: アルゴリズム分析の基礎学習

コンピュータの問題解決のプロセスにおいて、データ構造とアルゴリズムはプログラムの 2 つの主要要素で...

どうやってパートナーを見つけたのですか?日本のネットユーザー:国はAIを使って配信している

星野源のような容姿の人を満足させることは、実はとても簡単です。ついに国家がオブジェクトを割り当てる時...

機械学習の実践: Spark と Python を組み合わせるには?

Apache Sparkはビッグデータの処理や活用に最も広く使われているフレームワークの一つであり...

データ + 進化的アルゴリズム = データ駆動型進化的最適化?進化的アルゴリズムと数学的最適化

データ駆動型進化的最適化とは何ですか? それは単なるデータ + 最適化アルゴリズムですか? データ駆...

セキュリティにおける AI の必要性: 機械学習から機械の作成まで

セキュリティ専門家は、自分の仕事が人工知能に置き換えられることを心配する必要があるのでしょうか?警備...

機械学習の背後にある数学的な柱を理解するには、この 5 冊の本が役立ちます。

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

役に立つ情報: GitHub で 26,000 個のスターを獲得!初心者のための Python アルゴリズム

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Java プログラミング スキル - データ構造とアルゴリズム「ツリー」

[[388287]]なぜツリー構造が必要なのでしょうか? 1. 配列格納方法の分析:利点: 下付き...

ディープラーニング、NLP、コンピュータービジョン向けのトップ 30 Python ライブラリ

[[358174]] Gregory Piatetsky による次のグラフでは、各リポジトリにカテゴ...

エンドツーエンドの自動運転までどれくらい遠いのでしょうか?

エンドツーエンドの自動運転は、システムの複雑性が高まるなどのモジュール式システムに伴う欠点を回避でき...

...

NLPの新人プロンプトは円を超えて、清華大学劉志遠の最新論文はそれをVLM画像に適用する

[[426388]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...