このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

人間のロールプレイングへの熱意は決して衰えることがなく、だからこそ AI による顔の変形が人気を博しているのです。

3か月前、SyncedはAvatarifyと呼ばれる顔を変えるプロジェクトを発表しました。この技術により、自分の顔を他の人の顔にリアルタイムで置き換えることができるため、ビデオ会議でのパフォーマンスが非常にスムーズになります。これまでのところ、このプロジェクトは GitHub で 8.5k 個のスターを獲得しています。

このプロジェクトは、主に今年3月に発表されたarXiv論文「First Order Motion」に基づいています。対象画像に対する事前のトレーニングなしで、自分の画像を他の人のビデオに置き換えることができます。

Avatarify を使用する場合、アルゴリズムは、ディープフェイクなどの他の顔交換技術を使用して、交換する顔画像でトレーニングされます。対象画像の類似カテゴリでアルゴリズムをトレーニングすることにより、モデルはリアルタイムの顔交換操作を可能にします。

一次運動モデルの全体的な枠組み

具体的な操作手順も非常に簡単です。

まず静止画像をインポートすると、眉を上げる、瞬きする、話すなど、ビデオ内の実際の人物の動作に応じて写真の顔の特徴が変化し、別の人が会議に参加しているように見えます。

さらに便利なのは、開発者がすでにアプリ化しており、現在 Apple Store からダウンロードできるということです。

Avatarify は現在 APP Store で入手可能です。

このアプリの使い方は非常に簡単です。アプリで写真を選択し、表情を操作するだけで、最終的に希望する顔のビデオが作成されます。

トランプ大統領が、友人に「お誕生日おめでとう、ジョー!」と誕生日のお祝いを個人的に送れるような家庭環境がどんなものなのか、私にはわかりません。

[[336425]]

あなたは人間になることを選ぶことも、人間であることを諦めることもできます。

そして、変顔の世界で最も人気の高いモナ・リザは、

モナリザ:「私の笑顔が好きですか?」

裁判効果

当社は責任を持って製品をテストしました。次の画像は、特殊効果なしの実際の効果を示しています。アイコンタクトと笑顔の弧がうまく捉えられていることがわかります。

アプリが提供する画像に加えて、ターゲットアバターをカスタマイズすることもできますが、ターゲットアバターを正方形にトリミングし、距離が遠すぎたり近すぎたりしないように注意する必要があります。復元の歪みを最小限に抑えるには、単一の背景を選択するのが最適です。

多くのユーザーがソーシャルプラットフォーム上でトライアル結果を示しました。顔の特徴は正確にキャプチャされますが、ユーザーが見上げるなどの動きを加えると、生成された結果は依然として歪んでしまいます。

下の写真では、マスク氏の顔の下半分が少しずれています。

もちろん、これはユーザーのアクションにも左右されます。表情をコントロールする能力が強ければ強いほど、よりリアルになります。

プロジェクト作成から製品発売まで3か月

GitHub プロジェクトの紹介によると、このプロジェクトは作成以来継続的に更新されており、具体的なスケジュールは次のとおりです。

2020.04.13: Windowsサポートを追加しました。

2020.04.15: StyleGAN (ThisPersonDoesNotExist) で生成されたアバターを追加しました。 Q キーを押すと、存在しない人物の画像が表示されます。ワンクリックで簡単にアバターを変更できます。

2020.04.17: Slackコミュニティを作成しました。

2020.04.24: Windowsインストールチュートリアルを追加しました。

2020.05.07: すべてのプラットフォームにリモート GPU サポートが追加されました。

2020.05.22: Google Colab モードが追加され、ユーザーは GPU のないコンピューターでも Avatarify を実行できるようになりました。

2020.07.11: Docker サポートが追加され、ユーザーは Linux 上で Docker を使用して Avatarify を実行できるようになりました。

数日前、Avatarify アプリが Apple APP Store でリリースされました。

Avatarify の作者は、プロジェクトの作成からソフトウェアの商品化まで、わずか 3 か月強を要しました。

おそらく、退屈こそが生産力の原動力なのでしょう。

参考リンク:

https://github.com/alievk/avatarify#configure-video-meeting-app

<<:  2020年のAI目視検査の応用価値

>>:  アルゴリズム博士の平均月収は4万元、データ可視化スキルは世界中で需要が高い

ブログ    

推薦する

AIの限界を理解することがその可能性を実現する鍵となる

人工知能は多くの業界のワークフローを変革しました。デジタル顧客サービスアシスタント、自動運転車、無人...

説明可能なAI: 機械が自らを説明できるようにし、アルゴリズムによって生成されるバイアスを減らす

2018 年 5 月 25 日、一般データ保護規則 (GDPR) が欧州連合全域で発効し、組織による...

人工知能がデータセンターを変革

[[253094]]がんの早期発見から国境を越えた人間の言語理解、リアルタイムの高解像度ビデオでの顔...

エッジコンピューティングにおける AI の利点

エッジと極端エッジの間でこれがどのように展開するか、また無線アクセス ネットワークにどのような階層が...

AI批判: GPT-3は何を話しているのか分かっていない

【51CTO.com クイック翻訳】 [[341305]] 【はじめに】 GPT-3は1750億個の...

...

ノーベル賞を予約しますか? DeepMind の創設者が「ノーベル賞」ラスカー賞を受賞、AlphaFold が「科学のための AI」のベンチマークに

9月21日、生理学・医学分野の最高賞であるラスカー賞が発表されました!ラスカー賞には、基礎医学研究賞...

クロスカメラトラッキングと「スマート」な眼認識技術戦略の研究と実装

ラボガイド現在、公共の場や個人の応用場面に設置されている監視カメラの総数は1億7500万台を超えてい...

人工知能は ICT 専門家にとって味方でしょうか、それとも敵でしょうか?

人工知能 (AI) とそのサブセットである機械学習 (ML) は、今日最も急速に成長しているテクノロ...

これらの業界をリードする大型モデルはすべて1つの会社によって「買収」されました

GPT-4 のリリースは AI の歴史に残る大きな出来事であることは間違いありません。しかし、時が経...

...

インメモリコンピューティング技術に基づく人工知能チップが利用可能:パフォーマンスは数十から数百倍高速

[[249742]]人工知能システム用の新しいコンピュータチップが利用可能になりました。プリンストン...

...

知能ロボットは世界経済を書き換えるだろうが、全てが良いわけではない

高度に自動化された社会では、人々の反復的な労働のレベルは最小限に抑えられています。人件費が高い分野で...