この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 人間の顔の 3D モデリングを完了するには、いくつのステップが必要ですか? データ収集段階での答えは、「携帯電話 1 台 + 3.5 分」でした。 そうです、わずか 3.5 分間のデータで、忠実度が高く、運転可能な、リアルな 3D 顔ポートレートを生成するのに十分です。 この研究は、ザッカーバーグ氏のメタバース プロジェクトの中核部門である Meta Reality Labs によるものです。この論文はSIGGRAPH 2022に採択されました。 著者らは、このアプローチは VR アプリケーションに適していると述べています。 つまり、VRの世界では、将来的には漫画のような顔で登場する必要がなくなるかもしれないのです。 代わりに、太った友達の本当の姿に簡単に会うことができます。 方法の原理この結果を達成するための方法のフレームワークを下の図に示します。 具体的には、3つの部分に分かれています。 まず、大規模なマルチビュー顔データセットを使用してスーパーネットワークをトレーニングします。このスーパーネットワークは、ニューラルネットワークデコーダーを通じて個人のアバターパラメータを生成できます。 データセット内の顔は、マルチビューキャプチャシステムによって収集され、さまざまな年齢、性別、人種の 255 人の参加者の顔画像データが含まれています。 △左が撮影装置、右が撮影した顔
このハイパーネットワークでは、デコーダーの基本的な構成要素は、バイアス マップを備えた畳み込みアップサンプリング レイヤーであることに留意してください。 これらのバイアス マップは、レイ トレーシングを介してアバターをレンダリングするためのボリューム セルを生成するために使用されます。 さらに、デコーダー アーキテクチャは視線を他の顔の動きと区別できるため、VR アプリケーションでは視線追跡システムをより直接的に活用できます。 第二に、軽量な表情キャプチャです。 この研究では、顔を撮影するために深度カメラを備えたスマートフォンのみが必要でした。 実験では、研究者らはiPhone 12を使用した。 収集プロセスは次のようになります。 収集されたデータは次のように処理されます。
モデルをさらに改善する過程で、65 個の特定の表現を収集する必要があります。 最後に、この方法で出力される 3D 顔アバターは、ユーザーの外見に高度に一致するだけでなく、グローバル表現空間を通じてさらに駆動および制御することもできます。 研究者らは、採取プロセス全体には約3.5分かかると述べた。 ただし、モデリング プロセスはリアルタイムではなく、データ処理には数時間かかることに注意してください。 実験結果ここまで述べてきましたが、どれくらい効果があるのか実験結果を見てみましょう。 Pinscreenの「1枚の写真から3Dデジタルアバターを構築する」方法(CVPR 2021)と比較すると、この方法はよりリアルな顔モデルを生成できます。 ハイデルベルク大学、ミュンヘン工科大学、マックス・プランク研究所などの研究機関による論文「Neural Head Avatars from Monocular RGB Videos」で提案された方法と比較すると、この方法はより忠実度の高い結果を生成できます。 しかし、著者はこの方法には、長い髪や眼鏡をうまく保持できないこと、アーティファクトが発生しやすいことなどの限界もあると指摘しています。さらに、この方法では照明条件に関しても一定の要件があります。 |
<<: 時代遅れのリソグラフィー機械は中国に販売できません!米国がオランダのASMLに不当な圧力をかけ、国産チップが再び抑制される
>>: 人工知能技術が英語学習にどのように役立つかについての簡単な議論
ビッグデータと高性能コンピューティング リソースにアクセスすることで、企業は新しい人工知能ツールと機...
現在の AI の世界は電力を大量に消費し、計算能力が制限されています。モデル開発の軌跡は急速でしたが...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ブロックバスター社の映画には毎年人工知能が満載されており、昨年も例外ではありませんでした。 『ブレー...
特定の問題を解決するための最適な技術としての人工知能 (AI) に対する熱意は否定できず、注目に値し...
次のようなシナリオを想像してください。 あなたはレベル3の自動運転機能を備えたAudi A8を所有し...
インターネット技術の急速な発展に伴い、「クラウド コンピューティング」や「フォグ コンピューティング...
人類はもはや人工知能(AI)の波から逃れることはできない。彼らが行くところすべてで、最新の AI ソ...
[[425002]]自然言語理解 (NLU) は難しい問題です。数十年前の AI の誕生から現在に至...
人工知能がどのような新しい形で登場するかが話題になっている一方で、教育分野では新たな一連の変化が起こ...
最近、ViT はコンピューター ビジョンの分野で強力な競争力を発揮し、複数のタスクで驚くべき進歩を遂...