筋肉の震えもはっきりと見えます! 3D人体モデル自動生成アルゴリズム、第一著者北京大学チューリングクラス

筋肉の震えもはっきりと見えます! 3D人体モデル自動生成アルゴリズム、第一著者北京大学チューリングクラス

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ゲームをしたりアニメを見たりするときに、次のような状況に遭遇することがあります。

何かがおかしい気がします...

現在、これらの 3D 人間モデルは改善可能で、姿勢はよりリアルになり、しわはより自然になり、筋肉はより豊かになります。

感情もより関わってくるようです…

筋肉の震えもはっきりと見えます。

こうやって比べてみると違いは一目瞭然ですね〜

この新しい方法により、アニメーションの品質が向上するだけでなく、手作業の労力も大幅に削減され、制作スピードも向上します。

ご存知のように、過去のアニメーションには、スケルトンの構築、スキニング、ウェイトのブラッシングなどの面倒な手順が必要でした。アニメーターは何年も練習しなければならないことが多く、結果が満足のいくものでないことがよくありました。

今では、ニューラル ネットワークがその仕事をこなすことができます。

それだけでなく、画像からスケルトンを予測しウェイトをバインドすることもできるので、モーションキャプチャーによるアニメーション化が容易になります。

この研究成果は、北京大学や北京電影学院などの大学や研究機関の協力により完成しました。

関連論文「ニューラルブレンドシェイプによる骨格関節の学習」がSIGGRAPH 2021で公開され、コードがオープンソースになりました。

提案されたニューラル融合形状技術

研究チームは、特定の構造を持つ骨を生成し、骨の皮膚の重量を正確に結合するニューラル ネットワークを開発しました。

これは、エンベロープ変形ブランチと残差変形ブランチの 2 つの部分で構成されます。

ラッピング変形ブランチは、間接的な監視を通じてオフセットで構成されるスケルトン固有のアセンブリ パラメータを学習し、最終的に入力文字からスケルトン、スキン、およびウェイト バインディングを予測します。

よく使われるアニメーション制作ツール「Mixamo」にもバインディングとスキニングは備わっていると言えるでしょう。

しかし、新しい方法ではそれ以上のことが可能です。モデルによく一致するボーンを正確に予測し、ウェイトをバインドすることもできます。

これにより、モーションをキャプチャしてアニメーションを作成しやすくなります。

さらに、ニューラル ブレンド シェイプ技術を使用すると、補正変形ブランチは入力メッシュ接続に基づいて対応するブレンド シェイプを予測できます。

同時に、関節の回転に基づいて融合係数が予測され、これに基づいて補償変形が補間されます。

たとえば、ニューラル ブレンド シェイプは筋肉の形状を修正し、筋肉の膨らみを正確に維持します。

LBS (Linear Blended Skinning) アルゴリズムの効果と比較すると、詳細がより適切に処理されます

3DアニメーションソフトBlenderの効果との比較:(小腹は完璧に保存されています)

さらに、研究チームはニューラルハイブリッド形状係数視覚化し、左側の画像出力が右側の対応する姿勢に結びついていることを確認できました。

さらに、各関節のブレンド形状係数の活性化度合いを色の変化で表現します。

この方法を使用すると、ニューラルネットワークは、トレーニングデータセットの変形方法に制限を受けることなく、間接学習のために変形された文字モデルを観察するだけでよくなり、適用範囲が大幅に拡大します。

最終的に、リアルタイムで高品質なエンドツーエンドの 3D キャラクター モデル アニメーションの自動生成が実現しました。

著者の1人は北京大学チューリングクラス出身である

チームは、北京大学のバオクアン・チェン教授の研究チーム、北京電影学院の未来映像先端イノベーションセンター、Google Research、テルアビブ大学、ETHチューリッヒの研究者で構成されています。

論文の第一著者は北京大学チューリングクラスの学部生、李培卓氏である。

彼は重慶第一中学校を卒業し、情報科学コンテストの省チームに選ばれ、2017年の大学入試で687点を獲得して北京大学に入学した。

現在、Li Peizhuo 氏は Chen Baoquan 教授の下で学んでおり、ディープラーニングとコンピュータグラフィックスを研究の方向性としています。現在は北京大学のビジュアルコンピューティングおよび学習研究所と北京電影学院の未来画像先端イノベーションセンター (AICFVE) でインターンシップを行っています。

彼は以前、SIGGRAPH で論文を発表していました。 QuantumBit とのやり取りの中で、彼はグラフィックスに特に興味があることを表明しました。

論文の詳細については、興味のある方はリンクをクリックして詳細をご覧ください。

プロジェクトのホームページ:
https://peizhuoli.github.io/neural-blend-shapes/
論文の宛先:
https://peizhuoli.github.io/neural-blend-shapes/papers/neural-blend-shapes-camera-ready.pdf

<<:  10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました

>>:  自然言語処理 (NLP) とは何ですか?

ブログ    

推薦する

...

...

インテリジェントな人間とコンピュータの相互作用とは何ですか?

これは非常に興味深い質問であり、知性と人間とコンピューターの相互作用の両方が関係しており、さらに重要...

...

ETHは、画像の超解像と画像の再スケーリングを考慮して、新しい統合フレームワークHCFlowを提案しています。

[[423154]]近年、正規化フローモデルは、画像超解像(画像SR)[SRFlow、ECCV20...

究極のAlp​​haGo、DeepMindの新アルゴリズムMuZero、著者の解釈

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

自動化プロジェクトの成功は、ビジネスとITの高度な連携にかかっています。

[[399107]]ウー・ウェイ UiPath Greater China 社長前回 UiPath...

ディープラーニングの背後にある数学的アイデアを分析する

ディープ ニューラル ネットワーク (DNN) は、基本的に複数の接続されたパーセプトロン (パーセ...

...

GPT-4 だけが自己改善可能、GPT-3.5 はできない、MIT と Microsoft のコード生成実験で新たな発見

大規模言語モデル (LLM) は、自然言語からコード スニペットを生成できることが示されていますが、...

AI時代、私たちは将来の仕事にどう備えればいいのでしょうか?

将来のテクノロジーとそれによって可能になるかもしれない新しいタイプの仕事について多くのことが書かれて...

囲碁AIの不正行為の最初の事例はすでに発生しています。他の事例は後れを取っているのでしょうか?

[[227817]]画像出典: Visual Chinaカンニングは間違いなく長い歴史を持つ「科学...

認知知能を業界の奥深くまで導くWAIC Baiduが言語と知識技術の完全なレイアウトを公開

言語は機械と人間をつなぐ重要な経路であり、機械が現実世界を深く理解するためには知識が必要です。 8月...

海外メディア:人間はますます余暇を持ち、AIは資本主義を排除する

ベストセラー作家のバーナード・マー氏はフォーブス誌に「人工知能はいかにして資本主義を殺すか」と題する...

金融業界のデータ管理はどこへ向かうのでしょうか?

近年、インターネット金融の波は伝統的な金融業界に課題をもたらしています。同時に、伝統的な金融企業の情...