筋肉の震えもはっきりと見えます！ 3D人体モデル自動生成アルゴリズム、第一著者北京大学チューリングクラス

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

ゲームをしたりアニメを見たりするときに、次のような状況に遭遇することがあります。

何かがおかしい気がします...

現在、これらの 3D 人間モデルは改善可能で、姿勢はよりリアルになり、しわはより自然になり、筋肉はより豊かになります。

感情もより関わってくるようです…

筋肉の震えもはっきりと見えます。

こうやって比べてみると違いは一目瞭然ですね〜

この新しい方法により、アニメーションの品質が向上するだけでなく、手作業の労力も大幅に削減され、制作スピードも向上します。

ご存知のように、過去のアニメーションには、スケルトンの構築、スキニング、ウェイトのブラッシングなどの面倒な手順が必要でした。アニメーターは何年も練習しなければならないことが多く、結果が満足のいくものでないことがよくありました。

今では、ニューラルネットワークがその仕事をこなすことができます。

それだけでなく、画像からスケルトンを予測し、ウェイトをバインドすることもできるので、モーションキャプチャーによるアニメーション化が容易になります。

この研究成果は、北京大学や北京電影学院などの大学や研究機関の協力により完成しました。

関連論文「ニューラルブレンドシェイプによる骨格関節の学習」がSIGGRAPH 2021で公開され、コードがオープンソースになりました。

提案されたニューラル融合形状技術

研究チームは、特定の構造を持つ骨を生成し、骨の皮膚の重量を正確に結合するニューラルネットワークを開発しました。

これは、エンベロープ変形ブランチと残差変形ブランチの 2 つの部分で構成されます。

ラッピング変形ブランチは、間接的な監視を通じてオフセットで構成されるスケルトン固有のアセンブリパラメータを学習し、最終的に入力文字からスケルトン、スキン、およびウェイトバインディングを予測します。

よく使われるアニメーション制作ツール「Mixamo」にもバインディングとスキニングは備わっていると言えるでしょう。

しかし、新しい方法ではそれ以上のことが可能です。モデルによく一致するボーンを正確に予測し、ウェイトをバインドすることもできます。

これにより、モーションをキャプチャしてアニメーションを作成しやすくなります。

さらに、ニューラルブレンドシェイプ技術を使用すると、補正変形ブランチは入力メッシュ接続に基づいて対応するブレンドシェイプを予測できます。

同時に、関節の回転に基づいて融合係数が予測され、これに基づいて補償変形が補間されます。

たとえば、ニューラルブレンドシェイプは筋肉の形状を修正し、筋肉の膨らみを正確に維持します。

LBS (Linear Blended Skinning) アルゴリズムの効果と比較すると、詳細がより適切に処理されます。

3DアニメーションソフトBlenderの効果との比較：（小腹は完璧に保存されています）

さらに、研究チームはニューラルハイブリッド形状係数も視覚化し、左側の画像出力が右側の対応する姿勢に結びついていることを確認できました。

さらに、各関節のブレンド形状係数の活性化度合いを色の変化で表現します。

この方法を使用すると、ニューラルネットワークは、トレーニングデータセットの変形方法に制限を受けることなく、間接学習のために変形された文字モデルを観察するだけでよくなり、適用範囲が大幅に拡大します。

最終的に、リアルタイムで高品質なエンドツーエンドの 3D キャラクターモデルアニメーションの自動生成が実現しました。

著者の1人は北京大学チューリングクラス出身である

チームは、北京大学のバオクアン・チェン教授の研究チーム、北京電影学院の未来映像先端イノベーションセンター、Google Research、テルアビブ大学、ETHチューリッヒの研究者で構成されています。

論文の第一著者は北京大学チューリングクラスの学部生、李培卓氏である。

彼は重慶第一中学校を卒業し、情報科学コンテストの省チームに選ばれ、2017年の大学入試で687点を獲得して北京大学に入学した。

現在、Li Peizhuo 氏は Chen Baoquan 教授の下で学んでおり、ディープラーニングとコンピュータグラフィックスを研究の方向性としています。現在は北京大学のビジュアルコンピューティングおよび学習研究所と北京電影学院の未来画像先端イノベーションセンター (AICFVE) でインターンシップを行っています。

彼は以前、SIGGRAPH で論文を発表していました。 QuantumBit とのやり取りの中で、彼はグラフィックスに特に興味があることを表明しました。

論文の詳細については、興味のある方はリンクをクリックして詳細をご覧ください。

プロジェクトのホームページ:
https://peizhuoli.github.io/neural-blend-shapes/
論文の宛先:
https://peizhuoli.github.io/neural-blend-shapes/papers/neural-blend-shapes-camera-ready.pdf

<<: 10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました

>>: 自然言語処理 (NLP) とは何ですか?

GPT-4 ワイルドスポークスマン Terence Tao: 新しい文学ツールは、それがなければ崩壊してしまいます! 11ページの「超短編」新作がオンラインになりました

筋肉の震えもはっきりと見えます！ 3D人体モデル自動生成アルゴリズム、第一著者北京大学チューリングクラス

提案されたニューラル融合形状技術

著者の1人は北京大学チューリングクラス出身である

GPT-4 ワイルドスポークスマン Terence Tao: 新しい文学ツールは、それがなければ崩壊してしまいます! 11ページの「超短編」新作がオンラインになりました

2022年までのビッグモデルの未来を展望し、周志華、唐潔、楊紅霞といったビッグネームはどう考えているのだろうか？

AIが中古高級品の真贋を判別、同社は精度は99.1%と主張

人工知能はどのようにしてスマートホームを実現するのでしょうか?

カメラの前で指をタップすることでパーキンソン病の症状を遠隔で評価するAIツールが開発される

AI-WAN: AIOps と SD-WAN が出会うとき

2022年にJAXを使うべきでしょうか？ GitHubには16,000個のスターがあるが、この若いツールは完璧ではない

AIを活用して都市の建物の特性を識別し、地震などの災害に対するリスクを予測する

カリフォルニア大学バークレー校と他の研究チームは、岩の多い海岸や草原を横断しながら、変化する環境にリアルタイムで素早く適応する新しいロボット動作アルゴリズムを開発している。

推薦する

インテリジェントな人間とコンピュータの相互作用とは何ですか?

ETHは、画像の超解像と画像の再スケーリングを考慮して、新しい統合フレームワークHCFlowを提案しています。

究極のAlphaGo、DeepMindの新アルゴリズムMuZero、著者の解釈

自動化プロジェクトの成功は、ビジネスとITの高度な連携にかかっています。

ディープラーニングの背後にある数学的アイデアを分析する

GPT-4 だけが自己改善可能、GPT-3.5 はできない、MIT と Microsoft のコード生成実験で新たな発見

AI時代、私たちは将来の仕事にどう備えればいいのでしょうか？

囲碁AIの不正行為の最初の事例はすでに発生しています。他の事例は後れを取っているのでしょうか？

認知知能を業界の奥深くまで導くWAIC Baiduが言語と知識技術の完全なレイアウトを公開

海外メディア：人間はますます余暇を持ち、AIは資本主義を排除する

金融業界のデータ管理はどこへ向かうのでしょうか?