この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 グレーの 3D モデルに「新しいスキン」を追加するのはどれくらい簡単ですか? 今では、それを実行するために必要なのは1 つの文だけです。 見て! 普通の小さなデスクランプは「ブリックランプ」と表現でき、すぐに「ブリックランプ」になります。 灰色のポニーに「Astronaut Horse」という文字を追加すると、そのポニーは即座に「Astronaut Horse」になります。 操作が簡単なだけでなく、あらゆる角度から細部や質感まで表現します。 これはText2Meshと呼ばれるモデルを使用して作成されています。これは3D オブジェクトの「スキン変更」専用に設計されており、シカゴ大学とテルアビブ大学が共同で作成しました。 面白いと思いませんか? 3D オブジェクトの「スキン変更」を 1 文で実行Text2Mesh モデルの入力には、3D メッシュ (元の画像の品質に関係なく) とテキストの説明のみが必要です。 具体的な変換プロセスは次のとおりです。 入力元のメッシュモデルメッシュ、頂点V∈Rn×3、表面F∈{1, . . . , n}m×3は、トレーニングプロセス全体を通じて固定されます。 次に、ニューラル スタイル ネットワークが構築され、メッシュの各頂点のスタイル属性が生成され、表面全体でスタイルを定義できるようになります。 具体的には、ネットワークはメッシュ表面 p∈V 上の点を対応する RGB カラーにマッピングし、法線方向に沿って移動させて、様式化された初期メッシュを生成します。 このメッシュは複数のビューからレンダリングされます。 次に、CLIP に組み込まれた 2D 拡張テクノロジを使用して、結果をよりリアルにします。 このプロセスでは、レンダリングされた画像とテキストプロンプト間の CLIP 類似度スコアが、ニューラル ネットワークの重みを更新するための信号として使用されます。 Text2Mesh 全体に事前トレーニングは必要なく、専用の 3D メッシュ データセットも必要なく、UV パラメータ化 (三角形メッシュを 2 次元平面に展開する) も必要ありません。 具体的な効果は何ですか?Text2Mesh は単一の GPU でトレーニングするのに 25 分もかからず、10 分以内に高品質の結果を生成できます。 さまざまなスタイルを生成でき、詳細も非常によく復元されます。 例えば、下の写真では、雪だるま、忍者、バットマン、ハルク、あるいはスティーブ・ジョブズ、メッシ、弁護士など、服のしわ、アクセサリー、筋肉、髪の毛など、細部まで鮮明に表現できます。 研究者らは、Text2Mesh とベースライン手法である VQGAN を比較するためのユーザー調査も設計しました。 採点には 3 つの質問が含まれます。1. 生成された結果の自然さ。2. テキストと結果の一致。3. 結果と元の画像との一致。 57 人のユーザーが評価した結果、次のようになりました。 Text2Mesh はすべてのカテゴリーで VQGAN よりも高いスコアを獲得しています。 さらに、Text2Mesh はより複雑で特殊なテキスト記述も処理できます。 たとえば、「かぎ針編みで作られた光沢のある金色の衣類用アイロン」: 「波形金属を使用したブルースチールの高級テーブルランプ」: さらに、Text2Mesh モデルは画像によって直接駆動することもできます。 たとえば、サボテンの写真があれば、元の灰色の 3D 豚を「サボテン スタイル」に直接変換できます。 もう一つText2Mesh コードはオープンソース化されており、デモが Kaggle Notebook にアップロードされています。興味のある方は以下をお試しください: 最後に、これが何だかわかりますか? デモアドレス: 紙: コード: 参考リンク: |
<<: GANは画像生成の王様ではないでしょうか?最近は拡散モデルが人気になり、その影響はSOTAにも及んでいる。
[[248121]] [[248122]]最近はアプリが満載のスマートフォンを持っている人はほとん...
序文Meituan マーチャント データ センター (MDC) には、調整および監査済みの POI ...
「ディープラーニングフレームワークは人工知能技術システムの真ん中にあり、下のチップと上のアプリケーシ...
[[415947]]顔認識技術は今や私たちの生活のあらゆる側面に浸透しています。公共の安全、スマー...
2024 年までに、AI は少なくとも 3 つの異なる方法で顧客体験 (CX) に影響を与えるでしょ...
[[375039]]人工知能の歴史は、アラン・チューリングがチューリングテストを発明した 1950...
近年、人工知能(AI)の急速な台頭と各産業への応用は、社会経済の生産構造と生産関係に破壊的な影響を及...
オラクルが最近ラスベガスで開催したモダン・ビジネス・エクスペリエンス・カンファレンスで、同社のCEO...
Facebook は最近、コンパイラ最適化タスクを実行するための高性能で使いやすい強化学習 (RL)...
ロボットが社会を変える出発点は、旅行の分野にあるかもしれない。 1956 年、ジョン・マッカーシーは...
19 世紀には、絵画、彫刻、版画などの分野で印象派の芸術運動が広まりました。その特徴は「形をほとんど...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
9月27日、ネイチャー誌は45の機関からなる国際科学研究チームの最新の研究成果を発表した。 200...
スポーツにロボットを導入することは、器用な移動、リアルタイムのモーション制御、経路計画などの最新ロボ...