AIが5分で「3D展示」を完成させる「魔法の博物館」を制作

AIが5分で「3D展示」を完成させる「魔法の博物館」を制作

よく見てください、ここはメカスーツまで多種多様な展示品がある「魔法博物館」です...

魔法の鏡、クリスタルの杖...まるで本当に魔法の世界に入ったかのように、あらゆるものが揃っています。

そうです、この「博物館」の「展示物」はすべて AI によって作成されており、1 つ作成するのに 5 分しかかかりません。

南洋理工大学、上海AI研究所などの研究者が共同で、新しいVincent 3Dベースモデル3DTopiaを発表しました。

テキスト一式だけで、5分以内に多様で高精度な3Dモデルを生成できます。

「魔法博物館」の展示品以外にも、3DTopia では日常的なオブジェクトも正確に合成できます。

たとえば、上司が突然オフィスを飾りたくなった場合、テーブルや椅子の外観を作成し、テーブルの上のコーヒーまで一緒に「準備」することができます。

少々突飛なことでも構いません。人々が思いつけば、月の「砂のテーブル」を作ることができます。

では、3DTopia を使用して 3D モデルを作成するにはどうすればよいでしょうか?

推論は2段階で行われる

3DTopia の推論プロセスは 2 つの段階に分かれています。最初の段階では、プロンプトの単語に基づいてポイント クラウド形式で大まかなモデルを生成します。

たとえば、ロボットモデルを生成するように指示すると、最初の段階で取得されるモデルは次のようになります。

2 番目の段階は、チームが立ち上げた theeefiner を使用して、この大まかなポイント クラウドを精緻化し、色付けなどの操作を完了することです。

イーファイナーを最適化した後、ロボットモデルは最終的に人間に馴染みのあるものになりました。

したがって、実際の運用プロセスでは、これら 2 つの部分で使用するツールを個別に展開する必要もあります。

まず、3DTopia ファイルを pull し、conda を使用して仮想環境を作成し、インストールを完了します。次に、別のチュートリアルのデプロイメントの第 2 段階で使用する threefiner をインストールします。

デプロイが完了すると、チェックポイント ファイルが HuggingFace からダウンロードされ、指定されたディレクトリに配置されます。

全体のプロセスは難しくありませんが、初心者が操作するには多少の労力が必要になる場合があります。

したがって、このデプロイメント プロセスが面倒すぎると思われる場合は、優れた人物によって調整された Colab ノートブックを参照してください。

このノートブックを使用すると、プロンプトの単語とファイル名を変更するだけで、展開プロセスはワンクリックで完了します。ただし、実際のテストでは、完璧に実行するには A100 を選択する必要があります。

このノートでは、第 2 段階を 2 つのサブステップに分割しているため、デプロイ後に合計 3 つのコードを実行する必要があります。プロンプト ワードを変更する方法は、次の図のとおりです。

ステージ 1 で生成されたファイル名は、左側のフォルダー アイコンをクリックすると、3DTopia - results ディレクトリで見つかります。最初のドラフトのプレビュー ビデオもステージ 1 ディレクトリに生成されます。

最終的な製品モデルは、デフォルトで stage2 ディレクトリに保存されます。

ただし、現在のノートのステップ 2-2 に小さなエラーがあることに注意する必要があります。実行する前に、threefiner の前に英語の感嘆符を追加する必要があります。そうしないと、正しく実行されません。

GitHub: https://github.com/3DTopia/3DTopia
Colab ノート: https://colab.research.google.com/github/camenduru/3DTopia-jupyter/blob/main/3DTopia_jupyter.ipynb

<<:  教育に人工知能を使う理由

>>:  アルトマン氏の地位は再び危険にさらされているのか? ! OpenAIの取締役会が競合他社の参加を呼びかけ、Google Geminiの幹部を引き抜いた

ブログ    
ブログ    

推薦する

人工知能が銀行業界の変革を加速します!ビッグデータにより各ユーザーの信用格付けが提供されます!

[[221188]]将来、人工知能が 380 万人以上の銀行員の仕事を全て置き換える日が来るのでし...

データコレクターでリアルタイム機械学習に TensorFlow を使用する方法

【51CTO.com クイック翻訳】ビジネス ユーザーとアプリケーションがさまざまなソースからの生デ...

OpenAIの仮説が覆される!計算量を考慮すると、小さいモデルの方が大きいモデルよりも優れています。Llama 2 のトレーニングは GPU コンピューティングに関連しています。

モデルを推論する際には、収束が遅いために計算能力を無駄にしないようにすることが重要です。孫子の兵法に...

テスラのオプティマスロボットプロジェクトは強化学習などの分野でエンジニアを募集している

テスラは11月1日、強化学習の専門家を含むヒューマノイドロボットプロジェクト「オプティマス」のエンジ...

AI人材の確保をめぐる秘密の戦い:中国が勝利する可能性は?

[[251811]]画像ソース @Visual China人工知能の概念は、提唱されてから60年以...

あるいは人間の目よりも鮮明です!世界初の3D人工眼球が発売され、何百万人もの人々が視力を取り戻す

[[327384]] 5月24日、メディアの報道によると、香港科技大学の研究者らがネイチャー誌に発表...

モバイルデバイスにディープラーニングを導入: モバイルデバイスにおける Mogujie のディープラーニング最適化の実践

[51CTO.com からのオリジナル記事] ディープラーニングは、データを表現する学習に基づいた機...

スーパーコンピューターで設計された、カエルの細胞から作られた初の生きたロボット

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

百度CTO王海鋒氏:オープンソースは技術革新と産業発展の原動力である

12月20日、国家深層学習技術応用工程研究室と百度が共催するWAVE SUMMIT+2020深層学習...

...

...

...

デューク大学: 効率的な人工知能システムのソフトウェアとハ​​ードウェアの共同設計

少し前に、機械知能 AI テクノロジー年次会議がオンラインで開催されました。デューク大学電気・コンピ...

...