AIが5分で「3D展示」を完成させる「魔法の博物館」を制作

AIが5分で「3D展示」を完成させる「魔法の博物館」を制作

よく見てください、ここはメカスーツまで多種多様な展示品がある「魔法博物館」です...

魔法の鏡、クリスタルの杖...まるで本当に魔法の世界に入ったかのように、あらゆるものが揃っています。

そうです、この「博物館」の「展示物」はすべて AI によって作成されており、1 つ作成するのに 5 分しかかかりません。

南洋理工大学、上海AI研究所などの研究者が共同で、新しいVincent 3Dベースモデル3DTopiaを発表しました。

テキスト一式だけで、5分以内に多様で高精度な3Dモデルを生成できます。

「魔法博物館」の展示品以外にも、3DTopia では日常的なオブジェクトも正確に合成できます。

たとえば、上司が突然オフィスを飾りたくなった場合、テーブルや椅子の外観を作成し、テーブルの上のコーヒーまで一緒に「準備」することができます。

少々突飛なことでも構いません。人々が思いつけば、月の「砂のテーブル」を作ることができます。

では、3DTopia を使用して 3D モデルを作成するにはどうすればよいでしょうか?

推論は2段階で行われる

3DTopia の推論プロセスは 2 つの段階に分かれています。最初の段階では、プロンプトの単語に基づいてポイント クラウド形式で大まかなモデルを生成します。

たとえば、ロボットモデルを生成するように指示すると、最初の段階で取得されるモデルは次のようになります。

2 番目の段階は、チームが立ち上げた theeefiner を使用して、この大まかなポイント クラウドを精緻化し、色付けなどの操作を完了することです。

イーファイナーを最適化した後、ロボットモデルは最終的に人間に馴染みのあるものになりました。

したがって、実際の運用プロセスでは、これら 2 つの部分で使用するツールを個別に展開する必要もあります。

まず、3DTopia ファイルを pull し、conda を使用して仮想環境を作成し、インストールを完了します。次に、別のチュートリアルのデプロイメントの第 2 段階で使用する threefiner をインストールします。

デプロイが完了すると、チェックポイント ファイルが HuggingFace からダウンロードされ、指定されたディレクトリに配置されます。

全体のプロセスは難しくありませんが、初心者が操作するには多少の労力が必要になる場合があります。

したがって、このデプロイメント プロセスが面倒すぎると思われる場合は、優れた人物によって調整された Colab ノートブックを参照してください。

このノートブックを使用すると、プロンプトの単語とファイル名を変更するだけで、展開プロセスはワンクリックで完了します。ただし、実際のテストでは、完璧に実行するには A100 を選択する必要があります。

このノートでは、第 2 段階を 2 つのサブステップに分割しているため、デプロイ後に合計 3 つのコードを実行する必要があります。プロンプト ワードを変更する方法は、次の図のとおりです。

ステージ 1 で生成されたファイル名は、左側のフォルダー アイコンをクリックすると、3DTopia - results ディレクトリで見つかります。最初のドラフトのプレビュー ビデオもステージ 1 ディレクトリに生成されます。

最終的な製品モデルは、デフォルトで stage2 ディレクトリに保存されます。

ただし、現在のノートのステップ 2-2 に小さなエラーがあることに注意する必要があります。実行する前に、threefiner の前に英語の感嘆符を追加する必要があります。そうしないと、正しく実行されません。

GitHub: https://github.com/3DTopia/3DTopia
Colab ノート: https://colab.research.google.com/github/camenduru/3DTopia-jupyter/blob/main/3DTopia_jupyter.ipynb

<<:  教育に人工知能を使う理由

>>:  アルトマン氏の地位は再び危険にさらされているのか? ! OpenAIの取締役会が競合他社の参加を呼びかけ、Google Geminiの幹部を引き抜いた

ブログ    

推薦する

推奨システムにおける自然言語処理 (NLP) の応用

[[195357]]パーソナライズされた推奨はビッグデータ時代に欠かせない技術であり、電子商取引、情...

今後 30 年間、人工知能の時代において、どの職業が消滅し、あるいは存続するのでしょうか?

最近の教育プロセスの中で、何人かの子供たちが私に大学で何を専攻すればいいかと尋ねました。将来的に発展...

...

機械学習に関する12の現実世界の真実

導入現実世界で働くときには、直面しなければならない事実がいくつかあります。この記事ではそれについて説...

10分で多言語チャットボットを作成する方法

[51CTO.com クイック翻訳]チャットボットは、人間との会話を自動的に行い、組織と顧客間のビジ...

航空会社が AI を活用して乗客体験を向上させる方法

「おはようございます、ジョーンズさん。ロンドン・ガトウィック空港からパリへの『ニューノーマル』フライ...

...

OpenAIは低コストで開発者を引き付けるために大規模なアップデートを計画している

10月12日、外国メディアは関係者の話として、人工知能(AI)研究企業OpenAIが来月、開発者向け...

AIチップ分野におけるNvidiaの優位性により、スタートアップ企業の資金調達は困難になっており、資金調達取引件数は80%減少した。

9月12日、複数の投資家は、NVIDIAがすでに人工知能(AI)チップ製造の分野で優位に立っており...

ニューラルネットワークアルゴリズムの利点と応用

[[211834]]人工ニューラル ネットワーク (ANN) は脳の処理メカニズムに基づいており、複...

2022 年ソフトウェア エンジニア レポートが公開されました。最も高い年収はサイバーセキュリティ業界、機械学習はNLPに勝てない

2022 年に雇用主の間で最も人気のあるプログラミング言語はどれですか? 地域や職種によってソフトウ...

AIは賢くなり、これらの新しい技術は流行の防止と生産の再開に役立つだろう

新型コロナウイルス肺炎の流行状況の変化に伴い、企業や機関の業務と生産の再開が現在の仕事の新たな焦点と...

...

ロボットチャットGPTが登場: ビッグモデルが現実世界に登場、DeepMindの画期的な進歩

インターネット上の言語と画像を習得した後、大きなモデルが最終的に現実世界に入り、「具現化された知能」...

...