よく見てください、ここはメカスーツまで多種多様な展示品がある「魔法博物館」です... 魔法の鏡、クリスタルの杖...まるで本当に魔法の世界に入ったかのように、あらゆるものが揃っています。 そうです、この「博物館」の「展示物」はすべて AI によって作成されており、1 つ作成するのに 5 分しかかかりません。 南洋理工大学、上海AI研究所などの研究者が共同で、新しいVincent 3Dベースモデル3DTopiaを発表しました。 テキスト一式だけで、5分以内に多様で高精度な3Dモデルを生成できます。 「魔法博物館」の展示品以外にも、3DTopia では日常的なオブジェクトも正確に合成できます。 たとえば、上司が突然オフィスを飾りたくなった場合、テーブルや椅子の外観を作成し、テーブルの上のコーヒーまで一緒に「準備」することができます。 少々突飛なことでも構いません。人々が思いつけば、月の「砂のテーブル」を作ることができます。 では、3DTopia を使用して 3D モデルを作成するにはどうすればよいでしょうか? 推論は2段階で行われる3DTopia の推論プロセスは 2 つの段階に分かれています。最初の段階では、プロンプトの単語に基づいてポイント クラウド形式で大まかなモデルを生成します。 たとえば、ロボットモデルを生成するように指示すると、最初の段階で取得されるモデルは次のようになります。 2 番目の段階は、チームが立ち上げた theeefiner を使用して、この大まかなポイント クラウドを精緻化し、色付けなどの操作を完了することです。 イーファイナーを最適化した後、ロボットモデルは最終的に人間に馴染みのあるものになりました。 したがって、実際の運用プロセスでは、これら 2 つの部分で使用するツールを個別に展開する必要もあります。 まず、3DTopia ファイルを pull し、conda を使用して仮想環境を作成し、インストールを完了します。次に、別のチュートリアルのデプロイメントの第 2 段階で使用する threefiner をインストールします。 デプロイが完了すると、チェックポイント ファイルが HuggingFace からダウンロードされ、指定されたディレクトリに配置されます。 全体のプロセスは難しくありませんが、初心者が操作するには多少の労力が必要になる場合があります。 したがって、このデプロイメント プロセスが面倒すぎると思われる場合は、優れた人物によって調整された Colab ノートブックを参照してください。 このノートブックを使用すると、プロンプトの単語とファイル名を変更するだけで、展開プロセスはワンクリックで完了します。ただし、実際のテストでは、完璧に実行するには A100 を選択する必要があります。 このノートでは、第 2 段階を 2 つのサブステップに分割しているため、デプロイ後に合計 3 つのコードを実行する必要があります。プロンプト ワードを変更する方法は、次の図のとおりです。 ステージ 1 で生成されたファイル名は、左側のフォルダー アイコンをクリックすると、3DTopia - results ディレクトリで見つかります。最初のドラフトのプレビュー ビデオもステージ 1 ディレクトリに生成されます。 最終的な製品モデルは、デフォルトで stage2 ディレクトリに保存されます。 ただし、現在のノートのステップ 2-2 に小さなエラーがあることに注意する必要があります。実行する前に、threefiner の前に英語の感嘆符を追加する必要があります。そうしないと、正しく実行されません。 GitHub: https://github.com/3DTopia/3DTopia |
>>: アルトマン氏の地位は再び危険にさらされているのか? ! OpenAIの取締役会が競合他社の参加を呼びかけ、Google Geminiの幹部を引き抜いた
[[195357]]パーソナライズされた推奨はビッグデータ時代に欠かせない技術であり、電子商取引、情...
最近の教育プロセスの中で、何人かの子供たちが私に大学で何を専攻すればいいかと尋ねました。将来的に発展...
導入現実世界で働くときには、直面しなければならない事実がいくつかあります。この記事ではそれについて説...
[51CTO.com クイック翻訳]チャットボットは、人間との会話を自動的に行い、組織と顧客間のビジ...
「おはようございます、ジョーンズさん。ロンドン・ガトウィック空港からパリへの『ニューノーマル』フライ...
10月12日、外国メディアは関係者の話として、人工知能(AI)研究企業OpenAIが来月、開発者向け...
9月12日、複数の投資家は、NVIDIAがすでに人工知能(AI)チップ製造の分野で優位に立っており...
[[211834]]人工ニューラル ネットワーク (ANN) は脳の処理メカニズムに基づいており、複...
2022 年に雇用主の間で最も人気のあるプログラミング言語はどれですか? 地域や職種によってソフトウ...
新型コロナウイルス肺炎の流行状況の変化に伴い、企業や機関の業務と生産の再開が現在の仕事の新たな焦点と...
インターネット上の言語と画像を習得した後、大きなモデルが最終的に現実世界に入り、「具現化された知能」...