インテルラボ、テキストプロンプトに基づいて360度パノラマ画像を生成する新しいAI拡散モデルをリリース

インテルラボ、テキストプロンプトに基づいて360度パノラマ画像を生成する新しいAI拡散モデルをリリース

6月21日、Intel ResearchはBlockade Labsと提携してLDM3D(Latent Diffusion Model for 3D)モデルをリリースしたと発表しました。この新しい拡散モデルは、生成AIを使用して3Dビジュアルコンテンツを作成します。

報道によると、 LDM3D は拡散プロセスを使用して深度マップを生成し、リアルで没入感のある 360 度パノラマを生成する業界をリードするモデルです。 LDM3D は、コンテンツ作成、メタバース アプリケーション、デジタル エクスペリエンスに革命をもたらし、エンターテイメント、ゲーム、建築、デザインなど多くの業界を変革する可能性があります。

インテルは、LDM3D は 10,000 個のサンプルを含む LAION-400M データセットのサブセットでトレーニングされたと述べた。 LAION-400M は、4 億を超える画像とテキストのペアを含む大規模な画像とテキストのデータセットです。研究チームは、トレーニング コーパスに注釈を付ける際に、Intel Labs が以前に開発した高密度深度推定モデルである DPT-Large を使用しました。このモデルは、画像内の各ピクセルに対して非常に正確な相対深度を提供します。 LAION-400M データセットは、研究者やその他の関心のあるコミュニティがより大規模なモデルトレーニングをテストできるように、研究目的で作成されました。

LDM3Dモデルは、Intel XeonプロセッサとIntelを搭載したIntel AIスーパーコンピュータでトレーニングされました。 ハバナガウディAIアクセラレータドライバー。最終的なモデルとパイプラインは、RGB 画像と深度マップを統合して、没入感のある体験を実現する 360 度のパノラマを生成します。

<<:  テスラがテスラAIのTwitterアカウントを開設、Dojoスーパーコンピューターの生産を来月開始すると発表

>>:  エッジ AI がインダストリー 4.0 の成果を推進する方法

ブログ    
ブログ    
ブログ    

推薦する

Google、人工知能をより有効活用できるよう複数のAIツールをリリース

Google は今週開催された Cloud Next カンファレンスで、さまざまな機械学習ツール、顧...

...

ICLR 2024 の合格率は 31% です。清華大学 LCM 論文著者: 冗談を言ったら拒否されました。

国際学習表現会議(ICLR 2024)は今年で12回目となり、今年は5月7日から11日までオーストリ...

スマートフォンアプリケーションにおける人工知能の役割

人工知能がスマートフォンアプリとユーザーエクスペリエンスをどのように変えているのか。進化し続けるテク...

AI、IoT、ビッグデータでミツバチを救う方法

現代の農業はミツバチに依存しています。私たちが食べる食物や呼吸する空気を含む生態系のほぼ全体が、花粉...

AIを使って人の心を理解する?感情科学の専門家:表情から感情を識別するのは信頼できない

AIは人間の感情を認識できるでしょうか?原理的には、AIは音声認識、視覚認識、テキスト認識、表情認識...

Stack Overflow が ChatGPT に対抗し、VS Code と連携する独自開発の生成 AI ツールをリリース

数日前、Stack Overflow コミュニティのトラフィックが大幅に減少したというニュースがあり...

オペレーティング システムに関して、一般的に使用されているスケジューリング アルゴリズムをいくつ知っていますか?

オペレーティング システムには多くのスケジューリング アルゴリズムがあり、ジョブ スケジューリングに...

データサイエンス プロジェクトに Scikit-learn Python ライブラリを使用する方法

[[246038]]柔軟で多様な Python ライブラリは、データ分析とデータマイニングのための強...

CCTV、春節に初めてバーチャル司会者サ・ベイニン氏を迎える

AIブロックチェーン企業の技術が中国の重要な国家夜会で正式に使用された。 2019年のオンライン春節...

生成AI技術の原理を深く理解する: 生成AIの入門

人工知能を単純に目的別に分類すると、意思決定型AIと生成型AIの2つに分けられます。いわゆる意思決定...

コンピュータビジョンプロジェクトのためのオブジェクト検出の初心者向けガイド

[51CTO.com クイック翻訳]近年、人工知能技術の発展と進歩に伴い、コンピュータービジョンとデ...

Google、新しいオープンソース圧縮アルゴリズム Brotli を発表

Zopfli に続いて、Google の公式ブログでは新しいオープンソース圧縮アルゴリズム Brot...

プログラマーに必要ないくつかの一般的なソートおよび検索アルゴリズムの概要

[[434262]]序文最近、アルゴリズムの基礎を固めるために、アルゴリズムの本にある基本的なアルゴ...