6月21日、Intel ResearchはBlockade Labsと提携してLDM3D(Latent Diffusion Model for 3D)モデルをリリースしたと発表しました。この新しい拡散モデルは、生成AIを使用して3Dビジュアルコンテンツを作成します。 報道によると、 LDM3D は拡散プロセスを使用して深度マップを生成し、リアルで没入感のある 360 度パノラマを生成する業界をリードするモデルです。 LDM3D は、コンテンツ作成、メタバース アプリケーション、デジタル エクスペリエンスに革命をもたらし、エンターテイメント、ゲーム、建築、デザインなど多くの業界を変革する可能性があります。 インテルは、LDM3D は 10,000 個のサンプルを含む LAION-400M データセットのサブセットでトレーニングされたと述べた。 LAION-400M は、4 億を超える画像とテキストのペアを含む大規模な画像とテキストのデータセットです。研究チームは、トレーニング コーパスに注釈を付ける際に、Intel Labs が以前に開発した高密度深度推定モデルである DPT-Large を使用しました。このモデルは、画像内の各ピクセルに対して非常に正確な相対深度を提供します。 LAION-400M データセットは、研究者やその他の関心のあるコミュニティがより大規模なモデルトレーニングをテストできるように、研究目的で作成されました。 LDM3Dモデルは、Intel XeonプロセッサとIntelを搭載したIntel AIスーパーコンピュータでトレーニングされました。 ハバナガウディAIアクセラレータドライバー。最終的なモデルとパイプラインは、RGB 画像と深度マップを統合して、没入感のある体験を実現する 360 度のパノラマを生成します。 |
<<: テスラがテスラAIのTwitterアカウントを開設、Dojoスーパーコンピューターの生産を来月開始すると発表
>>: エッジ AI がインダストリー 4.0 の成果を推進する方法
セマンティック埋め込みモデルは、検索、推奨、データマイニングなどの重要な分野で広く使用されています。...
2020年は、厳しい防疫活動のさなか、静かに過ぎていきました。今年も人工知能の進歩は止まりませんでし...
世界有数の情報技術調査およびアドバイザリ企業であるガートナーによる最近の調査によると、現在人工知能 ...
[[247168]]最近、IBM は、AI アプリケーションがどのように意思決定を行うかを説明する際...
[[438829]]発進時に左ウィンカーを出し、歩行者がいる場合はスピードを落として迂回し、障害物が...
現在、ディープラーニングサービスを提供する事業者は数多く存在します。これらのサービスを利用する際には...
音声制御システムから今日のいくつかの無人技術まで、人工知能は徐々に成熟しています。ビッグデータセンタ...
ガートナーの 2021 年人工知能ハイプ サイクルの 4 つのトレンドが、短期的な AI イノベーシ...
[[283120]]インターネット全体が「メイおばさん」を探しているが、彼女が誰なのかは謎のままだ...
ディープラーニングは人工知能の分野に多大な貢献をしてきましたが、その技術自体には依然として致命的な欠...
健康診断のために病院に行くところを想像してください。診察室に入るとすぐに、看護師があなたの写真を撮り...