マイクロソフトは、対話してマルチモーダルコンテンツを生成できる AI モデル CoDi をリリースしました。

マイクロソフトは、対話してマルチモーダルコンテンツを生成できる AI モデル CoDi をリリースしました。

マイクロソフトは 7 月 11 日にプレスリリースを発行し、Combinable Diffusion Model (CoDi) を発表しました。これは、マルチモーダルコンテンツを対話して生成するように設計された、構成可能な拡散に基づく独自の人工知能モデルです。

Microsoft は、従来の単一モダリティ AI モデルの制限に対処するために CoDi を設計しました。同期されたビデオとオーディオを例にとると、独立して生成された情報ストリームは、つなぎ合わせたときに不整合や位置合わせの問題が発生する可能性があります。

CoDi は、独自の構成可能な生成戦略を採用し、拡散プロセスで複数のモダリティを調整して、絡み合ったパターンを生成します。さらに重要なのは、CoDi が任意の入力パターンを処理し、任意のモダリティのコンテンツを生成できることです。

CoDi は、Microsoft Azure Cognitive Services Research チームとノースカロライナ大学チャペルヒル校の協力により開発されたもので、人工知能を使用して人間とコンピューターの相互作用を強化する Microsoft のプロジェクト i-Code の一部です。

IT Home は、CoDi プロジェクトの公式紹介リンクをここに添付しています。興味のあるユーザーは、詳細を読むことができます。

<<: 考えてみてください。連合学習は大規模な言語モデルをトレーニングできるのでしょうか?

>>: 米国政府が警告: ChatGPT は重大なセキュリティリスクをもたらす

AI ロボットは製造業にどのような変化をもたらすのでしょうか?

AI ロボットは製造業にどのような変化をもたらすのでしょうか?

ブログ

南洋理工大学華中科技大学などの最新研究：完全自動化された「即脱獄」、大型モデルだけが大型モデルを倒せる！ NDSS

南洋理工大学華中科技大学などの最新研究：完全自動化された「即脱獄」、大型モデルだけが大型モデルを倒せる！ NDSS

ブログ

画像分類の精度を段階的に向上させるにはどうすればよいでしょうか?

画像分類の精度を段階的に向上させるにはどうすればよいでしょうか?

ブログ

デジタル時代において、クラウドインテリジェンスはクラウドの未来を再定義します

デジタル時代において、クラウドインテリジェンスはクラウドの未来を再定義します

ブログ

百度研究所が新しいAIツールを発表：10分以内に記事を自動的に動画に変換可能

百度研究所が新しいAIツールを発表：10分以内に記事を自動的に動画に変換可能

ブログ

ディープラーニングベースの検出および認識アルゴリズムをSAR画像のインテリジェントな解釈に適用する

ディープラーニングベースの検出および認識アルゴリズムをSAR画像のインテリジェントな解釈に適用する

ブログ

エッジ人工知能とは？エッジ人工知能の実装方法

エッジ人工知能とは？エッジ人工知能の実装方法

ブログ

AIと自動化はCOVID-19後のビジネス成功の鍵

AIと自動化はCOVID-19後のビジネス成功の鍵

ブログ

アルゴリズム図: 括弧が有効かどうかを判断するにはどうすればよいでしょうか?

アルゴリズム図: 括弧が有効かどうかを判断するにはどうすればよいでしょうか?

ブログ

自動運転時代のヒューマンマシンインタラクションの発展動向

自動運転時代のヒューマンマシンインタラクションの発展動向

ブログ

推薦する

AIが写真を見て場所を推測、その精度は90%以上！スタンフォードの最新のPIGEONモデル：予測誤差の40％は25キロメートル未満

インターネット上に何気なく投稿された写真から、どれほどの情報が漏れてしまうのでしょうか？外国人ブロガ...

ビデオPSツール！文字の非表示と透かしの除去：CVPRで発表されたこの研究はオープンソース化されました

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載...

RSA-PSSアルゴリズムを一緒に学びましょう

[[400577]] AS(5): RSA-PSSアルゴリズムの紹介2018 年にリリースされた T...

比類のない美しさ！ AIが90年前の梅蘭芳を復元：目と眉毛が感情を伝え、生きているかのよう

[[407844]]約 100 年前の白黒画像にカラーを施すと、歴史的な意味がさらに増すのでしょうか...

...

人間の脳をインターネットに接続するときは注意してください

[[264958]]将来、道を歩いていて急にお腹が空いたとき、今のように検索エンジンを使って検索する...

...

...

人工知能はこれら12の分野に混乱をもたらし、ホワイトカラー労働者も職を失うことになるだろう

[[192649]]人工知能 (AI) は、今日最もエキサイティングで将来有望な最先端技術の 1 つ...

...

...

敏捷性の秘密: iPCA ネットワークパケット保存アルゴリズム

次世代ネットワークにおける「見える化」への欲求ネットワークが複雑になるにつれて、ネットワーク管理に対...

百度の自動運転技術は掘削機の運転を熟練ドライバーと同等の効率化に導く

海外メディアのTech Xploreによると、百度の研究ロボット工学・自動運転研究所（RAL）とメリ...

...

あなたが私に言うと思いますよ！「私は数え切れないほどの映画を見てきました」ChatGPT、数分で私の記憶の奥深くにある映画を推測してください！

こんな経験をしたことがありますか？ TikTok の 3 部構成のミニマリスト説明など、映画や映画の...