マイクロソフトは、対話してマルチモーダルコンテンツを生成できる AI モデル CoDi をリリースしました。

マイクロソフトは、対話してマルチモーダルコンテンツを生成できる AI モデル CoDi をリリースしました。

マイクロソフトは 7 月 11 日にプレスリリースを発行し、Combinable Diffusion Model (CoDi) を発表しました。これは、マルチモーダル コンテンツを対話して生成するように設計された、構成可能な拡散に基づく独自の人工知能モデルです。

Microsoft は、従来の単一モダリティ AI モデルの制限に対処するために CoDi を設計しました。同期されたビデオとオーディオを例にとると、独立して生成された情報ストリームは、つなぎ合わせたときに不整合や位置合わせの問題が発生する可能性があります。

CoDi は、独自の構成可能な生成戦略を採用し、拡散プロセスで複数のモダリティを調整して、絡み合ったパターンを生成します。さらに重要なのは、CoDi が任意の入力パターンを処理し、任意のモダリティのコンテンツを生成できることです。

CoDi は、Microsoft Azure Cognitive Services Research チームとノースカロライナ大学チャペルヒル校の協力により開発されたもので、人工知能を使用して人間とコンピューターの相互作用を強化する Microsoft のプロジェクト i-Code の一部です。

IT Home は、CoDi プロジェクトの公式紹介リンクをここに添付しています。興味のあるユーザーは、詳細を読むことができます。

<<:  考えてみてください。連合学習は大規模な言語モデルをトレーニングできるのでしょうか?

>>:  米国政府が警告: ​​ChatGPT は重大なセキュリティリスクをもたらす

ブログ    
ブログ    

推薦する

現在のディープニューラルネットワークモデルの圧縮と加速方法の概要

[[208162]]大規模なニューラル ネットワークには多数のレイヤーとノードがあるため、特にオンラ...

ビッグデータ、人工知能、ロボットの血縁関係とは?

ビッグデータ、人工知能(AI)、ロボット、アルゴリズム、ディープラーニング、モノのインターネット、セ...

人工知能、機械学習、アルゴリズムが施設・資産管理に与える影響

急速に進化する今日のテクノロジーの世界では、「人工知能」、「機械学習」、「アルゴリズム」などの用語が...

...

人工知能が爆発的に進化しています。この「鉄の飯碗」を手に入れるための新しいガイドをぜひ保存してください!

近年の人工知能の発展スピードは驚異的で、あらゆる分野で専門的なAIが登場しています。上海では以前、無...

人工知能は希少疾患を患う4億人の患者がより効果的な診断を受けるのに役立っている

[[284630]] ▲人工知能は数百万の遺伝子変異を高速で検索し、希少疾患の原因を特定することがで...

GitHub ホットリスト 1 位: 数百万のトークン コンテキスト、動画も生成可能、カリフォルニア大学バークレー校制作

今日の GitHub ホット リストのトップは、最新のオープン ソース ワールド モデルです。コンテ...

作業の重複をなくしましょう! 30分で独自のディープラーニングマシンを作成する方法を教えます

[[327809]]画像ソース: unsplash繰り返し作業はいつも面倒です。新しいプロジェクトを...

2019年ディープラーニングフレームワークランキング(トップ10からトップ3まで)

【51CTO.comオリジナル記事】 1. 前に書く5Gは2019年上半期の輝く「星」と言えるが、...

機械学習を攻撃に利用する9つの方法

機械学習と人工知能 (AI) は、一部の脅威検出および対応ツールの中核技術になりつつあります。サイバ...

...

汎用聴覚AIのロックを解除します!清華大学電子工学部とVolcano Voiceが共同で新しい認知指向の聴覚言語モデルをオープンソース化

最近、清華大学電子工学部と Volcano Voice チームが協力して、認知指向のオープンソース聴...

Google、ブラウザで動作するプログラミング不要のAIトレーニングツールをアップデート

Google は人工知能トレーニング ツール「Teachable Machine」をアップグレードし...

サイバーセキュリティにおける人工知能の応用

1. アプリケーションの背景インターネットの急速な発展と広範な応用により、ネットワーク セキュリティ...

...