マイクロソフトは 7 月 11 日にプレスリリースを発行し、Combinable Diffusion Model (CoDi) を発表しました。これは、マルチモーダル コンテンツを対話して生成するように設計された、構成可能な拡散に基づく独自の人工知能モデルです。 Microsoft は、従来の単一モダリティ AI モデルの制限に対処するために CoDi を設計しました。同期されたビデオとオーディオを例にとると、独立して生成された情報ストリームは、つなぎ合わせたときに不整合や位置合わせの問題が発生する可能性があります。 CoDi は、独自の構成可能な生成戦略を採用し、拡散プロセスで複数のモダリティを調整して、絡み合ったパターンを生成します。さらに重要なのは、CoDi が任意の入力パターンを処理し、任意のモダリティのコンテンツを生成できることです。 CoDi は、Microsoft Azure Cognitive Services Research チームとノースカロライナ大学チャペルヒル校の協力により開発されたもので、人工知能を使用して人間とコンピューターの相互作用を強化する Microsoft のプロジェクト i-Code の一部です。 IT Home は、CoDi プロジェクトの公式紹介リンクをここに添付しています。興味のあるユーザーは、詳細を読むことができます。 |
<<: 考えてみてください。連合学習は大規模な言語モデルをトレーニングできるのでしょうか?
>>: 米国政府が警告: ChatGPT は重大なセキュリティリスクをもたらす
AI と自動化が進歩するにつれて、企業は人間的なタッチを維持しながらこれらのツールを最も効果的に活用...
DeepNude、DeepFake、Forgiveness Bao のストーリーは、テクノロジーが...
現在、コンピューター ビジョン ニューラル ネットワークは高度にパラメータ化されています。通常、数千...
この期間中、自宅に留まっている人々は、定期的にスーパーマーケットに行って商品を購入するという問題にも...
2020年、「人工知能」は産業発展における高頻度のホットワードとなり、市場展望は業界全体で広く認知さ...
これらの施設は重要であるにもかかわらず、あまり理解されていません。しかし、最近ではデータセンターに注...
10月28日、英国の消費者団体Which?が現地時間金曜日に発表した最新の調査結果によると、犯罪者は...
[[380742]]カナダのプライバシー保護担当コミッショナーは水曜日、顔認識スタートアップ企業のク...
この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像...
みなさんこんにちは。JavaプログラマーのChenです。最近、Open AIが再び人気を集めており、...
[51CTO.com からのオリジナル記事] ロボット製造は現在、知能ロボットの時代である 2.0 ...