一言で言えば、ハルクに VR メガネをかけさせるのです。 4K品質。 パンダのファンタジーの旅 これは、あらゆる素晴らしいアイデアを実現できる ByteDance の最新 AI ビデオ生成モデル、 MagicVideo-V2です。 4K、8Kの超高解像度をサポートするだけでなく、さまざまな描画スタイルも簡単に保持できます。 △左から油絵風、サイバー風、デザイン風評価結果は、Gen-2、Pika、既存のAIビデオ生成ツールの結果を上回りました。 その結果、オンラインになってから24時間以内に大きな注目を集めました。たとえば、1つのツイートの閲覧回数は20万回近くに達しました。 多くのネットユーザーがその効果に驚き、 「ランウェイやピカよりもいい」とコメントする人もいた。 「ランウェイやピカよりもいい」研究者たちは実際に効果の比較を行った。出場者は、 MagicVideo-V2 、StabilityAIのSVD-XT 、新たな潜在的プレーヤーPika1.0 、RunwayのGen-2です。 ラウンド 1: 光と影の効果。
(左から右へ: 右上が MagicVideo-V2、SVD-XT、Pika、右下が Gen-2、以下同様) MagicVideo-V2、Gen-2、Pika のいずれも、明瞭な光と影があることがわかります。しかし、Pika は旅行者向けではないようですし、MagicVideo-V2 の色調はより豊かです。 第2ラウンド:状況プロットの表現。
このラウンドでは、MagicVideo-V2 と Gen-2 が明らかに優れています。 SVD-XT が提示する中景の構成は、その古さを反映してはいるものの、表現力が十分ではありません。 第3ラウンド: リアリズム。
今回はその対比がさらに顕著です。 MagicVideo-V2とSVD-XTは文章の意味を完全に反映しますが、MagicVideo-V2は子供の足の動きを詳細に見ることができます。 さらに、研究者らは、最先端の方法とMagicVideo-V2を1対1で人間に評価させました。 結果は、MagicVideo-V2 が他の方法よりもパフォーマンスが優れていると人々が考えていることを示しました。
どうやってそれを達成するのでしょうか?簡単に言えば、MagicVideo-V2 は、テキストから画像へのモデル、ビデオ モーション ジェネレーター、参照画像埋め込みモジュール、および補間モジュールを統合したビデオ生成パイプラインです。 まず、T2I モジュールがテキストに基づいて 1024×1024 の画像を生成します。次に、I2V モジュールが静止画像をアニメーション化して 600×600×32 フレームのシーケンスを生成します。次に、V2V モジュールを使用してビデオ コンテンツを強化および改善します。最後に、補間モジュールを使用してシーケンスを 94 フレームに拡張します。 このようにして、高い忠実度と時間的連続性が保証されます。 しかし、早くも2022年11月に、ByteDanceはMagicVideo V1バージョンをリリースしました。 しかし、当時は効率性が重視され、1 枚の GPU カードで 256 x 256 解像度のビデオを生成することができました。 参考リンク: |
>>: ブロックチェーン技術を活用してディープフェイク動画の脅威に対抗する方法
北京日報によると、異なる消費者が同じ電子商取引プラットフォーム上で同じキーワードを使用して商品を検索...
[[407974]]人工知能はこれまで以上にビジネスにおいて重要な役割を果たしています。プロフェッシ...
人工知能、コンピュータービジョン、モノのインターネット、その他の先進技術を備えたロボット警察は、法と...
最近、モバイル端末向けのディープラーニングフレームワークの開発がますます増えてきています。最近、アリ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人口の高齢化が加速し、教育に対する需要が引き続き強いことから、中国のサービスロボットは大きな市場潜在...
専門家は、この画期的な進歩により、人工知能を使って新たながん治療法を開発するという新しい時代が到来す...
AI は、私たちが行うほぼすべての方法を変えています。私たちが行くところすべてで、かつては人間が行っ...
[[314073]]あらゆるソフトウェア システムの重要なコンポーネントは、データを保存、取得、分...
政府機関には常にさまざまな文書が詰まっていますが、その多くは紙の文書であり、電子文書であっても、実際...
[[253124]] 2018 年は AI 分野にとって依然として刺激的な年です。今年はNLP研究...
[[226981]]ディープラーニングアルゴリズムの台頭と普及により、人工知能の分野、特にコンピュー...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...