Google、かわいい動物動画生成に優れたAI動画ジェネレータ「Lumiere」をリリース

Google、かわいい動物動画生成に優れたAI動画ジェネレータ「Lumiere」をリリース

海外メディアの報道によると、1月26日、GoogleはLumiereと呼ばれる人工知能ビデオジェネレータを発表し、関連するプレプリント論文の中でこれを「リアルなビデオ生成のための時空間拡散モデル」と呼んだ。 Lumiere は、ローラースケートを履いたり、車を運転したり、ピアノを弾いたりといったおかしな状況にいるかわいい動物たちのビデオをうまく作成しています。

Google によれば、Lumiere は独自のアーキテクチャを活用して、ビデオの全期間を一度に生成します。あるいは、同社の言葉を借りれば、「モデルを 1 回通過するだけで、ビデオの全時間継続時間を瞬時に生成できる時空間 U-Net アーキテクチャを導入します」。これは、離れたキーフレームを合成し、その後に時間的超解像を行う既存のビデオ モデルとは対照的であり、このアプローチでは、本質的に全体的な時間的一貫性を実現することが困難です。 ”

簡単に言えば、Google のテクノロジーは、空間的側面 (ビデオ内のオブジェクトの位置) と時間的側面 (ビデオ内でオブジェクトがどのように移動し変化するか) の両方を同時に処理するように設計されています。そのため、多くの小さな部分やフレームを組み合わせてビデオを作成するのではなく、最初から最後まで 1 つのスムーズなプロセスでビデオ全体を作成できます。

Lumiere はさまざまなパーティー トリックも実行できます。Google のデモ ページには、この優れた例が掲載されています。たとえば、テキストからビデオへの生成 (書かれたプロンプトをビデオに変換する)、静止画像をビデオに変換する、参照画像を使用して特定のスタイルでビデオを生成する、テキストベースのプロンプトを使用して一貫したビデオ編集を適用する、画像の特定の領域をアニメーション化して映画のようなグラフィックを作成する、ビデオ ペイント機能 (たとえば、人が着ている服の種類を変更する) を提供するなどの機能があります。

ルミエールの研究論文の中で、グーグルの研究者らは、AIモデルが1024×1024ピクセルの5秒間の動画を出力し、それを「低解像度」と呼んでいると述べた。こうした制限にもかかわらず、研究者らはユーザー調査を実施し、Lumiere の出力は既存の AI ビデオ合成モデルよりも人気があると主張しています。

<<:  トラフィックエンジニアリングによりコード生成の精度が2倍に向上: 19%から44%

>>: 

ブログ    

推薦する

顔認識:攻撃の種類となりすまし防止技術

コンピュータサイエンスとエレクトロニクスの急速な発展により、顔認証は現在、指紋に次いで世界第2位の市...

...

Linuxに顔認識ログインを追加する方法

最近、Deepin OS 20.05がリリースされ、追加された顔認識機能がコミュニティの注目を集めて...

200以上の機械学習ツールを見て学んだこと

[[332582]]ビッグデータダイジェスト制作出典: huyenchip編集者: フィッシャー、ア...

AIを使ってアニメーションを作成する方法と、さまざまなツールがあなたを待っています

生成 AI は、インターネット上の重要なコンテンツ ソースとなっています。AI によって生成されたテ...

ChatGPT の機能低下が論争を引き起こしています。AIGC アプリケーションは依然として信頼できるのでしょうか?

スタンフォード大学とカリフォルニア大学バークレー校(UCLA)の研究者による新しい研究では、これらの...

2016年の音声認識の発展を技術的な観点から振り返る

ディープラーニングと人工ニューラルネットワークの発展により、音声認識は 2016 年に一連のブレーク...

中国人はアルゴリズムと戦い始めている:ログインなし、いいねなし、フォローなし、コメントなし

[[402565]]インターネット業務に携わる陸鋒さんは、あるテクノロジー製品の機能やユーザーエクス...

...

アルゴリズム | ダブルポインタはリンクリストを破る優れた魔法の武器です

今は少し理解できました。面接の過程で、面接官が私たちにコードを手書きで書くように頼むことがあります。...

...

2021年10月のドローン業界の最新動向を3分で振り返る

現在、人工知能や5Gなどの技術の助けを借りて、我が国のドローン開発は急速な成長の軌道に乗っています。...

生成 AI は DevSecOps を殺すのか?

ノアが編集制作:51CTO テクノロジースタック(WeChat ID:blog)生成 AI は De...

人工知能はリモートセンシングデータの大きな可能性を解き放ち、国勢調査の手作業が置き換えられるかもしれない

畳み込みニューラルネットワーク(CNN)と衛星画像データを使用して地域の所得レベルを予測する手法がま...