Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

これは間違いなく、生成 AI の進歩における画期的な出来事です。

深夜、Runway の象徴的な AI ビデオ生成ツール Gen-2 が、「iPhone の瞬間」のような壮大なアップデートを実施しました。

相変わらず簡単な文章入力ですが、今回は映像効果が超リアルな4Kレベルに!

では早速、爆発効果を見てみましょう。

今回のAI生成ビデオの効果は、これまでの「At a Glance AI」の欠点である、矛盾、ちらつき、変形、低解像度を克服していることは容易に理解できます。

そして、これがまさに Gen-2 のこの壮大なアップデートの焦点です。

これにより、テキストベースと画像ベースの両方のビデオの結果の忠実度と一貫性が大幅に向上します。

Runway は公式声明でこれを単に「アップデート」と表現したが、多くのネットユーザーはこれがメジャーバージョンの反復に相当すると考えている。

映像効果を見て、すでに多くの人が沸騰・燃えている状態です。

たとえば、ある AI 映画製作者はこれを「完全なゲームチェンジャー」と呼んだ。

別の生成AIの専門家も次のように考えています。

これは生成 AI にとって重要な瞬間です。

ご存知のとおり、Gen-2 が正式にリリースされてから (今年 6 月) わずか 4 か月しか経っていません。AI の進歩と反復のスピードにはため息が出ます。

公開アカウント「Digital Life Kha'Zix」は次のようにコメントしている。

地球上の1日はAI上の1年に相当します。

Gen-2 のこのメジャー アップデートは、Web サイトと APP で同時に実行されたことは注目に値します。

それでは、引き続き、新世代 Gen-2 の爆発的な効果を深く体験してみましょう。

コスト0で超大作を生み出す

現在、Web サイトで体験する場合でも、アプリで体験する場合でも、Gen-2 を使用している限り、生成されるビデオは最新の機能に基づいて作成されます。

ちょうど今、あるネットユーザーが Gen-2 をすぐに手に取り、ちょっとした歌と組み合わせて、あっという間に高級ファッション広告の大ヒット作を作り上げました。

この色、このモデル、そしてこの角度で、Gen-2 は広告の大ヒットをしっかりと捉えました。

以下のような、ハイエンドなMVショットのような動画もあります。

もう 1 つの例は、脳を刺激する創造的な SF 映画のクリップです。

正直に言うと、私たちはこれらの Gen-2 によって生成されたリアルな 4K ビデオにも魅了されました。

そこで私たちは自分たちで試してみることにしました。

操作は非常に簡単です。Runway の公式 Web サイトにアクセスし、「Text to Video」をクリックして、「Gen-2」を選択してテキスト入力インターフェイスに入ります。

テストしたテキストの内容は次のとおりです。

星間旅行、シュール。
スタートレック、シュールレアリズム。

数秒待つと、AIビデオが出てきました

正直に言うと、Gen-2 の結果は、私たちが当初想像していたものとは若干異なります (星空を背景にした宇宙船になると思っていました)。

しかし、その光景であろうと宇宙船のスタイルであろうと、人々に新鮮で独特な感覚を与えます。

これはクリエイティブな仕事をする人にとってはメリットです。インスピレーションが尽きたら、Gen-2 に考えを助けてもらいましょう。

画像から動画への変換機能に関しては、一部のネットユーザーは、トップクラスの AI 生成動画ツールである PIKA をGen-2 と比較しました。

全体的な結果から判断すると、Gen-2 は画像の鮮明さ、ビデオの滑らかさなどの点で現在優れています。

ちなみに、最新のGen-2を携帯電話で体験するのもとても便利ですよ〜

半年でゲームのルールを完全に書き換える

この画期的なアップデートでは新しい機能は追加されませんが、信頼性と一貫性の飛躍により、最新バージョンの Gen-2 は依然として画期的な製品となっています。

Gen-2 に関する関連論文はまだ発表されていないものの、Gen-1 の基本モデルを改良したものであることは確かです。

従来のテキスト制御拡散モデルと比較して、Gen はテキスト、画像、ビデオの混合トレーニング モデルを通じてトレーニング コストを削減しながら、生成されるビデオの品質と一貫性を向上させます。

同時に、Runway は遅延拡散モデルも提案しました。これは、事前トレーニング済みの拡散モデルにタイミング レイヤーを導入し、推論フェーズ中にモデルの時間的一貫性を高めるものです。

プロモーション ビデオでは、Runway は 3 セットの比較を使用して Gen-2 の大きな変更点を示しました。

公式発表はまだ具体的なテストデータを発表していないものの、Runwayが実施したユーザー調査では、Gen-1のユーザー嗜好がすでにStable Diffusion 1.5やText2Liveを上回っている。

Gen-2は今年3月にテストが開始され、6月に正式に一般にリリースされました。

既存のビデオ クリップとテキスト ガイダンスを組み合わせて合成された Gen-1 とは異なり、Gen-2 はテキストのみ、画像のみ、またはその両方の組み合わせを使用して生成できます。

さらに、Gen-1 のスタイル変換、マスキング、モデルのカスタマイズなどの機能も Gen-2 に保持されています。

半年前のリリース以来、Gen-2 はいくつかのアップデートが行われています。

8月に、RunwayはGen-2で生成される動画の最大長を4秒から18秒に延長しました。これはAI動画生成ツールとしては前例のない長さです。

9月にRunwayは、Gen-2に「カメラ」の位置と移動速度を制御できるディレクターモードが追加されたことを正式に発表しました。

その後まもなく、Gen-2 ではビデオ内の動きの範囲を調整できる新しい「モーション スライダー」機能が追加されました。

これらの大小さまざまなアップデートにより、このビデオ生成ツールは人気を博し、最終的には業界全体に衝撃を与えました。

創設者:クリエイティブソフトウェアは死んだ

Gen-2 のアップデートにより、映画、テレビ、クリエイティブ業界に大きな影響を与えました。

Runway の創設者兼 CEO である Cristóbal Valenzuela 氏は投稿の中で、「クリエイティブ ソフトウェアは死んだ」とさえ述べています。

ヴァレンズエラ氏はさらに、過去には人間が「ピクセルを手作業で操作」できたが、AI 作成ツールでは自然言語とパラメータ調整のみを使用して作品を完成させることができ、これは従来の (クリエイティブ) ソフトウェアではできないことだと説明した。

最後に、バレンズエラ氏は、刺激的な新しい(創造的な)時代が始まろうとしていると改めて強調した。

ヴァレンズエラの投稿には多くのネットユーザーが同意を表明し、これらのモデルは今すぐに塗装すべきだと述べた。

作者は直接賞賛はしなかったものの、過去に6か月かけて動画を作った経験を思い出し、まるですべてが自明であるかのように語ったという...

最後に、体験アドレスは以下です。興味のある方はぜひ行ってみてください〜

Gen-2 エクスペリエンス アドレス: https://research.runwayml.com/gen2。

参考リンク:[1] https://twitter.com/runwayml/status/1720064304374792615?s=20.

[2] https://twitter.com/hashtag/Gen2.

[3] https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video/.

[4]https://mp.weixin.qq.com/s/jwKtx-wpSVVvAxhUTMXQBw.

<<:  北京大学のチームは、ChatGPTにとって頭痛の種であったアルゴリズムの最適化を解決し、普通のラップトップでも実行できるようにした。

>>:  ChatGPTはプログラミングの楽しさを殺している

ブログ    

推薦する

2021 年の世界トップ 10 の人工知能アプリケーション

人工知能は、過去 10 年間にわたって年間を通じて最もホットな話題の 1 つとなっています。そして、...

...

ビッグデータ時代に機械学習 (ML) がビジネスを推進する 5 つの方法

世界がますますデジタル化されるにつれて、かつてない量のデータが毎日生成され、組織にはこの膨大な量のデ...

...

AIが仕事や生活を奪ったら、人類の未来はどうなるのでしょうか?

AIの発展は、人間の仕事の効率を向上させ、人間の働き方を変え、さらには人類の発展の方向を導く上で大...

...

AIの次の大きな課題:言語のニュアンスを理解すること

それは非常に奥深く、微妙なことです。同じ文でも、文脈によって意味が変わることがよくあります。人間でさ...

...

知遠の「盗作スキャンダル」最新報道:盗作2件、不正引用4件、関係者全員が自主辞任

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

グラフ畳み込みネットワークの作り方は?これは最小限のNumpy実装です

グラフは非常に複雑な構造を持ち、大量の情報を含んでいるため、グラフ上での機械学習は困難な作業です。こ...

1時間から3.5分まで、Metaの新しいアルゴリズムは携帯電話で3D顔データを収集できる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

数学を使わずに円の面積を計算する方法

機械学習の手法を使用して円の面積を計算します。円の面積はいくらかと誰かに尋ねると、r²だと答えるでし...