Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

Gen-2 は AI 生成ビデオに革命をもたらします。一言で4K高画質映画が作れる。ネットユーザー「ゲームのルールを完全に変えた」

これは間違いなく、生成 AI の進歩における画期的な出来事です。

深夜、Runway の象徴的な AI ビデオ生成ツール Gen-2 が、「iPhone の瞬間」のような壮大なアップデートを実施しました。

相変わらず簡単な文章入力ですが、今回は映像効果が超リアルな4Kレベルに!

では早速、爆発効果を見てみましょう。

今回のAI生成ビデオの効果は、これまでの「At a Glance AI」の欠点である、矛盾、ちらつき、変形、低解像度を克服していることは容易に理解できます。

そして、これがまさに Gen-2 のこの壮大なアップデートの焦点です。

これにより、テキストベースと画像ベースの両方のビデオの結果の忠実度と一貫性が大幅に向上します。

Runway は公式声明でこれを単に「アップデート」と表現したが、多くのネットユーザーはこれがメジャーバージョンの反復に相当すると考えている。

映像効果を見て、すでに多くの人が沸騰・燃えている状態です。

たとえば、ある AI 映画製作者はこれを「完全なゲームチェンジャー」と呼んだ。

別の生成AIの専門家も次のように考えています。

これは生成 AI にとって重要な瞬間です。

ご存知のとおり、Gen-2 が正式にリリースされてから (今年 6 月) わずか 4 か月しか経っていません。AI の進歩と反復のスピードにはため息が出ます。

公開アカウント「Digital Life Kha'Zix」は次のようにコメントしている。

地球上の1日はAI上の1年に相当します。

Gen-2 のこのメジャー アップデートは、Web サイトと APP で同時に実行されたことは注目に値します。

それでは、引き続き、新世代 Gen-2 の爆発的な効果を深く体験してみましょう。

コスト0で超大作を生み出す

現在、Web サイトで体験する場合でも、アプリで体験する場合でも、Gen-2 を使用している限り、生成されるビデオは最新の機能に基づいて作成されます。

ちょうど今、あるネットユーザーが Gen-2 をすぐに手に取り、ちょっとした歌と組み合わせて、あっという間に高級ファッション広告の大ヒット作を作り上げました。

この色、このモデル、そしてこの角度で、Gen-2 は広告の大ヒットをしっかりと捉えました。

以下のような、ハイエンドなMVショットのような動画もあります。

もう 1 つの例は、脳を刺激する創造的な SF 映画のクリップです。

正直に言うと、私たちはこれらの Gen-2 によって生成されたリアルな 4K ビデオにも魅了されました。

そこで私たちは自分たちで試してみることにしました。

操作は非常に簡単です。Runway の公式 Web サイトにアクセスし、「Text to Video」をクリックして、「Gen-2」を選択してテキスト入力インターフェイスに入ります。

テストしたテキストの内容は次のとおりです。

星間旅行、シュール。
スタートレック、シュールレアリズム。

数秒待つと、AIビデオが出てきました

正直に言うと、Gen-2 の結果は、私たちが当初想像していたものとは若干異なります (星空を背景にした宇宙船になると思っていました)。

しかし、その光景であろうと宇宙船のスタイルであろうと、人々に新鮮で独特な感覚を与えます。

これはクリエイティブな仕事をする人にとってはメリットです。インスピレーションが尽きたら、Gen-2 に考えを助けてもらいましょう。

画像から動画への変換機能に関しては、一部のネットユーザーは、トップクラスの AI 生成動画ツールである PIKA をGen-2 と比較しました。

全体的な結果から判断すると、Gen-2 は画像の鮮明さ、ビデオの滑らかさなどの点で現在優れています。

ちなみに、最新のGen-2を携帯電話で体験するのもとても便利ですよ〜

半年でゲームのルールを完全に書き換える

この画期的なアップデートでは新しい機能は追加されませんが、信頼性と一貫性の飛躍により、最新バージョンの Gen-2 は依然として画期的な製品となっています。

Gen-2 に関する関連論文はまだ発表されていないものの、Gen-1 の基本モデルを改良したものであることは確かです。

従来のテキスト制御拡散モデルと比較して、Gen はテキスト、画像、ビデオの混合トレーニング モデルを通じてトレーニング コストを削減しながら、生成されるビデオの品質と一貫性を向上させます。

同時に、Runway は遅延拡散モデルも提案しました。これは、事前トレーニング済みの拡散モデルにタイミング レイヤーを導入し、推論フェーズ中にモデルの時間的一貫性を高めるものです。

プロモーション ビデオでは、Runway は 3 セットの比較を使用して Gen-2 の大きな変更点を示しました。

公式発表はまだ具体的なテストデータを発表していないものの、Runwayが実施したユーザー調査では、Gen-1のユーザー嗜好がすでにStable Diffusion 1.5やText2Liveを上回っている。

Gen-2は今年3月にテストが開始され、6月に正式に一般にリリースされました。

既存のビデオ クリップとテキスト ガイダンスを組み合わせて合成された Gen-1 とは異なり、Gen-2 はテキストのみ、画像のみ、またはその両方の組み合わせを使用して生成できます。

さらに、Gen-1 のスタイル変換、マスキング、モデルのカスタマイズなどの機能も Gen-2 に保持されています。

半年前のリリース以来、Gen-2 はいくつかのアップデートが行われています。

8月に、RunwayはGen-2で生成される動画の最大長を4秒から18秒に延長しました。これはAI動画生成ツールとしては前例のない長さです。

9月にRunwayは、Gen-2に「カメラ」の位置と移動速度を制御できるディレクターモードが追加されたことを正式に発表しました。

その後まもなく、Gen-2 ではビデオ内の動きの範囲を調整できる新しい「モーション スライダー」機能が追加されました。

これらの大小さまざまなアップデートにより、このビデオ生成ツールは人気を博し、最終的には業界全体に衝撃を与えました。

創設者:クリエイティブソフトウェアは死んだ

Gen-2 のアップデートにより、映画、テレビ、クリエイティブ業界に大きな影響を与えました。

Runway の創設者兼 CEO である Cristóbal Valenzuela 氏は投稿の中で、「クリエイティブ ソフトウェアは死んだ」とさえ述べています。

ヴァレンズエラ氏はさらに、過去には人間が「ピクセルを手作業で操作」できたが、AI 作成ツールでは自然言語とパラメータ調整のみを使用して作品を完成させることができ、これは従来の (クリエイティブ) ソフトウェアではできないことだと説明した。

最後に、バレンズエラ氏は、刺激的な新しい(創造的な)時代が始まろうとしていると改めて強調した。

ヴァレンズエラの投稿には多くのネットユーザーが同意を表明し、これらのモデルは今すぐに塗装すべきだと述べた。

作者は直接賞賛はしなかったものの、過去に6か月かけて動画を作った経験を思い出し、まるですべてが自明であるかのように語ったという...

最後に、体験アドレスは以下です。興味のある方はぜひ行ってみてください〜

Gen-2 エクスペリエンス アドレス: https://research.runwayml.com/gen2。

参考リンク:[1] https://twitter.com/runwayml/status/1720064304374792615?s=20.

[2] https://twitter.com/hashtag/Gen2.

[3] https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video/.

[4]https://mp.weixin.qq.com/s/jwKtx-wpSVVvAxhUTMXQBw.

<<:  北京大学のチームは、ChatGPTにとって頭痛の種であったアルゴリズムの最適化を解決し、普通のラップトップでも実行できるようにした。

>>:  ChatGPTはプログラミングの楽しさを殺している

ブログ    
ブログ    

推薦する

グーグルが倫理学者を解雇してから3か月後、AI倫理研究会議はグーグルのスポンサーシップを停止した。

[[386762]]ビッグデータダイジェスト制作出典: ベンチャービート編集:赤道のパンダACM ...

ディープラーニングは限界に達したのか?

[[255738]]ビッグデータダイジェスト制作編集者: Xiao Jiang、lvy、Wang ...

インターネットの後半、人工知能の春は始まったばかり

最近、インターネット企業における「人員最適化」問題が友人の間で話題になっており、多くの人がパニックに...

...

...

マインクラフトがAIの街に変身、NPC住民が本物の人間のようにロールプレイ

この立方体の男が、目の前にいる「招かれざる客」の正体について素早く考えている様子を、注意深く見てくだ...

...

方向を理解し、座標を伝える、Shikraはマルチモーダルな大規模モデル参照ダイアログの新しい次元を開きます

人間の日常的なコミュニケーションでは、場面内のさまざまな領域や物体に焦点が当てられることが多く、これ...

パンデミック下でIoTが「最前線で働く人」の役割を果たす

[[397252]]画像ソース: https://pixabay.com/images/id-594...

機械学習が戦略ゲームを改善する方法

[[390356]]ポジティブなゲーム体験を生み出すために、ゲームデザイナーはゲーム内のバランスを繰...

オンラインショッピングデータに基づくスマートドアロック「ショッピングガイド」

ビル・ゲイツは1995年に「The Road Ahead」の中でこう述べています。「将来、スマート家...

人工知能の時代において、女の子が将来勝てるようにするために親はどのような教育理念を持つべきでしょうか?

私は二人の女の子の母親です。親は子供に何でも良いものを残そうとすると言われていますが、子育ての過程で...

フェデレーテッドラーニング - プライバシーの障壁を突破し、データの価値を引き出す

1. フェデレーテッドラーニングの背景従来の機械学習手法では、トレーニングのためにデータを単一のマシ...

...

AR乾物、説明する時間がない、早く保存する

[51CTO.com からのオリジナル記事] 近年、AR は常に資本追求の焦点となってきました。 2...