0 個のプロンプトワードと 1 枚の写真でビデオを生成する Gen-2 の新しいゲームプレイが画面を席巻します。ウェブ版は無料でプレイ可能

0 個のプロンプトワードと 1 枚の写真でビデオを生成する Gen-2 の新しいゲームプレイが画面を席巻します。ウェブ版は無料でプレイ可能

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

Gen-2 は先月無料で公開されたばかりですが、ビデオ分野の Midjourney が再び更新されました。

Runway Gen-2 は、サイレント ワード イメージ ビデオモードをサポートするようになりました。

あまり多くを語る必要はなく、Gen-2 は数秒で理解します。

静止画像をアップロードすると、AI がプロンプトの言葉を提供せずに自動的にビデオを生成します。

顔を回転させるといった技術的な作業も非常に自然に行われます。

このアップデートにより、大ヒット映画には写真だけが必要になりました。

独自の作品を作りたくてうずうずしているネットユーザーは、もはや我慢できず、Gen-2、Midjourney、Elevenlabs、MusicGenなどのツールを使用して、爆発的な効果を持つ大ヒット映画の波を生み出しています。

ほら、すでに誰かが Stable Duffision と Gen-2 を組み合わせて SF 短編映画を作っているんです。

一部のネットユーザーは Gen-2 を Midjourney、Elevenlabs、CapCut などのツールと組み合わせて使用​​し、「善と悪」のビデオを制作しました。

「サイバーパンクスタイル」は少なくとも少しはハイレベルなものでなければなりません。

Gen-2が生成したこの「ビッグショー」を見た後、ネットユーザーは冷静になれず、直接こう言った。

Midjourney 5.2+Gen-2 は爆発的すぎます。これは非常に深いウサギの穴であり、私は間違いなくしばらく迷子になるでしょう。

ネットユーザーの中には、止められないとさえ言う者もいた。

無料のウェブ版、実際の体験

数枚のシーンとキャラクターの写真があれば、映画のコンテンツが完成します。必要なのは手だけです!

公式では、Web版が無料で利用可能になったとしており、特別な体験リンクも公開されている。

また、iOSも近日中にリリースされる予定です。

多くを語るよりも、実際に試す方が良いです。体験してみましょう。

Web バージョンを例にとると、まず Web ページからランウェイ アカウントを登録してログインし、ランウェイ編集インターフェイスに入ります。

左側の「ビデオの生成」をクリックします。

次に、画面中央の「Gen-2: Text to Video」をクリックして Gen-2 に入ります。

左側の領域に写真をアップロードします。ここでは、Midjourney によって生成された写真を使用しました。

その後、プロンプトが表示されずに、写真をアップロードした後、「生成」をクリックするだけです。

約1分後、4秒間の動画が生成され、映像内のバイクと車が一瞬動いた!

使い始めてから、画像自体にダイナミック効果の要素が含まれていると、生成されたビデオのダイナミック効果がより顕著になることが分かりました。

これは主に、現時点ではモーションエフェクトが写真に含まれる内容に基づいてのみ生成されるためです。

物理法則に従うため、明らかに静止した画像やシーンであれば、明らかな動きの効果はほとんどありません

たとえば、このテストビデオでは、帆船とカモメが動いているのがぼんやりとしか見えません。

ネットユーザー:第2世代の遅延方法が取得されました

エフェクトは非常にクールですが、ビデオの長さがまだ 4 秒であるという問題があります。

ビデオを作るにはまだ少し短いですが、一部のネットユーザーはすでに方法を見つけています。

このネットユーザーは個人的にテストし、Midjourneyで生成された画像を初期画像として使用し、Gen-2が出力した最後のフレームを次の画像のプロンプトとして使用することで、Gen-2はより長いビデオを出力できると述べました。

以下は、このネットユーザーの実際の体験を収めた短いビデオです。

いくつかの細かい点を除けば、全体的な把握はかなり良好であることがわかります。

無料だけでは十分ではありません。有料でも構いません

もちろん、無料でプレイできる量にも制限があります。

公式規定によると、無料試用期間は 105 秒で、各ビデオは 4 秒なので、約 26 本の Gen2 ビデオを無料で生成できることになります。

クレジット限度額を使い切った場合や、透かしの削除や解像度の向上などの追加機能を体験したい場合は、メンバーシップを購入する必要があります。スタンダード版は月額15ドル、プロ版は35ドル、無制限のビデオ制作版は95ドルです。年間支払いの方が安くなります。

以下は月額支払いモデルの価格です。

これは年間支払いモデルの価格です。

<<: 

>>:  Llama 2 第 2 波のハイライト: 慎重すぎるため、コード生成には改善の余地が大いにある

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

ICLRは深層生成モデルに関する大きな議論を開催し、ウェリングとAAAIの百万ドル賞受賞者が来場する。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

コカ・コーラの新たな試み:アートや広告制作における生成AIの活用

生成型 AI の新たな波に直面して、私たちはそれに積極的に適応するか、AI (または AI を受け入...

184.3億ドルを突破! 「中国スピード」が人工知能の分野で再び出現

AlfGOと韓国のプロ囲碁選手、イ・セドルの対局以来、人工知能は幅広い注目を集めているかもしれない。...

...

「乾物」テイクアウト注文に8大AI配送・配分内部機構搭載、元気いっぱい!

過去2年間、テイクアウトの市場規模は驚異的なペースで成長を続けています。美団の最近のフードデリバリー...

SparseOcc: 完全にスパースな 3D パノラマ占有予測 (セマンティック + インスタンス デュアル タスク)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

アルゴリズムの問​​題を解決するための Python 3 コード フレームワーク

序文現在インターンシップをしており、仕事量はそれほど多くないので、空き時間を利用してPATのウェブサ...

ディープラーニングとニューラルネットワーク: 注目すべき 6 つのトレンド

ニューラル ネットワークの基本的な考え方は、コンピューターの「脳」内の複数の相互接続されたセルをシミ...

自動運転のための多視点視覚認識の理解

出力次元の観点から、視覚センサーに基づく知覚方法は、2D知覚と3D知覚に分けられます。視覚システムは...

Lingzhi Unuo CTO Xu Ke: AI技術が従来の保険販売モデルのジレンマを打破

[51CTO.comより] 徐克氏は百度で検索とスマートレコメンデーションの分野で長年勤務。2015...

...

AIの力を借りれば、罠だらけのジムは歴史の舞台から消えるのでしょうか?

[[336650]]驚くべきことに、COVID-19の世界的大流行の中で、フィットネスやエクササイ...

あなたの向かいに座っている「オフィス秘書」はロボットかもしれませんか?ロシアが超リアルなロボットを発表

ロボットがいくつかの簡単な作業を実行できることは目新しいことではありません。最近、ロシア西部の都市ペ...