動画生成AIが狂った! ランウェイとミッドジャーニーは、それぞれが究極の技を駆使して激しい戦いを繰り広げ、狂気の境地まで戦い抜いた。 Midjourney の前に、RunwayML は Gen-2 HD バージョンを緊急リリースし、生成された写真が動くようになりました。 Runway の CEO である Cristóbal Valenzuela 氏は、クリエイティブ ソフトウェアは死に絶え、一つの時代が終わったと述べました。 一方、史上最強の描画ツールであるMidjourneyも、色を調整するのと同じようにさまざまな画像スタイルを組み合わせて使用できる新機能Style Tunerを発表しました。 このままでは映画業界に大激震が走る! Gen-2: 細部までこだわった手作りの 4K 超大作先ほど、Runway はテキストと画像からビデオを生成するモデルのアップデートを発表しました。鮮明度とビデオの一貫性が大幅に向上し、Midjourney V5 のレベルにほぼ達しました。 ランウェイの進歩はすごいです。ご存知のとおり、Gen-2 が正式にリリースされてからまだ 4 か月しか経っていません。 生成される解像度とディテールがあまりにも驚異的で、ちょっと怖いくらいです。よく見ないと、それが本物の動画なのか、AI が生成した動画なのかはわかりません。 一貫性は、生成ビデオ AI の分野における大きな課題ですが、Gen-2 ではこれも完全に克服されています。画像の一貫性が向上し、歪みの問題が解決されます。 今年 2 月初旬、Runway の Gen-1 が初めてリリースされてから、すでに人々はこのゲームに夢中になっていました。その後、6 月に第 2 世代の Gen-2 にアップデートされ、生成されたコンテンツとエフェクトの豊かさの点で前世代をはるかに上回りました。 今日、新世代のアップデートでは、一見するととんでもないと思われるような解像度と詳細が生成されています。 Big V「indigo」は、これは間違いなくPPTビデオブロガーにとって良いニュースだと語った。この調子で開発が続けば、来年末までにはジェネレーティブビデオディレクターがハリウッドレベルのスライドショーを制作するようになるはずだ。 「何も予想外のことが起こらなければ、AIのせいで映画業界で多くの人が職を失うかもしれない」と誰かが言った。 Runway の CEO は、「ソフトウェアの 1 世代が終わりました。これは 1 つの時代の終わりであり、より刺激的な新しい時代の始まりです」と述べました。 クリエイティブ ソフトウェア 1.0 では、特定のタスクをドメインに分割することが中心でした。ベクターグラフィックス、NLE、モーショングラフィックス、画像編集、3D、オーディオ編集、合成などはすべて高度に専門化された分野です。 2.0 は、世界を理解するモデルを使用して大きなアイデアを実行することです。モデルは世界をシミュレートし、私たちが要求するものを生成する役割を担っています。私たちは皆、キュレーターです。私たちは皆、ディレクターです。 広告の大ヒット効果が爆発し、ゲームのルールが変わりました! 海外の AIGC 実践者は、Runway の Gen-2 はゲームチェンジャーであり、使用するツールが少なくなり、無限の新しい可能性をもたらす大きな改善であると述べました。 この有名人は、Gen-2 を使って「ピンク イビサ」をテーマにしたビデオを制作するのが待ちきれませんでした。その効果は驚くべきものでした。登場人物の髪、木、眠りなど、細部まで非常にリアルで、画像も非常に安定していました。 ネットユーザーたちは、これは素晴らしい、写真とキャラクターの一貫性には驚かされる、と言っている。 後ろにブランドロゴがなかったら、これは香水の広告だと思うでしょう! 広告俳優は失業するのでしょうか? このビデオは日本のネットユーザーが Gen-2 を使用して作成したもので、プロンプトは「最近、新宿のネオンが輝いています。」です。 「Gen-2 のアップデートを見て、過去 6 か月間のビデオをすべてやり直したい...」と叫ぶ人もいました。 このネットユーザーは、Runway の Gen-2 アップデートはすごいと言っています。 「Lion/Black Panther in the Jungle」をテストするために、携帯電話で 2 つのテキスト プロンプトをすばやく実行したところ、出力の品質と制御は優れていました。 一般的な爆弾のキノコ雲を見てみましょう。安定性と解像度が印象的です。 プロンプト: 映画のような広角ショット。氷の風景の中で原子爆発が起こり、周囲をまばゆい光で包み込む。破壊的で超現実的、破滅的な力の展示。監督: クリストファー・ノーラン。 一部のネットユーザーは、Gen-2の旧バージョンとアップデートバージョンで生成されたビデオ効果を比較しました。 明らかに、解像度ははるかに高くなります (16:9 - 2816x1536 VS 1792x1024)。 一方、更新された Gen-2 の動きは小さくなりますが、効果ははるかにきれいになります。スライダーを上に回すと、動きの範囲が広がります。 第 1 世代 Gen-2 で同じパラメータを持つ同じ画像は次のようになります。 第 2 世代の Gen-2 で作成されたビデオは、前世代で発生しがちな段階的なぼやけがなく、驚くほど鮮明です。小さな人物も見分けやすく、動きも簡単に追えます。 このアップデートは Gen-2 ですが、すでに Gen-3 と呼べると考える人もいます。品質の向上は驚異的です。 旅の途中の新製品:独占的なイメージスタイル、組み合わせがより面白くなるまた本日、史上最強の描画ツールである Midjourney も、新機能のアップデートである Style Tuner をリリースしました。 つまり、カラーマッチングと同じように、さまざまな画像スタイルを組み合わせて組み合わせることができるようになりました。 まずはネットユーザーによるデモをいくつか見てみましょう。 宮崎駿アニメスタイル、サイバーパンクカスタマイズMidjourney のこのアップデートは、ゲームのルールを変えるのに十分であり、無限の新しい可能性を切り開くでしょう。 すでに、これを使って何ができるのか楽しみにしている人がたくさんいます。 多様な人々のためのさまざまなスタイル。 ルネッサンス風の美しい少女。 プロンプト:フランク・ホールによるルネッサンス神話:熱狂的な夢が襲うとき --c 20.0 --style raw-4XGrq9MnocooIuj-l04HJl1seniG5FEF --s 1000 宮崎駿のアニメーションの「ジブリスタイル」は、まるでおとぎ話の街に足を踏み入れたかのようだ。 また、一部のネットユーザーもMidjourneyの「スタイルミックステスト」を行い、非常に興味深い美学をもたらした。 以下の画像がヒントとして使われます。 具体的には、/tune を使用して 128 個の固有のスタイル方向が生成されました。次に、6 つの固有のスタイルが選択され、6 つの固有のコードが生成されました。 次に、プロンプトを再度実行して、さまざまなスタイルを組み合わせます。 さまざまなプロンプトでこれらのスタイルを使用します。 これらはすべて、異なるプロンプトで「スタイル 2+3+4」の組み合わせを使用します。 それを見た他のネットユーザーたちは、サイケデリックな感じ以外には言葉も出ないほど驚愕した。 私たちがどれだけの美学に頼らなければならないのか、本当に理解できません! 「ああ、もう公式に全部見たんだ…」と思うたびに、私はいつも驚かされるのです。 呪われたセサミストリート。 アニメにしたらもっと面白くなりそうです。 「スタイルチューナー」の簡単なテストを通じて、ネットユーザーは「霧の雰囲気」のスタイルを開発した。 最後の写真は『ブレードランナー 2049』に少し似ています。 下の写真の左上には、次のようなプロンプトがあります。ビクトリア朝のロンドン時代、人けのない町の中心部の通りを歩く人々、暗くて不吉なスタイル、凍った動き、アナモルフィック レンズ フレア、受賞歴のある写真、金継ぎ、湿った、霧 --style raw-btvMSX6949oRdtpi --ar 21:9 中には大ヒット映画のような質感を持つ人もいます。 写真を作成するための 7 つのステップ、ステップバイステップのチュートリアル担当者は具体的なチュートリアルも提供した。 チュートリアルリンク: https://docs.midjourney.com/docs/style-tuner ステップ1: カスタムスタイルチューナーを生成する /tune コマンドを使用して、スタイル チューナー ページを作成します。 ステップ2: 希望するオプションを選択する - スタイルの方向: スタイル チューナーに表示する画像ペアの数を選択します (16、32、64、128 ペア)。 - デフォルトモード: 好みのスタイルモードを選択します (デフォルトまたはオリジナル) ステップ3: 送信を確認する 送信を確認するには、[送信] ボタンをクリックします。 スタイル チューナーは、スタイル方向ごとに 2 つの画像を生成します。 16 方向の場合は 32 枚の画像が生成され、128 方向の場合は 256 枚の画像が生成されます。 つまり、方向が多ければ多いほど、生成されるサンプル画像の数も増えます。 ただし、Midjourney は、大量のサンプル画像を生成すると、独自のサブスクリプション プランの GPU コンピューティング時間が消費されることを公式に通知しています。 ステップ4: カスタム「スタイルチューナー」を開く スタイル チューナーの準備が整うと、Midjourney ボットからチューナーへのリンクを含むダイレクト メッセージが送信されます。 リンクをクリックすると、Web ブラウザーでスタイル チューナーが開きます。 このスタイルのチューナーをお試しください: https://tuner.midjourney.com/ejYLCOY ステップ5: 画像を選択する スタイル チューナーには画像のペアが行ごとに表示され、各ペアはプロンプトの異なる視覚スタイルの方向を表します。 各ペアの気に入った画像をクリックしてください。特定の比較画像セットを明確に希望しない場合は、デフォルトで選択解除したままにしておくことができます。 ステップ6: コードをコピーする スタイル チューナーは、--style <code> パラメータを使用してプロンプトに追加できるコードを生成します。 プロンプトとパラメータをコピーします: - ページの下部にカスタム コードがあります。 - [コピー] ボタンをクリックして、元のプロンプトと新しく生成された --style <code> パラメータをコピーします。 ここで言及する価値があるのは、Style Tuner ページを友人と共有し、追加の GPU 時間を使用せずに新しいコードを生成できることです。 ステップ7: 画像を生成する - Discordに戻ります。 - /imagine コマンドを使用して、コピーしたプロンプトと --style <code> パラメータをプロンプト フィールドに貼り付けます。 - 画像を生成する チュートリアルの後半では、Midjourney が生成例も示します。 鮮やかなカリフォルニアポピー 旅の途中+第2世代の夢のつながりMidjourney+Gen-2 の新たなコラボレーションが登場します。 ネットユーザーたちは、AI映画制作の未来が到来したと語った。 RunwayML の Gen-2 アップデートにより、ほぼフル HD ビデオが実現します。 大手企業は狂ったように帳簿を公開しており、その疾走は止まるところを知らない。AIGCが映画業界にどのような転覆をもたらすのか、見守ろう。 最後の質問です。驚きましたか? |
<<: GPT-4+Midjourney がコードなしで「Angry Pumpkin」を作成!実際の経験:閾値は低くなく、再現が難しい
>>: 量子コンピューティングは今後10年間で物流業界を変えるだろう
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
多くの企業が AI のビジネスケースを模索し、経営陣の支援を求め、基本的な IT およびデータ機能を...
1. はじめに生成 AI は間違いなくゲームを変えるテクノロジーですが、ほとんどのビジネス上の問題...
8月1日、ガートナーの最新レポートによると、カスタマーサービスセンター(CC)テクノロジー、会話型A...
私たちがテクノロジーによってますます、そして不可逆的に動かされている世界に生きていることは疑いの余地...
電子技術の発達により、私たちはいつでもどこでも「視聴覚の饗宴」を楽しめるようになり、人間の聴覚と視覚...
[51CTO.com クイック翻訳] 機械学習は複雑な問題を自動的に解決する方法であることはすでに知...
ChatGPT は情報を提供したり質問に答えたりするだけでなく、インテリジェントなアシスタントとして...
現在、世界最高齢の人は、ギネス世界記録に認定された118歳の日本人老人、田中カネさんです。田中選手の...
ファーウェイにとって、独自のチップを開発することは必ず進むべき道であり、さらなる発展を遂げたいのであ...