リアルすぎて怖い! Gen-2 の壮大なアップデート、手作りの 4K ハリウッド大作、Midjourney の夢の連携、CEO: クリエイティブ ソフトウェアの時代は終わった

リアルすぎて怖い! Gen-2 の壮大なアップデート、手作りの 4K ハリウッド大作、Midjourney の夢の連携、CEO: クリエイティブ ソフトウェアの時代は終わった

動画生成AIが狂った!

ランウェイとミッドジャーニーは、それぞれが究極の技を駆使して激しい戦いを繰り広げ、狂気の境地まで戦い抜いた。

Midjourney の前に、RunwayML は Gen-2 HD バージョンを緊急リリースし、生成された写真が動くようになりました。

Runway の CEO である Cristóbal Valenzuela 氏は、クリエイティブ ソフトウェアは死に絶え、一つの時代が終わったと述べました。

一方、史上最強の描画ツールであるMidjourneyも、色を調整するのと同じようにさまざまな画像スタイルを組み合わせて使用​​できる新機能Style Tunerを発表しました。

このままでは映画業界に大激震が走る!

Gen-2: 細部までこだわった手作りの 4K 超大作

先ほど、Runway はテキストと画像からビデオを生成するモデルのアップデートを発表しました。鮮明度とビデオの一貫性が大幅に向上し、Midjourney V5 のレベルにほぼ達しました。

ランウェイの進歩はすごいです。ご存知のとおり、Gen-2 が正式にリリースされてからまだ 4 か月しか経っていません。

生成される解像度とディテールがあまりにも驚異的で、ちょっと怖いくらいです。よく見ないと、それが本物の動画なのか、AI が生成した動画なのかはわかりません。

一貫性は、生成ビデオ AI の分野における大きな課題ですが、Gen-2 ではこれも完全に克服されています。画像の一貫性が向上し、歪みの問題が解決されます。

今年 2 月初旬、Runway の Gen-1 が初めてリリースされてから、すでに人々はこのゲームに夢中になっていました。その後、6 月に第 2 世代の Gen-2 にアップデートされ、生成されたコンテンツとエフェクトの豊かさの点で前世代をはるかに上回りました。

今日、新世代のアップデートでは、一見するととんでもないと思われるような解像度と詳細が生成されています。

Big V「indigo」は、これは間違いなくPPTビデオブロガーにとって良いニュースだと語った。この調子で開発が続けば、来年末までにはジェネレーティブビデオディレクターがハリウッドレベルのスライドショーを制作するようになるはずだ。

「何も予想外のことが起こらなければ、AIのせいで映画業界で多くの人が職を失うかもしれない」と誰かが言った。

Runway の CEO は、「ソフトウェアの 1 世代が終わりました。これは 1 つの時代の終わりであり、より刺激的な新しい時代の始まりです」と述べました。

クリエイティブ ソフトウェア 1.0 では、特定のタスクをドメインに分割することが中心でした。ベクターグラフィックス、NLE、モーショングラフィックス、画像編集、3D、オーディオ編集、合成などはすべて高度に専門化された分野です。

2.0 は、世界を理解するモデルを使用して大きなアイデアを実行することです。モデルは世界をシミュレートし、私たちが要求するものを生成する役割を担っています。私たちは皆、キュレーターです。私たちは皆、ディレクターです。

広告の大ヒット効果が爆発し、ゲームのルールが変わりました!

海外の AIGC 実践者は、Runway の Gen-2 はゲームチェンジャーであり、使用するツールが少なくなり、無限の新しい可能性をもたらす大きな改善であると述べました。

この有名人は、Gen-2 を使って「ピンク イビサ」をテーマにしたビデオを制作するのが待ちきれませんでした。その効果は驚くべきものでした。登場人物の髪、木、眠りなど、細部まで非常にリアルで、画像も非常に安定していました。

ネットユーザーたちは、これは素晴らしい、写真とキャラクターの一貫性には驚かされる、と言っている。

後ろにブランドロゴがなかったら、これは香水の広告だと思うでしょう!

広告俳優は失業するのでしょうか?

このビデオは日本のネットユーザーが Gen-2 を使用して作成したもので、プロンプトは「最近、新宿のネオンが輝いています。」です。

「Gen-2 のアップデートを見て、過去 6 か月間のビデオをすべてやり直したい...」と叫ぶ人もいました。

このネットユーザーは、Runway の Gen-2 アップデートはすごいと言っています。 「Lion/Black Panther in the Jungle」をテストするために、携帯電話で 2 つのテキスト プロンプトをすばやく実行したところ、出力の品質と制御は優れていました。

一般的な爆弾のキノコ雲を見てみましょう。安定性と解像度が印象的です。

プロンプト: 映画のような広角ショット。氷の風景の中で原子爆発が起こり、周囲をまばゆい光で包み込む。破壊的で超現実的、破滅的な力の展示。監督: クリストファー・ノーラン。

一部のネットユーザーは、Gen-2の旧バージョンとアップデートバージョンで生成されたビデオ効果を比較しました。

明らかに、解像度ははるかに高くなります (16:9 - 2816x1536 VS 1792x1024)。

一方、更新された Gen-2 の動きは小さくなりますが、効果ははるかにきれいになります。スライダーを上に回すと、動きの範囲が広がります。

第 1 世代 Gen-2 で同じパラメータを持つ同じ画像は次のようになります。

第 2 世代の Gen-2 で作成されたビデオは、前世代で発生しがちな段階的なぼやけがなく、驚くほど鮮明です。小さな人物も見分けやすく、動きも簡単に追えます。

このアップデートは Gen-2 ですが、すでに Gen-3 と呼べると考える人もいます。品質の向上は驚異的です。

旅の途中の新製品:独占的なイメージスタイル、組み合わせがより面白くなる

また本日、史上最強の描画ツールである Midjourney も、新機能のアップデートである Style Tuner をリリースしました。

つまり、カラーマッチングと同じように、さまざまな画像スタイルを組み合わせて組み合わせることができるようになりました。

まずはネットユーザーによるデモをいくつか見てみましょう。

宮崎駿アニメスタイル、サイバーパンクカスタマイズ

Midjourney のこのアップデートは、ゲームのルールを変えるのに十分であり、無限の新しい可能性を切り開くでしょう。

すでに、これを使って何ができるのか楽しみにしている人がたくさんいます。

多様な人々のためのさまざまなスタイル。

ルネッサンス風の美しい少女。

プロンプト:フランク・ホールによるルネッサンス神話:熱狂的な夢が襲うとき --c 20.0 --style raw-4XGrq9MnocooIuj-l04HJl1seniG5FEF --s 1000

宮崎駿のアニメーションの「ジブリスタイル」は、まるでおとぎ話の街に足を踏み入れたかのようだ。

また、一部のネットユーザーもMidjourneyの「スタイルミックステスト」を行い、非常に興味深い美学をもたらした。

以下の画像がヒントとして使われます。

具体的には、/tune を使用して 128 個の固有のスタイル方向が生成されました。次に、6 つの固有のスタイルが選択され、6 つの固有のコードが生成されました。

次に、プロンプトを再度実行して、さまざまなスタイルを組み合わせます。

さまざまなプロンプトでこれらのスタイルを使用します。

これらはすべて、異なるプロンプトで「スタイル 2+3+4」の組み合わせを使用します。

それを見た他のネットユーザーたちは、サイケデリックな感じ以外には言葉も出ないほど驚愕した。

私たちがどれだけの美学に頼らなければならないのか、本当に理解できません! 「ああ、もう公式に全部見たんだ…」と思うたびに、私はいつも驚かされるのです。

呪われたセサミストリート。

アニメにしたらもっと面白くなりそうです。

「スタイルチューナー」の簡単なテストを通じて、ネットユーザーは「霧の雰囲気」のスタイルを開発した。

最後の写真は『ブレードランナー 2049』に少し似ています。

下の写真の左上には、次のようなプロンプトがあります。ビクトリア朝のロンドン時代、人けのない町の中心部の通りを歩く人々、暗くて不吉なスタイル、凍った動き、アナモルフィック レンズ フレア、受賞歴のある写真、金継ぎ、湿った、霧 --style raw-btvMSX6949oRdtpi --ar 21:9

中には大ヒット映画のような質感を持つ人もいます。

写真を作成するための 7 つのステップ、ステップバイステップのチュートリアル

担当者は具体的なチュートリアルも提供した。

チュートリアルリンク: https://docs.midjourney.com/docs/style-tuner

ステップ1: カスタムスタイルチューナーを生成する

/tune コマンドを使用して、スタイル チューナー ページを作成します。

ステップ2: 希望するオプションを選択する

- スタイルの方向: スタイル チューナーに表示する画像ペアの数を選択します (16、32、64、128 ペア)。

- デフォルトモード: 好みのスタイルモードを選択します (デフォルトまたはオリジナル)

ステップ3: 送信を確認する

送信を確認するには、[送信] ボタンをクリックします。

スタイル チューナーは、スタイル方向ごとに 2 つの画像を生成します。 16 方向の場合は 32 枚の画像が生成され、128 方向の場合は 256 枚の画像が生成されます。

つまり、方向が多ければ多いほど、生成されるサンプル画像の数も増えます。

ただし、Midjourney は、大量のサンプル画像を生成すると、独自のサブスクリプション プランの GPU コンピューティング時間が消費されることを公式に通知しています。

ステップ4: カスタム「スタイルチューナー」を開く

スタイル チューナーの準備が整うと、Midjourney ボットからチューナーへのリンクを含むダイレクト メッセージが送信されます。

リンクをクリックすると、Web ブラウザーでスタイル チューナーが開きます。

このスタイルのチューナーをお試しください: https://tuner.midjourney.com/ejYLCOY

ステップ5: 画像を選択する

スタイル チューナーには画像のペアが行ごとに表示され、各ペアはプロンプトの異なる視覚スタイルの方向を表します。

各ペアの気に入った画像をクリックしてください。特定の比較画像セットを明確に希望しない場合は、デフォルトで選択解除したままにしておくことができます。

ステップ6: コードをコピーする

スタイル チューナーは、--style <code> パラメータを使用してプロンプトに追加できるコードを生成します。

プロンプトとパラメータをコピーします:

- ページの下部にカスタム コードがあります。 - [コピー] ボタンをクリックして、元のプロンプトと新しく生成された --style <code> パラメータをコピーします。

ここで言及する価値があるのは、Style Tuner ページを友人と共有し、追加の GPU 時間を使用せずに新しいコードを生成できることです。

ステップ7: 画像を生成する

- Discordに戻ります。

- /imagine コマンドを使用して、コピーしたプロンプトと --style <code> パラメータをプロンプト フィールドに貼り付けます。

- 画像を生成する

チュートリアルの後半では、Midjourney が生成例も示します。

鮮やかなカリフォルニアポピー

旅の途中+第2世代の夢のつながり

Midjourney+Gen-2 の新たなコラボレーションが登場します。

ネットユーザーたちは、AI映画制作の未来が到来したと語った。 RunwayML の Gen-2 アップデートにより、ほぼフル HD ビデオが実現します。

大手企業は狂ったように帳簿を公開しており、その疾走は止まるところを知らない。AIGCが映画業界にどのような転覆をもたらすのか、見守ろう。

最後の質問です。驚きましたか?

<<:  GPT-4+Midjourney がコードなしで「Angry Pumpkin」を作成!実際の経験:閾値は低くなく、再現が難しい

>>:  量子コンピューティングは今後10年間で物流業界を変えるだろう

ブログ    
ブログ    
ブログ    

推薦する

ランサムウェア対策における人工知能の重要な役割

人工知能技術は、企業が多くのビジネス課題を解決するために不可欠です。最も重要なアプリケーション領域の...

...

美団は食品配達に「ドローン」を使う予定?テクノロジーは飛躍的な進歩を遂げました!

以前のPC時代では、人々は携帯電話やウェブページを通じて近くのレストランに注文をしていたが、これには...

CNN モデルの圧縮と加速アルゴリズムのレビュー

[[201727]]序文AlexNet が ILSVRC 2012 ImageNet 画像分類コンテ...

ビッグニュース! ChatGPTの2つの主要イベント

1 つ目は、GPT-4 API です。完全にオープンに使用できます。 7月7日、OpenAIは公式ウ...

実践的 | この記事は畳み込みニューラルネットワークを始めるのに十分です

まず、ディープラーニングとはすべてのディープラーニングアルゴリズムの総称であり、CNNは画像処理分野...

ソフトウェアテストに AI を統合する 9 つのメリット

[[390945]] [51CTO.com 速訳]人工知能の普及は人々に大きな期待をもたらしました。...

AIが有名人に似た人を紹介

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

データセキュリティ:アルゴリズムの限界

[[416227]]ビッグデータの時代において、データは人類の生産、生活などに多大な利便性をもたらす...

OpenAI CEO: GPT-4 は週当たり 1 億人のアクティブ ユーザーを抱え、依然として世界で最も強力な AI モデルです

米国現地時間11月7日月曜日に開催された第1回OpenAI開発者会議で、同社CEOのサム・アルトマン...

AI+教育はさまざまなシナリオに適用されていることをご存知ですか?

人工知能技術の継続的なアップグレードと革新的な変化に伴い、中国は時代の変化に対応し、人工知能関連のコ...

Deep Policy Gradient Algorithm は真の Policy Gradient Algorithm ですか?

深層強化学習は最近大きな成功を収めていますが、安定性の欠如や再現性の低さといった限界もあります。 M...

...

シリコンバレーのエンジニアの間で大人気だったこの技術共有セッションで、ディディはどんなことを話したのでしょうか?

11月19日、滴滴出行は米国の新研究オフィスで地元の科学研究者向けの技術サロンを開催した。 Did...

このガイドを理解することで、ニューラルネットワークの「ブラックボックス」をマスターすることができます。

「人間のニューラルネットワークはどのように機能するのか?」この質問は多くのデータ サイエンティスト...