Midjourney 5.2 がリリースされました!オリジナルの絵画から3Dシーンを生成し、無限の宇宙を無限に拡大します

Midjourney 5.2 がリリースされました!オリジナルの絵画から3Dシーンを生成し、無限の宇宙を無限に拡大します

旅の途中と安定した拡散が限界に達しました!

Stable Diffusion XL 0.9 がリリースされたのとほぼ同時に、Midjourney はバージョン 5.2 のリリースを発表しました。

バージョン 5.2 で最も目を引くアップデートは、元の画像と同じ詳細を維持しながら元の画像を無限に拡大できるズーム アウト機能です。

ズームアウトで描かれた果てしない宇宙のアニメーションは、言葉を失うほどの衝撃です。Midjourney 5.2はジェイムズ・ウェッブ宇宙望遠鏡よりも遠くまで見ることができるといえます。

この非常に強力な機能を使用すると、本当に素晴らしい写真を作成できるだけでなく、完璧な HD ズーム ビデオを撮影することもできます。

この「核レベル」のアップデートに、ネットユーザーは「あなたの機能は強力すぎる。私の睡眠を直接台無しにしてしまった!」と叫びました。

1時間プレイした後、ネットユーザーは再びこう言った。「強すぎて泣きたい…」


果てしなく広がる宇宙のように——

おばあちゃんの世界には何人いるの?答えは無限です。

アリスは小さなウサギを追いかけていたのですが、誤って「ウサギの穴」に落ちて不思議の国に入ってしまいました。

ズームアウトを利用してネットユーザーが作った「ウサギの穴」は夢のようだ。

また、AI画像デザインチーム「ilumine AI」も存在し、小さな原画のみを使用して、ズームアウトを通じて以下の壮大なシーンの画像を生成しました。

そこで、私たちが開発していた2Dから3Dへの変換技術を使って、3Dのゲームシーンを直接作成しました。

製品が正式に発売されたら、空中から画像を拡大できる「Midjourney Zoom Out」機能により、原画から直接 3D シーンを作成できるようになると思います。

これはまさにゲーム業界に革命を起こすものであり、多くのゲーム制作従事者は声を大にして嘆くはずです。

Zoom Out は Adob​​e AI と Uncrop を粉砕すると誓う?

以前、AdobeのGenerative Fillの塗りつぶし機能はネットユーザーの間で話題になった。この機能で塗りつぶされたチャウ・シンチーの映画の静止画は「完璧」だと言える。

スタビリティAIもその直後に究極の技を放った。同社はClipdropと提携し、究極の画像比率エディタであるUncrop Clipdropをリリースしました。

Midjourney V5.2 のズームアウト機能も同様に優れており、さらに強力になっています。

/image コマンドでプロンプトを入力するだけで、Midjourney はプロンプトに基づいて 4 つのビジュアル反復を生成します。次に、最も気に入ったものを選択してズームインすると、イメージ全体がより詳細にレンダリングされます。

すべての拡大された画像の下に「ズームアウト」ボタンが表示され、画像の拡大縮小に使用できるようになりました。

まず、拡大縮小する必要がある元の画像を指定して、下の「2 倍に拡大縮小」ボタンをクリックします。

以前紹介した Uncrop と同様に、Midjourney は 4 つの代替パターンを生成します。

スケーリング後、4 つの代替パターンのスタイルは非常に一貫しており、背景の詳細​​に若干の違いがあるだけです。

4 つのアップスケール パターンのいずれかを選択した後、2 倍にズームインして写真のズームインを続けることもできます。

さらに拡大した後も、パターンのスタイルと詳細が非常に一貫していることがわかります。拡大を続けたい場合は、最初にハッブル望遠鏡効果を作成できます。

このプロセスを繰り返し続けると、無限の詳細を持つ非常に大きな「メガマップ」を生成できます。

熱心なネットユーザーの指導により、記事の冒頭にある「無限宇宙ズームアニメーション」を生成することができました。

左側の夢のようなワンダーランドはさらに拡張でき、芸術とファンタジーの世界が無限に広がります...

ネットユーザーたちは興奮のあまり眠れなくなるほど楽しんだ。

マスク氏のサンダーボルト・ユニバースはこんな感じです。

これはすでに芸術の傑作です。

モーフィアスはジェダイの騎士となり、シーンが進むにつれてさらに強力に見えます。

あるネットユーザーは次のようにコメントしています。「Midjourney v5.2 は、極端なクローズアップからワイドオープンショットまでのカメラの動きをシミュレートするのに優れています。」

次のステップは、レートを 24 ~ 60 フレーム/秒に上げて、キャラクターを動かせるようにすることですか? Midjourney は 12 か月以内にテキストからビデオへのサービスを開始する予定ですか?

もちろん、時事問題に敏感なネットユーザーもおり、馬社長のために八角形のケージバトル写真を作成した。

3大ソフトの無限ズーム機能比較

Uncrop はフリーソフトウェアですが、リソースを節約するための公式の配慮なのか技術的な問題なのかはわかりませんが、無限のネストドールスケーリングはサポートされていません。

元の画像:

一度スケーリングした後:

2 回目のスケーリング後、黒いエッジが表示され、入れ子人形は拒否されます。

Midjourney の入れ子人形宇宙の効果についてはすでに上で説明しました。

理論的には、キャンバスを無限に拡大できる限り、PS GF は空白スペースを画像で無限に埋めて、無限のスケーリングの効果を実現することもできます。

Midjourney よりも実装が少し難しいだけです。

熱心なネットユーザーがフクロウ動画の作り方を教える

問題は、記事の冒頭にある、驚くほど美しいフクロウの飛行ズーム動画はどのようにして作られたのかということです。

ネットマスターの「Gui Zang」が、ステップごとに教えてくれる詳細なチュートリアルを提供してくれました。

まず、フクロウの画像を作成し、次に下の 1.5 倍ズームアウト ボタンを使用します。

このプロセスを 7 回続けて繰り返すと、ビデオのキー フレーム イメージが 7 つ取得されます。

並べ替えた後、app.cunwayml.com にログインし、左側のナビゲーションで [ビデオの作成] タブを見つけて、[フレーム補間] 機能を見つけます。

次に、作成した 7 枚の写真を左側の位置にドラッグしてアップロードします。順序が正しいことを確認したら、[生成] をクリックしてビデオを生成できます。

しばらくすると、このビデオのプレビュー効果を確認できますが、一般ユーザーは 720P でしかエクスポートできません。

TL;DR: V5.2 アップデートの 8 つの主要機能

つまり、この V5.2 アップデートは、次の 8 つの主要機能に要約できます。

1 スクエアリフレーム

- 画像サイズを大きくする

- 選択して正方形にする

このアップデートには、画像の形状を正方形以外のアスペクト比に変更できる「正方形にする」ツールも付属しています。

16:9のアスペクト比のオリジナル画像

正方形の画像

このツールを使用すると、写真のサイズを変更し、ソーシャル メディア フィードに合わせてフレームを変更できます。

2 標準ズーム(標準ズーム 1.5 - 2倍)

1.5 倍または 2 倍に拡大することを選択します。

この機能は短距離ズームに最適で、写真にさらに詳細を追加できます。

3. エンドレスズーム(写真の再ズーム)

この機能を使用すると、特定の文字の周囲に新しい大きな画像の背景を作成できます。

4 カスタムズームリフレーミング

アーティスト、デザイナー、ブランドなど、どのような方でも、画像のサイズをカスタマイズして、あらゆるオンライン プラットフォームに適合する画像を作成できます。

5. 様式化

Midjourney は、芸術的な輝きと豊かな視覚的美しさを備えた画像を作成するように訓練されており、これが Stable Diffusion との最大の違いです。

以前は、ユーザーはプロンプトの末尾に「–styleize X」を追加できました (X の範囲は 0 ~ 1000)。しかし、V5.2 ではモデルの既存のスタイル設定機能が活用され、リアリズムとセンスの面で 11 レベルに引き上げられました。

6 バリエーションモード

Midjourney V5.2 には、バリエーション モードと呼ばれる新しい機能も搭載されており、ユーザーは出力に適用する視覚的なニュアンスを繰り返し調整することができます。

プロンプトで「低バリエーション」モードを使用すると、一貫性のある文字画像が生成されますが、「高バリエーション」を選択すると、元の出力との視覚的な違いが大きくなり、4 つの画像はより創造的で芸術的なものになります。

7 さまざまな写真

あなたのオリジナルの写真を与えると、似たような 4 人のあなた、またはまったく異なるスタイルのあなたを生成することを選択できます。

8 短いプロンプト

Midjourney に関しては、プロンプトに多くの単語を使用すると、より良い結果やより詳細な結果が表示されるという誤解がよくあります。

しかし実際には、プロンプトが長すぎると、各単語の効果が相殺され、出力画像が必ずしもユーザーの考えと一致しなくなることがよくあります。

Midjourney アップデートの「短縮」コマンド機能は、プロンプトのコンポーネントを分析し、いくつかの代替案を提案してくれます。

新しいプロンプトを使用すると、多くの場合、元の写真からさらに驚くべき結果を生成できます。

<<:  「これまで作られなかった最も重要な機械」アラン・チューリングとチューリングマシン

>>:  11人のLLMが連携することで、パフォーマンスが爆発的に向上します。 AI2とUSCが共同でLLM-Blender統合学習フレームワークをオープンソース化:まずソートしてからマージ

ブログ    
ブログ    
ブログ    

推薦する

革新を続ける: 6月のロボット研究開発の概要

近年、人工知能への熱狂が多くの業界を席巻しており、ロボット工学の分野も例外ではありません。人工知能技...

ビル・ゲイツ: 生成AIは限界に達した

ビル・ゲイツ氏の暴露は機械学習コミュニティで話題となっている。 「GPT-5 は GPT-4 よりそ...

Nature: 機械視覚による行動理解と脳神経の間には本質的なつながりがあるのでしょうか?上海交通大学のLu Cewu氏のチームはマッピングモデルを構築した

被験者が特定の行動をとったとき、その脳はそれに対応する安定した脳神経パターンのマッピングを生成するで...

エンタープライズ AI の 4 つのトレンド: 現在地と今後の方向性

[[275946]]ビッグデータダイジェスト制作出典: フォーブス編纂者:張大毓人工知能は従来の産業...

データセンターは大量の電力を消費します。しかしAIはエネルギーを大量に消費する必要はない

世界経済フォーラム(AI が地球を救う 8 つの方法)を含む多くの予測では、人工知能 (AI) が「...

...

...

もう一つの「無人工場」が誕生。残された労働者たちは何をするのでしょうか?

最近、ZTEの南京浜江インテリジェント製造基地が設立されたのを見たとき、私はまったく喜びを感じません...

...

予測分野における人工知能技術の応用

社会の発展と科学技術の進歩に伴い、人工知能技術が人類に与える影響は日々増大しており、その応用分野は拡...

中国は2022年に耐量子暗号アルゴリズムを開発し、2025年に実装予定

[[248782]]量子コンピュータが実用化されるまでにはしばらく時間がかかるだろうが、国際的な暗号...

ChatGPTを使用して小児疾患を診断しますか?新たな研究がこれに冷水を浴びせる:正解率はわずか17%

1月4日、ニューヨークのコーエン小児医療センターの3人の小児科医が、大規模言語モデルChatGPT...

...

成都初の無人地下鉄が運行開始。列車の前方からの眺めはまるで時空を旅しているかのようだ

毎日地下鉄に乗るとき、トンネルを高速で走る列車の前方風景を見たことがありますか?11月13日、成都初...

古代のLRから始まる初心者でもわかるレコメンデーションアルゴリズム入門

[[386397]]みなさんこんにちは。私は、気づかないうちに長い間、推薦システムに取り組んできまし...