Midjourney 5.2 がリリースされました!オリジナルの絵画から3Dシーンを生成し、無限の宇宙を無限に拡大します

Midjourney 5.2 がリリースされました!オリジナルの絵画から3Dシーンを生成し、無限の宇宙を無限に拡大します

旅の途中と安定した拡散が限界に達しました!

Stable Diffusion XL 0.9 がリリースされたのとほぼ同時に、Midjourney はバージョン 5.2 のリリースを発表しました。

バージョン 5.2 で最も目を引くアップデートは、元の画像と同じ詳細を維持しながら元の画像を無限に拡大できるズーム アウト機能です。

ズームアウトで描かれた果てしない宇宙のアニメーションは、言葉を失うほどの衝撃です。Midjourney 5.2はジェイムズ・ウェッブ宇宙望遠鏡よりも遠くまで見ることができるといえます。

この非常に強力な機能を使用すると、本当に素晴らしい写真を作成できるだけでなく、完璧な HD ズーム ビデオを撮影することもできます。

この「核レベル」のアップデートに、ネットユーザーは「あなたの機能は強力すぎる。私の睡眠を直接台無しにしてしまった!」と叫びました。

1時間プレイした後、ネットユーザーは再びこう言った。「強すぎて泣きたい…」


果てしなく広がる宇宙のように——

おばあちゃんの世界には何人いるの?答えは無限です。

アリスは小さなウサギを追いかけていたのですが、誤って「ウサギの穴」に落ちて不思議の国に入ってしまいました。

ズームアウトを利用してネットユーザーが作った「ウサギの穴」は夢のようだ。

また、AI画像デザインチーム「ilumine AI」も存在し、小さな原画のみを使用して、ズームアウトを通じて以下の壮大なシーンの画像を生成しました。

そこで、私たちが開発していた2Dから3Dへの変換技術を使って、3Dのゲームシーンを直接作成しました。

製品が正式に発売されたら、空中から画像を拡大できる「Midjourney Zoom Out」機能により、原画から直接 3D シーンを作成できるようになると思います。

これはまさにゲーム業界に革命を起こすものであり、多くのゲーム制作従事者は声を大にして嘆くはずです。

Zoom Out は Adob​​e AI と Uncrop を粉砕すると誓う?

以前、AdobeのGenerative Fillの塗りつぶし機能はネットユーザーの間で話題になった。この機能で塗りつぶされたチャウ・シンチーの映画の静止画は「完璧」だと言える。

スタビリティAIもその直後に究極の技を放った。同社はClipdropと提携し、究極の画像比率エディタであるUncrop Clipdropをリリースしました。

Midjourney V5.2 のズームアウト機能も同様に優れており、さらに強力になっています。

/image コマンドでプロンプトを入力するだけで、Midjourney はプロンプトに基づいて 4 つのビジュアル反復を生成します。次に、最も気に入ったものを選択してズームインすると、イメージ全体がより詳細にレンダリングされます。

すべての拡大された画像の下に「ズームアウト」ボタンが表示され、画像の拡大縮小に使用できるようになりました。

まず、拡大縮小する必要がある元の画像を指定して、下の「2 倍に拡大縮小」ボタンをクリックします。

以前紹介した Uncrop と同様に、Midjourney は 4 つの代替パターンを生成します。

スケーリング後、4 つの代替パターンのスタイルは非常に一貫しており、背景の詳細​​に若干の違いがあるだけです。

4 つのアップスケール パターンのいずれかを選択した後、2 倍にズームインして写真のズームインを続けることもできます。

さらに拡大した後も、パターンのスタイルと詳細が非常に一貫していることがわかります。拡大を続けたい場合は、最初にハッブル望遠鏡効果を作成できます。

このプロセスを繰り返し続けると、無限の詳細を持つ非常に大きな「メガマップ」を生成できます。

熱心なネットユーザーの指導により、記事の冒頭にある「無限宇宙ズームアニメーション」を生成することができました。

左側の夢のようなワンダーランドはさらに拡張でき、芸術とファンタジーの世界が無限に広がります...

ネットユーザーたちは興奮のあまり眠れなくなるほど楽しんだ。

マスク氏のサンダーボルト・ユニバースはこんな感じです。

これはすでに芸術の傑作です。

モーフィアスはジェダイの騎士となり、シーンが進むにつれてさらに強力に見えます。

あるネットユーザーは次のようにコメントしています。「Midjourney v5.2 は、極端なクローズアップからワイドオープンショットまでのカメラの動きをシミュレートするのに優れています。」

次のステップは、レートを 24 ~ 60 フレーム/秒に上げて、キャラクターを動かせるようにすることですか? Midjourney は 12 か月以内にテキストからビデオへのサービスを開始する予定ですか?

もちろん、時事問題に敏感なネットユーザーもおり、馬社長のために八角形のケージバトル写真を作成した。

3大ソフトの無限ズーム機能比較

Uncrop はフリーソフトウェアですが、リソースを節約するための公式の配慮なのか技術的な問題なのかはわかりませんが、無限のネストドールスケーリングはサポートされていません。

元の画像:

一度スケーリングした後:

2 回目のスケーリング後、黒いエッジが表示され、入れ子人形は拒否されます。

Midjourney の入れ子人形宇宙の効果についてはすでに上で説明しました。

理論的には、キャンバスを無限に拡大できる限り、PS GF は空白スペースを画像で無限に埋めて、無限のスケーリングの効果を実現することもできます。

Midjourney よりも実装が少し難しいだけです。

熱心なネットユーザーがフクロウ動画の作り方を教える

問題は、記事の冒頭にある、驚くほど美しいフクロウの飛行ズーム動画はどのようにして作られたのかということです。

ネットマスターの「Gui Zang」が、ステップごとに教えてくれる詳細なチュートリアルを提供してくれました。

まず、フクロウの画像を作成し、次に下の 1.5 倍ズームアウト ボタンを使用します。

このプロセスを 7 回続けて繰り返すと、ビデオのキー フレーム イメージが 7 つ取得されます。

並べ替えた後、app.cunwayml.com にログインし、左側のナビゲーションで [ビデオの作成] タブを見つけて、[フレーム補間] 機能を見つけます。

次に、作成した 7 枚の写真を左側の位置にドラッグしてアップロードします。順序が正しいことを確認したら、[生成] をクリックしてビデオを生成できます。

しばらくすると、このビデオのプレビュー効果を確認できますが、一般ユーザーは 720P でしかエクスポートできません。

TL;DR: V5.2 アップデートの 8 つの主要機能

つまり、この V5.2 アップデートは、次の 8 つの主要機能に要約できます。

1 スクエアリフレーム

- 画像サイズを大きくする

- 選択して正方形にする

このアップデートには、画像の形状を正方形以外のアスペクト比に変更できる「正方形にする」ツールも付属しています。

16:9のアスペクト比のオリジナル画像

正方形の画像

このツールを使用すると、写真のサイズを変更し、ソーシャル メディア フィードに合わせてフレームを変更できます。

2 標準ズーム(標準ズーム 1.5 - 2倍)

1.5 倍または 2 倍に拡大することを選択します。

この機能は短距離ズームに最適で、写真にさらに詳細を追加できます。

3. エンドレスズーム(写真の再ズーム)

この機能を使用すると、特定の文字の周囲に新しい大きな画像の背景を作成できます。

4 カスタムズームリフレーミング

アーティスト、デザイナー、ブランドなど、どのような方でも、画像のサイズをカスタマイズして、あらゆるオンライン プラットフォームに適合する画像を作成できます。

5. 様式化

Midjourney は、芸術的な輝きと豊かな視覚的美しさを備えた画像を作成するように訓練されており、これが Stable Diffusion との最大の違いです。

以前は、ユーザーはプロンプトの末尾に「–styleize X」を追加できました (X の範囲は 0 ~ 1000)。しかし、V5.2 ではモデルの既存のスタイル設定機能が活用され、リアリズムとセンスの面で 11 レベルに引き上げられました。

6 バリエーションモード

Midjourney V5.2 には、バリエーション モードと呼ばれる新しい機能も搭載されており、ユーザーは出力に適用する視覚的なニュアンスを繰り返し調整することができます。

プロンプトで「低バリエーション」モードを使用すると、一貫性のある文字画像が生成されますが、「高バリエーション」を選択すると、元の出力との視覚的な違いが大きくなり、4 つの画像はより創造的で芸術的なものになります。

7 さまざまな写真

あなたのオリジナルの写真を与えると、似たような 4 人のあなた、またはまったく異なるスタイルのあなたを生成することを選択できます。

8 短いプロンプト

Midjourney に関しては、プロンプトに多くの単語を使用すると、より良い結果やより詳細な結果が表示されるという誤解がよくあります。

しかし実際には、プロンプトが長すぎると、各単語の効果が相殺され、出力画像が必ずしもユーザーの考えと一致しなくなることがよくあります。

Midjourney アップデートの「短縮」コマンド機能は、プロンプトのコンポーネントを分析し、いくつかの代替案を提案してくれます。

新しいプロンプトを使用すると、多くの場合、元の写真からさらに驚くべき結果を生成できます。

<<:  「これまで作られなかった最も重要な機械」アラン・チューリングとチューリングマシン

>>:  11人のLLMが連携することで、パフォーマンスが爆発的に向上します。 AI2とUSCが共同でLLM-Blender統合学習フレームワークをオープンソース化:まずソートしてからマージ

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

シンプルで効果的な新しい敵対的攻撃手法により、人気の Android アプリの DL モデルが破られることに成功

現在、多くのディープラーニング モデルがモバイル アプリに組み込まれています。デバイス上で機械学習を...

...

...

テンセントが論文を提出しました!とても誇りに思う

執筆者 | Mo Yan & Yun Zhao 「国家チーム」テンセント渾源モデルがついに本...

なぜ人工知能は未だに愚かなものなのでしょうか?人間のせいにする

[[186749]]かつてはSF作家や脚本家の領域だった人工知能が、今や着実に現実世界に進出しつつあ...

調査:アーティストの半数以上がAIによる描画は作品制作に役立たないと考えている

近年、人工知能(AI)は芸術作品の創造において驚くべき能力を発揮しています。テキストボックスに文章を...

ADMap: 干渉防止オンライン高精度マップへの新しいアプローチ

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

JSPフォーラムツリー構造を実装するための特定のアルゴリズム

1. JSP フォーラムのデモテーブルの構造: テーブル名: mybbslist フィールド データ...

2022 年に予測されるロボティック プロセス オートメーションのトップ 10 トレンド

ロボティック プロセス オートメーション (RPA) を導入する企業の主な目標は、時間のかかる反復的...

最高の AI 学習アプリ トップ 10

人工知能の革新により、ツールの使用方法は変化しています。 AI 学習アプリケーションは、適応型学習、...

あなたの孤独をAIが見抜く:その精度はなんと94%

[[344787]]あなたは本当に「孤独」ですか?かつて宇宙規模で流行したこの「国際孤独度スケール...

2020年に注目すべき10のAIトレンド

来年、AI テクノロジーと市場はどのように進化するのでしょうか? 主要な AI トレンドとしては、エ...

AIデコードと同じくらい魔法的? AIによるカラーリングはブラックテクノロジーなのか、それとも単なるジョークなのか?

画像処理の分野では、AIブラシがますます目立つようになってきています。以前、AIロスレス画像拡大、A...

グリーンAIが気候変動の影響にどう対処できるか

機械学習などの計算集約型テクノロジーの開発には、大きな二酸化炭素排出量が伴い、気候変動の一因となりま...