Midjourney の最新「拡張イメージ」ゲームプレイ: 高解像度の大ヒット作が 1 時間で直接制作可能!

Midjourney の最新「拡張イメージ」ゲームプレイ: 高解像度の大ヒット作が 1 時間で直接制作可能!

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

Midjourney「マップ拡張」は本当に想像力を最大限に生かしています。

次の 2 つの画面を見てみましょう。

これらが同じ写真からのものだと想像できますか?

本物のスキルを披露する時が来ました。

これは、Midjourney の最新バージョン 5.2 で導入されたズーム アウト機能です。

この効果が明らかになると、多くのネットユーザーがその狂気ぶりに驚き、また、何倍に「拡大」されたのか推測した。あるネットユーザーは大胆に推定値を示した。

50回。

より多くのネットユーザーが独自に派手なことをし始め、 1時間も経たないうちに大ヒット映画が制作されました。

旅の途中「地図を広げる」体験記

新しいズームアウトでは、Midjourney は「画像を 1.5 倍に拡大する」と「画像を 2 倍に拡大する」という 2 つの機能オプションを提供します。

そして公式紹介によれば、上下左右あらゆる方向に充填できるとのこと。

次に、ChatGPT を使用して「女性ボクサー」に関するプロンプトを生成してみましょう。

次に、このテキストを Midjourney に入力すると、女性ボクサーの非常にリアルな写真が 4 枚表示されます。

次に、そのうちの 1 つを選択すると、ズーム アウト機能のオプションが表示されます。

写真

ここでは、1 回のクリックだけで、元の画像がすぐに「拡大」されます。

たとえば、ズームアウト 1.5 倍の効果は次のようになります。

写真

具体的な比較は以下のとおりです。

同じようにズームアウト 2 倍機能を試してみましょう。

Midjourney の「画像を拡大する」効果が依然として良好であることは容易にわかります。

「1.5 倍ズームアウト」と「2 倍ズームアウト」のオプションに加えて、Midjourney には「正方形にする」「カスタム ズーム」という 2 つの機能も用意されています。

これらはそれぞれ、スクエア拡張機能とカスタム拡張機能に対応します。

このように繰り返しズームアウトすると、今のビデオのような効果が得られます。

どのAI「マップ拡張」が最適か?

AI 画像拡大に関しては、Midjourney がこの機能を導入した最初の企業ではありません。

それ以前にも、Photoshop、DALL-E 2、Stable Diffusionなどで同様の機能がすでにリリースされていました。

そこで疑問なのが、どの AI が「マップ拡張」に優れているかということです。

例えば、同じ元画像に対して、4社の「拡大画像」の効果は以下のようになります。

写真

「画像を拡大する」という効果において、各社が独自のスタイルを持っていることは容易にわかります。

この点に関して、AIGC 研究所は非常に詳細な比較を行っています。

写真

AIGC トレーニング協会の結論は次のとおりです。

MJ のアウトペインティング機能は、MJ によって生成された画像を拡張するために使用され、他に特別な要件がない場合には、間違いなく最も便利です。

全体的に、4 つのツールの中では、十分なカスタマイズ機能と変更機能を備え、PS AI が最も強力であると私は考えています。効果はMJよりそれほど悪くありません。

SDとDalle2は基本的に使用は考慮されません。

では、AI の「マップ拡張」といえば、どれを選びますか?

<<:  自律走行車の障害物回避、経路計画、制御技術の詳細な説明

>>:  スマートからレスポンシブへ: 人工知能で建築の未来を探る

ブログ    
ブログ    
ブログ    

推薦する

ファーウェイ、2025年のトップ10トレンドを発表:大企業の97%がAIを導入

世界の人口の58%が5Gネットワ​​ークにアクセスできるようになり、14%の家庭に「ロボット執事」が...

ChatGPTという独立系ゲームがSteamから削除されました。開発者は「貯金と3年半の人生が消えてしまいました」と語っています。

3年半このゲームに一生懸命取り組んだのに、ChatGPT を使用したという理由だけで Steam ...

5分間の技術講演 | GPU仮想化に関する簡単な講演

パート01 背景1.1 GPU アプリケーションのシナリオGPU (グラフィックス プロセッシング ...

...

2023年版CV初心者ガイドの概要

コンピューター ビジョンは、驚くほど急速に発展している分野です。本質的には、コンピューターに人間と同...

24時間365日対応のAI教師は生徒にどのような影響を与えるのでしょうか?

伝統的な教育方法は、過去 1 世紀か 2 世紀の間にあまり変わっていません。通常、生徒は教室で教師の...

Python、Java、C++がすべて含まれています。このGitHubプロジェクトは、複数の言語で古典的なアルゴリズムを実装しています。

古典的なデータ構造とアルゴリズムをいくつ知っていますか?大企業で面接を受けてみませんか?アルゴリズム...

CCTV 3.15は顔認識の悪用を暴露し、多くの教育企業が同様のカメラを使用する可能性がある

CCTV スクリーンショット街面の李婷が報告顔認識の応用シナリオはますます多様化しており、その背後...

製造業における機械学習

機械学習と人工知能:違いは何ですか?機械学習は人工知能のサブフィールドですが、すべての人工知能技術が...

Baidu Brain EasyDL Retail Editionは、消費財メーカーのオフライン流通チャネルのデジタルアップグレードをサポートします。

消費財ブランドにとって、製品の売上を増やすことが仕事の中心となります。しかし、電子商取引が普及してい...

予測分野における人工知能技術の応用

社会の発展と科学技術の進歩に伴い、人工知能技術が人類に与える影響は日々増大しており、その応用分野は拡...

市場を席巻するアメリカの5大テクノロジー企業はAI時代にさらに勢力を拡大するのでしょうか?

アメリカのデジタルテクノロジー大手は、流行病の打撃を受けた後、軌道に戻った。数日前、Alphabet...

待望のWeb顔認識ログインのフルバージョンが登場しました。気に入っています

[[436944]]この記事はWeChatの公開アカウント「Programmer Insider T...

コロナウイルス流行中のIoTの真実と虚構を区別する

モノのインターネットは長い間、インターネットの第2フェーズとして宣伝されてきましたが、現在、コロナウ...