Midjourney V6は大幅に進化しており、トップネットユーザーによる徹底レビューがここにあります!画質は恐ろしいほどリアルで、ポートレート写真は素晴らしいです

Midjourney V6は大幅に進化しており、トップネットユーザーによる徹底レビューがここにあります!画質は恐ろしいほどリアルで、ポートレート写真は素晴らしいです

最近、Andrei Kovalevという外国人ネットユーザーがMidjourney V6の非常に詳細なレビューを投稿しました。

ガイドは非常に専門的で、V6 と V5.2 の違いが非常に明確です。

さあ、巨匠の足跡を辿り、Midjourney V6の迫力あるパフォーマンスを深く体験してみましょう。

V6 モデルは V5.2 モデルと比べてどう優れているのでしょうか?

かつては、AI が生成した絵を見ると、すぐに AI が描いたものだと感じたかもしれません。

しかし、Midjourney V6 では、そのように感じることはほとんどありません。

このセクションでは、Kovalev が V6 の利点と欠点、および V5.2 と比較した主な変更点を紹介します。

ティム・ウォーカーによる、ワイヤーの海に溺れる半透明の皮膚を持つ、透き通った白い幽玄なロボットの正面からのハイファッションなポートレート。赤とシアンのトーン、輝くハイライト、暗い影

V6

V5.2

Kovalev 氏は、V6 には次のアップグレードがあることを発見しました (まだアルファ テスト段階であるため、将来変更される可能性があります)。

プロンプトに従う際の精度が向上し、より長いプロンプトを使用すると結果も良くなりました。

新しいモデルははるかに一貫性があります。

V6では画像プロンプト機能が改善されました。

現在、V6 には、Subtle モードと Creative モード (どちらも解像度を 2 倍に増加) を備えた 2 つの新しいアップスケーラーが搭載されています。

「非意見的な」 --style の raw モードがあります (V5.2 と同様)。

さらに、画像にテキストを追加できるようになりました。

それで、V6はどうなったのでしょうか?

シュルレアリスム

これまでの Midjourney のアップグレードでは写真のリアリティが向上してきましたが、V6 も例外ではありません。

V6を最もよく表すキーワードはおそらく「シュルレアリスム」でしょう。

川内倫子による10代の宇宙飛行士たちの写真ポートレート

V6

V5.2

全体的に見て、V6 のリアリティは桁外れで、特にすでに混乱している写真スタイルの点では、新たなレベルに達しています。

コートニー・ロイのオールドセーラーフォトグラフィーポートレート

V6

Midjourney V6 のリアルな画像機能が驚くほど素晴らしいのは、レンズの収差、意図的に誇張された領域、偶然に焦点が合っていない要素、さまざまなフィルム効果など、不完全さが存在するからです。

初音ミクの写真 - 勝井光雄 - stylize 175

もちろん、V6 はポートレートを描くのが得意なだけではありません。

トビリシのタイムラプス写真 - stylize 175

また、V6 のハイパーリアリズムが少々過激でやり過ぎのように感じられる場合、より繊細な外観と感触が求められることもあります。

1970年代のイスタンブールのカジノのギャンブラーを描いたアラ・ギュレルの肖像

V6

V5.2

詳細はクレイジーだ

Midjourney の各モデルがリリースされる前は、多くの人がその詳細がどのように扱われるのかを息を詰めて見守っています。

V6のディテールは驚異的です。新しいアップスケーラー機能により、細部がさらに向上します。

イヴァン・ビリビンによる、白い狼に乗った冬の王を描いた絵画

V6

V5.2

しかし、新しいモデルが登場するたびに画像の複雑さが着実に増す一方で、テクスチャなど、その過程で失われるものもいくつかあります。

たとえば、V4 の詳細レベルは V5+ では 10 倍に向上しており、フィルム グレインやリアルなブラシ ストロークなどの効果を実現することはほぼ不可能になっています。

本当の粒状感はまだ手の届かないところにあるように思われますが、V6 は明らかに、これまで失われていた生々しさへの確実な一歩を踏み出したと言えます。

テクスチャは素晴らしく、V5 とは大きく異なります (V5 では、「洗練されていない」ビジュアル スタイルを選択する必要がありました)。

マリアンナ・ローゼン著『ドリームガール』

V6

V5.2

V6 をよく表すもう 1 つのコンセプトは、型破りな構成です。これにより、V5.2 では構造とバランスへのアプローチが大きく変わりました。

以前のモデルは幾何学的な完璧さ、黄金比、中央の被写体を追求していましたが、V6 は非対称性を追求し、被写体をフレームの中央から遠ざけることを目指しています。

タイラス・ウォンの異次元の神秘の獣

V6

V5

これにより、よりダイナミックで魅力的なビジュアルが実現される可能性がありますが、プロンプトもそれに応じて調整する必要があります。小さな調整でも中心の構成と対称性を復元できます。

変動性の増加

V6 では、同じプロンプトに対する結果の変動性が高まっていることがわかります。

一般に、単一のキューの 4 つのバリエーションは、以前のモデルと比較してより顕著な違いを示します。

ジェシー・ウィルコックス・スミス著『シルバー・ウォーロック』

V6

V5.2

多くの場合、これにより、より創造的で、より興味深く、時には現実のプロトタイプの多様性にさらに忠実なアート スタイルの表現が実現します。

アートスタイル

キューでは、「スタイル修飾子」の名前を参照して、画像の特定の視覚スタイル、テクニック、ジャンル、テーマ、またはコンテキストを呼び出すことができます。

ピクセルアート

V6

V5.2

新しいモデルが登場するたびに、ソース マテリアルをより良く理解し、それを出力で再現できるようになるのが、今では伝統となっています。

しかし、『Midjourney』は劇的な変化で止まることはありません。

ジョディ・バーグスマ

V6

V5.2

これらのスタイル自体がいかに素晴らしいものであっても、それを単なるオリジナルの解釈からユニークなものへと変えるのは、私たちが加えるヒントです。

画像にテキストを追加する

「旅の途中の文章 - 本物か偽物か?」というタイトルの新聞を両手で持っています。

V6

V5.2

詳細はオリジナルサイトをご参照ください。

<<:  GPT-4V は惨めに失敗しました! CVマスター謝彩寧氏の新作:V*の重量級「視覚検索」アルゴリズムにより、LLMの理解力が人間に近づく

>>: 

推薦する

...

MLP は視覚研究に潜在的な驚きをもたらすでしょうか?最近のMLP画像分類作業の概要と分析

画像分類は、コンピューター ビジョン研究において常に非常に基本的で重要なタスクです。過去 10 年間...

世界中のもう一人の自分と話すのはどんな感じでしょうか?世界初のAI人間観察者が誕生

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

重要インフラのサイバーセキュリティリスク管理における AI の影響

AIがサイバー攻撃から重要なインフラを守るためにどう役立つか 電力網、水道システム、交通網などの重要...

2020年に注目を集めるグラフ機械学習の研究動向とは?

[[314165]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...

ChatGPTの現在の時代では、ベクトルデータベースには大規模モデル用のスーパーブレインが搭載されています

次のような経験をしたことはありませんか。インターネットで壁紙を見て、写真に写っている雪をかぶった山や...

...

自動運転HMI設計のポイントは何ですか?

ヒューマンマシンインターフェースがなければ、ドライバーは自動運転車 (AV) と通信できません。さら...

AIとMLでドキュメントを自動化する方法

[[312937]] [51CTO.com クイック翻訳] かつて紙は必須の事務用品とみなされ、ほと...

スマートシティ開発:廃棄物管理と大気質監視

廃棄物管理と空気質監視におけるスマートシティの進歩を通じて、都市生活の未来を探ります。 「スマート ...

環境センシング:スマートホームの次のステップ

「スマートホーム」という用語は何年も前から存在しているようですが、業界自体は比較的初期段階にあります...

...

機械学習に基づく自動脆弱性修復分析法

[[393588]]まとめファームウェア/ソフトウェアのセキュリティ脆弱性はグリッド セキュリティに...

AIとソフトウェアが5Gデータセンターの変革を推進する方法

今日、私たちはコンピューティングにおける大きなイノベーションの時代を目の当たりにしており、世界中で ...

シリコンバレーの大企業も「名門校の学位」を重視するのでしょうか? Redditの男の魂を問う質問が白熱した議論を巻き起こす

シリコンバレーの大企業からのオファーは多くのプログラマーにとって依然として非常に魅力的であり、今年は...