Midjourney V6は大幅に進化しており、トップネットユーザーによる徹底レビューがここにあります!画質は恐ろしいほどリアルで、ポートレート写真は素晴らしいです

最近、Andrei Kovalevという外国人ネットユーザーがMidjourney V6の非常に詳細なレビューを投稿しました。

ガイドは非常に専門的で、V6 と V5.2 の違いが非常に明確です。

さあ、巨匠の足跡を辿り、Midjourney V6の迫力あるパフォーマンスを深く体験してみましょう。

V6 モデルは V5.2 モデルと比べてどう優れているのでしょうか?

かつては、AI が生成した絵を見ると、すぐに AI が描いたものだと感じたかもしれません。

しかし、Midjourney V6 では、そのように感じることはほとんどありません。

このセクションでは、Kovalev が V6 の利点と欠点、および V5.2 と比較した主な変更点を紹介します。

ティム・ウォーカーによる、ワイヤーの海に溺れる半透明の皮膚を持つ、透き通った白い幽玄なロボットの正面からのハイファッションなポートレート。赤とシアンのトーン、輝くハイライト、暗い影

V5.2

Kovalev 氏は、V6 には次のアップグレードがあることを発見しました (まだアルファテスト段階であるため、将来変更される可能性があります)。

プロンプトに従う際の精度が向上し、より長いプロンプトを使用すると結果も良くなりました。

新しいモデルははるかに一貫性があります。

V6では画像プロンプト機能が改善されました。

現在、V6 には、Subtle モードと Creative モード (どちらも解像度を 2 倍に増加) を備えた 2 つの新しいアップスケーラーが搭載されています。

「非意見的な」 --style の raw モードがあります (V5.2 と同様)。

さらに、画像にテキストを追加できるようになりました。

それで、V6はどうなったのでしょうか?

シュルレアリスム

これまでの Midjourney のアップグレードでは写真のリアリティが向上してきましたが、V6 も例外ではありません。

V6を最もよく表すキーワードはおそらく「シュルレアリスム」でしょう。

川内倫子による10代の宇宙飛行士たちの写真ポートレート

V5.2

全体的に見て、V6 のリアリティは桁外れで、特にすでに混乱している写真スタイルの点では、新たなレベルに達しています。

コートニー・ロイのオールドセーラーフォトグラフィーポートレート

Midjourney V6 のリアルな画像機能が驚くほど素晴らしいのは、レンズの収差、意図的に誇張された領域、偶然に焦点が合っていない要素、さまざまなフィルム効果など、不完全さが存在するからです。

初音ミクの写真 - 勝井光雄 - stylize 175

もちろん、V6 はポートレートを描くのが得意なだけではありません。

トビリシのタイムラプス写真 - stylize 175

また、V6 のハイパーリアリズムが少々過激でやり過ぎのように感じられる場合、より繊細な外観と感触が求められることもあります。

1970年代のイスタンブールのカジノのギャンブラーを描いたアラ・ギュレルの肖像

V5.2

詳細はクレイジーだ

Midjourney の各モデルがリリースされる前は、多くの人がその詳細がどのように扱われるのかを息を詰めて見守っています。

V6のディテールは驚異的です。新しいアップスケーラー機能により、細部がさらに向上します。

イヴァン・ビリビンによる、白い狼に乗った冬の王を描いた絵画

V5.2

しかし、新しいモデルが登場するたびに画像の複雑さが着実に増す一方で、テクスチャなど、その過程で失われるものもいくつかあります。

たとえば、V4 の詳細レベルは V5+ では 10 倍に向上しており、フィルムグレインやリアルなブラシストロークなどの効果を実現することはほぼ不可能になっています。

本当の粒状感はまだ手の届かないところにあるように思われますが、V6 は明らかに、これまで失われていた生々しさへの確実な一歩を踏み出したと言えます。

テクスチャは素晴らしく、V5 とは大きく異なります (V5 では、「洗練されていない」ビジュアルスタイルを選択する必要がありました)。

マリアンナ・ローゼン著『ドリームガール』

V5.2

V6 をよく表すもう 1 つのコンセプトは、型破りな構成です。これにより、V5.2 では構造とバランスへのアプローチが大きく変わりました。

以前のモデルは幾何学的な完璧さ、黄金比、中央の被写体を追求していましたが、V6 は非対称性を追求し、被写体をフレームの中央から遠ざけることを目指しています。

タイラス・ウォンの異次元の神秘の獣

これにより、よりダイナミックで魅力的なビジュアルが実現される可能性がありますが、プロンプトもそれに応じて調整する必要があります。小さな調整でも中心の構成と対称性を復元できます。

変動性の増加

V6 では、同じプロンプトに対する結果の変動性が高まっていることがわかります。

一般に、単一のキューの 4 つのバリエーションは、以前のモデルと比較してより顕著な違いを示します。

ジェシー・ウィルコックス・スミス著『シルバー・ウォーロック』

V5.2

多くの場合、これにより、より創造的で、より興味深く、時には現実のプロトタイプの多様性にさらに忠実なアートスタイルの表現が実現します。

アートスタイル

キューでは、「スタイル修飾子」の名前を参照して、画像の特定の視覚スタイル、テクニック、ジャンル、テーマ、またはコンテキストを呼び出すことができます。

ピクセルアート

V5.2

新しいモデルが登場するたびに、ソースマテリアルをより良く理解し、それを出力で再現できるようになるのが、今では伝統となっています。

しかし、『Midjourney』は劇的な変化で止まることはありません。

ジョディ・バーグスマ

V5.2

これらのスタイル自体がいかに素晴らしいものであっても、それを単なるオリジナルの解釈からユニークなものへと変えるのは、私たちが加えるヒントです。

画像にテキストを追加する

「旅の途中の文章 - 本物か偽物か?」というタイトルの新聞を両手で持っています。

V5.2

詳細はオリジナルサイトをご参照ください。

<<: GPT-4V は惨めに失敗しました! CVマスター謝彩寧氏の新作：V*の重量級「視覚検索」アルゴリズムにより、LLMの理解力が人間に近づく

>>:

ブログ

「最強の7Bモデル」論文が発表され、ラマ2の13Bバージョンを超える方法が明らかになった

ブログ

アリババが自社開発したAI推論チップがリリース、Hanguang 800は他のチップより10倍強力

ブログ

私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

ブログ

予測: 2019 年に爆発的に普及する 10 の人工知能テクノロジー!

ブログ

自動運転データの閉鎖とエンジニアリングの詳細な分析

ブログ

Midjourney V6は大幅に進化しており、トップネットユーザーによる徹底レビューがここにあります!画質は恐ろしいほどリアルで、ポートレート写真は素晴らしいです

V6 モデルは V5.2 モデルと比べてどう優れているのでしょうか?

シュルレアリスム

詳細はクレイジーだ

変動性の増加

アートスタイル

画像にテキストを追加する

「最強の7Bモデル」論文が発表され、ラマ2の13Bバージョンを超える方法が明らかになった

アリババが自社開発したAI推論チップがリリース、Hanguang 800は他のチップより10倍強力

私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

予測: 2019 年に爆発的に普及する 10 の人工知能テクノロジー!

自動運転データの閉鎖とエンジニアリングの詳細な分析

推薦する

AIが人間を支配するのではないかと心配ですか?人工知能の「怖さ」をどう克服するか？

効果はSDXLを超える！香港中文大学の博士課程学生が3億4000万枚の画像でトレーニングした超リアルな肖像画合成ツールを発表

ランウェイの最強のライバルが登場、ワンクリックでショートビデオを生成、期間限定で無料

AIOps で IT 運用にインテリジェンスを組み込む方法

アマゾン、AIが女性の求職者に低い評価を与えたため研究チームを解散に追い込まれる

世界を驚かせたNASAの火星無人機はどのように設計されたのか？

ディープラーニングを使用した音声分類のエンドツーエンドの例と説明

Yisaqi 9周年: RPA製品の進化を振り返る

2020 年に最も注目される人工知能 (AI) アプリケーショントップ 10

Xing Bo 氏のチームの LLM360 は、大規模なモデルを真に透明化する総合的なオープンソースプロジェクトです。

フォーブス誌の2020年のAIに関するトップ10予測: 人工知能はますます「疎外」されつつある!

AIとコグニティブコンピューティングがIoTデータを理解