Midjourney V6は大幅に進化しており、トップネットユーザーによる徹底レビューがここにあります!画質は恐ろしいほどリアルで、ポートレート写真は素晴らしいです

Midjourney V6は大幅に進化しており、トップネットユーザーによる徹底レビューがここにあります!画質は恐ろしいほどリアルで、ポートレート写真は素晴らしいです

最近、Andrei Kovalevという外国人ネットユーザーがMidjourney V6の非常に詳細なレビューを投稿しました。

ガイドは非常に専門的で、V6 と V5.2 の違いが非常に明確です。

さあ、巨匠の足跡を辿り、Midjourney V6の迫力あるパフォーマンスを深く体験してみましょう。

V6 モデルは V5.2 モデルと比べてどう優れているのでしょうか?

かつては、AI が生成した絵を見ると、すぐに AI が描いたものだと感じたかもしれません。

しかし、Midjourney V6 では、そのように感じることはほとんどありません。

このセクションでは、Kovalev が V6 の利点と欠点、および V5.2 と比較した主な変更点を紹介します。

ティム・ウォーカーによる、ワイヤーの海に溺れる半透明の皮膚を持つ、透き通った白い幽玄なロボットの正面からのハイファッションなポートレート。赤とシアンのトーン、輝くハイライト、暗い影

V6

V5.2

Kovalev 氏は、V6 には次のアップグレードがあることを発見しました (まだアルファ テスト段階であるため、将来変更される可能性があります)。

プロンプトに従う際の精度が向上し、より長いプロンプトを使用すると結果も良くなりました。

新しいモデルははるかに一貫性があります。

V6では画像プロンプト機能が改善されました。

現在、V6 には、Subtle モードと Creative モード (どちらも解像度を 2 倍に増加) を備えた 2 つの新しいアップスケーラーが搭載されています。

「非意見的な」 --style の raw モードがあります (V5.2 と同様)。

さらに、画像にテキストを追加できるようになりました。

それで、V6はどうなったのでしょうか?

シュルレアリスム

これまでの Midjourney のアップグレードでは写真のリアリティが向上してきましたが、V6 も例外ではありません。

V6を最もよく表すキーワードはおそらく「シュルレアリスム」でしょう。

川内倫子による10代の宇宙飛行士たちの写真ポートレート

V6

V5.2

全体的に見て、V6 のリアリティは桁外れで、特にすでに混乱している写真スタイルの点では、新たなレベルに達しています。

コートニー・ロイのオールドセーラーフォトグラフィーポートレート

V6

Midjourney V6 のリアルな画像機能が驚くほど素晴らしいのは、レンズの収差、意図的に誇張された領域、偶然に焦点が合っていない要素、さまざまなフィルム効果など、不完全さが存在するからです。

初音ミクの写真 - 勝井光雄 - stylize 175

もちろん、V6 はポートレートを描くのが得意なだけではありません。

トビリシのタイムラプス写真 - stylize 175

また、V6 のハイパーリアリズムが少々過激でやり過ぎのように感じられる場合、より繊細な外観と感触が求められることもあります。

1970年代のイスタンブールのカジノのギャンブラーを描いたアラ・ギュレルの肖像

V6

V5.2

詳細はクレイジーだ

Midjourney の各モデルがリリースされる前は、多くの人がその詳細がどのように扱われるのかを息を詰めて見守っています。

V6のディテールは驚異的です。新しいアップスケーラー機能により、細部がさらに向上します。

イヴァン・ビリビンによる、白い狼に乗った冬の王を描いた絵画

V6

V5.2

しかし、新しいモデルが登場するたびに画像の複雑さが着実に増す一方で、テクスチャなど、その過程で失われるものもいくつかあります。

たとえば、V4 の詳細レベルは V5+ では 10 倍に向上しており、フィルム グレインやリアルなブラシ ストロークなどの効果を実現することはほぼ不可能になっています。

本当の粒状感はまだ手の届かないところにあるように思われますが、V6 は明らかに、これまで失われていた生々しさへの確実な一歩を踏み出したと言えます。

テクスチャは素晴らしく、V5 とは大きく異なります (V5 では、「洗練されていない」ビジュアル スタイルを選択する必要がありました)。

マリアンナ・ローゼン著『ドリームガール』

V6

V5.2

V6 をよく表すもう 1 つのコンセプトは、型破りな構成です。これにより、V5.2 では構造とバランスへのアプローチが大きく変わりました。

以前のモデルは幾何学的な完璧さ、黄金比、中央の被写体を追求していましたが、V6 は非対称性を追求し、被写体をフレームの中央から遠ざけることを目指しています。

タイラス・ウォンの異次元の神秘の獣

V6

V5

これにより、よりダイナミックで魅力的なビジュアルが実現される可能性がありますが、プロンプトもそれに応じて調整する必要があります。小さな調整でも中心の構成と対称性を復元できます。

変動性の増加

V6 では、同じプロンプトに対する結果の変動性が高まっていることがわかります。

一般に、単一のキューの 4 つのバリエーションは、以前のモデルと比較してより顕著な違いを示します。

ジェシー・ウィルコックス・スミス著『シルバー・ウォーロック』

V6

V5.2

多くの場合、これにより、より創造的で、より興味深く、時には現実のプロトタイプの多様性にさらに忠実なアート スタイルの表現が実現します。

アートスタイル

キューでは、「スタイル修飾子」の名前を参照して、画像の特定の視覚スタイル、テクニック、ジャンル、テーマ、またはコンテキストを呼び出すことができます。

ピクセルアート

V6

V5.2

新しいモデルが登場するたびに、ソース マテリアルをより良く理解し、それを出力で再現できるようになるのが、今では伝統となっています。

しかし、『Midjourney』は劇的な変化で止まることはありません。

ジョディ・バーグスマ

V6

V5.2

これらのスタイル自体がいかに素晴らしいものであっても、それを単なるオリジナルの解釈からユニークなものへと変えるのは、私たちが加えるヒントです。

画像にテキストを追加する

「旅の途中の文章 - 本物か偽物か?」というタイトルの新聞を両手で持っています。

V6

V5.2

詳細はオリジナルサイトをご参照ください。

<<:  GPT-4V は惨めに失敗しました! CVマスター謝彩寧氏の新作:V*の重量級「視覚検索」アルゴリズムにより、LLMの理解力が人間に近づく

>>: 

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Googleがまた新しいことを始める: 視覚言語モデルに空間推論をさせる

視覚言語モデル (VLM) は、画像の説明、視覚的な質問応答 (VQA)、具体化された計画、アクショ...

科学的人工知能と疑似科学的人工知能を区別する方法

人工知能が進歩し続けるにつれて、研究者たちはその能力を向上させ、さまざまな分野で倫理的かつ責任を持っ...

ChatGPT以外の14の大規模言語モデル

翻訳者 | 李睿レビュー | Chonglou今日、多くの企業幹部は人工知能を将来の発展方向と見てお...

...

...

2020年に注目すべき8つのAIトレンド

自動化、ハードウェア、モデル開発などの新たな開発が、2020 年の AI を形作るでしょう。 O&#...

アルゴリズムのインテリジェントなアップグレードにより、将来のデジタルライフはより明るくなります

[[120716]]研究者たちは現在、検索結果の改善、自動運転車、スマート携帯電話のアップグレード、...

...

20年後、AIはデータセンターアーキテクチャを再び分裂に引きずり込むのでしょうか?

Alpha GO が人間の囲碁プレイヤーに勝利して以来、AI はビジネス界全体で最もホットな用語に...

...

AIは大学入試のエッセイを次のように書きました。「ネイティブの手、素晴らしい手、普通の手はすべて手であり、コピーの手もまた手です...」

昨日、大学入試の中国語テストが終わった後、作文の話題がWeiboのホットな検索語句の上位を占めました...

2024年のデジタル変革のトレンド

AI と自動化が進歩するにつれて、企業は人間的なタッチを維持しながらこれらのツールを最も効果的に活用...

人工知能は業界の生態系を変え、銀行支店を減らし、スマートカードを活用する

多くの注意深い国民は、気づかないうちに銀行支店の数が減少していることに気づいています。予備統計による...

石油探査のための AI: 石油産業のデジタル変革に向けた新しい考え方

石油は産業の血液であるだけでなく、私たちの日常生活にも深く関わっていることは周知の事実です。統計によ...