Midjourney V6 は壮大なレベルにアップグレードされ、ネットユーザーたちはそのリアルさに驚いています。写真は次々と公開されており、今日と明日にはオンラインになるという。

旅の途中のV6、緊急RLHF中。オンライン化へのカウントダウンが始まりました！

今朝、Midjourney V6 は 2 回目のコミュニティレビューを開始しました。ユーザーは注釈を付ける必要があり、200 枚の写真に注釈を付けると 1 時間の自由時間が与えられます。

ネットユーザーは、リアルなディテールと驚くべき効果を備えた素晴らしい写真を次々と投稿しており、どの写真も大ヒットとなっている。

写真

今回のV6の映像出力をどう評価しますか？簡単に言うと、画像と写真の差がなくなったということです。

写真

やはり、昨日のミッドジャーニーを超えることができるのは、今日のミッドジャーニーだけです。

これらの素晴らしい写真は、AI 生成画像の分野では、現時点では誰も Midjourney の地位を揺るがすことはできないということを改めて証明しています。

ご存知のとおり、Midjourney V5は2023年3月にリリースされる予定で、ネットユーザーは9か月間待っていました。

写真

いつ使えますか？

良いニュースです。Midjourney V6 が RLHF の最終ラウンドに出場します。スタイルが調整され次第、クリスマス前にリリースされる予定です。

公式ニュースによると、V6は今日か明日発売されるようです！

写真

これも素晴らしいクリスマスプレゼントになるでしょう。

これは本当に実在の人物ではないのでしょうか?

ドラゴンの母の肌の質感や顔の筋肉の向きは、すでに映画のリアリティに非常に近いです。

写真

劇的に改善された肌の質感は素晴らしいです。

たとえば次の写真のうち、どれが本物の人間に見えないでしょうか?

写真

大きな猫に乗った男性とボトルの中に現れたマスク氏がなければ、これが AI の写真だとは決して分からないでしょう。

写真

Cybertruck のレンダリングも非常にリアルです。

写真

照明や影の効果も優れており、不自然な箇所を見つけるのは難しいです。

写真

光と反射の扱いに欠点はありません。

写真

撮影した写真はすべて大ヒット映画のような質感になります。

写真

キャラクターの血管やアームガードのディテール、肌の質感など、どれも自然でAI感がありません。

写真

グルートでも動物でも、細部に歪みはありません。

写真

猫や犬の毛やひげもとても丁寧に描かれています。

写真

Midjourney V6 は、同じ解像度で多くの詳細を追加し、非常にリアルな方法で食べ物を描画します。

写真

絵の中の色彩はすべてゴッホの「ひまわり」をモチーフにしています。

写真

自然の風景を描くときも、彼は非常に写実的です。

写真

V6の絵画スタイルもさらに広がり、中国絵画もより良くなりました。

写真

ネットユーザー：本当に怖い

一部のネットユーザーは「Midjourney V6は本当にちょっと怖い」とコメントした。

下のようなグラフを作成するには、いつものプロンプトスタイルを使用すればよいのでしょうか、それとも新しい言語を学習する必要がありますか?

写真

言うことはあまりありません。これが現実です。

写真

材料にお金を払う理由はもうないと言う人もいます。

忠実度と品質は素晴らしく、解像度と DPI も印象的です。

V6 は、一般消費者が専門家レベルのコンテンツを作成できるまったく新しい領域に私たちをもたらしました。

写真

新しいプロンプト構造

最も優れた AI 画像作成ツールの 1 つである Midjourney は、自然言語プロンプトをうまく理解できないという致命的な問題のため、DALL-E や Adobe Firefly の影に隠れてしまうことがあります。

結局のところ、プロフェッショナルなプロンプトを書くには、一定の基準がまだあります。

しかし、V6 の発売により、状況は変わりそうです。

写真

デザイナー「Tatiana Tsiguleva」の分析によると、Midjourney V6 はユーザーのプロンプトをより正確に理解できるため、奇妙なフレーズや単語を入力する必要がなくなりました。

以下は、一般的な言語フレームワーク設計に基づいた単純な構造です。

写真

スタイル

目的: 作品に特定の美的または芸術的なスタイルを与えること。

含める詳細: 好みのスタイルまたは歴史的時代。

テーマ

目的: 画像の中心焦点を特定します。

含める詳細: 人物、物体、動物などの主要な被写体の特徴、外観、色など。

環境

目的: 対象に適した環境または背景を作成します。

含める詳細: 場所 (屋内、屋外、架空など)、環境要素 (自然の風景や都市の風景など)、時間帯、気象条件。

構成

目的: テーマとその要素のプレゼンテーションと視点を計画します。

含める詳細: 視野角 (クローズアップ、パノラマ、鳥瞰図など)、撮影角度、特定の構図の好み。

ライト

目的: 画像の雰囲気と視覚的なインパクトを作り出す。

含める詳細: 光の種類 (明るい、薄暗い、自然光)、それが伝える雰囲気 (例: 陽気、神秘的)、雰囲気の効果。

追加情報

目的: 画像の階層化と深みを豊かにします。

含める詳細: 二次的な要素、キャラクター、動物、およびそれらの主題との関係または配置。

明らかに、DALL-E 3 に似たこのプロンプト方式により、V6 はより確実になり、必要な画像コンテンツをより適切に制御できるようになります。

写真

次は、V6 の正式リリースを心待ちにしましょう。

一部のネットユーザーは、準備はできていると述べた。

写真

眠れぬままワクワクしながら待っています。

写真

参考文献:

https://twitter.com/op7418/status/1737445886165451227

https://twitter.com/op7418/status/1737445353002344532

https://twitter.com/ciguleva/status/1737573077633085584

https://twitter.com/BeezyManzell/status/1737516209988604289

https://twitter.com/doganuraldesign/status/1737398934073385346

https://twitter.com/giffboake/status/1737533263671853462

https://twitter.com/ai_artworkgen/status/1737588573778432406

https://twitter.com/dnaijatechguy/status/1737617371454701950

https://twitter.com/Anima_Labs/status/1737592798390460567

https://twitter.com/PhotoGarrido/status/1737479363476525377

<<: ジェネレーティブAIがファッション業界にもたらす変化

>>:

ドローンは都市の発展を助け、6つの側面でインテリジェントな変化をもたらす

ブログ

九張雲吉DataCanvasマルチモーダル大規模モデルプラットフォームの実践と思考

ブログ

OpenOOD アップデート v1.5: 包括的かつ正確な分布検出コードベースとテストプラットフォーム、オンラインランキングとワンクリックテストをサポート

ブログ

将来展望: 2024 年の人工知能

ブログ

将来、AIは人類を脅かすと思いますか？人工知能の未来はどうなるのでしょうか?

ブログ

マイクロソフトがBing Chatのエンタープライズ版を発表。将来的にはスタンドアロン製品として発売され、価格は1人あたり月額5ドル。

ブログ

アリババ、AI推論・計算用Ali-NPUニューラルネットワークチップをリリース

ブログ

Midjourney V6 は壮大なレベルにアップグレードされ、ネットユーザーたちはそのリアルさに驚いています。写真は次々と公開されており、今日と明日にはオンラインになるという。

これは本当に実在の人物ではないのでしょうか?

新しいプロンプト構造

スタイル

テーマ

環境

構成

ライト

追加情報

ドローンは都市の発展を助け、6つの側面でインテリジェントな変化をもたらす

九張雲吉DataCanvasマルチモーダル大規模モデルプラットフォームの実践と思考

OpenOOD アップデート v1.5: 包括的かつ正確な分布検出コードベースとテストプラットフォーム、オンラインランキングとワンクリックテストをサポート

将来展望: 2024 年の人工知能

将来、AIは人類を脅かすと思いますか？人工知能の未来はどうなるのでしょうか?

マイクロソフトがBing Chatのエンタープライズ版を発表。将来的にはスタンドアロン製品として発売され、価格は1人あたり月額5ドル。

アリババ、AI推論・計算用Ali-NPUニューラルネットワークチップをリリース

推薦する

5G と AI のユースケース - 5G が人工知能の実装にどのように役立つか

AIソリューションがビジネスの成長にどのように役立つか

生成AIとクラウドの相互利益を探る

GPT-3: 高く評価されている交通の星ですが、大きな欠陥があり、非常に危険です...

ベクトルデータベースが生成AIを強化する方法

Googleの華博士がICCV2021で新モデルを発表、卵を泡立てるだけでパンケーキを作りたいかどうかがわかる

人工知能では顔と性格の違いは分からない

この「PhD Study Simulator」はとてもリアルです。何回諦めるように説得されるか試してみてください。

IGN は拡散モデルに終止符を打ち、ワンステップでリアルな画像を生成します。カリフォルニア大学バークレー校のGoogleがLLMを革新、アメリカのテレビシリーズがインスピレーションの源に

顔認識技術は「束縛」されているのか？テクノロジーはまだシステムを待つ必要がある

顔認証決済はまだ普及していないが、中央銀行はすでに新しい決済方法を発表しており、ジャック・マーは今回不意を突かれた

数千億ドル規模の市場：教育用ロボットは本当に実現可能か？