Midjourney V6 は壮大なレベルにアップグレードされ、ネットユーザーたちはそのリアルさに驚いています。写真は次々と公開されており、今日と明日にはオンラインになるという。

Midjourney V6 は壮大なレベルにアップグレードされ、ネットユーザーたちはそのリアルさに驚いています。写真は次々と公開されており、今日と明日にはオンラインになるという。

旅の途中のV6、緊急RLHF中。オンライン化へのカウントダウンが始まりました!

今朝、Midjourney V6 は 2 回目のコミュニティ レビューを開始しました。ユーザーは注釈を付ける必要があり、200 枚の写真に注釈を付けると 1 時間の自由時間が与えられます。

ネットユーザーは、リアルなディテールと驚くべき効果を備えた素晴らしい写真を次々と投稿しており、どの写真も大ヒットとなっている。

写真

写真

今回のV6の映像出力をどう評価しますか?簡単に言うと、画像と写真の差がなくなったということです。

写真

やはり、昨日のミッドジャーニーを超えることができるのは、今日のミッドジャーニーだけです。

これらの素晴らしい写真は、AI 生成画像の分野では、現時点では誰も Midjourney の地位を揺るがすことはできないということを改めて証明しています。

ご存知のとおり、Midjourney V5は2023年3月にリリースされる予定で、ネットユーザーは9か月間待っていました。

写真

いつ使えますか?

良いニュースです。Midjourney V6 が RLHF の最終ラウンドに出場します。スタイルが調整され次第、クリスマス前にリリースされる予定です。

公式ニュースによると、V6は今日か明日発売されるようです!

写真

これも素晴らしいクリスマスプレゼントになるでしょう。

これは本当に実在の人物ではないのでしょうか?

ドラゴンの母の肌の質感や顔の筋肉の向きは、すでに映画のリアリティに非常に近いです。

写真

劇的に改善された肌の質感は素晴らしいです。

たとえば次の写真のうち、どれが本物の人間に見えないでしょうか?

写真

写真

写真

写真

写真

写真

写真

写真

写真

写真

写真

大きな猫に乗った男性とボトルの中に現れたマスク氏がなければ、これが AI の写真だとは決して分からないでしょう。

写真

写真

Cyber​​truck のレンダリングも非常にリアルです。

写真

照明や影の効果も優れており、不自然な箇所を見つけるのは難しいです。


写真

写真

写真

写真

光と反射の扱いに欠点はありません。

写真

写真

写真

写真

撮影した写真はすべて大ヒット映画のような質感になります。

写真


キャラクターの血管やアームガードのディテール、肌の質感など、どれも自然でAI感がありません。

写真

グルートでも動物でも、細部に歪みはありません。

写真

写真

写真

猫や犬の毛やひげもとても丁寧に描かれています。

写真

写真

写真

Midjourney V6 は、同じ解像度で多くの詳細を追加し、非常にリアルな方法で食べ物を描画します。

写真

写真

写真

写真

写真

写真

写真

絵の中の色彩はすべてゴッホの「ひまわり」をモチーフにしています。

写真

自然の風景を描くときも、彼は非常に写実的です。

写真

V6の絵画スタイルもさらに広がり、中国絵画もより良くなりました。

写真

ネットユーザー:本当に怖い

一部のネットユーザーは「Midjourney V6は本当にちょっと怖い」とコメントした。

下のようなグラフを作成するには、いつものプロンプト スタイルを使用すればよいのでしょうか、それとも新しい言語を学習する必要がありますか?

写真

言うことはあまりありません。これが現実です。

写真

材料にお金を払う理由はもうないと言う人もいます。

忠実度と品質は素晴らしく、解像度と DPI も印象的です。

V6 は、一般消費者が専門家レベルのコンテンツを作成できるまったく新しい領域に私たちをもたらしました。

写真

新しいプロンプト構造

最も優れた AI 画像作成ツールの 1 つである Midjourney は、自然言語プロンプトをうまく理解できないという致命的な問題のため、DALL-E や Adob​​e Firefly の影に隠れてしまうことがあります。

結局のところ、プロフェッショナルなプロンプトを書くには、一定の基準がまだあります。

しかし、V6 の発売により、状況は変わりそうです。

写真

デザイナー「Tatiana Tsiguleva」の分析によると、Midjourney V6 はユーザーのプロンプトをより正確に理解できるため、奇妙なフレーズや単語を入力する必要がなくなりました。

以下は、一般的な言語フレームワーク設計に基づいた単純な構造です。

写真

スタイル

目的: 作品に特定の美的または芸術的なスタイルを与えること。

含める詳細: 好みのスタイルまたは歴史的時代。

テーマ

目的: 画像の中心焦点を特定します。

含める詳細: 人物、物体、動物などの主要な被写体の特徴、外観、色など。

環境

目的: 対象に適した環境または背景を作成します。

含める詳細: 場所 (屋内、屋外、架空など)、環境要素 (自然の風景や都市の風景など)、時間帯、気象条件。

構成

目的: テーマとその要素のプレゼンテーションと視点を計画します。

含める詳細: 視野角 (クローズアップ、パノラマ、鳥瞰図など)、撮影角度、特定の構図の好み。

ライト

目的: 画像の雰囲気と視覚的なインパクトを作り出す。

含める詳細: 光の種類 (明るい、薄暗い、自然光)、それが伝える雰囲気 (例: 陽気、神秘的)、雰囲気の効果。

追加情報

目的: 画像の階層化と深みを豊かにします。

含める詳細: 二次的な要素、キャラクター、動物、およびそれらの主題との関係または配置。

明らかに、DALL-E 3 に似たこのプロンプト方式により、V6 はより確実になり、必要な画像コンテンツをより適切に制御できるようになります。

写真

次は、V6 の正式リリースを心待ちにしましょう。

一部のネットユーザーは、準備はできていると述べた。

写真

眠れぬままワクワクしながら待っています。

写真

参考文献:

https://twitter.com/op7418/status/1737445886165451227

https://twitter.com/op7418/status/1737445353002344532

https://twitter.com/ciguleva/status/1737573077633085584

https://twitter.com/BeezyManzell/status/1737516209988604289

https://twitter.com/doganuraldesign/status/1737398934073385346

https://twitter.com/giffboake/status/1737533263671853462

https://twitter.com/ai_artworkgen/status/1737588573778432406

https://twitter.com/dnaijatechguy/status/1737617371454701950

https://twitter.com/Anima_Labs/status/1737592798390460567

https://twitter.com/PhotoGarrido/status/1737479363476525377

<<:  ジェネレーティブAIがファッション業界にもたらす変化

>>: 

ブログ    
ブログ    

推薦する

オラクル、企業の言語モデルの導入と微調整を支援するクラウドベースの生成AIサービスを開始

データベース大手のオラクルは最近、Oracle Cloud Infrastructure Gener...

機械学習における線形代数の理解に役立つ 10 の例

線形代数は、ベクトル、行列、線形変換を扱う数学の分野です。これは機械学習の重要な基盤であり、アルゴリ...

人工知能の真の可能性

サイエンス フィクションや大衆文化では、人工知能 (AI) 技術に関する大胆な予測や説明がよく取り上...

スマートビルディングでは通信システムに何が必要ですか?

今日のいわゆるスマート ビルディングの多くは、実際にはビルディング オートメーション システムに加え...

ディープラーニングに新たな落とし穴が!シドニー大学は、テキストを使用して画像のマット化をガイドする新しいクロスモーダルタスクを提案しています

画像マッティングとは、画像内の正確な前景を抽出することを指します。現在の自動方法では、画像内のすべて...

JavaScript によるデータ構造とアルゴリズムの実装と応用: Stack/Recursion/Hanno

まとめこの記事では、Stack データ構造の基本的な操作とそのいくつかの応用について紹介します。括弧...

詳細 | ビッグデータアルゴリズムアプリケーションのテストの開発

[[389157]]この記事では、アリババ AI ミドルプラットフォームの技術品質システム、つまり検...

AIには意識があるのでしょうか?意識の定義から始めましょう

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

マイクロソフトの調査:英国の従業員のほぼ半数がロボットに仕事が置き換えられることを懸念

[[248243]]北京時間31日、マイクロソフトが英国のビジネスリーダーと従業員5,000人を対象...

データが限られている場合にディープラーニングモデルを最適化する方法

[[198229]]転移学習転移学習とは、ある問題で訓練したモデルを、簡単な調整で新しい問題に適した...

30分で独自のディープラーニングサーバーを作成する

新しいプロジェクトを始めるたびに、私はディープラーニング マシンを何度も何度も作成していることに気づ...

BAIRは、3種類のモデルフリー強化学習アルゴリズムを組み合わせたRLコードライブラリrlpytをオープンソース化しました。

最近、BAIR は強化学習研究コードライブラリ rlpyt をオープンソース化しました。このライブラ...

...

大規模なモデルでプロンプト内のより多くの例を学習させたい場合は、この方法を使用すると、より多くの文字を入力できます。

GPT や LLaMA などの大規模な言語モデルを使用する場合、入力プロンプトに文字数制限があるこ...