Midjourneyの隠されたスキルをアンロックする:プロンプトを変更すると、4つの正方形のグリッドが「分裂」します

Midjourneyの隠されたスキルをアンロックする:プロンプトを変更すると、4つの正方形のグリッドが「分裂」します

Midjourney は多くの人が使用するグラフィック デザイン ツールです。最近アップデートされた動画生成ツール「Runway Gen2」と組み合わせれば、映画の予告編を自分で作ることもできます。最近SNSで大人気の「Trailer: Genesis」や「The Wandering Earth 3」の映画予告編は、すべてこのAIツールの力を借りて生成されたものです。

ただし、これらの「予告編」には、長さが短い、画像の変化がないなどの制限があります。これらの制限を克服するために、上記のツールをどのように有効活用するかが、すべてのプロデューサーが直面する困難な問題となっています。

最近、「Chase Lean」という名の Twitter ブロガーが、Midjourney の使用において「新しい世界を発見」しました。彼は、Prompt でいくつかのトリックを使用すれば、Midjourney で非常に一貫性のあるキャラクターの画像を複数生成でき (Midjourney はデフォルトでキャラクターの比較的ランダムな画像を 4 つ生成します)、キャラクターの撮影角度や環境を非常に多様なものにできると述べました。これを前述の映画予告編の制作に活用すれば、プロデューサーにさらに多様な素材を提供することになり、これをもとに制作された映像はよりストーリー性のあるものとなる。

Chase Lean はどうやってそれを実現するのでしょうか?一度に同じ人物の写真を 6 枚生成する例を挙げると、彼のアプローチは、プロンプトに「複数の角度から撮影した 6 つの異なる画像に分割」を追加することです。しかし、この方法はチェイス・リーンが最初に発明したものではありません。彼は、Prompt の「画像を 2 つに分割する」(同じ文字の画像を 2 つ生成する) 魔法を発見した「juliewdesign_」という Twitter ブロガーからインスピレーションを得たと語った。

Chase Lean はこのアプローチを継続し、さらに拡張しています。たとえば、「V4」ボタンを押すと、生成される画像にさらに多様性を持たせることができます (V1、V2、V3、V4 は、生成される 4 つの画像に対応します。いずれかのボタンをクリックすると、システムは対応する 4 つの画像の詳細な調整バージョンをプッシュします)。

変更の結果は次のとおりです。

さらに興味深いのは、これをMidjourney が 6 月にリリースしたズーム アウト」機能と組み合わせると、さらに多くの画像を取得できることです (ズーム アウト ボタンを押すと、焦点距離を調整するのと同じようにレンズに大きな画像を含めることができ、クローズアップ ビューから遠距離ビューへの切り替えが完了します。Midjourney バージョン 5.2 では、1.5 倍、2 倍、および「1.0 ~ 2.0」のカスタム ズームの 3 つのズーム オプションが提供されます)。

上記の「変更」と「拡大縮小」の操作を繰り返すことで、理論的には同じキャラクターの画像を無限に得ることができます。

画像の背景 (環境) を変更する場合は、まず変更する画像を選択し (U1-U4 ボタンを押します)、次に「カスタム ズーム」ボタンを押します。このボタンを使用すると、画像をズームし、同時にプロンプ​​トを変更できます。この時点で、ビーチや都市などのカスタム環境の単語をプロンプトに追加することで、同じキャラクターのさまざまなシーンの画像を取得できます。

生成された画像を見ると、一部の画像は実際には非常に小さく、環境画像は不完全であることがわかります。この問題を解決するために、Chase Lean は Clipdrop の Web サイトの「Uncrop」機能を使用することを推奨しています。

チェイス・リーン氏は、キャラクターの一貫性を保ちながら一度に複数の画像を生成するこの手法は現実でも多くの用途があり、ファッション、家族、アニメーションなど多くのシーンで試してきたと語りました。

最も興味深いシナリオの 1 つは、子供向けの漫画本を作ることです。たとえば、「ビーチでサーフィンをする少年、青い波、ヤシの木、3D、Unreal Engine、4 つの異なる画像に分割、複数の角度から撮影、niji スタイルの表現力」というプロンプトで、Chase Lean は次の 8 枚の写真を一度に生成しました。

「2倍ズームアウト」ボタンを押すと、さらに画像が表示されます。

このようなシンプルな方法は非常に効果的であり、チェイス・リーンの共有は多くの人々にインスピレーションを与えました。

誰かがTwitterでChase Leanが実証した効果を「再現」する手順を実行しました。

この進歩の速度でいけば、本物の「AI 映画」を観る日もそう遠くないかもしれない。

<<:  「アドビの父」が82歳で逝去!ガレージで始まり、PostScriptを発明し、伝説的な人生で世界を変えた

>>:  口を動かしてゴッホの傑作を生き生きと表現しましょう!朱俊燕チームの最新AIモデル、テキストで川の方向を制御でき、映画の繊細な質感が十分に表現されている

ブログ    
ブログ    

推薦する

画像やテキストが無限の3D世界を生み出します!スタンフォード大学の呉嘉軍氏のチームの新しい研究は、ネットユーザーから「信じられない」と評された。

スタンフォード大学の呉嘉軍チームが『不思議の国のアリス』の傑作のAI版を制作!たった 1 つの画像ま...

...

マイクロソフトが新たなAIアクセス原則を発表、同社史上最大の投資計画

IT Homeは2月27日、2024年のモバイル・ワールド・コングレスでマイクロソフトのブラッド・ス...

...

...

ADAPT: エンドツーエンドの自動運転の説明可能性を徹底的に探求する、理解の夜明け!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

グラフィカルな説明 | Linux メモリリサイクル LRU アルゴリズム

[[421791]]メモリは、オペレーティング システムにとって非常に重要なリソースです。オペレーテ...

マイクロソフトは、Bingチャットのベテラン向けにエキスパートモードの導入を検討中:より複雑なUIとより豊富な機能

7月26日、マイクロソフト広告およびウェブサービスのCEOであるミハイル・パラキン氏は、ネットユーザ...

...

...

シェア | Meituanのディープラーニングシステムのエンジニアリング実践

背景ディープラーニングは、AI時代の中核技術として、さまざまなシナリオに適用されてきました。システム...

画像認識のためのトップ 5 プログラミング言語

この間、ゴミの分別に関するミニプログラムやアプリの登場により、画像認識が再び人々の注目を集めています...

五菱科技は、知能絵本ロボット「ルカヒーロー」と「ルカベイビー」を発売し、シリーズA資金調達を獲得した。

昨日、五菱科技は北京で新製品発表会を開催し、多感覚インタラクション機能を備えた「Luka Hero」...

自然言語処理のためのOne Hot Modelについて

[[421481]]この記事はWeChatの公開アカウント「Pythonとビッグデータ分析」から転載...