Midjourneyの隠されたスキルをアンロックする:プロンプトを変更すると、4つの正方形のグリッドが「分裂」します

Midjourneyの隠されたスキルをアンロックする:プロンプトを変更すると、4つの正方形のグリッドが「分裂」します

Midjourney は多くの人が使用するグラフィック デザイン ツールです。最近アップデートされた動画生成ツール「Runway Gen2」と組み合わせれば、映画の予告編を自分で作ることもできます。最近SNSで大人気の「Trailer: Genesis」や「The Wandering Earth 3」の映画予告編は、すべてこのAIツールの力を借りて生成されたものです。

ただし、これらの「予告編」には、長さが短い、画像の変化がないなどの制限があります。これらの制限を克服するために、上記のツールをどのように有効活用するかが、すべてのプロデューサーが直面する困難な問題となっています。

最近、「Chase Lean」という名の Twitter ブロガーが、Midjourney の使用において「新しい世界を発見」しました。彼は、Prompt でいくつかのトリックを使用すれば、Midjourney で非常に一貫性のあるキャラクターの画像を複数生成でき (Midjourney はデフォルトでキャラクターの比較的ランダムな画像を 4 つ生成します)、キャラクターの撮影角度や環境を非常に多様なものにできると述べました。これを前述の映画予告編の制作に活用すれば、プロデューサーにさらに多様な素材を提供することになり、これをもとに制作された映像はよりストーリー性のあるものとなる。

Chase Lean はどうやってそれを実現するのでしょうか?一度に同じ人物の写真を 6 枚生成する例を挙げると、彼のアプローチは、プロンプトに「複数の角度から撮影した 6 つの異なる画像に分割」を追加することです。しかし、この方法はチェイス・リーンが最初に発明したものではありません。彼は、Prompt の「画像を 2 つに分割する」(同じ文字の画像を 2 つ生成する) 魔法を発見した「juliewdesign_」という Twitter ブロガーからインスピレーションを得たと語った。

Chase Lean はこのアプローチを継続し、さらに拡張しています。たとえば、「V4」ボタンを押すと、生成される画像にさらに多様性を持たせることができます (V1、V2、V3、V4 は、生成される 4 つの画像に対応します。いずれかのボタンをクリックすると、システムは対応する 4 つの画像の詳細な調整バージョンをプッシュします)。

変更の結果は次のとおりです。

さらに興味深いのは、これをMidjourney が 6 月にリリースしたズーム アウト」機能と組み合わせると、さらに多くの画像を取得できることです (ズーム アウト ボタンを押すと、焦点距離を調整するのと同じようにレンズに大きな画像を含めることができ、クローズアップ ビューから遠距離ビューへの切り替えが完了します。Midjourney バージョン 5.2 では、1.5 倍、2 倍、および「1.0 ~ 2.0」のカスタム ズームの 3 つのズーム オプションが提供されます)。

上記の「変更」と「拡大縮小」の操作を繰り返すことで、理論的には同じキャラクターの画像を無限に得ることができます。

画像の背景 (環境) を変更する場合は、まず変更する画像を選択し (U1-U4 ボタンを押します)、次に「カスタム ズーム」ボタンを押します。このボタンを使用すると、画像をズームし、同時にプロンプ​​トを変更できます。この時点で、ビーチや都市などのカスタム環境の単語をプロンプトに追加することで、同じキャラクターのさまざまなシーンの画像を取得できます。

生成された画像を見ると、一部の画像は実際には非常に小さく、環境画像は不完全であることがわかります。この問題を解決するために、Chase Lean は Clipdrop の Web サイトの「Uncrop」機能を使用することを推奨しています。

チェイス・リーン氏は、キャラクターの一貫性を保ちながら一度に複数の画像を生成するこの手法は現実でも多くの用途があり、ファッション、家族、アニメーションなど多くのシーンで試してきたと語りました。

最も興味深いシナリオの 1 つは、子供向けの漫画本を作ることです。たとえば、「ビーチでサーフィンをする少年、青い波、ヤシの木、3D、Unreal Engine、4 つの異なる画像に分割、複数の角度から撮影、niji スタイルの表現力」というプロンプトで、Chase Lean は次の 8 枚の写真を一度に生成しました。

「2倍ズームアウト」ボタンを押すと、さらに画像が表示されます。

このようなシンプルな方法は非常に効果的であり、チェイス・リーンの共有は多くの人々にインスピレーションを与えました。

誰かがTwitterでChase Leanが実証した効果を「再現」する手順を実行しました。

この進歩の速度でいけば、本物の「AI 映画」を観る日もそう遠くないかもしれない。

<<:  「アドビの父」が82歳で逝去!ガレージで始まり、PostScriptを発明し、伝説的な人生で世界を変えた

>>:  口を動かしてゴッホの傑作を生き生きと表現しましょう!朱俊燕チームの最新AIモデル、テキストで川の方向を制御でき、映画の繊細な質感が十分に表現されている

ブログ    
ブログ    

推薦する

1行のコードでデバッグと印刷を排除し、アルゴリズムの学習を支援

[[442725]]この記事はWeChatの公開アカウント「Python Technology」から...

RoSA: 大規模モデルパラメータを効率的に微調整する新しい方法

言語モデルが前例のない規模にまで拡大し続けるにつれて、下流のタスクのすべてのパラメータを微調整するこ...

李菲菲のチームはロボット用の「模擬キッチン」を作った。洗浄、カット、調理のワンストップトレーニングである。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIによる顔を変える技術によって危害を受けるのではないかと心配ですか?怖がらないで!ディープフェイク偽造対策チームが到着

ディープフェイクは登場以来、人間性の暗い側面へと向かっています。 Bステーションのユーザーは、陸小玲...

[強く推奨] 史上最も包括的な IT アーキテクト技術知識マップ 34 選

この記事は、著者が長年にわたり蓄積し収集してきた知識とスキルのマップです。編集者は、これを周囲の技術...

機械学習とビッグデータを学ぶための必読書6選!

機械学習とデータサイエンスは複雑で相互に関連した概念です。技術トレンドに遅れないようにするには、知識...

ディープラーニングの専門家になるにはどうすればいいですか?このアリ天池大会の優勝者はあなたのためにプロとしての成長の道を計画しました

[[209722]]ディープラーニングは本質的には深層人工ニューラルネットワークです。これは孤立した...

オペレーターの人工知能への道

1年間の開発を経て、人工知能の技術とアプリケーションは、特に通信業界で徐々に爆発的に増加しました。 ...

ディープラーニング入門: オートエンコーダから変分オートエンコーダまで

オートエンコーダ(AE)は、半教師あり学習や教師なし学習で使用される人工ニューラルネットワーク(AN...

AIを使って死後の意識を蘇らせることは信頼できるのか?デジタル不滅には経済計算が必要

十分なデータがあれば、愛する人が亡くなった後でも、その人の意識を生かし続けることができます。それは何...

マイクロソフト、仕事の効率化に役立つ 7 つの新しい AI 製品を発表

Zhidongxi は 11 月 1 日に北京から、この日 (寒くて風が強い)、2017 Micro...

Reddit で高く評価:機械学習分野における「8つの大罪」!査読は変化し、偶像崇拝が蔓延している

最近、Reddit コミュニティで機械学習の分野を批判する記事が白熱した議論を巻き起こし、3.1k ...

人工知能の歴史 - チューリングテストからビッグデータまで

[[194770]]私はずっと、人工知能がどのように提案されたのか、その背後にはどのような物語がある...

...

...