Midjourney は多くの人が使用するグラフィック デザイン ツールです。最近アップデートされた動画生成ツール「Runway Gen2」と組み合わせれば、映画の予告編を自分で作ることもできます。最近SNSで大人気の「Trailer: Genesis」や「The Wandering Earth 3」の映画予告編は、すべてこのAIツールの力を借りて生成されたものです。 ただし、これらの「予告編」には、長さが短い、画像の変化がないなどの制限があります。これらの制限を克服するために、上記のツールをどのように有効活用するかが、すべてのプロデューサーが直面する困難な問題となっています。 最近、「Chase Lean」という名の Twitter ブロガーが、Midjourney の使用において「新しい世界を発見」しました。彼は、Prompt でいくつかのトリックを使用すれば、Midjourney で非常に一貫性のあるキャラクターの画像を複数生成でき (Midjourney はデフォルトでキャラクターの比較的ランダムな画像を 4 つ生成します)、キャラクターの撮影角度や環境を非常に多様なものにできると述べました。これを前述の映画予告編の制作に活用すれば、プロデューサーにさらに多様な素材を提供することになり、これをもとに制作された映像はよりストーリー性のあるものとなる。 Chase Lean はどうやってそれを実現するのでしょうか?一度に同じ人物の写真を 6 枚生成する例を挙げると、彼のアプローチは、プロンプトに「複数の角度から撮影した 6 つの異なる画像に分割」を追加することです。しかし、この方法はチェイス・リーンが最初に発明したものではありません。彼は、Prompt の「画像を 2 つに分割する」(同じ文字の画像を 2 つ生成する) 魔法を発見した「juliewdesign_」という Twitter ブロガーからインスピレーションを得たと語った。 Chase Lean はこのアプローチを継続し、さらに拡張しています。たとえば、「V4」ボタンを押すと、生成される画像にさらに多様性を持たせることができます (V1、V2、V3、V4 は、生成される 4 つの画像に対応します。いずれかのボタンをクリックすると、システムは対応する 4 つの画像の詳細な調整バージョンをプッシュします)。 変更の結果は次のとおりです。 さらに興味深いのは、これをMidjourney が 6 月にリリースした「ズーム アウト」機能と組み合わせると、さらに多くの画像を取得できることです (ズーム アウト ボタンを押すと、焦点距離を調整するのと同じようにレンズに大きな画像を含めることができ、クローズアップ ビューから遠距離ビューへの切り替えが完了します。Midjourney バージョン 5.2 では、1.5 倍、2 倍、および「1.0 ~ 2.0」のカスタム ズームの 3 つのズーム オプションが提供されます)。 上記の「変更」と「拡大縮小」の操作を繰り返すことで、理論的には同じキャラクターの画像を無限に得ることができます。 画像の背景 (環境) を変更する場合は、まず変更する画像を選択し (U1-U4 ボタンを押します)、次に「カスタム ズーム」ボタンを押します。このボタンを使用すると、画像をズームし、同時にプロンプトを変更できます。この時点で、ビーチや都市などのカスタム環境の単語をプロンプトに追加することで、同じキャラクターのさまざまなシーンの画像を取得できます。 生成された画像を見ると、一部の画像は実際には非常に小さく、環境画像は不完全であることがわかります。この問題を解決するために、Chase Lean は Clipdrop の Web サイトの「Uncrop」機能を使用することを推奨しています。 チェイス・リーン氏は、キャラクターの一貫性を保ちながら一度に複数の画像を生成するこの手法は現実でも多くの用途があり、ファッション、家族、アニメーションなど多くのシーンで試してきたと語りました。 最も興味深いシナリオの 1 つは、子供向けの漫画本を作ることです。たとえば、「ビーチでサーフィンをする少年、青い波、ヤシの木、3D、Unreal Engine、4 つの異なる画像に分割、複数の角度から撮影、niji スタイルの表現力」というプロンプトで、Chase Lean は次の 8 枚の写真を一度に生成しました。 「2倍ズームアウト」ボタンを押すと、さらに画像が表示されます。 このようなシンプルな方法は非常に効果的であり、チェイス・リーンの共有は多くの人々にインスピレーションを与えました。 誰かがTwitterでChase Leanが実証した効果を「再現」する手順を実行しました。 この進歩の速度でいけば、本物の「AI 映画」を観る日もそう遠くないかもしれない。 |
<<: 「アドビの父」が82歳で逝去!ガレージで始まり、PostScriptを発明し、伝説的な人生で世界を変えた
>>: 口を動かしてゴッホの傑作を生き生きと表現しましょう!朱俊燕チームの最新AIモデル、テキストで川の方向を制御でき、映画の繊細な質感が十分に表現されている
Google はブログ投稿で、同社の AI がさまざまな要素を分析して、こうした更新を行うべきかどう...
社会の継続的な発展に伴い、わが国の医療・ヘルスケア産業は徐々に変化を迎え、医療機器のインテリジェント...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
[[283217]] [51CTO.com クイック翻訳] 著名なベンチャーキャピタリスト、マーク...
ご存知のとおり、検索エンジンとして始まった Google は、(A×a% + B×b% + C×c%...
[[342088]]基本的なデータ構造の統合は、大規模システムの基礎となります。たとえば、Redis...
Aisle50 の共同創設者であるクリストファー・シュタイナー氏は、新著の中で、デジタルが優位性を...
著者: Chu Yi、Kai Heng 他最近、Meituan のビジュアル インテリジェンス部門は...
AI の健全性と進歩に関する最近の調査、研究、予測、その他の定量的評価では、労働力の再訓練の必要性、...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
教育の分野では、人工知能の倫理に関する人々の考え方には複数の道が存在します。例えば、主観に基づく検討...
人工知能の進歩は2024年まで大きな原動力となる可能性が高く、ビッグデータの課題、つまりそれをどのよ...
諜報活動は私たちが想像するよりもはるかに退屈で複雑です。現在、米国の諜報機関は、手作業に代わる人工知...
10月12日、全米レコード協会(RIAA)は、人工知能(AI)による音声複製が著作権侵害の潜在的な脅...