Midjourney は多くの人が使用するグラフィック デザイン ツールです。最近アップデートされた動画生成ツール「Runway Gen2」と組み合わせれば、映画の予告編を自分で作ることもできます。最近SNSで大人気の「Trailer: Genesis」や「The Wandering Earth 3」の映画予告編は、すべてこのAIツールの力を借りて生成されたものです。 ただし、これらの「予告編」には、長さが短い、画像の変化がないなどの制限があります。これらの制限を克服するために、上記のツールをどのように有効活用するかが、すべてのプロデューサーが直面する困難な問題となっています。 最近、「Chase Lean」という名の Twitter ブロガーが、Midjourney の使用において「新しい世界を発見」しました。彼は、Prompt でいくつかのトリックを使用すれば、Midjourney で非常に一貫性のあるキャラクターの画像を複数生成でき (Midjourney はデフォルトでキャラクターの比較的ランダムな画像を 4 つ生成します)、キャラクターの撮影角度や環境を非常に多様なものにできると述べました。これを前述の映画予告編の制作に活用すれば、プロデューサーにさらに多様な素材を提供することになり、これをもとに制作された映像はよりストーリー性のあるものとなる。 Chase Lean はどうやってそれを実現するのでしょうか?一度に同じ人物の写真を 6 枚生成する例を挙げると、彼のアプローチは、プロンプトに「複数の角度から撮影した 6 つの異なる画像に分割」を追加することです。しかし、この方法はチェイス・リーンが最初に発明したものではありません。彼は、Prompt の「画像を 2 つに分割する」(同じ文字の画像を 2 つ生成する) 魔法を発見した「juliewdesign_」という Twitter ブロガーからインスピレーションを得たと語った。 Chase Lean はこのアプローチを継続し、さらに拡張しています。たとえば、「V4」ボタンを押すと、生成される画像にさらに多様性を持たせることができます (V1、V2、V3、V4 は、生成される 4 つの画像に対応します。いずれかのボタンをクリックすると、システムは対応する 4 つの画像の詳細な調整バージョンをプッシュします)。 変更の結果は次のとおりです。 さらに興味深いのは、これをMidjourney が 6 月にリリースした「ズーム アウト」機能と組み合わせると、さらに多くの画像を取得できることです (ズーム アウト ボタンを押すと、焦点距離を調整するのと同じようにレンズに大きな画像を含めることができ、クローズアップ ビューから遠距離ビューへの切り替えが完了します。Midjourney バージョン 5.2 では、1.5 倍、2 倍、および「1.0 ~ 2.0」のカスタム ズームの 3 つのズーム オプションが提供されます)。 上記の「変更」と「拡大縮小」の操作を繰り返すことで、理論的には同じキャラクターの画像を無限に得ることができます。 画像の背景 (環境) を変更する場合は、まず変更する画像を選択し (U1-U4 ボタンを押します)、次に「カスタム ズーム」ボタンを押します。このボタンを使用すると、画像をズームし、同時にプロンプトを変更できます。この時点で、ビーチや都市などのカスタム環境の単語をプロンプトに追加することで、同じキャラクターのさまざまなシーンの画像を取得できます。 生成された画像を見ると、一部の画像は実際には非常に小さく、環境画像は不完全であることがわかります。この問題を解決するために、Chase Lean は Clipdrop の Web サイトの「Uncrop」機能を使用することを推奨しています。 チェイス・リーン氏は、キャラクターの一貫性を保ちながら一度に複数の画像を生成するこの手法は現実でも多くの用途があり、ファッション、家族、アニメーションなど多くのシーンで試してきたと語りました。 最も興味深いシナリオの 1 つは、子供向けの漫画本を作ることです。たとえば、「ビーチでサーフィンをする少年、青い波、ヤシの木、3D、Unreal Engine、4 つの異なる画像に分割、複数の角度から撮影、niji スタイルの表現力」というプロンプトで、Chase Lean は次の 8 枚の写真を一度に生成しました。 「2倍ズームアウト」ボタンを押すと、さらに画像が表示されます。 このようなシンプルな方法は非常に効果的であり、チェイス・リーンの共有は多くの人々にインスピレーションを与えました。 誰かがTwitterでChase Leanが実証した効果を「再現」する手順を実行しました。 この進歩の速度でいけば、本物の「AI 映画」を観る日もそう遠くないかもしれない。 |
<<: 「アドビの父」が82歳で逝去!ガレージで始まり、PostScriptを発明し、伝説的な人生で世界を変えた
>>: 口を動かしてゴッホの傑作を生き生きと表現しましょう!朱俊燕チームの最新AIモデル、テキストで川の方向を制御でき、映画の繊細な質感が十分に表現されている
[[247978]]本質的には、「見知らぬ人同士がイベントの共有記録を信頼できるようにするための技...
今日、MetaとIBMが主導し、50を超えるテクノロジー企業、大学、機関が共同でAIアライアンスを設...
Theano、Caffeに続き、大学主導のディープラーニングフレームワークがオープンソース化され、国...
都市化と経済発展の加速に伴い、我が国の社会保障を構成する要素が拡大し、公安機関の警察活動に大きな圧力...
大規模言語モデル (LLM) テクノロジが成熟するにつれて、迅速なエンジニアリングがますます重要にな...
人工知能の活発な発展は大きな論争を引き起こしています。発展の一般的な傾向からすると、これはデメリット...
最近、2022年のナスダック上位10社の研究開発費のグラフが突然人気を集めました。ご覧のとおり、Am...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
1. 背景1.1 ブースティングブースティング[1]は、アンサンブルモデルを訓練するための古典的な手...
ステージ上の1分、ステージ外の10年間の努力。ボストン・ダイナミクスのロボット「アトラス」は新たなス...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
私は長年、学界と産業界の両方で機械学習モデリングに取り組んできましたが、Scalable ML で「...