動画生成AIはここまで進化したのか? ! 写真をスワイプするだけで、選択したターゲットが動きます。 明らかに停止中のトラックでしたが、一回スワイプするだけで動き出し、光と影まで完璧に復元されました。 もともとはただの火の写真でしたが、今ではスワイプするだけで炎が空に向かってまっすぐに上がり、その熱さは圧倒的です。 こうなると、写真と実際の動画の違いがどうやってわかるのでしょう。 これは、Runway が AI ビデオ ソフトウェア Gen-2 用に作成した新機能であることがわかりました。ブラシを少し触れるだけで、画像内のオブジェクトを動かすことができ、そのリアルさは Ma Liang の魔法のブラシに劣りません。 まだ予告機能だったのですが、効果が出るとすぐにネット上で人気が出ました。 これを見たネットユーザーは次々と「早く試してみたい」と期待の王様になった。 Runwayではさらに多くの機能ウォームアップエフェクトもリリースされているので、見てみましょう。 写真が動画になり、指すだけで動きますRunway のこの新しい機能は、モーション ブラシと呼ばれます。 名前が示すように、画像内のオブジェクトを動かすには、このブラシを使用して「ペイント」するだけです。 人物が静止しているだけでなく、スカートや頭の動きも非常に自然です。 滝のように液体を流したり、霧を復元したりすることもできます。 あるいはまだ燃えているタバコ: みんなの前で燃える焚き火: 大きな背景も動的に作成でき、高速で移動する暗い雲など、画像の光と影の効果を変更することもできます。 もちろん、上記はすべて Runway の「オープンカード」であり、写真が「改ざん」されたことを積極的に伝えています。 以下のビデオには、にじみの痕跡がまったくなく、AI の改変がほとんど見られません。 一連のエフェクトが爆発的に広がり、機能がまだ正式にリリースされていないにもかかわらず、ネットユーザーたちはすでに焦り始めている。 多くの人がこの機能がどのように実装されているかを理解しようとしてきました。一部のネットユーザーは、この機能がいつリリースされるのかを心配しており、321(手動犬の頭)に直接リンクすることを望んでいます。 それは本当に楽しみなことだ。 ただし、この新しいモーション ブラシ機能を導入したのは Runway だけではありません。 AI 生成における最近の一連の進歩は、ビデオ生成の分野が技術的な爆発的な進歩を迎えようとしていることを示しているようです。 AI 生成ビデオは本当に普及するのでしょうか?過去数日間と同様に、一部のネットユーザーは、人気のVincentアニメーションソフトウェアAnimatediffをプレイする新しい方法を開発しました。 最新研究のLCM-LORAを組み合わせるだけで、16フレームのアニメーション動画を生成するのにわずか7秒しかかかりません。 LCM-LORAは清華大学とHugging Faceが開発した新しいAI画像生成技術であり、安定拡散画像の生成速度を大幅に向上させることができます。 中でもLCM(潜在的整合性モデル)は、今年初めにOpenAIが提案した「整合性モデル」をベースにした新しい画像生成手法で、768×768の高解像度画像を高速に生成できる。 しかし、LCM は既存のモデルと互換性がないため、清華大学と Baobao Face のメンバーは、すべての Stable Diffusion モデルと互換性があり、描画プロセスを高速化する新しいバージョンの LCM-LORA モデルをリリースしました。 Animatediff ソフトウェアと組み合わせると、次のようなアニメーションを生成するのに約 7 秒しかかかりません。 現在、LCM-LORAはBaobao Faceでオープンソース化されています。 最近の AI によるビデオ生成の進歩についてどう感じていますか。また、実用化までどのくらい時間がかかるのでしょうか。 参考リンク: |
<<: Google DeepMindがAGIをランク付け、ChatGPTのランクはどこになるか推測してください
>>: OpenAI が Stable Diffusion を救います! Ilya Song Yang らによるオープンソースの Dall E3 デコーダー
国内外の新車メーカーの急速な台頭により、自動車の知能レベルは向上し続けています。車両の中央コンピュー...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
社会の生産性の向上は現代交通の進歩を牽引していますが、現代交通がもたらす大きな利便性を享受する一方で...
米国のテクノロジーメディアの報道によると、IBMは本日、ワトソンブランドの人工知能サービスを自社のク...
Pika、北京大学、スタンフォード大学が共同で最新のテキスト画像生成/編集フレームワークをオープンソ...
[[248512]]当時、英語に支配されていた恐怖を覚えている人がどれだけいるでしょうか?前日に覚...
技術が急速に進歩する時代において、私たちと建築との関係は大きな変化を遂げています。もはやレンガやモル...
ブロックチェーンと人工知能の関係は何ですか?ブロックチェーンは人工知能に影響を与えることができるか?...
21 世紀に実現可能かつ実現されるであろう AI の驚くべき応用例をすべて紹介します。 AI が世界...
[[188605]] Numpy は Python 科学計算のコアライブラリの 1 つであり、主に多...