描いた場所に画像が動きます! Gen-2の新機能「マジックブラシ馬良」が大ヒット、ネットユーザー:緊急、緊急、緊急

描いた場所に画像が動きます! Gen-2の新機能「マジックブラシ馬良」が大ヒット、ネットユーザー:緊急、緊急、緊急

動画生成AIはここまで進化したのか? !

写真をスワイプするだけで、選択したターゲットが動きます。

明らかに停止中のトラックでしたが、一回スワイプするだけで動き出し、光と影まで完璧に復元されました。

もともとはただの火の写真でしたが、今ではスワイプするだけで炎が空に向かってまっすぐに上がり、その熱さは圧倒的です。

こうなると、写真と実際の動画の違いがどうやってわかるのでしょう。

これは、Runway が AI ビデオ ソフトウェア Gen-2 用に作成した新機能であることがわかりました。ブラシを少し触れるだけで、画像内のオブジェクトを動かすことができ、そのリアルさは Ma Liang の魔法のブラシに劣りません。

まだ予告機能だったのですが、効果が出るとすぐにネット上で人気が出ました。

これを見たネットユーザーは次々と「早く試してみたい」と期待の王様になった。


Runwayではさらに多くの機能ウォームアップエフェクトもリリースされているので、見てみましょう。

写真が動画になり、指すだけで動きます

Runway のこの新しい機能は、モーション ブラシと呼ばれます。

名前が示すように、画像内のオブジェクトを動かすには、このブラシを使用して「ペイント」するだけです。

人物が静止しているだけでなく、スカートや頭の動きも非常に自然です。

滝のように液体を流したり、霧を復元したりすることもできます。

あるいはまだ燃えているタバコ:

みんなの前で燃える焚き火:

大きな背景も動的に作成でき、高速で移動する暗い雲など、画像の光と影の効果を変更することもできます。

もちろん、上記はすべて Runway の「オープンカード」であり、写真が「改ざん」されたことを積極的に伝えています。

以下のビデオには、にじみの痕跡がまったくなく、AI の改変がほとんど見られません。

一連のエフェクトが爆発的に広がり、機能がまだ正式にリリースされていないにもかかわらず、ネットユーザーたちはすでに焦り始めている。

多くの人がこの機能がどのように実装されているかを理解しようとしてきました。一部のネットユーザーは、この機能がいつリリースされるのかを心配しており、321(手動犬の頭)に直接リンクすることを望んでいます。

それは本当に楽しみなことだ。

ただし、この新しいモーション ブラシ機能を導入したのは Runway だけではありません。

AI 生成における最近の一連の進歩は、ビデオ生成の分野が技術的な爆発的な進歩を迎えようとしていることを示しているようです。

AI 生成ビデオは本当に普及するのでしょうか?

過去数日間と同様に、一部のネットユーザーは、人気のVincentアニメーションソフトウェアAnimatediffをプレイする新しい方法を開発しました。

最新研究のLCM-LORAを組み合わせるだけで、16フレームのアニメーション動画を生成するのにわずか7秒しかかかりません。

LCM-LORAは清華大学とHugging Faceが開発した新しいAI画像生成技術であり、安定拡散画像の生成速度を大幅に向上させることができます。

中でもLCM(潜在的整合性モデル)は、今年初めにOpenAIが提案した「整合性モデル」をベースにした新しい画像生成手法で、768×768の高解像度画像を高速に生成できる。

しかし、LCM は既存のモデルと互換性がないため、清華大学と Baobao Face のメンバーは、すべての Stable Diffusion モデルと互換性があり、描画プロセスを高速化する新しいバージョンの LCM-LORA モデルをリリースしました。

Animatediff ソフトウェアと組み合わせると、次のようなアニメーションを生成するのに約 7 秒しかかかりません。

現在、LCM-LORAはBaobao Faceでオープンソース化されています。

最近の AI によるビデオ生成の進歩についてどう感じていますか。また、実用化までどのくらい時間がかかるのでしょうか。

参考リンク:
[1] https://twitter.com/runwayml/status/1723033256067489937.
[2]https://twitter.com/op7418/status/1723016460220735748.

<<:  Google DeepMindがAGIをランク付け、ChatGPTのランクはどこになるか推測してください

>>:  OpenAI が Stable Diffusion を救います! Ilya Song Yang らによるオープンソースの Dall E3 デコーダー

ブログ    
ブログ    

推薦する

知っておくべき 10 個の機械学習 API

[[257117]] [51CTO.com クイック翻訳] 今日では、携帯電話の写真ストリーム認識...

1日当たりの予算が508万だと、OpenAIは2024年までしか存続できないのでしょうか?

執筆者:Qianshan最近、海外メディアAnalytics India Magazineによると、...

OpenAI COO: AIが一夜にしてビジネスに大きな変化をもたらすとは期待しない

12月5日、OpenAIは企業ユーザーの開拓に力を入れているものの、同社の幹部の一部は、この技術がす...

人気の4D Radarオープンソースデータの概要

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

2024年のビッグデータの不完全な予測

人工知能の進歩は2024年まで大きな原動力となる可能性が高く、ビッグデータの課題、つまりそれをどのよ...

Pythonアルゴリズム実践シリーズ: スタック

スタックは、特別な順序付けがされたテーブルです。挿入および削除操作はスタックの先頭で実行され、先入れ...

人工知能に関する詳細な調査:AIツールを使ったことがある人は思っているほど考えていない

6月27日、有名なテクノロジーメディアVergeは調査会社と協力し、人工知能の使用状況、期待、懸念を...

顔認識に関する初の訴訟が法廷に。顔スキャンを拒否する権利は失われたのか?

今日では、顔認識技術は私たちの生活や消費の場面でますます利用されるようになっています。最近、「中国初...

機械学習を使用して画像キャプションを生成する

最近のディープ ニューラル ネットワークの開発以前は、業界で最も優秀な人材でもこの問題を解決できませ...

...

マーケターが人工知能を採用する時が来た

[[275753]] [51CTO.com クイック翻訳] あらゆる業界の先進的な企業は、人工知能を...

NLP モデルは人間のレベルを超えるか?大きな詐欺に遭ったかもしれない

[[276457]]ビッグデータダイジェスト制作出典: thegradient編纂者:張瑞怡、呉帥、...

インテルのAIが破壊された万里の長城の修復にどのように貢献したか、その背後にある秘密が発見された

人工知能がテクノロジーと人文科学の交差点に到達したとき、どのようなエネルギーが解き放たれるのでしょう...

未来を形作るAIのトレンド

多くの人が人工知能技術の導入に非常に興味を持っていることは間違いありません。しかし、世界的な調査によ...