クラシック絵文字パッケージにこの「続編」があることが判明しました。ステーブルビデオのクリエイティブなゲームプレイが人気

クラシック絵文字パッケージにこの「続編」があることが判明しました。ステーブルビデオのクリエイティブなゲームプレイが人気

AI を使って古典的な絵文字を動画にアップグレードする、この創造的な遊び方が最近かなり人気になっています。

たとえば、 「男性が赤いスカートの女性を見るために頭を回した」という最も古典的な絵は、現在次のようになっています。

最高なのは続編です:

男は発見され、恥ずかしさのあまり追い返されました。妻も恥ずかしがっていました。

見た直後に太ももを叩いた人もいました。

何年も経って、ようやくこのカップルの物語を知りました。

この絵文字パッケージに加えて、多くの馴染みのある画像が AI によって偽装されています。

たとえば、次のようになります。

少女の手に握られたマッチを見ると、本当に何かを気づかされます。家が燃えているときでさえ、彼女が穏やかに微笑んでいたのも不思議ではありません。

もちろん、最も古典的な老人もいます。

そして、感動的な赤ちゃん:

この波はとてもエキサイティングなので、誰もが見るのをやめられません。まったく止まることができません。

安定したビデオは大きな貢献を果たしている

これらの作品のコメント欄では、多くのネットユーザーが作品の制作にどんな道具が使われたのかを尋ねています。

えーと、それらはすべてStable Video Diffusion (SVD)から来ていることがわかりました。

Stable AI の最初のビデオ生成ツールは 5 日前にリリースされたばかりで、テキストまたは画像から 14fps または 25fps の作品を生成できます。

ユーザーレビューではRunwayのGenよりも人気があると言われています。

Twitterユーザーの@cocktail peanutさんが紹介しているように、上記のような楽しいエフェクトを作りたい場合は、対応する絵文字画像をそこに投げ込むだけです

少し待つと、画像が動き出します。

その老人はキーボードを叩きながら水を飲んでいた。

これを基に、このネットユーザーは、絵文字パッケージ内のキャラクターの顔を変えるという高度な遊び方も開発しました。

これには、別のツールである Facefusion (ワンクリックで Pinokio にローカルにインストールできます)が必要です。

操作も非常に簡単です。Emad Mostaque (Stable AI のボス)のビデオと写真を用意するだけです。

ダンダン:

今度はエマドが水を飲む番です。

なお、Stable Video Diffusion はまだ一般公開されておらず、試してみるには順番待ちリストに参加して資格を待つことしかできません。

しかし、他に 2 つの選択肢があります。

1 つは、fal.ai が提供する SVD インターフェースを使用することです。

個人的なテストの後、うまく動作します。写真を直接アップロードすることもできます。

2つ目は、行列に並ばずにすぐに使えるGen-2を試すことです。何と言っても、入力した写真を動画にしたり、同時にプロンプ​​トワードを提供したりもできます(最新のモーションブラシ機能を使用)

ここでは、ネットユーザーがこれを作成しましたが、効果はかなり良好です(特にダイナミック)

最後に、このような創造的なゲームプレイに対して、注意深いネットユーザーはいくつかの欠陥も発見しました。

例えば、絵文字のキャラクターのをよく見ると、かなり怖いものもあります。

そしてこの写真から、男性の目は実際には赤いドレスを着た女性を見つめているのではなく、正面を見つめていることがわかります。


これは、 AI が表情の意味を理解するために、さらに努力する必要があることを示しています。

最後に、ちょっとしたイースターエッグがあります。

AIは、この物語には別の続編があるかもしれないことを発見しました。つまり、赤いドレスを着た女性の隣には、実は筋肉質の男性が立っているということです。これは4人の物語です(犬の頭)

このボサボサの髪がなければ完璧だろうね ==

<<:  Google: LLM は推論エラーを見つけることはできないが、修正することはできる

>>:  ビル・ゲイツ氏:GPT-5はGPT-4よりそれほど良くはならない、生成AIは限界に達した

ブログ    

推薦する

サービスロボットは大きな将来性があり、すぐに何千もの家庭に導入されるだろう

親が子どもの世話をしたり、子どもと遊んだり勉強したり、看護師や介護士の仕事を手伝ったりするロボットに...

OpenAIの「コピー&ペースト」の背後にあるのは、盗作者が全てを無料で手に入れたいということ

今日では、盗作された記事や作品が出版され、盗作者がそれを無料で使用したり、利益を得たりすることは珍し...

これから起こることは避けられません。AIサイバー犯罪はすでにあなたの近くにあります

数か月前の2017 GMICカンファレンスで、ホーキング博士は再びAI脅威論を提起し、「強力なAIの...

OpenAI が GPT-3 を使って小学生と数学で競います!小型モデルのパフォーマンスは2倍になり、1750億の大型モデルに匹敵する

[[432741]]小学生の頃、「暗算日常練習」の文章題に戸惑ったトラウマをまだ覚えていますか?ぜひ...

Quora は機械学習をどのように活用していますか?

[[202181]] 2015年、同社のエンジニアリング担当副社長であるXavier Amatri...

ByteDanceが大規模モデルトレーニングフレームワークveGiantModelをオープンソース化、パフォーマンスが最大6.9倍向上

最近、ByteDanceの応用機械学習チームは、veGiantModelという大規模モデルトレーニン...

非常に厳しい CPU 制約下でも正常に動作しますか? Java におけるさまざまな圧縮アルゴリズムのパフォーマンス比較

この記事では、一般的に使用されているいくつかの圧縮アルゴリズムのパフォーマンスを比較します。結果は、...

...

OpenAIはChatGPTを軍事目的で使用する予定か?国防総省との協力禁止が解除、元グーグルCEO「AIは核爆弾になる」

AIの兵器化?大規模言語モデルの誕生以来、人々はその潜在的な影響について議論し続けています。しかし...

ニューラルネットワークのデバッグは難しすぎる。6つの実用的なヒントをご紹介します

ニューラル ネットワークに基づくプロジェクトにおけるボトルネックは通常、ネットワークの実装ではありま...

AIがモノのインターネットをどう変えるのか

AI は、ネットワークとデバイスが過去の決定から学習し、将来のアクティビティを予測し、パフォーマン...

人工知能が製造業に与える4つの影響

人工知能はあらゆるところに存在し、私たちは気づかないうちに日常生活でそれを使用しています。人工知能は...

AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

[[343105]] [51CTO.com クイック翻訳] サイバー脅威の複雑さと数は時代とともに進...

機械学習アルゴリズムに関する 16 のヒント

スイスアーミーナイフについて聞いたことがあるかもしれません。そうでない場合は、下の図をご覧ください。...

...