AI を使って古典的な絵文字を動画にアップグレードする、この創造的な遊び方が最近かなり人気になっています。 たとえば、 「男性が赤いスカートの女性を見るために頭を回した」という最も古典的な絵は、現在次のようになっています。 最高なのは続編です: 男は発見され、恥ずかしさのあまり追い返されました。妻も恥ずかしがっていました。 見た直後に太ももを叩いた人もいました。 何年も経って、ようやくこのカップルの物語を知りました。 この絵文字パッケージに加えて、多くの馴染みのある画像が AI によって偽装されています。 たとえば、次のようになります。 少女の手に握られたマッチを見ると、本当に何かを気づかされます。家が燃えているときでさえ、彼女が穏やかに微笑んでいたのも不思議ではありません。 もちろん、最も古典的な老人もいます。 そして、感動的な赤ちゃん: この波はとてもエキサイティングなので、誰もが見るのをやめられません。まったく止まることができません。 安定したビデオは大きな貢献を果たしているこれらの作品のコメント欄では、多くのネットユーザーが作品の制作にどんな道具が使われたのかを尋ねています。 えーと、それらはすべてStable Video Diffusion (SVD)から来ていることがわかりました。 Stable AI の最初のビデオ生成ツールは 5 日前にリリースされたばかりで、テキストまたは画像から 14fps または 25fps の作品を生成できます。 ユーザーレビューではRunwayのGenよりも人気があると言われています。 Twitterユーザーの@cocktail peanutさんが紹介しているように、上記のような楽しいエフェクトを作りたい場合は、対応する絵文字画像をそこに投げ込むだけです。 少し待つと、画像が動き出します。 その老人はキーボードを叩きながら水を飲んでいた。 これを基に、このネットユーザーは、絵文字パッケージ内のキャラクターの顔を変えるという高度な遊び方も開発しました。 これには、別のツールである Facefusion (ワンクリックで Pinokio にローカルにインストールできます)が必要です。 操作も非常に簡単です。Emad Mostaque (Stable AI のボス)のビデオと写真を用意するだけです。 ダンダン: 今度はエマドが水を飲む番です。 なお、Stable Video Diffusion はまだ一般公開されておらず、試してみるには順番待ちリストに参加して資格を待つことしかできません。 しかし、他に 2 つの選択肢があります。 1 つは、fal.ai が提供する SVD インターフェースを使用することです。 個人的なテストの後、うまく動作します。写真を直接アップロードすることもできます。 2つ目は、行列に並ばずにすぐに使えるGen-2を試すことです。何と言っても、入力した写真を動画にしたり、同時にプロンプトワードを提供したりもできます(最新のモーションブラシ機能を使用) 。 ここでは、ネットユーザーがこれを作成しましたが、効果はかなり良好です(特にダイナミック) : 最後に、このような創造的なゲームプレイに対して、注意深いネットユーザーはいくつかの欠陥も発見しました。 例えば、絵文字のキャラクターの顔をよく見ると、かなり怖いものもあります。 そしてこの写真から、男性の目は実際には赤いドレスを着た女性を見つめているのではなく、正面を見つめていることがわかります。 これは、 AI が表情の意味を理解するために、さらに努力する必要があることを示しています。 最後に、ちょっとしたイースターエッグがあります。 AIは、この物語には別の続編があるかもしれないことを発見しました。つまり、赤いドレスを着た女性の隣には、実は筋肉質の男性が立っているということです。これは4人の物語です(犬の頭) このボサボサの髪がなければ完璧だろうね == |
<<: Google: LLM は推論エラーを見つけることはできないが、修正することはできる
>>: ビル・ゲイツ氏:GPT-5はGPT-4よりそれほど良くはならない、生成AIは限界に達した
親が子どもの世話をしたり、子どもと遊んだり勉強したり、看護師や介護士の仕事を手伝ったりするロボットに...
今日では、盗作された記事や作品が出版され、盗作者がそれを無料で使用したり、利益を得たりすることは珍し...
数か月前の2017 GMICカンファレンスで、ホーキング博士は再びAI脅威論を提起し、「強力なAIの...
[[432741]]小学生の頃、「暗算日常練習」の文章題に戸惑ったトラウマをまだ覚えていますか?ぜひ...
[[202181]] 2015年、同社のエンジニアリング担当副社長であるXavier Amatri...
最近、ByteDanceの応用機械学習チームは、veGiantModelという大規模モデルトレーニン...
この記事では、一般的に使用されているいくつかの圧縮アルゴリズムのパフォーマンスを比較します。結果は、...
AIの兵器化?大規模言語モデルの誕生以来、人々はその潜在的な影響について議論し続けています。しかし...
ニューラル ネットワークに基づくプロジェクトにおけるボトルネックは通常、ネットワークの実装ではありま...
AI は、ネットワークとデバイスが過去の決定から学習し、将来のアクティビティを予測し、パフォーマン...
人工知能はあらゆるところに存在し、私たちは気づかないうちに日常生活でそれを使用しています。人工知能は...
[[343105]] [51CTO.com クイック翻訳] サイバー脅威の複雑さと数は時代とともに進...
スイスアーミーナイフについて聞いたことがあるかもしれません。そうでない場合は、下の図をご覧ください。...