クラシック絵文字パッケージにこの「続編」があることが判明しました。ステーブルビデオのクリエイティブなゲームプレイが人気

AI を使って古典的な絵文字を動画にアップグレードする、この創造的な遊び方が最近かなり人気になっています。

たとえば、 「男性が赤いスカートの女性を見るために頭を回した」という最も古典的な絵は、現在次のようになっています。

最高なのは続編です:

男は発見され、恥ずかしさのあまり追い返されました。妻も恥ずかしがっていました。

見た直後に太ももを叩いた人もいました。

何年も経って、ようやくこのカップルの物語を知りました。

この絵文字パッケージに加えて、多くの馴染みのある画像が AI によって偽装されています。

たとえば、次のようになります。

少女の手に握られたマッチを見ると、本当に何かを気づかされます。家が燃えているときでさえ、彼女が穏やかに微笑んでいたのも不思議ではありません。

もちろん、最も古典的な老人もいます。

そして、感動的な赤ちゃん：

この波はとてもエキサイティングなので、誰もが見るのをやめられません。まったく止まることができません。

安定したビデオは大きな貢献を果たしている

これらの作品のコメント欄では、多くのネットユーザーが作品の制作にどんな道具が使われたのかを尋ねています。

えーと、それらはすべてStable Video Diffusion (SVD)から来ていることがわかりました。

Stable AI の最初のビデオ生成ツールは 5 日前にリリースされたばかりで、テキストまたは画像から 14fps または 25fps の作品を生成できます。

ユーザーレビューではRunwayのGenよりも人気があると言われています。

Twitterユーザーの@cocktail peanutさんが紹介しているように、上記のような楽しいエフェクトを作りたい場合は、対応する絵文字画像をそこに投げ込むだけです。

少し待つと、画像が動き出します。

その老人はキーボードを叩きながら水を飲んでいた。

これを基に、このネットユーザーは、絵文字パッケージ内のキャラクターの顔を変えるという高度な遊び方も開発しました。

これには、別のツールである Facefusion (ワンクリックで Pinokio にローカルにインストールできます)が必要です。

操作も非常に簡単です。Emad Mostaque (Stable AI のボス)のビデオと写真を用意するだけです。

ダンダン：

今度はエマドが水を飲む番です。

なお、Stable Video Diffusion はまだ一般公開されておらず、試してみるには順番待ちリストに参加して資格を待つことしかできません。

しかし、他に 2 つの選択肢があります。

1 つは、fal.ai が提供する SVD インターフェースを使用することです。

個人的なテストの後、うまく動作します。写真を直接アップロードすることもできます。

2つ目は、行列に並ばずにすぐに使えるGen-2を試すことです。何と言っても、入力した写真を動画にしたり、同時にプロンプトワードを提供したりもできます（最新のモーションブラシ機能を使用）。

ここでは、ネットユーザーがこれを作成しましたが、効果はかなり良好です（特にダイナミック）：

最後に、このような創造的なゲームプレイに対して、注意深いネットユーザーはいくつかの欠陥も発見しました。

例えば、絵文字のキャラクターの顔をよく見ると、かなり怖いものもあります。

そしてこの写真から、男性の目は実際には赤いドレスを着た女性を見つめているのではなく、正面を見つめていることがわかります。

これは、 AI が表情の意味を理解するために、さらに努力する必要があることを示しています。

最後に、ちょっとしたイースターエッグがあります。

AIは、この物語には別の続編があるかもしれないことを発見しました。つまり、赤いドレスを着た女性の隣には、実は筋肉質の男性が立っているということです。これは4人の物語です（犬の頭）

このボサボサの髪がなければ完璧だろうね ==

<<: Google: LLM は推論エラーを見つけることはできないが、修正することはできる

>>: ビル・ゲイツ氏：GPT-5はGPT-4よりそれほど良くはならない、生成AIは限界に達した

インスピレーションプログラミング: 最大公約数アルゴリズムの分析

ブログ

GoogleはコードネームGenesisと呼ばれるAIニュースライティング製品をテストしていると報じられている。

ブログ

2020年にスパムはなくなるでしょうか？

ブログ

軍用殺人ロボットは人類の救世主か悪魔か？

ブログ

新型コロナウイルスによりスマートシティがさらにスマート化

ブログ

企業がAI対応データベースを使用してAI導入を加速する方法

ブログ

次世代交通におけるAI世代の影響

ブログ

Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

ブログ

AI「黒ヘルメット」が成都でデビュー、警察が2分で路上で数百人の体温を検査！

ブログ

クラシック絵文字パッケージにこの「続編」があることが判明しました。ステーブルビデオのクリエイティブなゲームプレイが人気

安定したビデオは大きな貢献を果たしている

インスピレーションプログラミング: 最大公約数アルゴリズムの分析

GoogleはコードネームGenesisと呼ばれるAIニュースライティング製品をテストしていると報じられている。

2020年にスパムはなくなるでしょうか？

軍用殺人ロボットは人類の救世主か悪魔か？

新型コロナウイルスによりスマートシティがさらにスマート化

企業がAI対応データベースを使用してAI導入を加速する方法

次世代交通におけるAI世代の影響

Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

AI「黒ヘルメット」が成都でデビュー、警察が2分で路上で数百人の体温を検査！

推薦する

AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

Meta、Google、Tesla、競合他社が団結してOpenAIについて不満を訴える！ソラは物理世界を理解していません。GPT3 だけです。

アリババ、AI研究所、清華大学が共同でAIに認知能力を与える新しいAIモデルを発表

RangePerception: Range View3D 検出への新しいアプローチ!

生死に関わる問題：病院のICU病棟で人工知能は何ができるのか？

AIがビジネスプロセスとインテリジェントセキュリティをサポートする方法

興味深く実用的なオープンソース人工知能プロジェクトトップ10

ChatGPTプロンプトワードの新しいゲームプレイ「もっと作る」、テキストと画像の効果を2倍にする

論文を Nature に投稿する前に GPT-4 に問い合わせてください。スタンフォード大学は5,000本の論文をテストし、コメントの半分は人間の査読者のコメントと変わらないことを発見した。

11 分で GPT-3 をトレーニングしましょう! Nvidia H100が8つのMLPerfベンチマークを制覇、25年ぶりにリリースされた次世代グラフィックカード

人工知能教育の時代が到来。AIは何ができるのか？