さらに混沌です！ソラになりすました実在の人物の動画がすでに存在し、ウィル・スミスがパスタを食べながらミームを演じる

今日、「ウィル・スミスがパスタを食べている」というビデオがソーシャルメディアで話題になっている。動画画面は2つの部分に分かれており、上部には「1年前のAI動画」、下部には「現在のAI動画」が表示されます。

周知のとおり、AIが「ウィル・スミスがスパゲッティを食べている」動画を生成するのは容易ではありません。キャラクターの手、麺、口に入った後の麺の変形は、これまでのAIにとって大きな課題であったため、この問題は多くの人から冗談めかして「動画生成業界のチューリングテスト」と呼ばれています。 RunwayやPikaなどの有名な動画生成AIは、この問題に関して多くのゴースト動物の素材を提供してきました。

OpenAIがSoraをリリースした後、誰かが「Online Orders」のSam Altman氏にも挑戦しましたが、Altman氏はその挑戦を受け入れませんでした。

しかし数日後、ソラが作成したと疑われる「ウィル・スミスがパスタを食べている」動画がソーシャルメディア上で拡散し始めた。動画の後半を見ればわかるように、現在のトップクラスのAIは前述の「チューリングテスト」を乗り越えたようで、生成される手や麺は非常にリアルだ。 OpenAIが最近発表したさまざまなSora生成結果と合わせて、多くの人が「これはSoraが生成した新しいビデオだ。今日のビデオ生成AIは、これほどリアルなレベルに進化したのだ」と信じ始めました。

しかし、すぐに誰もが、それはウィル・スミスが冗談を言っただけだったことに気づいた。ビデオの後半部分は実際に彼自身が録画したのだ。つまり、今回ウィル・スミスは人工知能によって生成された自分自身を演じたのです。「アイ、ロボット」で培った演技力がようやく役に立ったと冗談を言う人もいた。

では、ソラはパスタを食べるシーンを生成できるのでしょうか?現在、この問題に関するテスト結果はありません。最近ソラがホットモードになっているため、誰でもソラをテストできるように見えますが、そうではありません。 OpenAIは、テストへのアクセスをまだ一般に公開しておらず、一部の研究者や学者とのみ共有していると述べた。サム・アルトマンは数日前からオンラインで注文を受け付け始めた。ネットユーザーがリクエストを出すと、彼はそれを実現するのを手伝うのだ。

ソラのオープンベータ版がまだ見えないので、みんなちょっと焦り始めています。そこで、一部のネットユーザーは、実際のビデオを使用してソラが生成したビデオを模倣するという新しいゲームを始めました。これらのビデオは本物か偽物かを見分けるのが難しく、そのビデオが Sora によって生成されたものか、それとも他の誰かが作成したものかを見分けるのが難しくなります。

例えば、ハンバーガーに関する次の例では、一部のネットユーザーは、このビデオは OpenAI の新しいモデル Sora によって生成されたものだと述べています。動画のキャプションには、「チーズバーガーのCM、カマンベールチーズ入りのバンズ、半分にスライスされてバンズからチーズが溢れ出ている、断面図、カマンベールチーズが溢れ出ているハンバーガーを食べている男性、HD」と書かれている。

しかし、このビデオはすぐにゲイリー・マーカスの注目を集め、彼ははっきりとこう述べた。「これは偽物です。これはソラによって生成されたものではありません。」

出典: https://twitter.com/GaryMarcus/status/1759578135665004683

これに対し、ネットユーザーらは「5年前のYouTube動画とほぼ同じだ」と深い同意を示した。

動画アドレス: https://youtu.be/ieRuoEMnb4A

2つの動画を見ると、誰かがYouTube動画を使ってソラになりすましたのではないかと疑わずにはいられない。現状では、誰かが偽のソラ動画を拡散したとしても、一般の人が見破るのは難しいようだ。

別の例では、アスリートがダイナミックな方法でさまざまな一貫した動きを実行し、そのビデオも Sora によって生成されたと主張しています。

しかし、この動画もネットユーザーによって偽物だと暴露され、「このような動画は通報されてもいい」とコメントした。

誰かが犬の毛の中にヒントを見つけ、このネットユーザーは「AIが生成した毛むくじゃらの白い犬が本物の毛むくじゃらの白い犬より優れていることはあり得ない」と考えました。

しかし、これはAIが生成したものではなく、本物のビデオだと指摘する人もいた。

ソラはあまりにもリアルなので、私たちの目が私たちを裏切り始めています

Sora はリリース初日に皆に衝撃を与えました。その強力な一貫性とテキスト追従機能により、Pika、Runway、Stable Video などのビデオ生成モデルとはすぐに差をつけられました。 Sora の魅力は、従来のビデオ編集の限界を超え、私たちの現実認識に挑戦する、生成された結果のリアリティにあります。ソラの作品に没頭すると、私たちの目が自分自身を裏切ったように感じるでしょう。結局のところ、作品の細部すべてが、これが本物のビデオであることを物語っています。

ソラの発売後、人気は急上昇し、数多くの素晴らしい事例が生まれました。人物、動物、植物、建物などの主題、そして現実、ファンタジー、SF、サイバーなどのさまざまなスタイルは、すべてソラによってマスターされています。一瞬、これが実写なのか、人工的な特殊効果なのか、それとも AI による制作なのか分からないかもしれません。

SORA はテクノロジーの勝利であるだけでなく、視覚表現の分野に革命をもたらしています。テキストをダイナミックなビジュアルストーリーに変換します。複雑な撮影機材やポストプロダクション技術は必要ありません。テキスト 1 つだけで、魅力的なビジュアル作品を作成できます。

それだけでなく、Sora の強力なビデオ編集機能も驚異的です。ビデオを入力すると、Sora は他の要素を変更することなく、テキストプロンプトに基づいて編集を行います。「終盤ボス」が誰なのかわかる人はいますか？

ネットユーザーの@ai_for_successは、AIと現実のこの複雑な戦いにため息をつくことなく、「Soraによって生成された結果を見て、OpenAIが達成したことは私たちの認識をはるかに超えていると感じています。」と述べた。

しかし、心配しすぎないでください。私たちは、そのようなリアルなソラを区別する能力をまだ保持できます。よく見ると、Sora が生成したビデオにいくつかのバグがあることがわかります。注意深く見ると、人間の体の動きのエラー、空中に突然現れるオブジェクト、誤った物理モデリング、不合理なインタラクション方法と結果など、それらは AI によって生成されたものであると分類できます。これらを観察すると、基本的にこれが AI によって生成された結果であることが確認できます。

おそらく、ネットユーザーが言うように、現在のビデオ生成のベンチマークは、ウィル・スミスがスパゲッティを食べている男のドレッドヘアを食べることだろう。このプロンプトを使用して、大規模モデルのビデオ生成の現在のレベルを試してみてはいかがでしょうか。

<<: 10x Nvidia GPU: Google TPUスタートアップチームによる、モデル固有の大型チップが一夜にして有名に

>>: 生成 AI とデータ品質は共存できますか?