ソラのトレーニングデータが流出した疑い、ネットユーザー「UE5が間違いなく使われている」

ソラのトレーニングデータが流出した疑い、ネットユーザー「UE5が間違いなく使われている」

朗報です、朗報です、本物のソラの新しいビデオがあります!通りかかったらぜひお見逃しなく!

(本物のSora製品を識別するために待ったり目を凝らしたりする必要はありません)

過去数時間の間、ビル・ピーブルズとティム・ブルックスの2人のリーダーを含むスタッフは、Nショットを発射するために懸命に取り組んできました。

(わかった、わかった、君たち二人は仲良しだってことは知ってるよ)

これまでにない多様な視点や新機能があるだけでなく、最も重要なのは、各ビデオのプレゼンテーション効果が依然として素晴らしいことです。

たとえば、Go Pro の視点から難破船を探索するダイビングなどです。

例えば、以下のビデオでは、その効果はこれまでのリアルで生き生きとしたスタイルとは少し異なります。

さらに、Sora は同じクリップをさまざまな視点から作成します。

テーマは「日本の江戸時代の静かな情景を描いた、丁寧に作られたジオラマ」です。伝統的な木造建築。精巧な甲冑を身にまとった一人の侍が、ゆっくりと町中を歩いています。

もう一つの驚くべきドラゴンは、大きな目と長いまつげを持ち、口から冷たい空気を吐き出す小さな白いドラゴンです。それが以下のものです。

誰かが同じプロンプトを使用して DALLE 3 に描画しようとしましたが、結果は次のようになりました。

まあ、かなり似ていますね!

しかし、ソラの白龍効果により、特定の音がどんどん大きくなりました。

わあ、これは一目見て Unreal Engine の影があることがわかります!

しかし、この一連の動画はネットユーザーを驚かせ、ソラの動画がどんどん良くなっていく理由に驚嘆し続けた。

ああ、ソラのパブリックベータ版のリリースを長い間待っていたので、1日3食しか食べられません!

一部のネットユーザーは興奮のあまり、すでに有名な新製品発見プラットフォームである ProductHunt で Sora の API の場所を予約している。

準備はすべて整っています。あとは東風だけです。

公式の新ビデオがまた公開されました

まずはSORAの新商品から見ていきましょう。今回一番驚いたのは、夕暮れの浜辺を這うガラスの亀です。

しかし、注意深いネットユーザーの中には、「足は3本しか見えなかった…」「前足2本は亀のひれのように見えた」と指摘する人もいた。


Midjourney で同じプロンプトを使用すると、次のようになります。

さらに、複数の視点もこの新しいリリースのハイライトとなっています。

たとえば、ハワイでのスカイダイビング。

キュー:熱帯ハワイの海上でベースジャンプする男性。ペットのコンゴウインコも一緒に飛んでいる

F1ドライバーの視点もあります。

さらに、Sora はシームレス接続といういくつかの新しい編集機能も公開しました。

前に見たように、テキスト、画像、またはビデオ入力でモデルにプロンプ​​トを出すことが可能です。

現在、2 つの入力ビデオ間を徐々に補間することもできることが発見されました。無関係な 2 つの Sora ビデオが、シームレスに新しいビデオに移行しました。

えーと、でもなぜ水中に蝶がいるんですか? ?

任意のサイズ比率で生成でき、新しいビデオも表示されます。

しかし、すべてのビデオはSoraチームのメンバーによって公開されたため、一部のネットユーザーは、OpenAIスタッフ以外の誰かがテストしない限り、Soraはベイパーウェアであると感じていました。

これらの訴訟のいくつかは覆されたと考えられています...

プロンプト: 幻想的な動物や動物が輝く暗いネオンの熱帯雨林

ネットユーザーたちはこう言った。「なぜベクターアニメーションのスタイルになっているのか?プロンプトにはそのようなヒントが全くない。」

これは私が今まで見たソラの中で最悪の例です。

「私は専門家ではありませんが、これは間違いなく UE5 を使用しています」

同時に、ソラが生成した動画についての議論の焦点は、「これは物理世界の法則に従わない」というレベルから、より深いレベルへと徐々に移っていった。

その背後にあるトレーニング データのソースについての議論。

現在主流の民間の格言(doge)は次のとおりです。

これは間違いなく 3D エンジン/UE5 を使用してトレーニングされました。

Nvidiaの科学者であり親しい友人でもあるジム・ファン氏は初日、SoraがUE5を呼び出したことは明示的に述べなかったものの、UE5によって生成されたテキストとビデオが合成データとして使用され、独自のトレーニングセットに追加された可能性が高いと推測した。

元Google社員もソラの新しいビデオについて辛辣なオンラインレビューを投稿した。

ソラ エフェクトの場合、このような一貫性とビデオ品質を実現するには、3D エンジン + 生成 AI の組み合わせが本当に必要だと思います。
結局、より多くのデータと計算が必要になるだけなのです...

これはジム・ファン氏や他の人たちだけの意見ではありません。ソラのビデオの第一波が出た当初から、このような声が最初に聞こえ、音量もかなり大きかった。

もうひとつ例を挙げてください。

データサイエンスと機械学習に携わるTwitterユーザーが、この見解を裏付ける「証拠」をリストアップした。

彼が見せてくれたカードは、桜並木を散歩している動画だった。

そして彼はこう付け加えた。「ビデオで動いている人々は、UE5 デモの人間の動きと非常によく似ているようです。現実世界では、人々は常に一定の速度で歩いたり買い物に行ったりするわけではありません。」

この発言に疑問を抱く人もいます。結局のところ、YouTube などのインターネット上には数十億時間(おそらくそれ以上)のビデオ クリップがあります。なぜ Unreal Engine を使って作業負荷を増やすのでしょうか?

そこで誰かが、前述のツイッター上の若者の前に「車の運転」のビデオクリップを投げつけ、「3Dエンジンで作られたようには見えない」と言ったのです!

若者は友好的な態度で分析を始めた。

「私は専門家ではありませんが、UE が巻き上げるほこりは後輪だけのように思えます。しかし、実際には前輪もほこりを巻き上げます。」

もちろん、多くの人が彼に同意し、次のように繰り返した。

UE5 は使用されないかもしれませんが、デジタル ツイン シミュレーションを使用する方が効果的かつ効率的である可能性があるのは事実です。
これにより、より少ない IRL データでより高品質のデータ サンプリングが可能になります。

中には、Sora のパイプラインについての理解を Twitter に載せている人もいました。

この議論が広まった後、多くの人が Sora が「UE5 + AIGC」の結果であるかもしれないという考えを嘲笑しました。

「ふん!合成データはビジュアル機械学習のチートコードだよ!」

一方で、この議論から近い将来の可能性を感じている人もいます。

つまり、未来の生成は、現実の物理をシミュレートすることによってではなく、物理シミュレーション(つまり現実世界)をシミュレートするモデルをトレーニングすることによって提示されます。

まあ...、そういう可能性がないことを誰が否定できるでしょうか?

もう一つ

ソラが新しいビデオを公開した後、一部のネットユーザーは急いでAIビデオ生成のもう一つの大手企業であるRunwayのCEOに質問した。

「今後数ヶ月以内に、新しいバージョンをリリースする予定はありますか?ソラに近い品質のものを〜」

ランウェイのCEOは一言で冷たく答えた。

より良い

<<:  AIの最下層に突入! NUSのYou Yang氏のチームは拡散モデルを使用してニューラルネットワークパラメータを構築したとLeCun氏は称賛した。

>>:  制御核融合における新たなマイルストーン! AIがプラズマの裂け目を予測することに成功し、ネイチャー誌に掲載され、クリーンエネルギーの「聖杯」に一歩近づいた。

ブログ    

推薦する

AsiaInfoが中国聯通のネットワークAIフォーラムに参加し、自動運転ネットワークの革新研究拠点の設立を開始

9月24日、中国聯通の「ネットワークAIフォーラム」が北京で開催された。フォーラムは5GとAI技術の...

...

とても驚きました! GPT-4V錯視チャレンジ記録: 間違っているはずのものは間違っていない、間違っているはずのないものも間違っている

GPT-4V は視覚エラーマップに挑戦し、その結果は「衝撃的」でした。 「どちらの側が明るいですか」...

パートナーはいますか? Facebookの従業員が休暇中にロボットを家に持ち帰り、死に関する質問に答える

[[286539]]ビッグデータダイジェスト制作著者: 張大毓如、陳若夢春節が近づいてきました!叔母...

完全自動サポートにより、ドローンは真の「無人」になります。

ドローンについては皆さんもよくご存知だと思います。近年、無人運用の需要が継続的に高まり、さまざまな最...

2019年のAI開発の7つの分野

[[257419]] 2018 年は人工知能 (AI) の主流採用をさらに促進し、より多くの機能の提...

AIがFBIに加わったとき、KGBはそれを専門家と呼んだ

「市の東にある家で爆弾が爆発しようとしています!」 「爆弾はネズミ捕り、ACデルコ社の単三電池、亜鉛...

...

1 つの記事で 10 個のアルゴリズムをカバーします。基本的なグラフアルゴリズムの視覚的な説明

[[343053]]グラフは、ソーシャル メディア ネットワーク、Web ページやリンク、GPS の...

AIがAIに勝つ: Googleの研究チームがGPT-4を使ってAI-Guardianのレビューシステムを打ち破る

8月2日、Googleの研究チームはOpenAIのGPT-4を使用して他のAIモデルのセキュリティ保...

非人道的だ!人工知能はソーシャルエンジニアリングの天敵である

人工知能 (AI) はまだ初期段階ですが、AI は急速に企業が自らを守るための重要な手段になりつつあ...

[文字列処理アルゴリズム] 入力文字列の各単語の順序を逆にするアルゴリズム設計とCコード実装

1. 要件の説明文字列を入力し、文字列内の単語を逆順に組み立てて出力するプログラムを作成します。たと...

Google mBERT の秘密を解明: ディープラーニングは人間の言語をどのように処理するのか?

[[384615]]言語機能を備えたディープラーニングシステムは、人々の生活の中で広く利用されてき...

AIは5Gネットワ​​ークの管理にどのように活用されるのか

AI は、モノのインターネットやプライベート 5G ネットワークなど、複数の用途をサポートするために...

AIとロボット工学でオフショア業務を効率化する方法

長い間、肉体的に過酷で危険な仕事が特徴とされてきた石油産業は、変革を遂げつつある。この変化は、通信技...