OpenAIがテキストから動画を生成するAIジェネレーター「Sora」をリリース

OpenAIがテキストから動画を生成するAIジェネレーター「Sora」をリリース

OpenAI が Sora をリリースし、テキストからビデオへの AI コンテンツ生成競争に参入。 Sora は、ユーザーのプロンプトに基づいて最長 1 分間のビデオを生成できます。

同社は、東京の街を歩く女性やゴールドラッシュ時代のカリフォルニアの歴史的映像など、SORAで制作した印象的なビデオをいくつか披露した。

Sora プレビューは現在、一般公開されていますが、セキュリティ専門家やクリエイターなどの特定のグループにも公開される予定です。同社は、クリエイティブな専門家にとって最も役立つモデルに進化させる方法についてのフィードバックを得るために、特定の個人にアクセスを許可しています。全体的なリリース日はまだ発表されていません。

「私たちは、誤報、憎悪コンテンツ、偏見などの分野の専門家である『レッドチーム』と協力して、このモデルに対して敵対的テストを実施しています」と同社は述べた。「また、動画がSoraによって生成されたかどうかを判断できる検出分類器など、誤解を招くコンテンツの検出に役立つツールも構築しています。」

OpenAI は、この種の技術を考案した最初の企業ではありません。 Meta、Google、その他いくつかの企業は、同様の製品の独自バージョンをリリース済み、またはリリース準備中です。市場で最も人気のあるソリューションには、Stability AI、Runway、Pika、Google Lumiere などがあります。しかし、業界アナリストは、Sora のビデオ品質はほとんどの競合他社よりも優れていると指摘しています。おそらく、それが Sora のデモが大きな話題と誇大宣伝を生み出した理由でしょう。

OpenAIによると、Soraが他のモデルより優れている点は、その驚異的なリアリティと、短いプロンプトからより長いビデオクリップを生成できる能力だ。 Sora は言語に対する深い理解に基づいており、プロンプトを理解し、キャラクターや感情を生成することができます。

Sora のデモでは、いくつかの単語からビデオを生成する機能が示されましたが、単一の画像や一連のフレームからビデオを生成する機能は示されませんでした。

Sora の発売は興奮を生んだが、懸念もいくつかあった。この技術はディープフェイクを作成し、誤った情報を広めるのに使用される可能性があります。 Sora では、不適切な実在の人物や、ポルノや暴力を含むコンテンツを作成するためにプラットフォームを使用するなど、コンテンツに対していくつかの制限が設けられると予想されます。

「誤情報の解決には、ある程度の緩和策を講じる必要がありますが、それには社会とソーシャルメディアネットワークの理解も必要です」と、DALL-Eチームの主任研究員兼リーダーであるアディティア・ラメシュ氏は述べた。

Sora に関するもう一つの懸念は、他者の著作権を侵害する可能性があることです。 OpenAI は、トレーニング データはライセンスを受けたコンテンツまたは公開されているコンテンツから取得されると主張していますが、何が「公開されている」かについては常に曖昧さが残ります。 OpenAI がこの問題を解決できない場合、多くの訴訟に直面する可能性があります。

Sora には、複雑なシーンの物理を正確にシミュレートする上でもいくつか問題があります。たとえば、キュ​​ーの空間的な詳細がわかりにくくなる可能性があります。

Sora は、一般ユーザーにテキストを使用した AI 搭載ビデオを作成する機能を提供します。テキストからビデオへの変換技術が映画やテレビ番組の制作業界を脅かすまでにはまだまだ長い道のりがありますが、エンターテインメント業界に大きな混乱をもたらす可能性もあります。

現時点では、OpenAI はそこまで先のことを考えていません。同社は、不適切なコンテンツや誤情報を拒否し、C2PAガイドラインに従ってSoraが制作した動画にラベルを付けるなど、プラットフォームの基本的な安全機能の向上に注力する。(C2PAは、出版社や企業などがメディアにメタデータを埋め込んで、その出所や関連情報を検証できるようにするオープンな技術標準である。C2PAはAI生成画像だけでなく、カメラメーカーや報道機関などもメディアコンテンツの出所や履歴、出所を証明するために同じ標準を採用している。)

<<:  1024解像度で最速モデル、ByteDanceのオープンモデルSDXL-Lightningがリリース

>>:  顔認識は終わったのか?最初の「顔ハイジャック」型バンキングトロイの木馬が誕生

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

OpenAIとAppleの分岐点、アルトマンとジョブズが排除された日

何の警告もなく、OpenAIのCEOサム・アルトマンは解雇された。一つの石が千の波紋を呼ぶ。ウルトラ...

AI は「彼ら」による盗聴を防ぐことができますか?

次のような状況に遭遇したことがあるかもしれません:携帯電話でアプリを開くと、最初に表示されるのは数分...

Google は最新の NLP モデルをオープンソース化しました。このモデルは「罪と罰」の全巻を処理できます。

Transformer は、近年 NLP 分野で注目されているモデルの 1 つです。 2017年、...

行動分析:誤解された人工知能がもたらすセキュリティリスク

誇大宣伝を信じるなら、人工知能 (AI) と機械学習 (ML) はすでに現代の IT インフラストラ...

貨物ドローンは宅配業界に革命を起こす:より重い荷物を運び、より遠くまで飛ぶ

貨物ドローンは、高効率、環境保護、低コストなど、多くの利点を備え、宅配業界に革命をもたらそうとしてい...

人工知能の時代において、中国語と英語のどちらがAIの母国語になるのでしょうか?

人工知能は現在非常に人気の高い技術であり、世界中の国々が研究に資金と人材を投入しています。人工知能を...

世界各国の人工知能の配置をご存知ですか?

[[207472]]人工知能は未来をリードする戦略技術です。世界の主要先進国は人工知能の発展を国家...

...

マイクロソフトはソフトからハードへの変革に向けてカスタム AI チップを開発中。その計画とは?

噂は本当で、Microsoft は大規模な言語モデルのトレーニングに使用できるカスタム AI チップ...

...

アルゴリズムエンジニアのメリット: 超実践的技術ロードマップ

これは、会社のアルゴリズム グループの同僚向けに作成された技術ロードマップです。主な目的は、技術ルー...

転移学習の限界を突破せよ! Googleが新しいNLPモデル「T5」を提案、複数のベンチマークでSOTAに到達

[[316154]]過去数年間、転移学習は NLP 分野に実りある成果をもたらし、新たな発展の波を...

コーディングが ChatGPT を圧倒します! UIUCと清華大学が共同で7BパラメータのMagicorderをリリース、コードデータの重みは完全にオープンソース

オープンソースの「ビッグコードモデル」が登場しました。 UIUC 清華大学の研究者チームは、70 億...

OpenAI エンジニア必読: 苦い教訓

OpenAIが動画生成モデルSoraをリリースしてから1週間が経ちましたが、その人気は衰えていません...