OpenAI、テキストから動画を生成できる新しい大規模モデル「Sora」を発表

OpenAI、テキストから動画を生成できる新しい大規模モデル「Sora」を発表

海外メディアの報道によると、OpenAIは2月18日、短いテキストプロンプトを通じて「リアル」かつ「想像力豊かな」60秒の動画を作成できると言われるSoraという新しいAIモデルを発表した。

OpenAIはブログ投稿で、Soraはテキスト指示に基づいて最長60秒の動画を生成でき、複数のキャラクター、特定の種類のアクション、詳細な背景の詳細​​を含むシーンを思いつくことができると述べた。

「このモデルは、ユーザーがプロンプトで何を求めているのかを理解するだけでなく、それが現実世界にどのように存在するのかも理解します」とブログ投稿には書かれている。

OpenAIは、AIモデルを訓練して「現実世界でのやり取りを必要とする問題を人々が解決できるように」する計画だと述べた。

市場調査会社ABIリサーチのシニアアナリスト、リース・ヘイデン氏は、「マルチモーダルモデル」は新しいものではなく、テキストから動画へのモデルはすでに存在しているが、OpenAIが主張するSoraの長さと正確さは、Soraをユニークなものにしていると述べた。

ヘイデン氏は、新しいパーソナライズされたコンテンツがさまざまなチャネルを通じて配信されるようになるため、こうしたタイプの AI モデルはデジタル エンターテイメント市場に大きな影響を与える可能性があると述べました。

「明らかな使用例はテレビで、物語を補足する短いシーンを作成するものです」とヘイデン氏は言う。「このモデルにはまだ限界がありますが、市場がどこに向かっているかを示しています。」

同時に、OpenAIは、Soraはまだ開発中であり、特に手がかりの空間的詳細に関して重大な「弱点」があると述べた。例えば、クッキーを一口食べたものの、食べた後には噛み跡が残っていないという動画が作られました。

今のところ、OpenAI のメッセージは安全性に重点を置いています。同社は、専門家チームと協力して最新モデルをテストし、誤報、憎悪的なコンテンツ、偏見などの分野を注意深く監視する予定だと述べた。同社は、誤解を招く情報の検出に役立つツールも開発中だと述べた。

Sora は、まず、製品の危害やリスクを評価する「レッドチーム」と呼ばれるサイバーセキュリティの教授たちに提供される予定です。また、多くのビジュアルアーティスト、デザイナー、映画製作者にアクセスを提供し、クリエイティブプロフェッショナルがどのように使用しているのかについてのフィードバックを収集しています。

<<:  Appleは開発者がアプリのコードを書くのに役立つXcodeのアップデート版を開発中だ

>>:  OpenAIのSora、中国は追いつけないのか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

心臓血管画像診断における人工知能の応用の進歩

人工知能(AI)は、人間の知能特性を備えたタスクを実行できるコンピューティングプログラムを指します。...

このような秩序だったニューロンは、皆さんがよくご存知の再帰型ニューラル ネットワークに似ていますか?

本論文では、これまでの RNN モデル研究に基づいて、隠れ状態ニューロン間の更新頻度の順序を強制し、...

ディープラーニングのメリットが終わりを迎える中、AIは再び「死の谷」に直面しているのでしょうか?

[[384224]]大いに期待されているディープラーニングは、人工知能を再び AI の冬に突入させ...

...

53ページのPDFが広く出回り、中核社員が次々と退職。OpenAIにはどんな秘密があるのか​​?

「OpenAIが2027年にAGIを実現する」という53ページのPDFがインターネット上で広く流通...

未来を自分の目で目撃しよう: 人工知能を使って加齢黄斑変性を治療する

加齢黄斑変性症のリスクが高い個人を特定することは、専門家の不足と網膜画像の評価における臨床専門知識へ...

「機械代替」がもたらす技術的失業危機をどう見るか

[[376593]] 1月18日の光明日報によると、近年、中国の製造業は「機械が人間に取って代わる」...

ガートナー:世界のAIチップの収益は2023年に530億ドル、2027年には1194億ドルに達する

8月24日、市場調査会社ガートナーの最新予測によると、 AI向けハードウェアの世界販売収益は2023...

説明可能な AI とは何ですか?

説明可能な人工知能 (XAI) とブロックチェーン技術の融合は、分散型エコシステムにおける取引の監査...

TENSORFLOW に基づく中国語テキスト分類のための CNN と RNN

[[211015]]現在、TensorFlow のメジャーバージョンは 1.3 にアップグレードさ...

フロンティアモデルフォーラムは責任あるAIの創造を目指している

政府や社会からの監視が強まる中、人工知能(AI)の責任ある開発を促進し、業界標準を確立することを目的...

たった一枚の写真でTikTokガール全員が踊れる

数日前、アリババの研究チームは「Animate Anyone」と呼ばれる手法を構築しました。この手法...

あらゆる場所でのAI実現へ: 人工知能分野におけるインテルの躍進

[51CTO.comからのオリジナル記事]クラウドコンピューティング、ビッグデータ、5G、モノのイン...

GPT-4 はグラフィカル推論を実行できないのですか? 「手放す」後も、正解率は33%にとどまる

GPT-4 のグラフィカル推論能力は人間の半分以下?米国のサンタフェ研究所の調査によると、 GPT-...

...