OpenAI、テキストから動画を生成できる新しい大規模モデル「Sora」を発表

OpenAI、テキストから動画を生成できる新しい大規模モデル「Sora」を発表

海外メディアの報道によると、OpenAIは2月18日、短いテキストプロンプトを通じて「リアル」かつ「想像力豊かな」60秒の動画を作成できると言われるSoraという新しいAIモデルを発表した。

OpenAIはブログ投稿で、Soraはテキスト指示に基づいて最長60秒の動画を生成でき、複数のキャラクター、特定の種類のアクション、詳細な背景の詳細​​を含むシーンを思いつくことができると述べた。

「このモデルは、ユーザーがプロンプトで何を求めているのかを理解するだけでなく、それが現実世界にどのように存在するのかも理解します」とブログ投稿には書かれている。

OpenAIは、AIモデルを訓練して「現実世界でのやり取りを必要とする問題を人々が解決できるように」する計画だと述べた。

市場調査会社ABIリサーチのシニアアナリスト、リース・ヘイデン氏は、「マルチモーダルモデル」は新しいものではなく、テキストから動画へのモデルはすでに存在しているが、OpenAIが主張するSoraの長さと正確さは、Soraをユニークなものにしていると述べた。

ヘイデン氏は、新しいパーソナライズされたコンテンツがさまざまなチャネルを通じて配信されるようになるため、こうしたタイプの AI モデルはデジタル エンターテイメント市場に大きな影響を与える可能性があると述べました。

「明らかな使用例はテレビで、物語を補足する短いシーンを作成するものです」とヘイデン氏は言う。「このモデルにはまだ限界がありますが、市場がどこに向かっているかを示しています。」

同時に、OpenAIは、Soraはまだ開発中であり、特に手がかりの空間的詳細に関して重大な「弱点」があると述べた。例えば、クッキーを一口食べたものの、食べた後には噛み跡が残っていないという動画が作られました。

今のところ、OpenAI のメッセージは安全性に重点を置いています。同社は、専門家チームと協力して最新モデルをテストし、誤報、憎悪的なコンテンツ、偏見などの分野を注意深く監視する予定だと述べた。同社は、誤解を招く情報の検出に役立つツールも開発中だと述べた。

Sora は、まず、製品の危害やリスクを評価する「レッドチーム」と呼ばれるサイバーセキュリティの教授たちに提供される予定です。また、多くのビジュアルアーティスト、デザイナー、映画製作者にアクセスを提供し、クリエイティブプロフェッショナルがどのように使用しているのかについてのフィードバックを収集しています。

<<:  Appleは開発者がアプリのコードを書くのに役立つXcodeのアップデート版を開発中だ

>>:  OpenAIのSora、中国は追いつけないのか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ウェーディングビジョン:主要技術からインテリジェント機器へ

海はなぜ青いのでしょうか?この古くて神秘的な疑問は常に人々の興味をそそってきました。論文「水関連の視...

ニューヨーク市の AI イニシアチブを分析: そこから何を学べるか?

エリック・アダムス市長は最近、ニューヨーク市政府がAI技術の応用を推進する計画を発表した。この計画に...

移転可能で適応性のある運転行動予測

2022年2月10日にarXivにアップロードされた論文「移転可能で適応可能な運転行動予測」は、バー...

美術系の学生は皆AIを崇拝しており、写真はすぐに絵画に描ける

ピエロの写真を入力するだけです。このプログラムは、油絵の肖像画を一筆一筆描いていく画家のようなもので...

「今日の簡単な歴史」:今後 15 年間でほとんどの人が失業することになるのでしょうか?

ユヴァル・ノア・ハラリ氏(42歳)はもともとエルサレムでヘブライ語で歴史を教える大学教授だった。38...

人工知能とモノのインターネット:自然災害への新たな対応アプローチ

より持続可能な環境を目指して、私たちは革新的な技術を活用して自然災害による損失を最小限に抑える努力を...

...

AIはどれほど強力でしょうか?人間とロボットが「真・偽の孫悟空」を演じる

過去数十年にわたり、チャットボットは進化を続け、私たちの日常生活に欠かせないヘルパーになりました。携...

現代のサイバーセキュリティに人工知能が必要な理由

ダイヤルアップ インターネットの時代よりずっと以前、ウイルスが感染したフロッピー ディスクを介して拡...

快手とインテルが提携し、KGNN プラットフォームでの大規模リアルタイム動的グラフトレーニングの効率を向上

ショートビデオの推奨やソーシャル推奨などのアプリケーションシナリオでは、推奨システムは大量の急速に変...

...

プログラマーでなくてもわかる「機械学習」の原理

機械学習とは何ですか?一般的なシナリオから始めましょう:ある日、マンゴーを買いに行ったところ、店員が...

時代の流れに乗り、華麗に変革を遂げる UiPath RPA が上海ノキアベルの新たな航海をサポートします。

上海ノキアベル株式会社(以下、「ノキアベル」)は、ノキアグループと中国保利集団の子会社である華新郵電...

Go 言語アルゴリズムの美しさ - 基本的なソート

[[404642]]この記事はWeChatの公開アカウント「roseduanの執筆場所」から転載した...