海外メディアの報道によると、OpenAIは2月18日、短いテキストプロンプトを通じて「リアル」かつ「想像力豊かな」60秒の動画を作成できると言われるSoraという新しいAIモデルを発表した。 OpenAIはブログ投稿で、Soraはテキスト指示に基づいて最長60秒の動画を生成でき、複数のキャラクター、特定の種類のアクション、詳細な背景の詳細を含むシーンを思いつくことができると述べた。 「このモデルは、ユーザーがプロンプトで何を求めているのかを理解するだけでなく、それが現実世界にどのように存在するのかも理解します」とブログ投稿には書かれている。 OpenAIは、AIモデルを訓練して「現実世界でのやり取りを必要とする問題を人々が解決できるように」する計画だと述べた。 市場調査会社ABIリサーチのシニアアナリスト、リース・ヘイデン氏は、「マルチモーダルモデル」は新しいものではなく、テキストから動画へのモデルはすでに存在しているが、OpenAIが主張するSoraの長さと正確さは、Soraをユニークなものにしていると述べた。 ヘイデン氏は、新しいパーソナライズされたコンテンツがさまざまなチャネルを通じて配信されるようになるため、こうしたタイプの AI モデルはデジタル エンターテイメント市場に大きな影響を与える可能性があると述べました。 「明らかな使用例はテレビで、物語を補足する短いシーンを作成するものです」とヘイデン氏は言う。「このモデルにはまだ限界がありますが、市場がどこに向かっているかを示しています。」 同時に、OpenAIは、Soraはまだ開発中であり、特に手がかりの空間的詳細に関して重大な「弱点」があると述べた。例えば、クッキーを一口食べたものの、食べた後には噛み跡が残っていないという動画が作られました。 今のところ、OpenAI のメッセージは安全性に重点を置いています。同社は、専門家チームと協力して最新モデルをテストし、誤報、憎悪的なコンテンツ、偏見などの分野を注意深く監視する予定だと述べた。同社は、誤解を招く情報の検出に役立つツールも開発中だと述べた。 Sora は、まず、製品の危害やリスクを評価する「レッドチーム」と呼ばれるサイバーセキュリティの教授たちに提供される予定です。また、多くのビジュアルアーティスト、デザイナー、映画製作者にアクセスを提供し、クリエイティブプロフェッショナルがどのように使用しているのかについてのフィードバックを収集しています。 |
<<: Appleは開発者がアプリのコードを書くのに役立つXcodeのアップデート版を開発中だ
人工知能(AI)は、人間の知能特性を備えたタスクを実行できるコンピューティングプログラムを指します。...
本論文では、これまでの RNN モデル研究に基づいて、隠れ状態ニューロン間の更新頻度の順序を強制し、...
[[384224]]大いに期待されているディープラーニングは、人工知能を再び AI の冬に突入させ...
「OpenAIが2027年にAGIを実現する」という53ページのPDFがインターネット上で広く流通...
加齢黄斑変性症のリスクが高い個人を特定することは、専門家の不足と網膜画像の評価における臨床専門知識へ...
[[376593]] 1月18日の光明日報によると、近年、中国の製造業は「機械が人間に取って代わる」...
8月24日、市場調査会社ガートナーの最新予測によると、 AI向けハードウェアの世界販売収益は2023...
説明可能な人工知能 (XAI) とブロックチェーン技術の融合は、分散型エコシステムにおける取引の監査...
[[211015]]現在、TensorFlow のメジャーバージョンは 1.3 にアップグレードさ...
政府や社会からの監視が強まる中、人工知能(AI)の責任ある開発を促進し、業界標準を確立することを目的...
数日前、アリババの研究チームは「Animate Anyone」と呼ばれる手法を構築しました。この手法...
[51CTO.comからのオリジナル記事]クラウドコンピューティング、ビッグデータ、5G、モノのイン...
GPT-4 のグラフィカル推論能力は人間の半分以下?米国のサンタフェ研究所の調査によると、 GPT-...