海外メディアの報道によると、OpenAIは2月18日、短いテキストプロンプトを通じて「リアル」かつ「想像力豊かな」60秒の動画を作成できると言われるSoraという新しいAIモデルを発表した。 OpenAIはブログ投稿で、Soraはテキスト指示に基づいて最長60秒の動画を生成でき、複数のキャラクター、特定の種類のアクション、詳細な背景の詳細を含むシーンを思いつくことができると述べた。 「このモデルは、ユーザーがプロンプトで何を求めているのかを理解するだけでなく、それが現実世界にどのように存在するのかも理解します」とブログ投稿には書かれている。 OpenAIは、AIモデルを訓練して「現実世界でのやり取りを必要とする問題を人々が解決できるように」する計画だと述べた。 市場調査会社ABIリサーチのシニアアナリスト、リース・ヘイデン氏は、「マルチモーダルモデル」は新しいものではなく、テキストから動画へのモデルはすでに存在しているが、OpenAIが主張するSoraの長さと正確さは、Soraをユニークなものにしていると述べた。 ヘイデン氏は、新しいパーソナライズされたコンテンツがさまざまなチャネルを通じて配信されるようになるため、こうしたタイプの AI モデルはデジタル エンターテイメント市場に大きな影響を与える可能性があると述べました。 「明らかな使用例はテレビで、物語を補足する短いシーンを作成するものです」とヘイデン氏は言う。「このモデルにはまだ限界がありますが、市場がどこに向かっているかを示しています。」 同時に、OpenAIは、Soraはまだ開発中であり、特に手がかりの空間的詳細に関して重大な「弱点」があると述べた。例えば、クッキーを一口食べたものの、食べた後には噛み跡が残っていないという動画が作られました。 今のところ、OpenAI のメッセージは安全性に重点を置いています。同社は、専門家チームと協力して最新モデルをテストし、誤報、憎悪的なコンテンツ、偏見などの分野を注意深く監視する予定だと述べた。同社は、誤解を招く情報の検出に役立つツールも開発中だと述べた。 Sora は、まず、製品の危害やリスクを評価する「レッドチーム」と呼ばれるサイバーセキュリティの教授たちに提供される予定です。また、多くのビジュアルアーティスト、デザイナー、映画製作者にアクセスを提供し、クリエイティブプロフェッショナルがどのように使用しているのかについてのフィードバックを収集しています。 |
<<: Appleは開発者がアプリのコードを書くのに役立つXcodeのアップデート版を開発中だ
今年のテクノロジー業界の大規模レイオフはまだ続いています! 2023年には再びレイオフにより数万人の...
[[223595]]はじめに: この記事では、著者の Emmanuel Ameisen が、機械学習...
「注目の式」に8年間存在していたバグが外国人によって発見された?一瞬にして、この話題はインターネット...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
アルゴリズムはビッグデータの最も価値のある部分です。ビッグデータマイニングとは、大量、不完全、ノイズ...
[[186928]]ビッグデータ、分析、モノのインターネット、クラウドテクノロジー...近年、これら...
01 起源産業発展のニーズ2022年下半期には、高速道路や都市高速道路でのインテリジェント運転の問題...
滴滴出行は1月25日、2018年スマート交通サミットでスマート交通戦略製品「Traffic Brai...
自動運転の普及初期には交通渋滞が悪化するだろう。これは、自動運転についてのあなたの理解と異なりますか...
最近、NVIDIA GPU 製品や SDK を使用してディープラーニングを学習している学生に多く出会...
序文インタビュアー: 「仮想 DOM と Diff アルゴリズムをご存知ですか? 説明してください。...
7月19日、「新バージョンの文心易言の性能はChatGPT 3.5を上回り、これは我が国の関連技術作...