OpenAIはDALL-E 3モデルをテストしていると報じられており、AI画像生成を新たな段階に押し上げると期待されている。

OpenAIはDALL-E 3モデルをテストしていると報じられており、AI画像生成を新たな段階に押し上げると期待されている。

8月2日、OpenAIは昨年4月に第2世代DALL-E「Vincent Image」モデルを発売した。このモデルは、その強力な実力で業界で広く注目を集め、一時期人気を博した。

海外メディアDecoderによると、OpenAIは次世代DALL-E AIモデル(DALL-E 3)を準備中とのこと。同社は現在一連のアルファテストを実施しており、一部のユーザーは既にAIモデルへの早期アクセスを行っている

海外メディアによると、Discord上の匿名ユーザーが最近、DALL-E 3をテストした際の体験を共有したという。

匿名のユーザーは、5月のDALL-E 3テストバージョンでは、さまざまなアスペクト比の画像を生成でき、より長いプロンプト文をサポートし、「通常のテキスト」を生成できたと述べた。

▲ 画像出典:デコーダー

今年7月のテスト版はさらに強力になっています。しかし、匿名のユーザーによると、 7月のテスト版では、一連のNSFWシーンや著作権で保護された商標パターンがランダムに生成される可能性があるとのことです。OpenAIは、モデルレベルからこのような「不適切なコンテンツ」の生成を禁止したいと考えているため、DALL-E 3には関連するトレーニング調整にまだしばらく時間が必要です。

海外メディアは、DALL-E 3は画質と多様性において飛躍的な進歩を遂げており、AIによる画像生成を新たな段階に押し上げると期待されていると報じた。

IT Homeは以前、Stable Diffusion XLが正式版1.0をリリースしたと報じた。Stability AIは、Stable Diffusion XL 1.0は同社がこれまで開発した「最も先進的な」AIツールであり、実際の効果は実に顕著であるため、OpenAIのDALL-Eモデルもこれに「真っ向から挑戦」することになると主張している。

<<:  エッジAIの台頭

>>:  ソフトウェアと自動化機器が持続可能性と回復力を向上させる方法

ブログ    
ブログ    

推薦する

01 コーヒーとsocket.ioで実装されたナップサックアルゴリズム

まず、なぜこれを書くのかお話しします。プログラマーになるのは本当に大変です。長い年月を経ても、レンガ...

量子コンピュータの公開:まだ多くのボトルネックがあり、最初の課題は機械学習の加速です

編集者注: 量子コンピューティングと機械学習の融合は、急成長している研究分野となっています。人々の期...

自然言語処理シーケンスモデル - CRF 条件付きランダムフィールド

シーケンスモデルにおけるHMM(隠れマルコフモデル)を習得した後は、別のシーケンスモデルであるCRF...

...

人工知能技術はビッグデータに基づいていますか?

[[201662]]今や、AI やロボットが徐々に人間の仕事に取って代わる時代になりました。知らな...

人工知能は過去70年間で急速に成長し始めたばかりである

[[337550]] 2019年末現在、わが国の中核人工知能産業の規模は510億人民元を超え、人工知...

Mobvoi Guo Xiao: 自動運転の中核要素の実現と車両インタラクションにおけるAIの応用

[51CTO.comより引用] 2017年12月1日~2日、51CTO主催のWOTDグローバルソフト...

OpenAIが「公式クローラー」をリリース: GPT-5はこれでトレーニングされ、必要に応じてブロックできる

周知のとおり、OpenAI は GPT-4 以降、技術的な詳細を完全に秘密にしてきました。当初は、ベ...

人工知能1年後:パンデミックはテクノロジーの発展にどのような影響を与えたのでしょうか?

[[389010]]消費者の行動が変化し、企業の業務ニーズが変化するにつれて、人工知能は徐々に企業...

インドのチームが人間のように考えることができる自動運転アルゴリズムを開発

[51CTO.com クイック翻訳]インド工科大学 (IIT マドラス) の研究者らは、人間のように...

分散コンセンサスアルゴリズム EPaxos について 1 つの記事で学ぶ

分散システムにおける中心的な問題はデータの一貫性です。 Paxos アルゴリズムは分散一貫性における...

SurroundOcc: サラウンド 3D 占有グリッドの最新技術!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

国内トップクラスのAIカンファレンスCPALに採択された論文の成果を公開!合計30件の口頭発表と60件のスポットライト記事

今年5月に発表され、国内の有力者である馬怡氏と沈向陽氏が主導する、まったく新しい初のAI学術会議CP...

人工知能はますます私たちに近づいている

科学者たちは、歌詞付きの歌を聞くと読書の妨げになりやすいのと同じように、音声信号とテキスト信号が脳に...

すべての画像が16x16ワードの価値があるわけではない。清華大学とファーウェイは動的ViTを提案した

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...