OpenAIは10月に開発された画像生成器DALL-E 3の新バージョンをリリースした。

OpenAIは10月に開発された画像生成器DALL-E 3の新バージョンをリリースした。

OpenAIは9月21日水曜日、書かれたプロンプトに基づいて画像を生成できる新しい画像生成器DALL-Eのプレビュー版をリリースした。同時に、OpenAI はこれを人気の ChatGPT チャットボットに統合する予定です。議員らが生成型人工知能へのさらなる規制を求める中、OpenAI は物議を醸しているこの技術の利用を拡大している。

DALL-E 3と呼ばれるこの新しいツールは、ユーザーコマンドを理解し、テキストを画像に変換する能力に優れています。これは、以前のAI画像生成ツールでは困難だったことです。 OpenAIの研究者らは、言語の進歩により、DALL-E 3は複雑な指示をより適切に解析し、詳細な要求内の紛らわしい要素を回避できると述べている。

「一般ユーザーは ChatGPT チャットボットにログインして、漠然とした質問をすることができます」と、DALL-E 3 のチームリーダーである Aditya Ramesh 氏は述べています。プレゼンテーションの中で、Ramesh 氏は、Mountain Ramen という会社のさまざまなロゴ シナリオをテストしている事業主の例を紹介しました。

この新しいツールは現在、初期テストのために少数のユーザーに提供されていますが、OpenAI は 10 月に ChatGPT の有料加入者にも公開し、この技術を利用できる人の数を大幅に増やす予定です。

OpenAIはますます高まる競争圧力に直面している。 Google の AI を活用した製品の相次ぐ発売により、DALL-E と OpenAI の主力チャットボットのトラフィックと月間ユーザー数の増加が鈍化している。しかし、OpenAI は、その斬新な画像ジェネレーターを ChatGPT に組み込むことで市場を拡大し、この技術を単独の製品ではなくチャットボットの機能として位置付けています。

オープンAIの広報ディレクター、リンジー・ボルトン氏は、DALL-E 3は発売時に不具合があったため、記者会見に出席したジャーナリストらはこの機能をテストできなかったと述べた。しかし、OpenAIはその後、DALL-E 3は水曜日のリリースまでに安定するだろうと述べた。

これまでにリリースされた DALL-E 2、Midjourney、Stable Diffusion などのテキストから画像へのジェネレーターは、早い段階でユーザーを魅了し、技術的なスキルを必要とせずに高度なソフトウェア機能を習得する機会を一般の人々に提供しました。広告主、マーケティング担当者、政治家、ビデオゲーム開発者は皆、キャンペーンを実行するためにこれらのツールを使用しています。

しかし、データ分析会社シミラーウェブのデータによると、DALL-Eツールへのオンライン訪問数は、OpenAIがChatGPTの基盤技術をアップグレードした2023年3月のピーク時の3,200万件から、8月には約1,300万件に減少している。

テキストから画像を生成するAI技術の将来は不透明であるものの、その発展にはほとんど限界がなく、リアルな画像を生成する能力が大きな社会的、政治的影響を及ぼす可能性があるという懸念が生じている。

旧バージョンの DALL-E で生成された道路標識やテキストは非常にごちゃごちゃして見えたため、AI で生成された画像を簡単に識別できました。しかし、DALL-E 3 の改良により、素人が画像が本物かどうかを判断することがより困難になりました。 「もはや自分の目は信用できない」と、デジタルフォレンジックを研究し、アドビと協力してコンテンツ真正性イニシアチブを支援しているカリフォルニア大学バークレー校の教授、ハニー・ファリド氏は言う。

ファリド氏は、AI はおよそ 6 か月ごとに現実世界を模倣する能力が向上するため、DALL-E 3 の改良は驚くべきことではないと強調した。彼は、人工知能から人間の創造物を取り除くための先進技術が必要だと訴えた。

OpenAIの競合企業であるStability AIとMidjourneyは、生成AIモデルのトレーニングに必要な膨大な量のインターネットデータに関して著作権侵害を主張するアーティストやゲッティイメージズからの訴訟に直面している。

法執行機関、規制当局、擁護団体は最近、これらのツールがどのように使用されているかに注目し始めている。たとえば、ディープフェイクのアダルトコンテンツや、次期大統領選挙に向けた AI 生成の広告の作成などだ。

DALL-E 3チームは、これらのリスクを優先し、最悪のシナリオをテストし、その経験を会社の対応戦略に組み込むために外部の専門家の「レッドチーム」を招集したと述べた。

DALL-E 2については、OpenAIはシステムカードでプロセスの詳細な概要を公開し、AIモデルの開発、微調整、安全性テストに関する公開手順を詳述しました。政策研究者のサンディニ・アガルワル氏は、OpenAIはDALL-E 3が一般に公開される前に同様のカードをリリースする予定だと述べた。 6月のホワイトハウスサミットでの自主的な取り組みの一環として、OpenAIは、画像を透かしで埋め込んだり、コンテンツを作成したサービスやモデルを示す来歴データをエンコードしたりするなどの方法を通じて、AIによって生成されたビデオやオーディオコンテンツを識別するための防止メカニズムを開発し、導入することに合意した。ラメシュ氏は、DALL-E 3は画像の出所やコンテンツの「由来」を調べることができる分類装置を実験中であり、これはホワイトハウスの公約にも記載されている手法だと述べた。

オープンソースのモデルライブラリ企業ハギング・フェイスの研究科学者で、グーグルの倫理的AIの元共同責任者であるマーガレット・ミッチェル氏は、これらのメカニズムはディープフェイクの識別に役立つと同時に、アーティストが自分の作品が同意や報酬なしにモデルのトレーニングに使用されたかどうかを追跡するのにも役立つと述べた。

ミッチェル氏はさらにこう付け加えた。「これは必ずしも会社の利益になるわけではないが、より一般大衆の利益になると思う。」

<<:  ChatGPT を使用して Web アプリケーションを構築する方法は?

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

新しい人工ニューロンデバイスは、非常に少ないエネルギーでニューラルネットワークの計算を実行できる

カリフォルニア大学サンディエゴ校の研究者らが開発した新しい人工ニューロン装置のおかげで、画像の認識や...

機械学習アルゴリズム(1):決定木とランダムフォレスト

モデルの組み合わせ (ブースティング、バギングなど) と決定木に関連するアルゴリズムは多数あります。...

Intel と AMD はパフォーマンスの向上のために AI PC に期待していますが、消費者はそれらを買い替える資金を持っているのでしょうか?

11月2日、新型コロナウイルス感染症のパンデミックをきっかけに2年間成長を続けてきたパソコン(PC...

遠隔管理+早期警告人工知能が危険物輸送の安全性を向上

2017年7月、国務院は「新世代人工知能開発計画」を発表し、人工知能が国家戦略の重要なツールとなって...

OpenAI DALL-E 3モデルには「不適切なコンテンツ」を生成する脆弱性があり、マイクロソフトの従業員はそれを報告した後に「口止め命令」を受けた。

2月2日、マイクロソフトのソフトウェアエンジニアリング部門のマネージャーであるシェーン・ジョーンズ...

...

...

...

CNN 推論エンジンを使用して IoT デバイスにディープラーニングを実装するにはどうすればよいですか?

[[212457]]ディープラーニング技術により、モノのインターネット (IoT) デバイスは非構...

...

...

AIOpsを始める前に知っておくべきこと

AIOps は、その優れたパフォーマンスにより、業界で幅広い注目と支持を集めています。AIOps が...

Android はなぜ弱い暗号化を使用するのでしょうか?

Android 2.2.1 で使用されるデフォルトの暗号化アルゴリズムは AES 256-SHA1...

百度CEOロビン・リー:AI時代のオープン性が技術の進歩を推進

8月19日、2017年ヤブリ中国起業家フォーラム夏季サミットが銀川で開催されました。百度の創業者で会...

...