公式論文コードが公開されました。OpenAIはGPT-3のイメージ版をどのように実装したのでしょうか?

公式論文コードが公開されました。OpenAIはGPT-3のイメージ版をどのように実装したのでしょうか?

OpenAIはDALL-Eに関するいくつかの論文と実装コードを公開しました。

今年初め、OpenAI の GPT-3 の画像バージョンと 120 億のパラメータを持つ DALL-E がコミュニティを席巻しました。この大規模なモデルは、自然言語で表現された多数の概念を適切な画像に変換することができ、驚くべき結果をもたらします。

「アボカド型の椅子」と入力すると、さまざまな形の緑色のアボカド型の椅子の画像が表示されます。

GPT-3と同じであれば、OpenAIがDALL-Eの公式論文と実装コードを公開するのを皆が楽しみにしています。

約 2 か月の待機の後、DALL-E の論文とコードがついに公開されました。

ただし、このプロジェクトは更新中です。記事執筆時点では、DALL-E は画像再構成部分 d-VAE を使用してトレーニングされた CNN エンコーダーとデコーダー部分のみを公開しており、Transformer コード部分はまだ公開されていません。そうしないとデータセットを使用できません。この論文ではd-VAE論文も掲載されました。

  • プロジェクトアドレス: https://github.com/openai/DALL-E
  • 論文アドレス: https://arxiv.org/abs/2102.12092

今後、OpenAI がさらに技術的な詳細を発表することを期待するばかりです。

DALL-Eコードの一部はオープンソース化されている

これは、DALL·E で使用される d-VAE の公式 PyTorch パッケージです。 DALL-E/notebooks/usage.ipynb プログラムを実行する前に、ソフトウェア パッケージをインストールする必要があります。コードは次のとおりです。

 pip install git+https: //github.com/openai/DALL-E.git

デコーダー、エンコーダーコード

d-VAE 論文

今年の初め、論文が公開される前、何人かの人々がこの現象を再現し始めました。再現の根拠となったのは、ブロガーが作成した YouTube 動画で、その中で彼らは DALL·E の原理的な構造について推測していました。論文が公開された今、彼の予想は覆されたのだろうか?

従来、テキストから画像への生成は、固定されたトレーニング データセット上でより優れたモデリング仮説を見つけることに重点を置いてきました。これらの仮定には、複雑なアーキテクチャ、補助的な損失、またはトレーニング中に提供されるオブジェクト部分のラベルやセグメンテーション マスクなどの補助的な情報が含まれる場合があります。この研究では、テキストと画像のトークンを自己回帰モデリングのための単一のデータ ストリームとして扱うための、単純なトランスフォーマー ベースのアプローチを提案しました。十分なデータと拡張機能があれば、ゼロショット方式で評価した場合、私たちのアプローチは以前のドメイン固有のモデルと競争力があります。

<<:  データサイエンスで勝つ: 製薬会社の幹部が始めるための 5 つのヒント

>>:  深層学習におけるチューリング賞受賞後のベンジオ氏の研究の核心は何ですか?因果表現学習

ブログ    
ブログ    

推薦する

60年ぶり! AI が新しい抗生物質の最初のバッチを発見し、MIT の主要な研究が Nature に掲載されました。人類はスーパーバグとの戦いに希望を持っている

60年間、人類は抗生物質の研究において大きな進歩を遂げていません。しかし、このギャップはAIによって...

ベンジオとヒントンの絶え間ない探求:ディープラーニングアルゴリズムが脳の学習方法を明らかにする

[[384610]] 「脳の学習メカニズムや学習方法の一部を解明できれば、人工知能はさらに進歩できる...

...

機械学習が交通と物流に革命を起こす4つの方法

AI は、自動運転車、より優れたルートマッピング、より正確な予測を通じて、輸送と物流をよりスマートか...

眼球認識技術が魔法を発揮し、一目であなたを認識します

サイバーセキュリティは「人民の戦い」を必要とするだけでなく、科学技術の問題でもある。オンライン詐欺で...

韓国チームはサンプルの引き渡しを拒否し、2本目のLK-99サスペンションビデオを公開しました! HUSTの新論文が初めて反磁性を証明

昨夜、「LK-99は韓国当局により偽物と摘発され、常温超伝導体ではない」というニュースがインターネッ...

宜春市はファーウェイと提携し、ビッグデータと人工知能で市のデジタル変革を推進

2019年11月21日〜22日、第一回ファーウェイ宜春市ビッグデータ・人工知能サミットフォーラムと宜...

連休明けの電力安定供給のため、変電所点検ロボットが活躍中

前年と比べると、春節期間中の電力供給の確保においてハイテク技術が重要な役割を果たした。ロボットによる...

人工知能による雇用促進

近年、人工知能は急速に発展し、新たな科学技術革命と産業変革を主導する中核的な原動力となり、人類の生産...

...

...

誰でも簡単にウェブサイトを構築できる 5 つの AI ウェブサイトビルダー

今日は、5 つの AI ウェブサイト ビルダー ツールをご紹介します。これらの AI ツールを使用す...

このアルゴリズムは顔認識の「マスク」問題を解決し、2日間で1,000人のコミュニティで97%の精度を達成しました | AIが疫病と戦う

ますます成熟する人工知能は、新型コロナウイルス感染症対策の最前線で「逆転者」と呼ばれる特別な集団とな...

自然言語処理におけるディープラーニングの応用

自然言語処理とは、自然言語を使用して人間とコンピューターが効果的にコミュニケーションするためのさまざ...

...