2020年、マイクロソフトはOpenAIと合意に達し、MicrosoftはGPT-3のソースコードに独占的にアクセスできるようになりました。それ以来、OpenAIは以前のようにGPT-3 AIモデルを公開していませんが、OpenAIのGPT-1とGPT-2は依然としてオープンソースプロジェクトです。 自然言語処理 AI モデルにおける OpenAI と Microsoft の独占を打ち破るために、Connor Leahy、Leo Gao、Sid Black は、AI の調整、スケーリング、オープンソース AI 研究に重点を置いた組織である EleutherAI を設立しました。最近、EleutherAI 研究チームは、GPT-3 をベースにした自然言語処理 AI モデル GPT-J をオープンソース化しました。 GPT-J は GPT-3 をベースにした自然言語処理 AI モデルであり、60 億のパラメータで構成されています。このモデルは 800 GB のオープンソース テキスト データセットでトレーニングされており、同様のサイズの GPT-3 モデルに匹敵します。 このモデルは、Google Cloud の v3-256 TPU と EleutherAI の The Pile データセットを使用して約 5 週間でトレーニングされました。 GPT-J は、OpenAI が報告した 67 億パラメータバージョンの GPT-3 と同等の精度を標準 NLP ベンチマーク ワークロードで達成します。モデル コード、事前トレーニング済みの重みファイル、Colab ドキュメント、デモ Web ページはすべて、EleutherAI のオープン ソース プロジェクトに含まれています。 EleutherAI は 2021 年 3 月に 27 億パラメータの GPT-Neo モデルをリリースしました。これは同社による GPT のようなシステムの最初の実装でした。 GPT-Neo は TensorFlow で構築され、Mesh TensorFlow 並列ライブラリを介して TPU でトレーニングされます。チームは現在、Microsoft DeepSpeed をベースにした GPU ソリューションである GPT-NeoX も開発しています。コードはオープンソースですが、モデル ファイルには現時点でアクセスできません。 最新モデル GPT-J は、新しいライブラリ Mesh-Transformer-JAX を使用してトレーニングされます。このライブラリは、TensorFlow のような特定のディープラーニング フレームワークを使用する代わりに、Google の JAX 線形代数フレームワークを使用します。 GPT-J は Tensorflow よりも柔軟で高速な推論を提供し、モデル開発時間は以前の取り組みよりもはるかに短くなります。 GPT-Neo モデルと比較して、GPT-J のトレーニング効率は 125% 向上します。いくつかのダウンストリーミング ワークロードにおけるゼロ ポイント パフォーマンスに関しては、GPT-J は公開されている Transformer LM の中で最高です。 EleutherAI の開発者である小松崎氏は、次のように述べています。「TensorFlow や TPU などの類似製品と比較すると、より柔軟で高速な推論が可能になります。さらに重要なのは、他の大規模モデルに比べてプロジェクトにかかる時間がはるかに短いことです。調査によると、JAX + xmap + TPU は、大規模なモデルを迅速に開発するための完璧なツール セットです。」 開発者は、GitHub で GPT-J のソースコードとモデルを、EleutherAI の公式 Web サイトでインタラクティブなデモを見つけることができます。 この記事はOSCHINAから転載したものです この記事のタイトル: GPT-3 に匹敵するか? EleutherAI が GPT-J をオープンソース化 この記事のアドレス: https://www.oschina.net/news/150972/eleutherai-open-sources-gpt-j |
<<: AIを活用してデジタル資産管理ワークフローを効率化する方法
ニューラルネットワークの説明不可能性は、AI の分野では常に「長年の」問題となってきました。しかし、...
科学者たちはすでに宇宙論の分野で大量のデータを処理するためにスーパーコンピュータを使用することに慣れ...
シスコが実施した調査によると、データプライバシーの面で生成AIに欠点があることを理解しているにもかか...
[[344622]] 第61回国際数学オリンピック(IMO)2020の結果が先日発表されました。中国...
コペルニクス気候変動サービスによると、2023年は記録上最も暖かい年となっただけでなく、世界の平均表...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ディープラーニング モデルが大きくなるにつれて、あらゆる種類のハイパーパラメータ調整を行うのは非常に...
今回、彼らは元チェス世界チャンピオンのウラジミール・クラムニクとチームを組み、AI技術にこの古代のボ...
デロイトは最新の「企業における AI の現状」レポートで、AI 実践の成功を特徴付ける共通点と、達成...
私たちの生活に浸透しているすべてのチャットボット、音声アシスタント、予測テキスト、その他の音声/テキ...
インターネットの一員として、私たちは「分散」の雰囲気に浸ることがよくあります。高可用性、高信頼性、高...
ドライバーが毎回信号を直進できるように旅行を計画できたらどうなるでしょうか?これは、特に幸運な状況下...