最近、GPT-3が人気になってきました!インターネット上で GPT-3 のさまざまなデモをご覧になったことがあると思います。 OpenAI によって作成されたこの大規模な機械学習モデルは、独自の論文を書くだけでなく、詩を作曲したり、独自のコードを書いたりすることもできます。 GPT-3 の威力を見てみましょう。まず、質問応答タスクにおける GPT3 のパフォーマンスを見てみましょう。 あなたの質問が素晴らしい頭の体操であろうと、高度に論理的な数学の問題であろうと、それは流暢に答えることができます。 開発者の Sharif Shameem 氏は、ビデオに示されているように、必要なレイアウトを入力するだけで JSX コードを生成するジェネレーターを GPT-3 を使用して作成しました。 また、誰かが Google スプレッドシートで新しい GPT3 関数を開発しました。この関数は、簡単な数学演算に加えて、米国の各州の人口と建国年を自動的に見つけることができます。 さらに、Twitter アカウントも見つけることができます: 残念ながら、GPT-3 を試したい場合は、まず試用ライセンスを取得する必要がありますが、このモデルによって作成されるアプリケーションは無限にあるようです。これを通じて、平易な英語で SQL データベースをクエリしたり、コードに自動的に注釈を付けたり、コードを自動的に生成したり、人気のある記事のタイトルを書いたり、さらには人気のある記事を書くのを手伝ったりすることができます。 GPT-3とは何ですか?GPT-3 はニューラル ネットワークを活用した言語モデルです。ほとんどの言語モデルと同様に、GPT-3 はラベルなしのテキスト データセット (トレーニング データには Common Crawl と Wikipedia が含まれます) で広範囲にトレーニングされます。テキストから単語やフレーズがランダムに削除され、モデルは周囲の単語のみをコンテキストとして使用して単語やフレーズを埋めることを学習する必要があります。これは、強力で一般化可能なモデルを生成する単純なトレーニング タスクです。 GPT-3 モデル アーキテクチャ自体は、単方向トランスフォーマー言語モデルに基づいています。このアーキテクチャは 2 ~ 3 年前に人気になりました。人気の NLP モデル BERT と GPT-3 の前身である GPT-2 はどちらもトランスフォーマー上に構築されています。アーキテクチャの観点から見ると、GPT-3 は実はあまり目新しいものではありません。 GPT-3 が人気の理由は、モデルサイズが 1,750 億にまで増加し、45 TB のデータを使用してトレーニングされているため、これまでに作成された最大の言語モデルとなっていることです。巨大なパラメータモデルのおかげで、他のモデルではできない多くのことを実現できます。前述のように、翻訳者、作家、詩人、プログラマーなどにすることができます。 GPT-3 の 1750 億のモデルパラメータが少し抽象的だと思うなら、例を挙げて理解してもらえるはずです。
2位のMicrosoft Turing NLPのデータパラメータでさえ、GPT-3と同じレベルではありません。 GPT-3 論文の著者は 31 名で、論文は 72 ページにも及ぶことは特筆に値します。ネットユーザーからは、「論文のページ数を競い合うのは PTM の仕事なのか?」という声が上がっています。 いつものように、GPT-3 はすぐに GitHub プロジェクト ページをリリースしました。そこではさまざまな興味深いデモを見つけることができ、最後に Github アドレス: https://github.com/openai/gpt-3 も見つかります。 |
<<: ロボット犬をDIYするにはどれくらいの費用がかかりますか?価格は900ドルと安く、スタンフォード大学が開発し、コードはオープンソースです
>>: Appleは10年間で28社のAI企業を売却。そのAI戦略は世間の注目を集めることだ!
[[197761]]序文前回の記事「機械学習アルゴリズムの実践: 決定木」では、決定木の実装について...
2023 年は生成 AI テクノロジーが爆発的に普及した年であり、ChatGPT などのツールが研究...
AI がより高度化し、普及するにつれて、多くの企業が最高 AI 責任者 (CAIO) を任命するかど...
2020年、カリフォルニア大学バークレー校、Google、カリフォルニア大学サンディエゴ校の研究者...
[51CTO.com クイック翻訳] 変化は常に起こっており、将来の変化は予測可能です。保険市場は大...
北京Megviiテクノロジー株式会社(以下、「Megvii」)は、シリーズDの株式資金調達の第2フェ...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
海外メディアの報道によると、デザインソフトウェアプロバイダーのAdobeは最近、インドの生成AIスタ...
[[258735]] 3月3日、毎年恒例の全国「両会」が正式に始まりました。「両会」シーズンが始ま...
年を追うごとに、機械学習用のライブラリはより高速かつ使いやすくなっています。 Python は長い間...
今日、ビッグデータ アプリケーションがビジネスのあらゆる側面で急増しているため、IT チームは膨大な...