編集者 | ヤン・ジェン 現地時間1月25日、OpenAIは新モデルをリリースし、GPT-3.5 Turboの価格を下げ、開発者がAPIキーを管理し、APIの使用状況を把握するための新しい方法を導入しました。 新しいモデルには、2 つの新しい埋め込みモデル、更新された GPT-4 Turbo プレビュー モデル、アップグレードされた GPT-3.5 Turbo モデル、および新しいテキスト レビュー モデルが含まれます。 モデル デフォルトでは、OpenAI API に送信されたデータは、OpenAI モデルのトレーニングや改善には使用されません。 1. 2つの新しい埋め込みモデル、価格引き下げOpenAI は、より小型で効率的な text-embedding-3-small モデルと、より大型で強力な text-embedding-3-large モデルという 2 つの新しい埋め込みモデルを導入します。 埋め込みにより、機械学習モデルやその他のアルゴリズムがコンテンツ間の関係を理解し、クラスタリングや検索などのタスクを実行しやすくなります。これらは、ChatGPT や Assistant API での知識検索などのアプリケーションや、多くの検索拡張生成 (RAG) 開発ツールを強化します。 写真 text-embedding-3-small は、2022 年 12 月にリリースされた前世代の text-embedding-ada-002 モデルと比較して大幅なアップグレードが行われ、パフォーマンスが向上した新世代の効率的な埋め込みモデルです。比較すると、多言語検索共通ベンチマーク(MRACL)の平均スコアは31.4%から44.0%に増加し、英語タスク共通ベンチマーク(MTEB)の平均スコアは61.0%から62.3%に増加しました。 価格引き下げの点では、text-embedting-3small は text-embedding-ada-002 と比較して 5 倍の価格引き下げとなり、1,000 トークンあたり 0.0001 ドルから 0.00002 ドルになりました。 text-embedding-3-large は、最大 3072 次元の埋め込みを作成し、より強力なパフォーマンスを備えた、新しい次世代の大規模埋め込みモデルです。 text-embedding-ada-002 と text-embeeding-3-large を比較すると、MIRACL では平均スコアが 31.4% から 54.9% に増加し、MTEB では平均スコアが 61.0% から 64.6% に増加します。 価格に関しては、text-embedding-3-large は 0.00013/1k トークンです。 写真 両方の新しい埋め込みモデルが短縮された埋め込みをネイティブにサポートしていることは注目に値します。 取得用にベクトル ストレージに保存するなど、より大きな埋め込みを使用すると、通常、コンピューティング、メモリ、ストレージの消費量が増えるなど、コストが高くなります。 両方の新しい埋め込みモデルは、開発者が埋め込みの使用時のパフォーマンスとコストを評価できる手法を使用してトレーニングされます。具体的には、開発者は、埋め込みの概念的表現プロパティを失うことなく、dimension API パラメータを渡すことによって、埋め込みを短縮する(つまり、シーケンスの末尾からいくつかの数字を削除する)ことができます。たとえば、MTEB ベンチマークでは、text-embedding-3 の大きな埋め込みをサイズ 256 に短縮しても、サイズ 1536 の縮小されていない text-embedding-ada-002 よりも優れたパフォーマンスが得られます。 これにより、使用方法が非常に柔軟になります。たとえば、長さが 1024 次元以下の埋め込みのみをサポートするベクター データストアを使用する場合、開発者は引き続き最適な埋め込みモデルである text-embedding-3-large を使用し、dimension API パラメータに 1024 の値を指定できます。これにより、埋め込みが 3072 次元から短縮され、精度が多少犠牲になりますが、ベクターは短く小さくなります。 2. 新しいGPT-3.5 Turboモデルと低価格来週、OpenAIは新しいGPT-3.5 Turboモデル、GPT-3.5-Turbo-0125をリリースし、GPT-3.5 Turboの価格を3度目に引き下げます。新しいモデルの入力価格は 50% 引き下げられて 1K トークンあたり 0.0005 ドルとなり、出力価格は 25% 引き下げられて 1K トークンあたり 0.0015 ドルとなります。 このモデルには、要求された形式での応答の精度の向上や、英語以外の関数呼び出しでテキスト エンコードの問題を引き起こすバグの修正など、さまざまな改善も加えられます。 固定の gpt-3.5-turbo モデル エイリアスを使用しているお客様は、そのモデルがリリースされてから 2 週間後に、gpt-3.5-turbo-0613 から gpt-3.5-durbo-0125 に自動的にアップグレードされます。 3. GPT-4 Turboプレビューを更新するGPT-4 API のリリース以来、開発者が更新された知識カットオフ、より大きな 128k コンテキスト ウィンドウ、および低価格を活用したことにより、GPT-4 顧客リクエストの 70% 以上が GPT-4 Turbo に移行しました。 OpenAI は、更新された GPT-4 Turbo プレビュー モデル GPT-4-0125-preview をリリースしました。 このモデルは、コード生成などのタスクを以前のプレビュー モデルよりも徹底的に完了し、モデルがタスクを完了できない「怠惰な」ケースを減らすことを目的としています。 新しいモデルには、英語以外の UTF-8 生成に影響するバグの修正も含まれています。新しい GPT-4 Turbo プレビュー バージョンに自動的にアップグレードしたい人のために、常に最新の GPT4-Turbo プレビュー モデルを指す新しい GPT-1-Turbo-preview モデルもリリースされました。 OpenAIはまた、今後数か月以内にGPT-4 Turboをリリースし、一般提供を開始する予定であると主張している。 4. 監査モデルを更新する無料の Moderation API を使用すると、開発者は潜在的に有害なテキストを識別できます。 OpenAI は、継続的な安全性向上の取り組みの一環として、これまでで最も強力なモデレーション モデルである text-moderation-007 をリリースします。 5. API の使用方法と API キーの管理方法の変更OpenAI は、開発者が API キーの使用をより適切に把握し、制御できるようにするために、2 つのプラットフォーム改善を展開しています。 まず、開発者は API キー ページから API キーに権限を割り当てることができるようになりました。たとえば、キーに読み取り専用アクセスを割り当てて内部追跡パネルを有効にしたり、特定のエンドポイントのみにアクセスできるように制限したりできます。 2 番目に、使用状況ダッシュボードと使用状況エクスポート機能では、トレースを有効にすると API キー レベルでメトリックが公開されるようになりました。これにより、機能、チーム、製品、プロジェクト レベルごとに個別の API キーを使用して、使用状況を簡単に確認できるようになります。 OpenAI は今後数か月以内に、開発者が API の使用状況を確認し、API キーを管理する機能をさらに強化する予定です。 オリジナルリンク: https://openai.com/blog/new-embedding-models-and-api-updates |
<<: GPT-4 はもう怠け者ではありません! OpenAI、5つの大型モデルを最大80%割引で販売
>>: Oracle は、MySQL、Java、OCI、およびすべてのテクノロジー スタックをフルパワーで活用して AI と戦う「AI バーサーカー」に変身します。
強化学習では、報酬と罰のメカニズムを使用してエージェントをトレーニングします。エージェントは正しい行...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
自然言語処理がどのようにビジネス最適化の実現手段へと進化しているかを学びます。 AI ベースのツール...
[[253702]] AI最前線ガイド:アルゴリズムエンジニアの何が特別なのか?このポジションは本...
顔認識技術は、顔の特徴に基づいて人物を識別する高度な認識技術です。非感度、利便性、正確性から広く利用...
人工知能(AI)は1950年代に誕生し、3つの発展の波を経てきました。研究段階から大規模な産業化段階...
人工知能の本質は、機械が人間のように世界を認識し理解できるようにすることです。言語と知識を研究する自...
海外メディアの報道によると、日本は5月31日に、特殊な外観の球形ロボットを月に送る予定だ。この球体ロ...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
迅速なサービスと便利な体験で知られるファーストフード業界は、顧客体験を向上させ、業務効率を改善するた...
人工知能の可能性は計り知れないものの、この技術革命から誰が最も恩恵を受けるのかについては議論が続いて...
【51CTO.comオリジナル記事】 1. AI ビジネス異常検出システムが必要な理由企業は、業務...
【51CTO.comオリジナル記事】機械学習の特許は、2013 年から 2017 年の間に 34% ...