OpenAI は本日、大規模言語モデル API (GPT-4 および gpt-3.5-turbo を含む) のメジャーアップデートを発表しました。これには、新しい関数呼び出し機能、使用コストの削減、gpt-3.5-turbo モデルの 16,000 トークンバージョンが含まれます。 大規模言語モデル(LLM)は、自然言語を処理できる人工知能技術です。その「コンテキストウィンドウ」は、入力内容やチャットボットの会話内容を保存できる短期メモリに相当します。コンテキスト ウィンドウのサイズを増やすことは言語モデルにおける技術的な競争となっており、Anthropic は最近、Claude 言語モデルが 75,000 トークンのコンテキスト ウィンドウ オプションを提供するようになったと発表しました。さらに、OpenAIはGPT-4の32,000トークンバージョンも開発していますが、まだ一般公開されていません。 OpenAI は、最大 16,000 トークンの長さの入力を処理できる「gpt-3.5-turbo-16k」という、gpt-3.5-turbo の新しい 16,000 コンテキスト ウィンドウ バージョンをリリースしました。つまり、一度に約 20 ページのテキストを処理できるということです。これは、モデルでより大きなテキスト ブロックを処理および生成する必要がある開発者にとって大きな改善点です。 この変更に加えて、OpenAI は少なくとも 4 つの主要な新機能を挙げています。
関数呼び出し機能により、開発者は外部ツールを呼び出したり、自然言語を外部 API 呼び出しに変換したり、データベースクエリを実行したりできるチャットボットを簡単に構築できます。たとえば、「次の金曜日にコーヒーを飲みたいかどうかを確認するために Anya にメールを送信する」のような入力を、「send_email (to: string, body: string)」のような関数呼び出しに変換できます。特に、この機能により、API ユーザーはこれまで実現が困難だった JSON 形式の出力を簡単に生成できるようになります。 「より制御可能」とは、LLM を希望どおりに動作させる方法に関する専門用語ですが、OpenAI は、新しい「gpt-3.5-turbo-0613」モデルには、「システム メッセージを介してより確実に制御」できる機能が含まれると述べています。システム メッセージは、API に入力される特別な種類の命令であり、「あなたはグレムリンです。あなたはミルクシェイクについてしか話しません」など、モデルに動作方法を指示します。 機能の向上に加えて、OpenAI はかなりのコスト削減も実現しました。特に、人気の gpt-3.5-turbo モデルのトークン価格が 25% 引き下げられました。つまり、開発者はこのモデルを 1,000 トークンあたり約 0.0015 ドル、1,000 トークンあたり約 0.002 ドルで使用できるようになり、これは 1 ドルあたり約 700 ページのテキストを処理するのに相当します。 gpt-3.5-turbo-16k モデルの価格は、1,000 トークンあたり 0.003 ドル、1,000 トークンあたり 0.004 ドルです。 さらに、IT Homeは、OpenAIが「text-embedding-ada-002」埋め込みモデルの価格も75%引き下げたことにも気づいた。埋め込みモデルは、コンピューターが単語や概念を理解し、自然言語を機械が理解できるデジタル言語に変換できるようにする技術であり、テキストの検索や関連コンテンツの推奨などのタスクにとって重要です。 OpenAI はモデルを常に更新しているため、古いモデルが永久に残ることはありません。同社は本日、gpt-3.5-turbo-0301やgpt-4-0314など、一部の旧バージョンモデルの廃止を開始したことも発表した。同社によれば、開発者は9月13日までこれらのモデルを引き続き使用できるが、それ以降は古いモデルは利用できなくなるという。 OpenAI の GPT-4 API はまだ待機リストにあり、完全には公開されていないことに注意する必要があります。 |
<<: マイクロソフトはOpenAIの警告を無視し、未熟なBingチャットサービスを開始したと報じられている。
>>: OpenAIはAPIのアップグレードと価格引き下げでメジャーアップデートを実施
「多体問題」(N 体問題とも呼ばれる)は単純に見えますが、実際には今日の数学で解決するのが非常に難し...
先ほど、DNS 負荷分散の概念をいくつか紹介しました。次に、この負荷分散テクノロジに関連するアルゴリ...
テキスト生成画像に関しては、Wenxin ERNIE-ViLG はユーザーが入力したテキストに基づい...
スケンダーさん、あなたの発明の本質から始めましょう。 SIZEアルゴリズム開発とは何ですか?このアル...
[[186928]]ビッグデータ、分析、モノのインターネット、クラウドテクノロジー...近年、これら...
みなさんこんにちは。JavaプログラマーのChenです。最近、Open AIが再び人気を集めており、...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
多数の法執行機関と契約している顔認識会社が、ハッキングされ顧客リスト全体が盗まれたと報告した。デイリ...
名前にちなんでFacebookとしても知られるMateは、顔認識システムを無効化し、10億人以上の個...
機械学習により、人間が設計した固定されたプログラムでは解決が難しい問題を解決できるようになります。科...
この記事では、アルゴリズムの文脈における「二次」や「n log(n)」などの用語の意味について説明し...
[[319624]]最近、スタンフォード大学の研究者らは、脳をシリコンベースの技術に直接接続できる新...
1. 要件の説明2 つの文字列を入力し、2 つの文字列の最長共通部分文字列を取得するプログラムを作成...