コストを 95% 削減した ChatGPT の代替品を作成しましょう! OpenAIのハードコアアップデートが来月リリースされ、ビジュアルAPIが登場

コストを 95% 削減した ChatGPT の代替品を作成しましょう! OpenAIのハードコアアップデートが来月リリースされ、ビジュアルAPIが登場

世界中の開発者は長い間、OpenAI モデルの価格に悩まされてきました。

ロイター通信は、11月6日に開催される最初の開発者会議で、OpenAIが毎年恒例の大規模なアップデートを発表すると報じた。

開発ツールにメモリ ストレージ機能を追加すると、API コストを 95% 大幅に削減できます。

つまり、開発者が待ち望んでいた朗報がついに到来したのです。今後は、GPT モデルを使用して、より低コストかつ高速にアプリケーションを構築できるようになります。

さらに、OpenAI は「視覚」機能が強化された新しい開発ツールのリリースも計画しています。

このようにして、開発者は「画像を分析」および「画像を記述」するためのより強力なアプリケーションを構築できます。

これらの新機能の公開は、最終的には、大規模モデルを活用した AI エージェントの構築という共通の目標を示しています。

OpenAIの動きは、ユーザー間の市場を開拓するだけでなく、人気のある開発者プラットフォームを提供する企業になるという、サム・アルトマンのビジョンに沿って一歩一歩進んでいます。

OpenAIが価格を下げた

昨年 11 月、ChatGPT は突如として登場し、世界中の何億人ものユーザーを魅了し、消費者向けアプリケーション ユーザーの成長において画期的な出来事となりました。

ChatGPTはWeb版に加えて、iOS版とAndroid版もリリースしました。

このような客観的なダウンロード量は OpenAI にいくらかの利益をもたらすでしょう。社内幹部は、今年の売上高が2億ドル、24年後には10億ドルになると予想している。

ChatGPT は既に消費者の間で優位性を確立していることがわかりますが、開発界では、開発者は OpenAI テクノロジーに基づくビジネスを構築する上で多くの課題に直面しています。

アルトマンCEOの見解では、OpenAIを他の企業がアプリケーションを構築する上で不可欠な要素にすることが同社の戦略目標の1つである。

彼は開発者たちと会い、OpenAI モデルに基づいた新しいエコシステムを構築したいという希望を熱心に表明しました。

現在、GPTモデルの機能は、アメリカ版「Ele.me」DoorDash、ライティングアシスタントJasperなど、数え切れないほどのアプリケーションに統合されています。

しかし、これではまだ十分ではありません。

6月、AI開発プラットフォームHumanloopのCEOサム・アルトマン氏はインタビューの中で、同社の将来の製品ロードマップを明らかにした。

言及されているポイントの 1 つは「ステートフル API」です。現在、ほとんどのトークンは上記の送信で無駄になっていますが、将来的には会話履歴を記憶できる API バージョンが登場する予定です。

これは、「メモリストレージ」を追加するという考えと一致します。この機能を追加すると、いくつかの理由によりコストを最適化できます。

- 新しいキャッシュ機能は、以前の会話履歴を埋め込みベクトルに変換して保存できる LangChain の Memory Chain の原理に似ています。新しいセッション コンテンツは、コンテキスト全体を再入力せずに、増分タグでのみ処理する必要があります。

- 事前に設定された役割や機能を再入力する必要はなく、類似性検索を実行するだけです。

- モデル計算中、CUDA グラフィックスでは、過去のチャット記録に基づいて全体を再度参照する必要はなく、増分のみを表示する必要があります。

つまり、これによりトークンの数が大幅に最適化されます。

いわゆる「メモリ API」の計画的なリリースにより、モデルにクエリの会話履歴を記憶させることで、アプリケーションの作成コストが削減されます。

これにより、開発者が支払う必要のある API 料金が大幅に削減される可能性があります。

OpenAI の公式ウェブサイトの価格設定によると、入力と出力の長さと複雑さに応じて、現在、GPT-4 で 1 ページのドキュメントを処理するのに 10 セントかかる場合があります。

もう 1 つのアップデートは、開発者が画像を分析できるソフトウェアを構築できるようにするビジョン API です。

これは、OpenAI がマルチモーダル機能を継続的に進化させるための重要なステップでもあり、将来的にはオーディオとビデオの機能が確実に追加されるでしょう。

開発者を捕まえろ、彼らはそれをやっている

OpenAI は、より多くの開発者を引き付けるために多大な努力を払ってきました。

同社は昨年、開発者とOpenAIの関係構築のため、初のエンジニアであるローガン・キルパトリック氏を採用した。

開発者にとって有益なツールやコンテンツを頻繁に更新しています。

UI を微調整します。エンドツーエンドのジョブ作成が UI でサポートされるようになり、コードなしでジョブを起動できるようになりました。

また、OpenAI は OpenAI Python SDK のバージョン 1.0 をリリースする予定です。

API 使用状況ダッシュボードのアップデートをリリースしました。これにより、どのモデルが使用を促進しているかがより明確になり、全体的な信頼性が向上するはずです。

さらに、OpenAI はモデルの適応やユーザー インターフェイスなど、開発者向けに多くの最適化を行っていることがわかります。

これらすべては、OpenAI のモデルを使用するために料金を支払う開発者を増やすためのものです。

PitchBookによると、AIスタートアップ企業は今年200億ドル以上の投資を受けた。

これらのスタートアップの多くは OpenAI が提供するテクノロジーに依存していますが、Llama のようなオープンソース ソリューションを採用するなど、使用するモデルの多様化にも取り組んでいます。これはまた、OpenAI が Google などの資金力のある競合他社と差別化する必要があることも意味します。

ロイター通信によると、開発者を満足させることは常にOpenAIの重点事項だった。

しかし、ChatGPT が消費者の間で大成功を収めたにもかかわらず、OpenAI は他の企業や開発者を獲得するまでにそれほど順調な道のりを歩んできたわけではありません。

たとえば、大いに期待されていた ChatGPT プラグイン システムは、当初は大きな反響を呼びましたが、その後、ユーザーや開発者の間で関心が急激に低下しました。

サム・アルトマンは後に、このプラグインが期待通りに市場で認知されなかったことを認めた。

価格表

GPT-4

GPT-3.5 ターボ

モデルの微調整

<<:  東大大学の中国人博士が「心の理論」を使ってテキサスホールデムをプレイすることを GPT-4 に教えました。従来のアルゴリズムを上回り、人間の初心者を圧倒する

>>:  Nvidia テルアビブ AI サミットが中止に!黄氏の社内メールが明らかに:Nvidiaの従業員も誘拐された

ブログ    
ブログ    

推薦する

...

技術革新により、AI人材が全国各地で活躍できるようになった

人力の60倍の速さで作業する送電線検査画像「認識者」、ベテラン並みの監視ビデオ「品質検査員」、さまざ...

人工知能技術は交通にどのように応用できるのでしょうか?

都市交通の分野では、AI信号制御、インテリジェントな街路交通監視、スマートバス停、スマート高速道路な...

ゼロから: Python で決定木アルゴリズムを実装する

決定木アルゴリズムは、非常に人気のある強力な予測方法です。初心者だけでなく専門家にも簡単に理解できる...

...

ジャック・マー氏:中国のAIは必ず米国のAIを上回る。ゲイツ氏は米国がボスだと反論した。

周知のとおり、AI はテクノロジー業界の次のトレンドとなっており、このトレンドは世界規模です。そこで...

人工知能の進化:過去、現在、そして未来

近年、人工知能はロボットが人間のように考え、行動することを可能にする強力なツールへと発展しました。さ...

75歳のヒントン氏が再び警告:AIが人間を支配するかもしれない!

10月9日、ヒントン氏は「60 Minutes」のインタビューを受け、人工知能が人間を支配するかも...

Megvii、AIイノベーションを加速させるため7億5000万ドルのシリーズD資金調達を完了

北京Megviiテクノロジー株式会社(以下、「Megvii」)は、シリーズDの株式資金調達の第2フェ...

ドイツの中小企業の35%以上がすでに人工知能技術を活用

序文ドイツ連邦政府は2018年に「ドイツ人工知能開発戦略」を発表し、人工知能分野におけるドイツの研究...

...

人工知能の時代が到来した今、子どもたちはどんな仕事に就くことができるのでしょうか?

昨年11月には世界インターネット会議が開催され、その期間中、人工知能が私たちの生活にどのような変化を...

OpenAIがヴィンセントのビデオモデル「Sora」をリリース。一般人がその恩恵を最大化するにはどうすればいいか?

2022年11月30日のChatGPTのリリース以来、OpenAIが新しい機能をリリースするたびに...

Metaは、パラメータを積み重ねたり、トレーニング時間に依存したりすることなくViTトレーニングプロセスを加速し、スループットを4倍に増加させます。

現在、ビジュアルトランスフォーマー(ViT)モデルは、画像分類、オブジェクト検出、セグメンテーション...

額をタップして入力できる。Googleエンジニアの「帽子型キーボード」は数え切れないほどのファンを魅了。自分で作ることもできる

キーボードと帽子を組み合わせたらどうなるでしょうか?冗談はさておき、Google 日本支社のエンジニ...