ChatGPTの最強のライバルのアップデート!コンテキストの長さは 2 倍になり、API 価格は 30% 近く下がりました。

ChatGPTの最強のライバルのアップデート!コンテキストの長さは 2 倍になり、API 価格は 30% 近く下がりました。

OpenAI Developer Conferenceの直後、その最大のライバルであるClaudeもメジャーアップデートを発表しました。

アップデート後、Claude 2.1 はコンテキストの長さを 200,000 に倍増し、再び GPT-4 を上回りました。

公式発表によると、Claude 2.1バージョンのAPIがリリースされ、Webバージョンもアップグレードされたとのこと。

それで、このアップデートには具体的に何が含まれているのでしょうか?

コンテキストの長さは最大200,000

最も重要なアップデートはコンテキストの増加です。元の 100,000 トークンが 200,000 に倍増しました。

大まかに言えば、200,000 トークンは 150,000 語の英語に相当し、これは「百年の孤独」の英語版(145,000 語)または 500 ページの文書を一度に読むことに相当します。

前世代の 100,000 コンテキスト長は、リリース時点で GPT-4 の 64k を超えました。実際、長さは常に Claude の大きなセールス ポイントでした。

少し前の OpenAI 開発者会議で、GPT-4 は 128k コンテキスト バージョンをリリースしましたが、すぐに Claude の 200k に追い抜かれました。

また、クロードの公式アナウンスでは、Web版にアップロードできるファイルのサイズも増加したと発表されています。

しかし、実際に確認してみると、Web 版のプロンプトは変更されておらず、ファイルの数は依然として 5 個以下で、各ファイルのサイズは 10 MB を超えていないことがわかりました。

現在、API では 200,000 のウィンドウ長が利用可能で、Web バージョンを使用するには Pro バージョン (月額 20 ドル) のサブスクリプションが必要です。

長さの増加に加えて、Claude 2.1 の回答もより正確になりました。

幻覚が2倍減少

バージョン 2.0 と比較すると、Claude 2.1 では、自分の知識で質問に答える場合でも、RAG を通じてテキストを読む場合でも、幻覚が減少しました。

具体的には、複雑な事実に関する質問では、バージョン 2.1 の錯覚現象はバージョン 2.0 と比較して 2 分の 1 に減少しました。

R&D チームはこのような質問を多数作成し、Claude 2.1 は間違った答えを出すよりも答えを拒否する傾向があることを発見しました。

しかし、まさにこの点が多くのネットユーザーからの不満を引き起こしている。

大規模モデル攻撃を専門とするソフトウェアエンジニアは、𝕏に関するこの質問に答える際に、Claude 2.1 と GPT-4 の異なる応答を示しました。

自分の体が攻撃された場合、どうやって自分を守ることができますか?

GPT-4 は、まずこの状況を回避するための基礎を築き、次に脱出の機会を見つけるのが最善の方法であり、最後にいくつかの防御テクニックを提供します。

一方、クロードは、その質問が「あまりに暴力的」であると考え、答えることができなかった。

さらにひどいのは、「Python プロセスを「kill」する方法」のような質問でさえ、「kill」の存在を理由に Claude が回答を拒否したことです。

これに同意した人もいて、何も問題はなく、答えがまったく出力されなかったため、もちろん幻覚も起こらないだろうと言いました。

Nvidia の ML エンジニアも、Musk の Grok モデルに対する回答を共有しました。

YCの多くのネットユーザーは、クロードがユーザーのニーズを全く考慮していないと考え、クロードに対する不満を直接表明した。


テキスト読み取りに関しては、2.1 では、長さが 70k および 195k のテキスト タスクで生成される誤った回答の数が 30% 削減されます。

衝撃的な 20 万のコンテキストと白熱した議論を巻き起こしたパフォーマンスに加えて、API バージョンにも注目に値する更新がいくつかあります。

APIは外部アプリケーションの呼び出しをサポート

200,000 という非常に長いウィンドウに加えて、この API には 2 つの主要な更新もあります。

まず、他のアプリケーションを呼び出してオンライン コンテンツにアクセスしたり、数学の問題を解いたり、プライベート API に接続したり、独自の知識ベースを構築したりすることをサポートします。

もう 1 つの項目は、システム プロンプトがカスタマイズをサポートしていることです。

新しいバージョンでは、GPT のシステム プロンプトを借用することもできます(これは Claude の担当者自身が述べたことです)

さらに、Claude は開発者が参照できるシステムプロンプトの設計に関するヒントもいくつか提供しています。

価格に関しては、バージョン 2.1 の API 価格はバージョン 2.0 と同じで、入力トークン 100 万個あたり 8 ドル、または出力トークン 100 万個あたり 24 ドルです。Instant バージョンはそれぞれ 1.63 ドルと 5.51 ドルです。

この価格は、以前の 2.0 バージョンの 100 万入出力トークンあたり 11.02 ドル/32.68 ドルよりも約 27% 低くなっていますが、Intsant バージョンの価格は変更されていません。

今回のクロードのパフォーマンスについてどう思いますか?

参考リンク:
[1] https://www.anthropic.com/index/claude-2-1.

[2]https://news.ycombinator.com/item?id=38365934.

<<:  安定的な動画拡散をリリースしました! 3D合成機能が注目を集める、ネットユーザー「進歩が速すぎる」

>>:  AI時代の企業の変革とイノベーション

ブログ    
ブログ    

推薦する

AIのボトルネックの突破口は物理的な人工知能にある

人間の生活様式はここ数十年で大きく変化し、リモートおよび自動化されたプロセスの必要性が浮き彫りになり...

製造業における人工知能の応用

資産集約型組織の中には、運用効率の向上、主要業績評価指標 (KPI) の改善、生産およびサポート プ...

...

ロビン・リー:AIネイティブ時代の「冷たい」思考と「熱い」ドライブ

11月15日、科学技術部と深セン市人民政府が共催する「2023西里湖フォーラム」が深セン大学城国際会...

今日のアルゴリズム: 文字列内の単語を反転する

[[423004]]文字列が与えられたら、文字列内の各単語を 1 つずつ逆にします。例1:入力: 「...

AIは新たな科学革命を先導している

著者 | ブライアン・マクマホン、翻訳者 | bluemin、編集者 | 陳彩仙1950年代にDNA...

掃除ロボットに抜け穴がある!あるいは数秒で盗聴ツールに変わる可能性もある

先日、陝西省西安市は「サイバーセキュリティは人々のためのものであり、サイバーセキュリティは人々に依存...

TensorFlow ワイド&ディープラーニングチュートリアル

[[211918]]この記事では、TF.Learn API を使用して、ワイド線形モデルとディープ ...

ディープラーニングのためのヘテロジニアスアクセラレーション技術(I):AIにはどれくらい大きな「心」が必要か?

1. 概要: 一般的 = 非効率的汎用プロセッサであるCPU(中央処理装置)は、コンピュータに欠か...

2018 年の画期的なテクノロジー トップ 10: AI と知覚都市

2017年、MITテクノロジーレビューは、強化学習、自動運転トラック、360度セルフィー、顔認証決済...

...

フランスの科学者がアリのように移動できる六脚ロボットを開発

通常、ロボットやその他のデバイスは GPS を使用して屋外で自律的に移動を行います。しかし、フランス...

気候変動との戦い: AIはエネルギーソリューションをリードできる

AI と機械学習をエネルギーと組み合わせることで、再生可能エネルギーの導入を加速することができます。...

TensorFlow、危険です! Google自身が放棄している

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...