Claude3 が GPT4 に教訓を与えました!オープンAI最強の対戦相手の深夜爆弾、全貌解析付き!

Claude3 が GPT4 に教訓を与えました!オープンAI最強の対戦相手の深夜爆弾、全貌解析付き!

制作:51CTO テクノロジースタック(WeChat ID:blog)

深夜、OpenAI の最大のライバルである Anthropic が、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus の 3 つの新しい SOTA 製品を同時にリリースしました。業界は「Claude 3 は一連の新たな業界ベンチマークをもたらします」と歓声を上げました。

このうち、Opus は叙事詩、Sonnet はソネット、Haiku は俳句、つまり 3 行の短い詩を意味します。

HaikuはAI市場で最も高速かつ最もコスト効率の高いモデルであると報告されています(図9)。チャートやグラフを含む、情報量とデータ量の多い arXiv の研究論文 (約 10,000 トークン) を 3 秒未満で読み取ることができます。

図 8. ほとんどのワークロードにおいて、Sonnet は Claude 2 および Claude 2.1 よりも 2 倍高速で、よりインテリジェントです。知識の検索や販売の自動化など、迅速な対応が必要なタスクに優れています。 Opus は Claude 2 および 2.1 と速度は似ていますが、インテリジェンスのレベルはより高くなっています。

Opus は現在、Anthropic の最もスマートなモデルであり、学部レベルの専門知識 (MMLU)、大学院レベルの専門的推論 (GPQA)、基礎数学 (GSM8K) など、AI システムの最も一般的な評価ベンチマークで他のモデルよりも優れたパフォーマンスを発揮しています。複雑なタスクに対して人間に近いレベルの理解力と流暢さを示し、汎用知能への道を切り開きます。

3 つの Claude 3 モデルはすべて、分析と予測、詳細なコンテンツ作成、コード生成、スペイン語、日本語、フランス語などの英語以外の言語での会話において、機能が向上しました。

さらに、Claude 3 シリーズはほぼ完璧なメモリ機能と非常に長いテキスト ウィンドウを備えており、200K のコンテキスト ウィンドウを提供します。 100万トークン以上の入力も受け付けており、顧客のニーズに応じて段階的に拡張していく予定。

全体的に、Claude3 には 3 つの衝撃的な側面があります。

1. ドメイン専門家によるベンチマーク。テストベンチマークとして金融、医学、哲学の 3 つの専門分野が選ばれ、NVIDIA の研究マネージャーである Jim Fan 氏は「下流のさまざまなアプリケーションが何を期待できるかがわかるように、すべての LLM がこれに従うことが推奨されます」と述べています。

2. 拒否率分析。多くの「無邪気な質問」に対するLLMの過度に慎重な対応は蔓延しており、クロードは安全なAI研究に尽力し、この点に関して努力を重ねてきました。

3. 他の主要モデルに匹敵する複雑な視覚機能。 PDF、フローチャート、プレゼンテーション スライドなど、写真、チャート、グラフ、技術図など、さまざまなビジュアル形式を操作します。

実際の評価はどうですか?
あるネットユーザーが、GPT4 と Claude3 にそれぞれログイン インターフェースのコードを書くように依頼しました。実際の実行テスト結果 (図 13) では、後者の方がアプリ インターフェースの設計において優れていることが示されました。

図1

図2

図3

図4

図5

図6

図7

図8

図9

図10

図11

図12

図13

図14

図15

<<:  シングルテナント AI ファクトリーは最新のデータセンタートレンドでしょうか?

>>: 

ブログ    
ブログ    

推薦する

AIがプライバシーを尊重しながら優れた顧客体験を生み出す方法

ゼブラテクノロジーズグレーターチャイナのテクニカルディレクター、チェン・ニン氏近年の人工知能(AI)...

...

...

グーグル、規制当局の措置を受けてEUでのチャットボット「バード」のリリースを一時停止

グーグルは6月14日、欧州連合(EU)の主要データ規制当局がプライバシーに関する懸念を表明したため、...

...

ITリーダーが避けるべき6つのGenAIの落とし穴

OpenAI が最近発表した ChatGPT のカスタム バージョンにより、あらゆる企業が GenA...

データセンターは大量の電力を消費します。しかしAIはエネルギーを大量に消費する必要はない

世界経済フォーラム(AI が地球を救う 8 つの方法)を含む多くの予測では、人工知能 (AI) が「...

タオバオの推奨シナリオのための強力なツール:複雑な目的を統合し、リアルタイムの規制をサポートする再注文モデル

1. 情報フローシナリオの課題と並べ替えモデルの独自の利点多くの学生は再ランキングに馴染みがないかも...

新しい小売業界における人工知能の応用

インターネットの急速な発展に伴い、伝統的なオフライン小売チャネルは弱体化の兆候を見せ始めており、中国...

ゲイツ氏は人工知能に楽観的だが、グーグルが自動運転車に大きく賭けている理由が理解できない

ビル・ゲイツ氏は、世界中の職場にパーソナルコンピュータシステムとソフトウェアをもたらすことでキャリア...

たくさん学びました!世界で最も遅いソートアルゴリズム!

今日は、世界で最も遅いソートアルゴリズムである Bogo ソートについてお話ししたいと思います。では...

2019 Baidu AI 開発者会議で AI レポートカードが披露される

7月3日、北京で百度AI開発者会議「Baidu Create2019」が開催された。この会議は「産業...

ChatGPT 技術製品の実装: 技術アーキテクチャから実際のアプリケーションまで

導入この共有では、ChatGPTテクノロジー製品の実装についてお話ししたいと思います。技術アーキテク...

AI企業の成人式:自由が996と衝突し、技術的理想が地上戦争と衝突する

戦争の理由はすべて、例外なく一つのこと、つまり生き残ることにつながります。狼の本能がなければ、生き残...

...