GPT-4の知能は突然低下した。OpenAIがアーキテクチャを再設計し、コストを削減して効率を高めるためにMOEを使用したことが明らかになった。公式の噂は否定されたが、ネットユーザーはそれを信じなかった。

GPT-4の知能は突然低下した。OpenAIがアーキテクチャを再設計し、コストを削減して効率を高めるためにMOEを使用したことが明らかになった。公式の噂は否定されたが、ネットユーザーはそれを信じなかった。

最近、多くの OpenAI ユーザーから、GPT-4 が愚かになったという報告がありました。

写真

GPT-4 は 5 月以降、より速くコンテンツを生成するようになったと一般的に考えられていますが、コンテンツの品質は著しく低下しています。

OpenAI フォーラムには、2 か月前に同じプロンプトで生成されたコンテンツと比較すると、GPT-4 の機能は最大でも GPT-3.6 になったと述べて、独自に生成したコンテンツを投稿したユーザーもいます。

写真

彼らは皆、毎月支払わなければならない20ドルを残念に思っていると述べました。

写真

しかし、GPT-4 のヘビーユーザーからの苦情を数多く読んだ後、私は突然ため息をつき始めました。

GPT-4 は確かにはるかに先を行っています。

このリードは、他の企業の大規模モデルが数日ごとに更新バージョンをリリースし、できるだけ早く OpenAI に追いつこうと残業するほどのレベルに達しています。

一方、自社はひっそりと「コスト削減と効率アップ」と「逆アップグレード」を進め、大型モデル界における「反崩壊モデル」となった。

パフォーマンス低下の考えられる原因

ユーザーは、GPT-4 のパフォーマンスの低下について合意に達し、GPT-4 の「低下」の理由について議論し始めているようです。

海外メディアの報道によると、言語モデル分野の専門家の中には、OpenAIが大規模モデルのように動作するが実行コストが低い複数の小規模なGPT-4モデルを作成していると推測する人もいる。

Sharon Zhouという専門家によると、OpenAIはGPT-4を構築するためにMixture of Experts(MOE)と呼ばれるフレームワークを使用したとのことです。

それぞれの小規模なエキスパート モデルは、異なるタスクと主題領域でトレーニングされます。

生物学専用のミニ GPT-4 モデルや、物理学、化学などの分野専用のミニ モデルが存在する可能性があります。

GPT-4 ユーザーが質問すると、新しいシステムが判断を下し、プロンプトを 1 つまたは複数の専門家モデルに送信します。

「このアイデアはしばらく前から存在しており、自然な流れだ」と周氏は語った。

周氏はこの状況を、船のさまざまな部品が徐々に交換され、船全体がゆっくりと新しい船になる「テセウスの船」に例えた。

「OpenAIはGPT-4を小型船の艦隊に変えています」と彼女は語った。

私の観点からすると、これは新しいモデルですが、多くの人はこの変更を気にしないかもしれません。 「

今週、GPT-4に関する大量のパラメータ詳細がオンラインで漏洩した後、多くの有力者も、そこに記載されているMoEの部分について独自のコメントを出しました。

アレン人工知能研究所の創設CEO、オーレン・エツィオーニ氏は、外国メディアとのインタビューで次のように述べた。「これらの推測はおおよそ正確だと思うが、確実に確認する方法はない。」

MOE を使用する主な理由は、発電応答の向上と、応答の低コスト化、高速化の 2 つであると説明しました。

エツィオーニ氏は次のように付け加えた。「専門家のモデルを適切に組み合わせれば、両方の長所を活かすことができますが、何事にも言えることですが、通常はコストと品質の間にトレードオフがあります。」

この仮説が真実であれば、OpenAI はコストを削減するために実際にある程度の品質を犠牲にした可能性があります。

もうひとつの証拠は、OpenAI の創設者である Greg Brockman 氏が、自身が参加した研究の中で MOE の技術的道筋について言及したことがあることです。

「専門家混合(MoE)アプローチを使用すると、ネットワークのごく一部だけが一度に使用され、1つの入力に対する出力が計算されます。これにより、計算コストを増やすことなく、より多くのパラメータを追加できます」とブロックマン氏と同僚のリリアン・ウェン氏は論文に記しています。

写真

パフォーマンスの低下は有害なコンテンツの削除に関連している可能性があります

大物たちの技術的な観点からの分析に加え、ネットユーザーたちもさまざまな角度から推測した。

一部のネットユーザーは、OpenAIの比較的保守的な倫理方針がモデルの応答の質を低下させた可能性があると考えている。

公式 OpenAI フォーラムの GPT 関連のサブフォーラムでは、ChatGPT のパフォーマンスが「低下した」と考える人たちの中に、OpenAI が新しいコンテンツ制限を採用する前は、ChatGPT は Prompt の包括性の点で大きく変化していたと述べる人が多かった。

これは、OpenAI が安全上の理由からモデルの出力機能と範囲を制御した可能性があるという見解を間接的に裏付けています。

写真

YCombinatorでの議論の中で、一部のネットユーザーは、OpenAIが安全性の問題に対する懸念を発表し始めてから、モデルのパフォーマンスがどんどん悪化していると指摘した。

GPT-4 が最初にリリースしたレポートにある、TikZ (TikZ はおそらく LaTex でグラフィック要素を作成するための最も複雑で強力なツールです) を使用してユニコーンを描くタスクを例に挙げてみましょう。GPT-4 のその後のリリースでは、レポートの結果を再現することが難しく、パフォーマンスはどんどん悪化しました。

写真

一方、ネットユーザーは、GPT-4 のパフォーマンスが低下した理由は、安全上の理由から人間が一連の矛盾した信念を GPT-4 に植え付けたことにあるのではないかと考えています。

安全上の理由から「悪い考え」を排除するというこのアプローチは、明らかに GPT-4 が物事をより深く理解することを妨げるでしょう。

写真

実際、OpenAI は暴力、人種差別、ヘイトスピーチなどの悪意のある行為を防ぐためにさまざまなフィルターを設定しています。

ただし、これらのフィルターは、小説の執筆、ブレーンストーミング、その他の創造的な作業などの通常の使用を妨げることがよくあります。

これらの変更の影響を測定することは困難ですが、OpenAI の創設者 Sam Altman 氏は、ポリシーの制限がユーザーエクスペリエンスに支障をきたすことを認めました。

写真

さらに、5月29日に行われたHumanloopの共同設立者Raza氏とSam Altman氏との会話の中で、Altman氏はOpenAIは現在GPUの数によって厳しく制限されていると述べた。

写真

ChatGPT のユーザー数が 1 億人を突破し、月間アクティブ回数が 18 億回に達したため、OpenAI のサーバーは頻繁に過負荷状態になりました。

コンピューティング能力の不足により、多くの短期計画が遅れただけでなく、GPT の回答コンテンツの信頼性について顧客から多くの苦情や論争が発生しました。

おそらくその理由は、この世代のネットユーザーにあるのだろうか?

公式技術スポークスマンであるLogan.GPTからの回答では、APIモードではGPT-4の品質は低下していないと述べられました。

写真

写真

写真

ちょうど昨日、OpenAIの製品担当副社長ピーター・ウェリンダー氏がこの噂についてコメントした。

写真

「いいえ、GPT-4 を愚かにしたわけではありません。むしろその逆です。新しいバージョンを以前のバージョンよりも賢くしたのです。」

ネットユーザーからの質問に対して、彼は「使い続けるうちに、以前は気づかなかった問題に気づき始める」と理解している。

つまり、GPT-4 は以前ほど強力ではなかったということであり、現在の GPT-4 こそが真の強みであるということです。

ちょっとベルサイユ宮殿のような雰囲気があります。

予想通り、ネットユーザーはあまり納得せず、ツイートに反応し続けました。

写真

変更していないと言いながら、どのバージョンも優れていると言います。矛盾していませんか?

写真

あなたが述べた仮定は正しくありません。同じ質問に対して、7 月の回答は 6 月の回答よりも悪いのです。

しかし、一部のネットユーザーは、GPT-4 のパフォーマンス低下について異なる説明をしています。

知覚劣化の心理学的観点から見ると、GPT-4 の最初の露出によってもたらされた驚きが消え、それが徐々に私たちの日常生活に浸透していくと、人々はその機能に慣れていくでしょう。

目新しさが薄れてくると、ユーザーの許容度は低下し、技術的欠陥や使用上の欠陥に注意を向けるようになります。

写真

さらに、GPT-4のパフォーマンスが低下したとRedditに投稿したネットユーザーは、最近のアップデートで、その日尋ねた質問は自分の精神状態に影響された可能性があると示唆した。なぜなら、それ以降GPT-4は順調に動作しているからだ。

写真

参考文献:

https://the-decoder.com/openai-comments-on-reports-of-gpt-4-performance-loss/

<<:  xAI Twitterライブ放送:GoogleやOpenAIと直接競合する

>>:  GPT-4 は宇宙のすべてのデータを消費します! OpenAI、データ不足で相次いで訴訟に直面、カリフォルニア大学バークレー校教授が警告

ブログ    
ブログ    
ブログ    

推薦する

AsiaInfoが中国聯通のネットワークAIフォーラムに参加し、自動運転ネットワークの革新研究拠点の設立を開始

9月24日、中国聯通の「ネットワークAIフォーラム」が北京で開催された。フォーラムは5GとAI技術の...

目に見えない戦場の技術である人工知能は、サイバー戦争にどのように応用できるのでしょうか?

[[339414]]英国のジェーンズ・ディフェンスのウェブサイトによると、米国防高等研究計画局のピ...

ICLRスポットライト!清華大学は時系列異常検出アルゴリズムを提案し、5つのSOTA結果を達成した。

現実世界のシステムは、動作中に大量の時系列データを生成します。これらの時系列データを通じてシステム内...

顔認識、今やアニメキャラクターも例外ではない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習アルゴリズムの基礎知識

利用できるアルゴリズムは多数あります。難しいのは、さまざまな種類の方法があり、それらの方法に拡張もあ...

人工知能に関する6つの大きな懸念

2017年、人工知能は最高熱に達し、最高情報責任者、コンサルタント、学者らは、この技術によってビジネ...

人工知能と現代の香水の発展

嗅覚系は、感情と連合学習を司る脳の領域に直接つながっている、体内の唯一の感覚系です。これが、匂いがこ...

アリババのナレッジグラフが初めて公開: 1日あたり数千万のブロックデータ、数十億の完全インテリジェント監査

アリババのナレッジグラフの助けにより、アリババの電子商取引プラットフォームの管理と制御は、以前の「巡...

...

パスワードを解読する方法: 暗号ハッシュアルゴリズムの識別

Q: パスワードのビットシーケンスから暗号化アルゴリズムを識別することは可能ですか? A: 外部ソー...

AIは万能か? AI がまだ直面している課題は何ですか?

[はじめに] 人工知能(特にコンピュータビジョンの分野)に関しては、誰もがこの分野における継続的な...

...

ヤン・ニン氏の新しい論文が突然ネイチャーのサブジャーナルに掲載された: 構造はAIの手の届かないところにある

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

IBMは顔認識技術の開発を中止し、議会に書簡を送った。

IBMは、顔認識技術の影響に対する人々の懸念が高まる中、今後は顔認識関連の技術や機能を開発しないこ...

AIが新たな成長エンジンに。アマゾン ウェブ サービスの技術的手法に耳を傾けてみよう

AI は数年前にテクノロジーの世界で人気を博しましたが、今では何千もの業界で革新と徹底的な応用が行わ...