GPT-4 が怠惰になる問題の解決に新たな進歩があります。 今朝、ウルトラマンが、新年には GPT-4 の問題が大幅に改善されるはずだとツイートしました。 写真 GPT-4 が怠惰になることについての苦情は数え切れないほどありますが、そのほとんどはコード関連のタスクに関するものです。 完成度が高くないだけでなく、細かく分割されてしまうため、使用時に一つずつコピーする必要があります。 最新バージョンについては、あるブロガーが体験して、小学1年生の子供のためにちょっとした学習ゲームを作ってみたところ、なかなかの効果が得られたと語っていました。 写真 しかし、反対する人もいます。たとえば、このネットユーザーは、ChatGPT の返信の長さは増えているものの、その多くは繰り返しになっており、作業がまだ十分に行われていないことに気づきました。 彼は ChatGPT にテキストを 17 の言語に翻訳するように依頼しましたが、意味不明な内容が大量に表示されただけで、翻訳されませんでした。 写真 個人差を排除するために、一部のネットユーザーがデータセットを使用して新しい ChatGPT をテストしたところ、結果は... 新しいバージョンはさらに怠惰ですか?このネットユーザーは、GitHubでオープンソースの「怠惰なベンチマーク」セットを使用して、0125(1月24日の最新バージョン)と1106(11月23日の前バージョン)のGPT-4モデルをテストし、新しいバージョンが以前よりもさらに悪く、より怠惰になっていることを発見しました。 写真 このテストデータセットにはコード関連のタスクが含まれており、正しい完了率は間接的に「怠惰」の度合いを反映します。完了率が高いほど、「怠惰」が少なくなります。 その結果、コード比較(Unified diff)タスクでは、旧バージョンでは半分以上の 57% を完了できましたが、新バージョンの完了率はわずか 44% で、ほぼ 4 分の 1 減少しました。 写真 直感的に、ChatGPT の「怠惰さ」が悪化していると感じた人もいました。 以前は、たとえ怠け者であっても、少なくとも試してみて、ユーザーが自分で埋められるような大まかな枠組みを提供していました。しかし、今では、彼らはただ諦めて、できないと言います。 写真 ネットユーザーのこの発見に対して、一部の人々は辛辣なコメントを寄せた。
写真 今回、ウルトラマンは、GPT-4 がなぜ遅延するようになったのか、どのような最適化戦略が採用されたのかについて、さらに詳しく説明しませんでした。 「自家製の方法」は怠惰を減らすことができるしかし、以前の研究では、GPT-4の怠惰さは時間と関係している可能性があることが示されており、この結論は、GPT-4が年末の12月に「怠惰」になったという事実と一致しています。 写真 この理論によれば、モデルのパフォーマンスは確かに新年の初めには向上するはずですが、パフォーマンスが向上せずに低下した理由は説明されていないようです。 しかし、ネットユーザーたちは、ChatGPTの慣性をある程度まで軽減できる「家庭療法」もいくつかまとめています。 たとえば、「指がない」と伝えると、断片的なコードではなく、比較的完全なコードを取得できます。 写真 あるいは、ChatGPT に「チップをあげる」と伝えることでも、動作を促すことができます。 「チップ」の金額について調査を行ったところ、10ドルが最も費用対効果が高いことが判明した人もいます。 写真 それで、ChatGPT は良くなったと思いますか、それとも怠惰になったと思いますか? 参考リンク: [2] https://aider.chat/docs/benchmarks-0125.html |
<<: 口を使ってiPhoneで10秒写真編集! UCSB Appleの中国人チームがマルチモーダルMGIEをリリース、オープンソースで誰でもプレイできることを公式発表
[[248715]] [51CTO.com 速訳] re:Invent 2017 カンファレンスで ...
生体認証技術である顔認証は、非接触、非強制、同時性などの特徴から、ますます広く利用され、人々の生活の...
最近、マスク氏の伝記「イーロン・マスク:伝記」が国内外でベストセラーとなった。この本には、マスク氏の...
概要: この記事では、機械学習とディープラーニングの定義と応用についてわかりやすい言葉で紹介するとと...
OpenAI の GPT-3.5 や GPT-4 などのクローズドソース モデルの優位性に挑戦する...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事は、Caiyun Technology のトップ ビッグ データ サイエンティストである Z...
2019 年に注目すべき 5 つのロボット トレンドは次のとおりです。 [[259551]] 1. ...
1. 製造業の発展の現状まず、製造業企業の発展状況について紹介します。 1. 企業経営は直線的な発展...
PCMagによると、7月31日のニュースでは、金曜日の記者との電話会議で、FBIは人工知能プログラム...
論文(継続的に更新):arxiv.org/abs/2310.19852 AI アライメント概要ウェブ...
[[430922]]文中の次の単語を予測するようにトレーニングされた機械学習ベースの言語モデルは、ま...
6月14日、マイクロソフトのBing人工知能チャットボットは、最初にリリースされた際に論争と混乱を...
OpenAI はおそらく歴史上最も困難な AI 著作権訴訟に直面している。原告のニューヨーク・タイ...