9月7日、スタンフォード大学の新たな研究により、人気の生成型人工知能(AI)チャットボット「ChatGPT」の機能が数か月にわたって変動していることが判明した。 スタンフォード大学のチームは、数か月にわたって ChatGPT がさまざまなタスクをどのように処理するかを評価しました。彼らは、ChatGPT の機能が時間の経過とともに一貫性を失っていることを発見しました。現在、ChatGPT には、無料の GPT-3.5 モデルと、よりスマートで高速な有料の GPT-4 バージョンの 2 つのバージョンがあります。 研究者らは3月にGPT-4が97.6%の精度で素数を識別し、数学の問題を効果的に解くことができることを発見した。 3か月後、その精度は2.4パーセントに低下しました。一方、GPT-3.5 は精度が 7.4% から 86.8% に向上し、大幅に改善しました。 研究者たちは、コードの記述と視覚的推論においても同様の変動があることに気づきました。スタンフォード大学のコンピューターサイエンス教授、ジェームズ・ゾウ氏は次のように述べている。「大規模な言語モデルを調整して、一部のタスクでのパフォーマンスを向上させると、他のタスクでのモデルのパフォーマンスに悪影響を与える予期しない結果が多数発生する可能性があります。モデルが質問に答える方法にはあらゆる種類の相互依存性があり、それが私たちが観察しているような動作の低下につながる可能性があります。」 研究者たちは、この結果はChatGPTのパフォーマンスの正確さを真に反映したものではなく、むしろモデルを微調整したことによる意図しない結果を示していると考えています。基本的に、 1 つのタスクを改善するためにモデルの一部を変更すると、他のタスクに影響が出る可能性があります。 ChatGPT がどのように動作するのか誰も知らず、そのコードはオープンソースではないため、なぜそうなるのかを突き止めるのは困難です。 時間が経つにつれて、研究者たちはChatGPTの応答の精度が低下するだけでなく、その理由を説明しなくなることに気づいた。 ChatGPT の動作方法により、そのパフォーマンスを調査して測定することが困難な場合があり、この研究では、ChatGPT のようなツールを駆動する大規模言語モデル (LLM) のパフォーマンスの変化を観察し評価する必要性を強調しています。この研究はarXivで公開されており、査読待ちです。こちらがリンクです。 |
<<: ユネスコは世界初の生成型AI教育ガイドを発行し、各国に関連法規制の策定、教師研修の実施を要請
近年、人工肉は急速に発展していますが、本物の肉と比較すると、味や食感にはまだ明らかな差があります。最...
すべてはウォール・ストリート・ジャーナルが最近発表した米国上場企業のCEOの給与ランキングから始まっ...
大学で何を専攻するかは、慎重に考える必要があります。結局のところ、大学の専攻の選択は私たちの将来の発...
ソフトロボット分野の研究者は、人間にとってより安全に操作できる新世代の機械を生み出すことを望んでおり...
顔認識、音声認識、自動運転などが注目されるようになり、人工知能(AI)と社会や人間の生活の融合が急速...
企業が AI プロジェクトをさらに展開するにつれて、特定の役割がビジネスの成功に不可欠であることがわ...
過去数十年にわたり、チャットボットは進化を続け、私たちの日常生活に欠かせないヘルパーになりました。携...
将来に大きな影響を与える人工知能の進歩について学びましょう。人工知能が最前線に立っており、企業や政府...