調査によると、ChatGPTはプログラミングの質問に答える際に50%以上のエラー率があることが判明

調査によると、ChatGPTはプログラミングの質問に答える際に50%以上のエラー率があることが判明

米パデュー大学の調査によると、OpenAIが開発した人工知能チャットボット「ChatGPT」は、ソフトウェアプログラミングの質問に答える際に誤り率が半分以上あり、質問者の3分の1を騙す可能性があることが判明した。

研究チームは、Stack Overflow ウェブサイト上の 517 件の質問に対する ChatGPT の回答を分析し、その正確性、一貫性、包括性、簡潔性を評価しました。また、回答の言語と感情の分析を実施し、12人のボランティア参加者を対象にアンケート調査を実施しました。調査報告書では、 ChatGPT の回答の言語スタイルは良好であったものの、回答の 52% が誤りであり、77% が長すぎると結論付けられました。参加者は、明らかな場合のみ、回答の誤りを認識することができました。そうしないと、ChatGPT のフレンドリーで権威があり、詳細な言語スタイルに惑わされてしまいます。

Stack Overflow は、プログラマー向けの質疑応答サービスを提供する Web サイトであり、開発者がコード スニペットを入手して問題を解決するための重要な情報源と考えられています。しかし、近年、同サイトはトラフィックの減少、コンテンツの質の低下、ユーザーの信頼の低下といった問題にも直面している。 SimilarWebの4月のレポートによると、同サイトの月間トラフィックは2022年1月以降6%減少し、3月には13.9%減少しており、その減少の理由の1つはChatGPTだった可能性がある。 Stack OverflowはSimilarWebの評価に異議を唱え、そのトラフィックは検索アルゴリズムとChatGPTへの関心の高まりの影響を受けたと述べた。

OpenAIは、自社のChatGPTウェブサイトで、同社のソフトウェアが「人物、場所、事実について不正確な情報を生成する可能性がある」と認めた。記事執筆時点で、同社はまだパデュー大学の研究に反応していない。

<<:  もう終わりですか? LK-99は単なる強磁性体であり、超伝導体ではない。北京大学などの研究論文が発表された。

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

市場規模は22億を超えるか?教育用ロボットは急速に発展している

教育は知識を伝える社会的活動として、国の人材育成システムや経済発展に影響を与え、国家の繁栄を促進しま...

まだ AI と機械学習を混同していませんか?まず、AIの6つの注目分野を見てみましょう。

AI の初心者向けに、AI の注目すべき 6 つの分野と、その概要、重要性、現在の使用方法、研究し...

ディープラーニングと通常の機械学習の違いは何ですか?

[[212077]]本質的に、ディープラーニングは、ディープニューラルネットワーク構造(多くの隠れ...

...

私の国における人工知能の発展に対する最大の圧力は、基礎理論と独自のアルゴリズムです。

業界では、人工知能はこれまで2世代を経てきたと一般的に考えられています。第一世代の人工知能は知識主導...

脳の治癒、人間と機械の共生、マスク氏は「脳コンピューターインターフェース」を擁護

[[316164]]天才イーロン・マスクについて語るとき、多くの人はまずテスラを思い浮かべるでしょう...

...

Baiduの新しいAIインフラがCIFTISでデビューし、CTOの王海峰が業界インテリジェンスの推進におけるBaiduの成果を紹介

AIはあらゆる分野に新たな活力を吹き込み、AIの新しいインフラはサービス貿易部門を含む社会経済の発展...

アルパカたちはどこまで来たのでしょうか?研究によると、最高のものはGPT-4のパフォーマンスの68%を達成できる。

大規模言語モデルは最近、かつてないほどの注目を集めています。急速に変化する環境において、オープンソー...

...

人工知能とモノのインターネット:完璧な組み合わせ

IoT デバイスのデータ生成の基本的な能力と、さまざまなデバイスのインテリジェントな動作をシミュレー...

...

機械学習: 教師なし学習: 9 つのクラスタリング アルゴリズム

今日は、機械学習の教師なし学習における一般的なクラスタリング手法をいくつか紹介したいと思います。教師...

初のオープンソースMoE大型モデル公開! 7Bx8の専門家、GPT-4に最も近いエピソード

「今夜の予定は全部キャンセル!」多くのAI開発者は寝ないことを決意しました。最初のオープンソース M...