検出器がミスを犯し、英語を母国語としない人が書いた英語の記事の半分以上がAIによって書かれたと判定された。

検出器がミスを犯し、英語を母国語としない人が書いた英語の記事の半分以上がAIによって書かれたと判定された。

7月13日、スタンフォード大学の研究者らは、英語を母国語としない人が英語の語彙力を十分持っていない場合、英語の記事を書く際にGPT検出器によってAI生成コンテンツと誤認されやすい可能性があることを発見した

この研究はスタンフォード大学の生物医学データサイエンスの助教授であるジェームズ・ゾウ氏が主導し、Patterns誌に発表されたと報じられている。現在のGPT検出器には実は欠陥があり、論文がAIによって書かれたものかどうかを評価するのは難しいことが示されており

▲ 出典:ジャーナル記事

研究者らは、7つの一般的なGPT検出器を使用して、実際の人間が書いた合計179の記事をチェックし、これらの検出器が英語を母国語としない人が書いた記事の半分以上をAI生成として分類したことを発見しました

▲ 出典:ジャーナル記事

IT Homeが論文を調べたところ、研究者らは実験に使用したGPT検出器の名前を明らかにしていないが、研究結果によると、現在のGPT検出器は「TOEFL記事がAIによって書かれたものかどうかを識別する」際に61.3%のエラー率を示している。エラー率が最大97.8%のGPT検出器もあり、すべての検出器は、実際の人間が書いたこれらの記事の内容の19.8%が「間違いなくAIによって生成された」ことに同意している。

▲ 出典:ジャーナル記事

研究者らはさらなる分析を通じて、認識エラーの主な原因は、英語を母国語としない人の言語の多様性と語彙の選択が限られていること、また彼らが習得している英語の語彙が比較的「フォーマル」で、生活の場面ではあまり使われないことから、AIが誤った判断を下す結果になっていることを突き止めた。

▲ 画像出典: Pexels

<<:  生徒のエッセイ採点における新たな傾向: 教師と AI の共同モデル

>>: 

ブログ    
ブログ    

推薦する

ジョン・マカフィーの意見: 人工知能は人類を滅ぼすのか?

2017 年 3 月 9 日、ハッカー アンダーグラウンド テクノロジーの専門家であり作家でもある...

...

GPT-4 の出力がなぜそれほどランダムなのか、深く考えたことはありますか?

今年はAI分野で大規模言語モデル(LLM)が注目され、OpenAIのChatGPTやGPT-4が大人...

古典的な論文を実装するための60行のコード:ポアソンディスクサンプリングを完了するのに0.7秒、Numpyよりも100倍高速

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

音声UIの裏にある魅力

Amazon の Echo および Echo Dot スマート スピーカーの成功により、音声コマンド...

マイクロソフトのGitHubはAIを使ってソフトウェア開発者の心を理解しようとしている

コード共有サービス GitHub は、ソフトウェア開発者向けの人工知能アシスタント「GitHub C...

Dynalang - 言語を使って世界のモデルを学習する新しいAIテクノロジー

翻訳者|朱 仙中レビュー | Chonglou導入この記事は、人工知能に関する最新の研究に関する当社...

北京大学の具現化知能チームは、人間のニーズに合わせてロボットをより効率的にするための需要主導型ナビゲーションを提案した。

ロボットに手伝ってもらいたい場合は、通常、より正確な指示を与える必要がありますが、指示の実際の実装は...

GitHubで3,000以上のいいねを獲得した「機械学習ロードマップ」は、モンスターをアップグレードして倒す方法を教えてくれる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

研究室から生活まで、人工知能はどこまで進化しているのでしょうか?

[[212805]]人工知能の概念は1956年に初めて提唱されました。60年間の浮き沈みを経て、人...

人工知能のインダストリー4.0指標8つ

インダストリー 4.0 における AI イニシアチブの主要な運用指標と主要業績評価指標 (KPI) ...

Keras 3.0 が市場を席巻しています!この大きなアップデートではPyTorchとJAXが統合され、世界中の250万人の開発者が使用しています。

先ほど、Keras 3.0 が正式にリリースされました! 5 か月のパブリック ベータ テストを経て...

...

情報抽出における画期的な進歩! NLP は大規模に実装されようとしているのでしょうか?

AI におけるブレークスルーには、一般的に 3 つの種類があります。学術ランキングで上位を占め、学...