AIの文章検出ツールは信頼性が低く、米国憲法は実際にはロボットによって書かれたと考えられている

AIの文章検出ツールは信頼性が低く、米国憲法は実際にはロボットによって書かれたと考えられている

7月16日、一部のネットユーザーは、米国で最も重要な法律文書である米国憲法を、人工知能による執筆を検出するために特別に設計されたツールに入力すると、米国憲法がほぼ間違いなく人工知能によって書かれたという驚くべき結果が得られることを発見した。ジェームズ・マディソン(アメリカ合衆国第4代大統領であり「合衆国憲法の父」)がタイムトラベラーでない限り、これは明らかに不可能である。では、なぜこれらの AI 検出ツールはこのような間違いを犯すのでしょうか?海外メディアArstechnicaは、その理由を明らかにするために複数の専門家とAI検出ツールGPTZeroの開発者にインタビューした。

教育の分野では、AI ライティングが多くの論争を引き起こしています。長い間、教師たちは伝統的な教授法に頼り、あるテーマに対する生徒の習熟度を測る手段としてエッセイを使ってきた。多くの教師は、AI によって生成された文章を検出するために AI ツールに頼ろうとしますが、これまでの証拠はそれらが信頼できないことを示唆しています。 GPTZero、ZeroGPT、OpenAI のテキスト分類器などの AI 検出ツールは、誤検知が発生するため信頼性が低く、記事が大規模言語モデル (LLM) によって生成されたかどうかを判断するために使用することはできません。

GPTZeroに米国憲法の一部が入力されると、その文章は「おそらく完全にAIによって書かれた」と表示された。同様の結果を示す他の AI 検出ツールのスクリーンショットは、過去 6 か月間にソーシャル メディアで何度も話題になっています。実際、聖書の内容を入力すると、同じことが起こります。これらのツールがなぜこのような明らかな間違いを犯すのかを説明するには、まずそれらがどのように機能するかを理解する必要があります。

IT Home によると、さまざまな AI 文章検出器がわずかに異なる検出方法を使用していますが、基本的な原理は似ています。AI モデルを通じて、大量のテキスト (何百万もの文章例を含む) と一連の想定ルール (文章が人間によって生成された可能性が高いか AI によって生成された可能性が高いかを判断するために使用) に基づいてトレーニングされます。

たとえば、GPTZero の本質は、「英語の散文に重点を置いた、人間の文章と AI 生成テキストの両方を含む大規模で多様なコーパス」でトレーニングされたニューラル ネットワークです。次に、システムは「困惑度」や「バースト性」などの特性を使用してテキストを評価し、分類します。

機械学習において、困惑度とは、テキストが AI モデルがトレーニング中に学習した内容からどの程度逸脱しているかを示す尺度です。困惑度を測定する背後にある考え方は、AI モデルが書き込みを行う際に、トレーニング データから得られる最も馴染みのあるコンテンツを自然に選択するというものです。出力がトレーニング データに近いほど、困惑度は低くなります。人間はより混乱を招く書き手ですが、特に法律文書や特定の種類の学術文書で使用される正式なスタイルを模倣する場合は、混乱を少なくして書くこともできます。そして、私たちが使うフレーズの多くは驚くほど一般的なものなのです。

たとえば、「I’d like a cup of _____」というフレーズの次の単語を推測するように求められたとします。ほとんどの人は、空欄に「水」、「コーヒー」、「お茶」のいずれかを入力するでしょう。大量の英語テキストでトレーニングされた言語モデルも同様のことを行いますが、これらのフレーズは英語の文章に頻繁に出現するため、これらの結果のいずれも困惑度は低くなります。

GPTZero が測定するテキストのもう 1 つの特性は「バースト性」です。これは、テキスト内で特定の単語やフレーズが連続して急速に出現する、つまり「バースト」する現象を指します。本質的に、バースト性はテキスト全体にわたる文の長さと構造の変動性を評価します。人間の書き手は動的な文体で書くことが多く、その結果、文章の長さや構造が変化するテキストが作成されますが、AI が生成したテキストはより一貫性があり統一されている傾向があります。ただし、バースト性は AI 生成コンテンツを検出するための確実な指標ではありません。 Perplexity と同様に、例外もあります。人間の書き手は、高度に構造化された一貫したスタイルで書く可能性があり、その結果、バースト性スコアが低くなります。代わりに、AI モデルは、文の長さと構造における人間の多様性をより模倣するようにトレーニングすることができ、それによってバースト性スコアが向上します。実際、AI 言語モデルが改良されるにつれて、AI の文章は人間の文章にますます似てくることが研究でわかっています。

<<:  マスク氏がxAIの目標を設定:汎用人工知能の実現期限は2029年

>>:  大規模言語モデルの新しいレビューが発表されました。51ページの論文では、LLM分野の専門技術について説明しています。

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

工業情報化部:最近の汎用人工知能の発展により、計算能力に対する新たな、より高い要件が提示されている。

デジタル経済時代の新たな生産力として、コンピューティングパワーは質の高い経済社会の発展を支える重要な...

...

MIT とハーバード大学が協力して、ニューラル ネットワークが自身の強みを理解する方法を研究しています。

ニューラルネットワークはますます使用されるようになっています。 [[357551]]医療診断であれ、...

可観測性はAIの成功の重要な要素の一つである

ますます多くの企業が自社のインフラストラクチャやビジネス プロセスに人工知能を統合するにつれて、シス...

あなたの AI は規制に対応できる準備ができていますか?

現在、人工知能 (AI) に関する同様の規制が世界中の複数の地域で施行され始めており、GDPR に関...

グラフのディープラーニングのための 7 つのオープンソース ライブラリ

[51CTO.com クイック翻訳]ディープラーニングの愛好家であれば、強力なディープニューラルネッ...

...

2024年のAI: ビジネスリーダーの対応とチャットボットの改善

Language I/O のプロダクト担当副社長である Chris Jacob が、進化する AI ...

OpenAI CEOがGPT-5の開発中であることを明らかに

11月14日、海外メディアの報道によると、OpenAIはGPT-5の構築を開始した。同社のCEOサム...

大規模言語モデルの効率的なパラメータ微調整 - BitFit/Prefix/Prompt 微調整シリーズ

2018年にGoogleはBERTをリリースしました。リリース後すぐに11のNLPタスクで最先端(S...

ソフトウェア開発プロセスは、路上でのスマートカーの安全な運行を保証するものである。

2021年に入り、自動車の道路事故率を減らし、運転プロセスの快適性を向上させる先進運転支援システム...

「ブラックスワン」の翼の下で:情報戦場におけるAIの光と影

[51CTO.comからのオリジナル記事] 突然の流行に直面して、国民は情報の適時性、透明性、伝達効...

アニメーション + 原理 + コード、トップ 10 の古典的なソート アルゴリズムを解釈する

ソートアルゴリズムは、「データ構造とアルゴリズム」における最も基本的なアルゴリズムの 1 つです。ソ...

人工知能を活用して会社のウェブサイトをより良く作成する方法

ここでは、テクノロジーの進歩に合わせて AI を使用して、より発展し、より強力になる Web サイト...