AIの文章検出ツールは信頼性が低く、米国憲法は実際にはロボットによって書かれたと考えられている

AIの文章検出ツールは信頼性が低く、米国憲法は実際にはロボットによって書かれたと考えられている

7月16日、一部のネットユーザーは、米国で最も重要な法律文書である米国憲法を、人工知能による執筆を検出するために特別に設計されたツールに入力すると、米国憲法がほぼ間違いなく人工知能によって書かれたという驚くべき結果が得られることを発見した。ジェームズ・マディソン(アメリカ合衆国第4代大統領であり「合衆国憲法の父」)がタイムトラベラーでない限り、これは明らかに不可能である。では、なぜこれらの AI 検出ツールはこのような間違いを犯すのでしょうか?海外メディアArstechnicaは、その理由を明らかにするために複数の専門家とAI検出ツールGPTZeroの開発者にインタビューした。

教育の分野では、AI ライティングが多くの論争を引き起こしています。長い間、教師たちは伝統的な教授法に頼り、あるテーマに対する生徒の習熟度を測る手段としてエッセイを使ってきた。多くの教師は、AI によって生成された文章を検出するために AI ツールに頼ろうとしますが、これまでの証拠はそれらが信頼できないことを示唆しています。 GPTZero、ZeroGPT、OpenAI のテキスト分類器などの AI 検出ツールは、誤検知が発生するため信頼性が低く、記事が大規模言語モデル (LLM) によって生成されたかどうかを判断するために使用することはできません。

GPTZeroに米国憲法の一部が入力されると、その文章は「おそらく完全にAIによって書かれた」と表示された。同様の結果を示す他の AI 検出ツールのスクリーンショットは、過去 6 か月間にソーシャル メディアで何度も話題になっています。実際、聖書の内容を入力すると、同じことが起こります。これらのツールがなぜこのような明らかな間違いを犯すのかを説明するには、まずそれらがどのように機能するかを理解する必要があります。

IT Home によると、さまざまな AI 文章検出器がわずかに異なる検出方法を使用していますが、基本的な原理は似ています。AI モデルを通じて、大量のテキスト (何百万もの文章例を含む) と一連の想定ルール (文章が人間によって生成された可能性が高いか AI によって生成された可能性が高いかを判断するために使用) に基づいてトレーニングされます。

たとえば、GPTZero の本質は、「英語の散文に重点を置いた、人間の文章と AI 生成テキストの両方を含む大規模で多様なコーパス」でトレーニングされたニューラル ネットワークです。次に、システムは「困惑度」や「バースト性」などの特性を使用してテキストを評価し、分類します。

機械学習において、困惑度とは、テキストが AI モデルがトレーニング中に学習した内容からどの程度逸脱しているかを示す尺度です。困惑度を測定する背後にある考え方は、AI モデルが書き込みを行う際に、トレーニング データから得られる最も馴染みのあるコンテンツを自然に選択するというものです。出力がトレーニング データに近いほど、困惑度は低くなります。人間はより混乱を招く書き手ですが、特に法律文書や特定の種類の学術文書で使用される正式なスタイルを模倣する場合は、混乱を少なくして書くこともできます。そして、私たちが使うフレーズの多くは驚くほど一般的なものなのです。

たとえば、「I’d like a cup of _____」というフレーズの次の単語を推測するように求められたとします。ほとんどの人は、空欄に「水」、「コーヒー」、「お茶」のいずれかを入力するでしょう。大量の英語テキストでトレーニングされた言語モデルも同様のことを行いますが、これらのフレーズは英語の文章に頻繁に出現するため、これらの結果のいずれも困惑度は低くなります。

GPTZero が測定するテキストのもう 1 つの特性は「バースト性」です。これは、テキスト内で特定の単語やフレーズが連続して急速に出現する、つまり「バースト」する現象を指します。本質的に、バースト性はテキスト全体にわたる文の長さと構造の変動性を評価します。人間の書き手は動的な文体で書くことが多く、その結果、文章の長さや構造が変化するテキストが作成されますが、AI が生成したテキストはより一貫性があり統一されている傾向があります。ただし、バースト性は AI 生成コンテンツを検出するための確実な指標ではありません。 Perplexity と同様に、例外もあります。人間の書き手は、高度に構造化された一貫したスタイルで書く可能性があり、その結果、バースト性スコアが低くなります。代わりに、AI モデルは、文の長さと構造における人間の多様性をより模倣するようにトレーニングすることができ、それによってバースト性スコアが向上します。実際、AI 言語モデルが改良されるにつれて、AI の文章は人間の文章にますます似てくることが研究でわかっています。

<<:  マスク氏がxAIの目標を設定:汎用人工知能の実現期限は2029年

>>:  大規模言語モデルの新しいレビューが発表されました。51ページの論文では、LLM分野の専門技術について説明しています。

ブログ    

推薦する

単純なアルゴリズム問題からO(1)が何を意味するかを説明する

[[396914]]今日、クラスメートがファングループでアルゴリズムに関する質問をしました。対話のト...

...

2020 年の生体認証市場 - パンデミックによる業界の動向の変化

生体認証技術市場は、COVID-19の流行により大きな影響を受けるでしょう。 接触のみの生体認証を採...

2021 年の人工知能の最新動向を示す 15 のグラフ

2021年AIインデックスレポートは、スタンフォード大学の人間中心AI研究所と、ハーバード大学、経済...

タイムトラベルが現実になる?人間はワームホールを通じて「時空の端」に到達できるかもしれないし、量子AIは機械に意識を与えるだろう

[[436484]]タイムトラベルは本当に可能なのでしょうか?新たな研究によれば、今から数千年後には...

人工知能の時代、主役となるのは誰でしょうか?

[[382357]] 1990年代、米国はコンピュータ産業の早期発展の機会をいち早く捉え、デジタル...

軍事用AIは普及するだろうか?公共の安全を重視すべきか、住民のプライバシーを重視すべきか?

[[227907]]ここ数カ月、軍事用AIと能動攻撃兵器の問題が話題になっており、多くのAI研究者...

色を選ぶと、このAIシステムがロゴをデザインします

LoGANがデザインしたいくつかのロゴ画像提供: マーストリヒト大学[51CTO.com クイック翻...

生成AIにおけるデータ制限を克服する方法

生成 AI は、トレーニングに使用されるデータに大きく依存します。ただし、データの制限により、望まし...

自律的で制御可能なAIフレームワークは信頼性が高いが、すべてのAIコンピューティングセンターが同等というわけではない

現在、人工知能の発展レベルは、都市の競争力と将来の発展の可能性を測る新たな指標となっている。その結果...

人工知能が習得する必要がある知識ポイントは何ですか?どんな本を読めばいいでしょうか?非常に詳細なチュートリアル

[[243197]]人工知能とは何ですか?人工知能の定義は、「人工知能」と「知能」の 2 つの部分に...

製造および自動化アプリケーション向けの人工知能技術の選び方

人工知能 (AI) の定義は、産業オートメーションにおける生産と、研究室外の日常生活では大きく異なり...

...

中国の自動運転はアメリカの自動運転と比べてどう劣っているのか?

アリゾナ州フェニックスからテキサス州エルパソまでの距離は約 690 キロメートルで、地図に示されてい...

AI as a Service: AIとクラウドコンピューティングが出会うとき

競争で優位に立つために、ますます多くの企業が自社のアプリケーション、製品、サービス、ビッグデータ分析...