AIは中国のインターネットを狂ったように汚染している

AIは中国のインターネットを汚染する「犯人」の1つとなった。

問題はこれです。

最近、誰もが AI に相談することに熱心です。あるネットユーザーが Bing に次のような質問をしました。

エレファント・トランク・ヒルにはケーブルカーはありますか？

Bing もすべての質問に答え、信頼できると思われる回答を返しました。

肯定的な回答をした後、Bing はチケットの価格や営業時間などの詳細な情報も親切に提供してくれました。

しかし、ネットユーザーは答えをそのまま受け入れず、ヒントに従って下の「参考リンク」をクリックした。

この時点で、ネットユーザーは何かがおかしいことに気づいた。なぜこの人の答えはそんなに「奇妙」なのか？

そこで彼は「百变人生」というユーザーのホームページをクリックし、このユーザーがAIであることに突然気づいたのです。

このユーザーは質問に非常に速く回答するため、ほぼ 1 ～ 2 分ごとに質問を終えることができます。

1分以内に2つの質問に答えることもできます。

注意深く観察した結果、このネットユーザーはこれらの回答の内容が検証されていないことを発見しました...

そして彼は、これが Bing が間違った回答を出力する原因であると考えています。

このAIは中国のインターネットをひどく汚染しています。

AI汚染の原因は1つではない

では、ネットユーザーによって発見されたこの AI ユーザーに今何が起こっているのでしょうか?

現状の結果から判断すると、彼は知虎によって「沈黙の刑」を宣告されたことになる。

しかし、それにもかかわらず、他のネットユーザーは率直にこう述べた。

1つ以上。

Zhihu の「回答を待っています」列をクリックし、質問をランダムに選択して下にスクロールすると、確かに多くの「機械語」回答が表示されます。

例えば、「生活における AI の応用シナリオは何ですか?」という質問に対する答えの中に、1 つの答えが見つかりました。

回答の言語が「機械語」であるだけでなく、回答には「AI支援による作成を含む」というラベルが直接付けられています。

そして、ChatGPT に質問を投げかけると、返ってくる答えは... まあ、ほとんど同じ古い話です。

実は、こうした「AI汚染源」はこのプラットフォームに限定されるものではありません。

単純な科学イラストであっても、AI は何度も間違いを犯します。

これを読んでネットユーザーも感動した。「わあ、川貝の写真が1枚もない」

AIによって生成されたさまざまな種類のフェイクニュースも一般的です。

例えば、少し前にインターネット上でセンセーショナルなニュースが広まりました。タイトルは「鄭州のチキンステーキ店で流血事件発生。男性が女性をレンガで殴り殺す！」でした。》。

しかし実際には、このニュースは江西省の陳という男性がChatGPTを使用してファンとトラフィックを集めて生成したものです。

偶然にも、広東省深セン市の洪穆迪氏もAI技術を使ってフェイクニュースを発信した。「今朝、甘粛省で列車が道路建設作業員に衝突し、9人が死亡した。」

具体的には、近年話題になっているソーシャルニュースをインターネット全体で検索し、AIソフトウェアを使ってニュースの時間や場所などを修正・編集し、特定のプラットフォームで注目度やトラフィックを獲得して不法な利益を得ていた。

警察は彼らに対して刑事強制措置を講じた。

しかし、実はこの「AI汚染源」という現象は中国だけでなく、海外にも存在している。

プログラマーの Q&A コミュニティである Stack Overflow がその一例です。

ChatGPT が人気になり始めた昨年末、Stack Overflow は突然「一時的な禁止」を発表しました。

当時発表された公式の理由は次の通りです。

目的は、ChatGPT を使用して作成された回答がコミュニティに流入するのを遅らせることです。
ChatGPT から間違った回答が返ってくる確率が高すぎるからです。

Stack Overflow ではこの現象についてさらに詳しく説明しています。

以前のユーザーが回答した質問は、専門知識を持つ他のユーザーによって閲覧され、正しい回答または誤った回答が与えられ、検証に相当すると考えています。

しかし、ChatGPTの登場以来、「非常に正しい」と感じられる回答が多数登場しています。ただし、専門知識の背景を持つユーザーの数は限られており、生成された回答をすべて読むことは不可能です。

さらに、ChatGPT はこれらの専門的な質問に答えますが、そのエラー率は現実的であるため、Stack Overflow はこれを無効にすることを選択しました。

一言で言えば、AI はコミュニティ環境を汚染します。

さらに、アメリカ版Redditには、ChatGPTのセクションやトピックが多数あります。

多くのユーザーがこのコラムでさまざまな質問をし、ChatGPT ボットがそれらすべてに回答します。

しかし、それは依然として同じ古い質問であり、答えの正確さは不明です。

しかし、この現象の背後には、実はもっと大きな危険が潜んでいます。

AIを誤用するとAIが台無しになる

AI モデルは大量のインターネットデータを取得しますが、情報の信憑性と信頼性を効果的に識別することはできません。

その結果、私たちは目もくらむほどの量の、急速に生成される低品質のコンテンツに直面することになります。

ChatGPT のような大規模なモデルがこのようなデータでトレーニングされた場合、結果がどうなるかは想像しにくいです...

このような AI の乱用は、結果として自己破壊の一形態となります。

最近、英国とカナダの研究者が「再帰の呪い: 生成されたデータでのトレーニングによりモデルが忘れてしまう」というタイトルの論文を arXiv に発表しました。

同報告書は、AI生成コンテンツがインターネットを汚染している現状について議論した後、モデル生成コンテンツを使用して他のモデルをトレーニングすると、結果として得られるモデルに回復不可能な欠陥が生じる可能性があるという憂慮すべき調査結果を発表した。

AI が生成したデータのこの「汚染」により、モデルは現実の認識を歪め、将来的にはインターネットデータをクロールしてモデルをトレーニングすることがより困難になるでしょう。

この論文の著者であり、ケンブリッジ大学とエディンバラ大学の安全工学教授であるロス・アンダーソン氏は率直にこう語った。

私たちが海をプラスチックで満たし、大気を二酸化炭素で満たしたように、インターネットをでたらめで満たそうとしている。

偽情報が飛び交う状況について、Google Brainの上級研究科学者であるダフネ・イッポリト氏は「今後はAIによるトレーニングを受けていない高品質なデータを見つけることがさらに難しくなるだろう」と指摘。

このような意味のない低品質の情報が画面に何度も表示されると、AI はデータのトレーニングを行わなくなり、出力結果にどのような意味があるのか?

この状況を踏まえて、大胆なことを想像してみましょう。ゴミや偽りのデータの環境で育った AI は、人間に進化する前に、「知的障害のあるロボット」や精神障害を持つ心理的に歪んだ人間に組み入れられる可能性がある。

1996 年の SF コメディ映画「A lot of Husbands」と同様に、この映画は、自分自身をクローン化し、さらに自分のクローンをクローン化する普通の男性の物語です。クローンが作られるたびに、クローンの知能レベルは急激に低下し、愚かさが増します。

その時、私たちは不条理なジレンマに直面することになるかもしれない。人間は素晴らしい能力を持つ AI を作ったが、それは退屈で愚かな情報で満たされているのだ。

AI に偽のジャンクデータしか与えられなかった場合、どのようなコンテンツが作成されると考えられますか?

その時が来れば、私たちは皆、過去を懐かしみ、真の人間の知恵に敬意を表することになるでしょう。

そうは言っても、すべて悪いニュースというわけではありません。たとえば、一部のコンテンツプラットフォームは、AI が低品質のコンテンツを生成する問題に注目し始めており、これを制限するための関連規制を導入しています。

一部の AI 企業は、AI によって生成された虚偽情報やスパム情報の爆発的な増加を抑えるために、AI によって生成されたコンテンツを識別できる技術の開発も始めています。

参考リンク:
[1] https://www.v2ex.com/t/948487.

[2]https://twitter.com/oran_ge/status/1669160826186633219.

[3]https://www.qbitai.com/2022/12/40167.html.

[4] https://arxiv.org/abs/2305.17493v2.

[5] https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250.

[6] https://futurism.com/ai-generates-fake-news.

<<: ChatGPTでPPTを書く別の方法

>>: GPT-4 は人間よりも資金調達を理解しています。 AIビジネスプランがベンチャーキャピタルを熱狂させる

ブログ

AIが70年間で急成長した理由が明らかに！タイム誌の4枚の写真がアルゴリズムの進化の謎を明らかにする

AIは中国のインターネットを狂ったように汚染している

AI汚染の原因は1つではない

AIを誤用するとAIが台無しになる

PyTorch を使って完全な NeRF をゼロから構築する

生成 AI、その開発は持続可能か?

超強力なPytorchオペレーション！！！

2023 年の ICML カンファレンスが開催されます! Google DeepMindの最新研究を簡単に見てみよう

AIが70年間で急成長した理由が明らかに！タイム誌の4枚の写真がアルゴリズムの進化の謎を明らかにする

分析と AI に関する 6 つの警告すべき間違い

上海交通大学のオープンソーストレーニングフレームワークは、大規模な集団ベースのマルチエージェント強化学習トレーニングをサポートします。

人工知能の登場により、一人暮らしの高齢者の介護は難しくなくなり、高齢者介護はテクノロジーの時代に入った

推薦する

機械学習において、トレーニングおよび検証メトリックグラフから何がわかるでしょうか?

人間かAIか？両方

ゼロから始める: すぐに使えるニューラルネットワークを作成することもできます

AIエージェントを実装するには？ 6 枚の写真 4090 Magic Llama2: タスクを分割して 1 つのコマンドで関数を呼び出す

意思決定インテリジェンス: 人工知能における新たな方向性

トレンドマイクロ：2030年までにサイバーセキュリティ分野で人工知能が人間に取って代わる

学術界の巨人たちのブラックテクノロジー：人工知能のダークマターについて聞いたことがありますか？

パリのノートルダム大聖堂の火災後、文化遺産の修復に AI 技術をどのように応用できるでしょうか?

AES暗号化アルゴリズムのハードウェア設計方法の簡単な分析

ニューラルネットワークの不気味な評判

無料の Python 機械学習コース 6: ニューラルネットワークアルゴリズム

AIプロジェクトでKubernetesを使用する方法

複数の機会が生まれており、虹彩認識技術の将来の発展は有望である