ChatGPTが見知らぬ人の自撮り写真を流出!モデルによって個人データが盗まれたのですか?ネットユーザーはパニックに

ChatGPTが見知らぬ人の自撮り写真を流出!モデルによって個人データが盗まれたのですか?ネットユーザーはパニックに

最近、ChatGPTの返信に見知らぬ男性の写真が現れるという事件が多くのネットユーザーに衝撃を与えました。

何が起こったか説明します。あるユーザーが ChatGPT に、Python でコード フォーマット パッケージを使用する方法についてのヘルプを依頼しました。

最初は、ChatGPTの回答は普通でした。

予想外に、ChatGPT は突然見知らぬ男性の自撮り写真で応答しました。

そして二度目の出来事が起こりました!

ネットユーザーたちはすぐにパニックに陥った。

ChatGPTの正体が明らかになったのでしょうか?

これはAIの中のもう一つの幽霊なのではないかと推測する人もいました。

ChatGPT のホラー系女性向けバージョンでしょうか?

インターネットの潜在空間には、さまざまな理論を含むさまざまなものが隠されているという伝説を思い出した人がいました。

ChatGPT が汚染されたのではないかと推測する人もいました。

あるいは、誰かが OpenAI をハッキングし、ChatGPT に自身の成果を誇示するためにランダムに自身の写真を投稿させたのかもしれません。

答えは予想外だった

ネットユーザーたちはブレインストーミングを行い、あらゆる場所で手がかりを集め、ついに事件を解決しました!

これは ChatGPT によって生成された写真ではなく、ユーザーの実際の自撮り写真です。

この写真は2016年12月7日にImgurにアップロードされたことが判明しました。 (この写真の閲覧回数は当初数百回だったが、事件を目撃する人が増えるにつれ、現在では17,000回以上も閲覧されている。)

何が起こったのかを推測する人もいます。ChatGPT が応答を生成したときに、ランダムに Imgur URL を生成し、それが偶然この自撮り男にリンクしたのです。

ChatGPT の目的は、説明付きの画像を生成することです。Visual Studio Code 設定のスクリーンショットを共有していると思っていましたが、Imgur リンクを通じて画像が生成されるとは予想していませんでした。

つまり、ChatGPT のトレーニング データセットでは、多くの回答に部分的な回答を指す Imgur リンクが含まれているため、Imgur リンクは正解と高い相関関係にあります。

ただし、ChatGPT は統計的にランダムな画像リンクを自動的に完成することはできないため、結果は予測できません。この男の写真はGPTの幻覚のページ番号に似ています。

別のネットユーザーも同様の説明をした。ChatGPT が回答を生成し、それが Imgur のリンクだった。

回答には Imgur リンクを提供する必要があると認識しましたが、同じ Imgur URL が必要であることを認識していなかったため、代わりにランダムな URL セットを生成しました。

最も偶然なのは、これが実際に有効なリンクであり、偶然にもその外国人男性の写真にリンクしていたことです。

また、トレーニングに使用されるのは Imgur ではなく、ChatGPT が Imgur リンク (実際には任意のリンク) を生成できるとも言われています。

つまり、このリンクは ChatGPT によってランダムに生成されたということです。これはどの程度あり得ることでしょうか?

誰かが、Imgur の画像 ID は [A-Za-z0-9] のセットの 7 つの文字で構成されていることを発見しました。そのため、62^7=3,521,614,606,208、つまり 3.5 兆通りの組み合わせが可能です。

2014 年に Igmur が初めて資金調達を行った際、同社は約 6.5 兆枚の画像をホストしていました。これを推測すると、インターネット上で作成されるデータの量は 2014 年以降 860% 急増したことになります。この論理によれば、Imgur は現在約 62 億 4000 万枚の画像をホストしていることになります。

したがって、ChatGPTが有効な画像IDを推測する確率は、

6.24B / 62^7 x 100 = 0.177%

これは 565 チャットごとに 1 回発生するため、ChatGPT がこの Imgur リンクを生成した可能性は否定できません。

これらの数値をテストするための簡単なスクリプトを作成しましたが、10,000 件のリクエストのうち 19 件の有効な画像が見つかったため、確率は 0.19% です。ところで、愛情表現はしましたか?

この時点で、事態は明らかになったようだ。

そのため、アップロードまたは入力したコンテンツは ChatGPT のトレーニングに使用されることにご注意ください。プライバシーを公開したくない場合は、チャット記録をアップロードするボタンをオフにしてください。

さらに、インターネット上に残したデジタルフットプリントは、いつか AI のトレーニング データになる可能性があります。

つまり、すべての写真を AI に送信しないでください。AI があなたの写真で何を行うかはわかりません。

<<:  仮想誘拐:人工知能がランサムウェア詐欺を助長

>>:  北京大学の具現化知能チームは、人間のニーズに合わせてロボットをより効率的にするための需要主導型ナビゲーションを提案した。

ブログ    
ブログ    
ブログ    

推薦する

2022年、どのような技術トレンドが世界を変え続けるのでしょうか?以下は百度研究所の予測です。

あっという間に2021年が過ぎ去りました。今年、新型コロナウイルス感染症のパンデミックは世界経済と社...

マスク氏は5年以内に人間の言語を無意味にするだろうと言っているが、今回は狂気ではないかもしれない

イーロン・マスク氏は、わずか5年で人間の言語を無意味にすることができる技術に取り組んでいると述べてい...

「製造」から「スマート」な製造へ、産業用インターネットが最良の選択となる

新インフラ政策の導入以来、データセンター、5G、ビッグデータの開発が最も頻繁に言及されていますが、産...

...

世界初の「自己複製」する生体ロボットが誕生。科学者たちの次なる目標とは?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

著者 | 王 睿平今日、大規模言語モデル技術が継続的に成熟するにつれ、専門家はそれを活用してインテリ...

人工知能業界データ分析:中国のネットユーザーの76.8%が2020年の人工知能トラフィックアプリケーションシナリオに満足している

政策の推進と資本の注目により、人工知能産業は今後も急速な発展傾向を維持するでしょう。投資家は人工知能...

機械学習プロジェクトでオプティマイザーを選択する方法

導入いくつかの一般的なオプティマイザーを紹介し、その長所と短所を分析し、オプティマイザーを選択するた...

360、認知汎用大型モデル「360 Brain 4.0」をリリース、360ファミリーバケットに完全統合

「デジタルヒューマン『周紅一』を我が社のスポークスマンにしよう。彼が正しいことを言ったら、それは私の...

人工知能の応用、開発、影響についての考察

ケンブリッジ大学人工知能研究センターは、人工知能によってもたらされる新しい能力とそれが直面するリスク...

日本の芥川賞受賞者が認める:小説の5%はChatGPTによって書かれた

1月22日、日本で最も権威のある文学賞である芥川賞を受賞した作家が、受賞作である小説「東京同情塔」の...

...

これはホログラムではありません!多角度から視聴できる真の3D画像

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...