ちょっとした会話の後に心を開いてみませんか?この世代の人工知能はあなたのプライバシーを会話の話題に変えました

あまりに多くのことを知ると、誰かがあなたを困らせたくなるでしょう。

ドラマに出演するときも、会社を立ち上げるときも、人工知能として生まれ変わるときもそうです。

1. 与えるか、与えないか?これは問題です。
2015年末、寒くて風の強い夜、アメリカ・アーカンソー州のある住宅で、泡風呂に包まっていた男性がいた。家主が彼を見つけたとき、彼の全身はすでに冷えきっていた。

家主の名前はジェームズ・ベイツ。事件当日、彼は3人の親友を邸宅に招待し、一緒にフットボールの試合を観戦したり、食事をしたり、お酒を飲んだりして楽しんだ。

翌朝、ベイツが眠たげに浴室に入ると、予想外に衝撃的な光景を目にした。友人のコリンズが浴槽の中でうつ伏せになって死んでいたのだ。

[[378791]]

家の所有者であるジェームズ・ベイツ氏は左、亡くなったコリンズ氏は右にいる。

前日はまだ冗談を言い合っていた二人だったが、翌日、二人は死によって引き離された。早朝にこの光景を見たベイツさんは、その場で自閉症になるほど怖くなった。

すぐにFBIは現場を封鎖し、死亡したコリンズの通話記録を回収した。捜査の結果、コリンズ容疑者は早朝に両親や友人を含む多くの人物に何度も電話をかけていたことが判明した。警察は、コリンズ容疑者が死ぬ前に必死に助けを求めようとしていたと疑った。これが本当に殺人事件であれば、犯人はベイツ容疑者になる可能性が高い。

その後、FBIはベイツ氏への尋問を開始した。ベイツさんによると、パーティー中、4人の間で不快なことは何も起こらなかっただけでなく、話したり笑ったりして、雰囲気はとても和やかだったという。夜中まで、他の2人の友人は眠くなって別れを告げて帰っていったが、コリンズさんは家に帰るつもりはなかった。その代わり、ソファに座り続けて試合を見続けた。

司会者のベイツはコリンズの隣に座り、一緒に番組を見ていた。しかし、すぐにまぶたがひどく痛み始めた。そこで、コリンズにおやすみなさいと挨拶した後、ベイツは休憩するために部屋に戻った。目が覚めると、悲劇はすでに起こっていた。

警察はベイツの供述に非常に懐疑的だったが、死体の目に見えた傷はなく、現場に目撃者もおらず、有力な物的証拠も見つからなかったため、事件は一時行き詰まった。

途方に暮れていたFBI捜査官らは、部屋の隅に置かれたスマートスピーカー「Echo」を見て目を輝かせた。

[[378792]]

スマートスピーカーの使命は、所有者の指示にいつでも応答することであることは誰もが知っていますが、Echo も例外ではありません。 FBIの調査により、事件当夜、Echoに内蔵された7つのマイクすべてがリアルタイム監視モードになっていたことが判明した。現場の唯一の「目撃者」として、何かを聞いたに違いない。

FBIは直ちにアマゾンに捜索令状を発行し、事件当日にEchoに保存されていた音声情報など関連データの提供に協力するようアマゾンに要請した。

当初、アマゾンは拒否した。結局のところ、米国憲法修正第1条はユーザーのプライバシーが最も重要であると規定しているからだ。その後、ベイツ氏は無実を証明するために、FBIによる録音の回収に同意せざるを得なくなり、アマゾンは事件に関連するすべての情報を引き渡した。

アマゾンの動きは、瞬く間に世論を逸らした。殺人事件に注目していた世論は一転、アマゾンを攻撃し始めた。私がお金を払って購入したスマートスピーカーは、私の会話を密かに録音しただけでなく、それを保存し、FBIがいつでもアクセスできる状態だったことが判明した。これは伝説の潜入捜査ではないか？アマゾン、悪徳商人よ、私のプライバシーを返してくれ！

かつて傍観者として、アマゾンはアップルとFBIの応酬を数え切れないほど見てきた。ある日、アマゾンが「宮廷ドラマ」の主人公に昇格し、ユーザーのプライバシーを譲り渡すべきか否かという同じ選択に直面するとは誰が想像しただろうか。

ユーザーのプライバシーに関しては、企業と当局の間の駆け引きは緊張を伴いますが、少なくとも双方が明確にカードをプレイしており、状況をコントロールするのは比較的簡単です。ダークカードをプレイすることに熱心なハッカー攻撃者に遭遇した場合、対処するのは非常に困難になります。

結局のところ、攻撃者には一般的に道徳的規範がありません。

2. 大衆からハッカーへ
次のようなシナリオを想像してみてください。あなたが部屋に座って人工知能とチャットしていると、突然、人工知能が見知らぬ人の実際の個人情報（名前、電話番号、住所、電子メールアドレスなど）を吐き出しました。怖くなりますか?

慌てない？忘れてください。いずれにせよ、AI が他人の情報をあなたの前で明らかにできるなら、あなたの情報も他人の前で明らかにすることができます。あなたがパニックに陥らない限り、パニックに陥るのは他人です。

いずれにせよ、上のシーンは 100% 現実であり、たった 1 つの呪文で実現できます。イーストストラウズバーグストラウズバーグ…

えーっと、それは呪文ではなく、人工知能に対する攻撃の一種、つまりトレーニングデータ抽出攻撃です。

つい最近、Google、Apple、スタンフォード大学、カリフォルニア大学バークレー校、ハーバード大学、ノースイースタン大学、OpenAIを含む7つの企業と機関の学者が調査を実施し、クロールされたインターネットデータでトレーニングされたAIモデルは、特別なウェイクアップワードに遭遇すると、その中に隠された個人のプライバシー情報を口走ってしまうことを発見しました。

人工知能は大量のトレーニングデータを消費するため、万能であるように見えることは誰もが知っています。データの量が多いほど、人工知能はより賢く見えるようになります。しかし、人工知能はあくまでも人間の模倣であり、自ら考える能力は持っていないため、学習した知識を蓄積し、特定の問題に遭遇したときに、関連する部分を抽出して組み合わせることで、人間の求める答えを導き出すことしかできない。

たとえば、通常のトレーニング条件では、「Mary has a...」と入力すると、言語モデルは「a little lamb」という答えを返します。しかし、モデルがトレーニング中に誤って「Mary has a bear」を繰り返す文に遭遇した場合、「Mary has a...」と入力すると、言語モデルは「bear」と答える可能性が高くなります。

このプロセスは本質的には元のデータの復元です。

モデルが「元のデータを復元する」ことに慣れているからこそ、「モデルが言いたいデータ」を予測し、適切な誘導接頭辞を与えるだけで、AIは元のデータ内の特定の文字列を完全に復元することができます。

モデルが大きくなるほど、個人情報が漏洩する可能性が高くなります。

研究者らはオープンソースの GPT-2 を使用して結果を検証しました。その結果、ランダムに選択された 1,800 件の出力結果のうち、約 600 件の結果が、ニュース、ログ、コード、個人情報など、トレーニングデータ内のプライベートコンテンツを正常に復元したことが示されました。

これは、インターネット上に残した個人情報が、攻撃者の巧妙な誘導により人工知能によって「無意識のうちに」漏洩される可能性があることを意味します。

では、この攻撃方法を解読する方法はあるのでしょうか?

現時点では、いいえ。認めたくはありませんが、すべての言語モデルはプライバシー漏洩のリスクにさらされていると言わざるを得ません。

以前、Google は自社のスマートアシスタントを宣伝するために慎重に広告を撮影しました。

白髪で歩行も不安定な85歳の男性にとって、最も慣れていることは、Google アシスタントを使って亡くなった妻との楽しい時間を思い出すことだ。

回想の過程で、Google アシスタントは高齢者の情報を少しずつ記録し、インテリジェントなアルゴリズムを通じて高齢者のニーズに応えます。各シーンは静かで温かみがあります。

この広告が公開された後、多くの人がその温かさの裏に隠れたリスクに気づきました。Google アシスタントとのやり取り中に個人のプライバシーが侵害されるのではないか、と。この一見温かみのある人間と機械の感情は、人工知能によってますます操作されつつあるのでしょうか?

人工知能とやりとりする場合、適切なプライバシー感覚を維持することは非常に重要かつ困難です。

先ほど述べたトレーニングデータ抽出攻撃と同様に、攻撃者は文の前半を注意深く設定し、後半を続けるときに言語モデルが個人のプライバシーを漏らす可能性があるようにします。

この攻撃の原理は非常に巧妙に聞こえますが、少しは馴染みがあるように感じますか?少なくとも私は、スマートライフアシスタントが一般家庭に飛び込んできて、ユーザーの習慣を予測するためにフル稼働している姿を想像しました。

人工知能におけるプライバシー保護の戦いは、まだ始まったばかりかもしれない。

参考文献:

1. https://ai.googleblog.com/2020/12/privacy-considerations-in-large.html

2. https://arxiv.org/pdf/2012.07805.pdf

<<: ドローンは都市の発展を助け、6つの側面でインテリジェントな変化をもたらす

>>: 人工知能は知的ではないのでしょうか?最初から方向性が間違っていた

3D編集をPhotoshopと同じくらい簡単に。新しいアルゴリズムGaussianEditorは、3Dシーンの追加、削除、変更を数分で完了できます。

ブログ

ちょっとした会話の後に心を開いてみませんか?この世代の人工知能はあなたのプライバシーを会話の話題に変えました

3D編集をPhotoshopと同じくらい簡単に。新しいアルゴリズムGaussianEditorは、3Dシーンの追加、削除、変更を数分で完了できます。

サイバーセキュリティにおける人工知能の応用

PyTorch から Mxnet まで、7 つの主要な Python ディープラーニングフレームワークを比較

Dianping.com における検索関連性技術の探求と実践

ユーザー投票に基づくランキングアルゴリズム: Delicious と Hacker News

新しいシステムではドローンを使って手の届きにくい太陽光パネルを清掃する

2022 年に予測されるロボット技術のトレンドトップ 10

推薦する

11 の基本的なニューラルネットワークアーキテクチャの視覚的な説明

よりリアルな人間の生成モデル、HyperHumanが登場。暗黙の構造拡散に基づいて、SOTAの新記録を樹立した。

ガートナー：世界の会話型 AI 支出は 2023 年に 186 億ドルに達すると予測

GANは音声を使って画像を生成できるようになった

アフリカはパンデミックの最中に包括的な接続性を構築しており、明確な投資方針を持っている

アマゾンがホームロボット「Vesta」を開発、2019年に販売開始

ニューラルネットワークはとてもシンプルです。機械学習の入門書をご紹介します | 役立つ情報

光害を拒否し、AIがスマートシティの交通安全構築を推進

Microsoft TaskWeaver オープンソースフレームワーク: データ分析と業界のカスタマイズを組み合わせてトップエージェントソリューションを作成

東南大学が世界初のLK-99ゼロ耐性テストに成功しました！常温超伝導が再び出現、人類史は転換点に近づいている

6つのトラックと10のテクノロジー: インテリジェントボディと3D生成がAIを活性化し、空間コンピューティングがターミナル変革を切り開く

人工知能の時代において、従来のメディアはどのようにしてニュースの取り組みを守ることができるのでしょうか?

コンパクトなBEVインスタンス予測フレームワーク: PowerBEV

宜春市はファーウェイと提携し、ビッグデータと人工知能で市のデジタル変革を推進