Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

今後、インターネット上で公に話すすべての言葉が、Google によって AI のトレーニングに使用される可能性があります。

そうです、絵を描いた後は、テキストワークも大きなモデルに送り込むことになります——

技術的なブログ、コード、論文など、オンラインで公開するあらゆるものは、著作権で保護されている場合でも、「Google Big Model Blender」に投入できます。

今週、Google はプライバシー ポリシーを更新し、AI ツールの構築のためにインターネット上のすべての公開コンテンツをクロールする権利を留保していることを明確にしました。

ネットユーザーたちはすぐに衝撃を受けた。 「Google はあらゆるものをクロールしている」と警告する人もいます。

Google があなたの書いたものを読むと、それは Google のものになります。

写真

ネットユーザーの中には、より悲観的な見方をする人もいる。

近い将来、すべてのコンテンツ制作者は AI になるでしょう。

写真

それで、このプライバシーポリシーとは何でしょうか?

BardなどのAI製品のトレーニングに使用

話は最近Googleが更新したプライバシーポリシーから始まります。

Googleは最新のプライバシーポリシーに、「研究開発」のためのAIモデルに関する条項を追加した。

Google は、ユーザーと一般の人々の利益のために、サービスの向上や新しい製品、機能、技術の開発のために情報を使用します。

たとえば、Google は公開されている情報を活用して、Google の AI モデルのトレーニングや、便利な製品や機能(Google 翻訳、Bard、Cloud AI 機能など)の構築に役立てています。

つまり、収集される可能性のあるすべての公開情報は、Google 翻訳、Bard、Cloud AI などの AI 関連製品や機能のトレーニングに使用されます。

写真

では、この公開情報には具体的に何が含まれるのでしょうか?

たとえば、検索キーワード、Google サービスとやり取りするアプリやブラウザに関する情報、サードパーティのサイトやアプリでの Google サービスの使用など、インターネット、ネットワーク、その他のアクティビティ情報などです。

つまり、以前に公開されたブログコンテンツだけでなく、オンラインで公開された Google ドキュメントや個人情報を含む投稿も、大規模なモデルのトレーニングのために Google によって収集される可能性があります。

もちろん、現時点ではこれらの内容はまだ「公開情報」に限られています。

Google が提供する Gmail などの電子メール サービスは、データにクロールされるべきではありません。

さらに、Google はプライバシー ポリシーで、セキュリティ上の脅威の防止、情報の確認、サービスのメンテナンス、パーソナライズされた広告、法的理由など、他の目的にもこの個人情報や公開情報を使用する可能性があることも明記しています。

しかし、なぜ Google はこの重要な時期にこのポリシーを更新したのでしょうか?

「AIはテキストの著作権に挑戦している」

おそらく、RedditやTwitterなどの企業が実施している「フロー制限」作戦にも関係しているのだろう。

まず、今年4月にRedditは、APIへのアクセスに対して企業に料金を請求し始めると発表しました。

同社のCEOはRedditのデータベースは価値があると考えているが、この貴重なコンテンツを大手テクノロジー企業に無料で提供することは望んでいない。

その後、Twitterも「AI企業がデータを無料で入手することを望まない」という理由でTwitterの流入を制限し始めた。未認証ユーザーの1日のページビューはわずか600だったが、認証後は6,000に増加した。

この一連のポリシーは、ユーザーとサードパーティのツールに深刻な影響を及ぼしています。たとえば、Redditはディスカッションフォーラムで大規模な抗議を引き起こしました。多くのモデレーターは、R​​edditの活動に抗議するために、フォーラムを直接閉鎖しました。Twitterでも多くの人々がこれを非難し、一部のネットユーザーは「Twitterは殺された」とさえ言っています。

しかし、何があっても、AI がデータを無料で取得できるようにするというのは、無視できない矛盾となってきました。

一部のネットユーザーは、Google AIによるデータのクロールについて疑問を呈している。

検索エンジンなどインターネットでもデータのクローリングといった業務があったのに、なぜ「AIクローリング」に人々は抵抗感を持つのでしょうか。

写真

一部のネットユーザーは次のように反応した。

それは本質的に著作権の問題です。著作権で保護された素材を単に引用しているだけであれば、必ずしも著作権を侵害しているわけではありません。しかし、AI を使用して著作権で保護されたコンテンツを「かき混ぜてクリーンにする」ことが合法となると、著作権は実質的に消滅します。

写真

だからこそ、彼はこの件に関して悲観的である。

誰かがあなたのブログ投稿を出典を明記せずにコピーしたり、あなたのオープンソース コードを有料サービスに使用したり、StackOverflow でのあなたの回答を質問への回答方法として使用したりしても構いませんか?

これまでやってきたことはすべて無料でした。しかし今、AIが私を消えてほしいと望むなら、私は消えます。

写真

もちろん、一部のネットユーザーはすでにこの政策の導入を受け入れており、各自の予防意識が不可欠であると警告している。

新しいポリシーを注意深く読み、オンラインで漏洩している情報の量に注意してください。

写真

それで、これについてどう思いますか?

参考リンク:

[1] https://gizmodo.com/google-says-it’ll-scrape-everything-you-post-online-for-1850601486
[2] https://news.ycombinator.com/item?id=36577626

<<:  AIサークルが爆発した!マイクロソフトがトランスフォーマーのブロックを解除、シーケンスの長さが10億以上に拡大

>>:  中国科学院とアリババが開発したFF3Dでは、カスタムスタイルの3Dポートレートを作成するのにわずか3分しかかかりません。

ブログ    
ブログ    

推薦する

最も孤独なニューラル ネットワーク: たった 1 つのニューロンですが、「クローンをシャドウ」することができます

世界で最も先進的なニューラルネットワークモデルは何ですか?それは人間の脳に違いない。人間の脳には86...

アルゴリズムの時間計算量分析: Big O 表記

[[354643]]開発の際、アルゴリズムの品質をどのように評価し、アルゴリズムの効率をどのように説...

Kaggle マスターはどのような言語、フレームワーク、モデルを使用していますか?詳細な統計はこちら

統計ウェブサイト: https://mlcontests.com/ 著者はいくつかの重要な結論に達し...

米国の専門家:中国のロボット優位性が懸念される

フォーブスは10月2日、寄稿者ティム・バジャリン氏による記事を掲載し、中国ロボットの利点と、中国と米...

...

負荷分散スケジューリングアルゴリズムを見てみましょう

[[122758]]ロード ホストは、スケジューリング メソッドまたはアルゴリズムと呼ばれる多くの負...

...

マスク氏の非嫡出双子が初めて暴露される!ニューラリンクの女性幹部に付き添われ、AIの終焉を憂いながら赤ちゃんを散歩させていた

マスク氏の非嫡出双子が初めて世間に公開される!最近、「スティーブ・ジョブズ」の著者であり伝記作家でも...

...

...

機械学習: 決定木について

ロジスティック回帰の基本原理と勾配降下法の導出プロセスについて説明しました。このコードは、分類アルゴ...

Linuxに顔認識ログインを追加する方法

最近、Deepin OS 20.05がリリースされ、追加された顔認識機能がコミュニティの注目を集めて...

LRU キャッシュ アルゴリズムの Java カスタム実装

背景LinkedHashMap は HashMap を継承し、内部的に removeEldestEn...

...

ChatGPT は IT ネットワーク エンジニアの代わりになるのでしょうか?

現代の IT ネットワークは、ファイアウォール、ルーター、スイッチ、サーバー、ワークステーション、そ...