今後、インターネット上で公に話すすべての言葉が、Google によって AI のトレーニングに使用される可能性があります。 そうです、絵を描いた後は、テキストワークも大きなモデルに送り込むことになります—— 技術的なブログ、コード、論文など、オンラインで公開するあらゆるものは、著作権で保護されている場合でも、「Google Big Model Blender」に投入できます。 今週、Google はプライバシー ポリシーを更新し、AI ツールの構築のためにインターネット上のすべての公開コンテンツをクロールする権利を留保していることを明確にしました。 ネットユーザーたちはすぐに衝撃を受けた。 「Google はあらゆるものをクロールしている」と警告する人もいます。
写真 ネットユーザーの中には、より悲観的な見方をする人もいる。
写真 それで、このプライバシーポリシーとは何でしょうか? BardなどのAI製品のトレーニングに使用話は最近Googleが更新したプライバシーポリシーから始まります。 Googleは最新のプライバシーポリシーに、「研究開発」のためのAIモデルに関する条項を追加した。
つまり、収集される可能性のあるすべての公開情報は、Google 翻訳、Bard、Cloud AI などの AI 関連製品や機能のトレーニングに使用されます。 写真 では、この公開情報には具体的に何が含まれるのでしょうか? たとえば、検索キーワード、Google サービスとやり取りするアプリやブラウザに関する情報、サードパーティのサイトやアプリでの Google サービスの使用など、インターネット、ネットワーク、その他のアクティビティ情報などです。 つまり、以前に公開されたブログコンテンツだけでなく、オンラインで公開された Google ドキュメントや個人情報を含む投稿も、大規模なモデルのトレーニングのために Google によって収集される可能性があります。 もちろん、現時点ではこれらの内容はまだ「公開情報」に限られています。 Google が提供する Gmail などの電子メール サービスは、データにクロールされるべきではありません。 さらに、Google はプライバシー ポリシーで、セキュリティ上の脅威の防止、情報の確認、サービスのメンテナンス、パーソナライズされた広告、法的理由など、他の目的にもこの個人情報や公開情報を使用する可能性があることも明記しています。 しかし、なぜ Google はこの重要な時期にこのポリシーを更新したのでしょうか? 「AIはテキストの著作権に挑戦している」おそらく、RedditやTwitterなどの企業が実施している「フロー制限」作戦にも関係しているのだろう。 まず、今年4月にRedditは、APIへのアクセスに対して企業に料金を請求し始めると発表しました。 同社のCEOはRedditのデータベースは価値があると考えているが、この貴重なコンテンツを大手テクノロジー企業に無料で提供することは望んでいない。 その後、Twitterも「AI企業がデータを無料で入手することを望まない」という理由でTwitterの流入を制限し始めた。未認証ユーザーの1日のページビューはわずか600だったが、認証後は6,000に増加した。 この一連のポリシーは、ユーザーとサードパーティのツールに深刻な影響を及ぼしています。たとえば、Redditはディスカッションフォーラムで大規模な抗議を引き起こしました。多くのモデレーターは、Redditの活動に抗議するために、フォーラムを直接閉鎖しました。Twitterでも多くの人々がこれを非難し、一部のネットユーザーは「Twitterは殺された」とさえ言っています。 しかし、何があっても、AI がデータを無料で取得できるようにするというのは、無視できない矛盾となってきました。 一部のネットユーザーは、Google AIによるデータのクロールについて疑問を呈している。
写真 一部のネットユーザーは次のように反応した。
写真 だからこそ、彼はこの件に関して悲観的である。
写真 もちろん、一部のネットユーザーはすでにこの政策の導入を受け入れており、各自の予防意識が不可欠であると警告している。
写真 それで、これについてどう思いますか? 参考リンク: [1] https://gizmodo.com/google-says-it’ll-scrape-everything-you-post-online-for-1850601486 |
<<: AIサークルが爆発した!マイクロソフトがトランスフォーマーのブロックを解除、シーケンスの長さが10億以上に拡大
>>: 中国科学院とアリババが開発したFF3Dでは、カスタムスタイルの3Dポートレートを作成するのにわずか3分しかかかりません。
世界で最も先進的なニューラルネットワークモデルは何ですか?それは人間の脳に違いない。人間の脳には86...
[[354643]]開発の際、アルゴリズムの品質をどのように評価し、アルゴリズムの効率をどのように説...
統計ウェブサイト: https://mlcontests.com/ 著者はいくつかの重要な結論に達し...
フォーブスは10月2日、寄稿者ティム・バジャリン氏による記事を掲載し、中国ロボットの利点と、中国と米...
[[122758]]ロード ホストは、スケジューリング メソッドまたはアルゴリズムと呼ばれる多くの負...
マスク氏の非嫡出双子が初めて世間に公開される!最近、「スティーブ・ジョブズ」の著者であり伝記作家でも...
ロジスティック回帰の基本原理と勾配降下法の導出プロセスについて説明しました。このコードは、分類アルゴ...
最近、Deepin OS 20.05がリリースされ、追加された顔認識機能がコミュニティの注目を集めて...
背景LinkedHashMap は HashMap を継承し、内部的に removeEldestEn...
現代の IT ネットワークは、ファイアウォール、ルーター、スイッチ、サーバー、ワークステーション、そ...