Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

今後、インターネット上で公に話すすべての言葉が、Google によって AI のトレーニングに使用される可能性があります。

そうです、絵を描いた後は、テキストワークも大きなモデルに送り込むことになります——

技術的なブログ、コード、論文など、オンラインで公開するあらゆるものは、著作権で保護されている場合でも、「Google Big Model Blender」に投入できます。

今週、Google はプライバシー ポリシーを更新し、AI ツールの構築のためにインターネット上のすべての公開コンテンツをクロールする権利を留保していることを明確にしました。

ネットユーザーたちはすぐに衝撃を受けた。 「Google はあらゆるものをクロールしている」と警告する人もいます。

Google があなたの書いたものを読むと、それは Google のものになります。

写真

ネットユーザーの中には、より悲観的な見方をする人もいる。

近い将来、すべてのコンテンツ制作者は AI になるでしょう。

写真

それで、このプライバシーポリシーとは何でしょうか?

BardなどのAI製品のトレーニングに使用

話は最近Googleが更新したプライバシーポリシーから始まります。

Googleは最新のプライバシーポリシーに、「研究開発」のためのAIモデルに関する条項を追加した。

Google は、ユーザーと一般の人々の利益のために、サービスの向上や新しい製品、機能、技術の開発のために情報を使用します。

たとえば、Google は公開されている情報を活用して、Google の AI モデルのトレーニングや、便利な製品や機能(Google 翻訳、Bard、Cloud AI 機能など)の構築に役立てています。

つまり、収集される可能性のあるすべての公開情報は、Google 翻訳、Bard、Cloud AI などの AI 関連製品や機能のトレーニングに使用されます。

写真

では、この公開情報には具体的に何が含まれるのでしょうか?

たとえば、検索キーワード、Google サービスとやり取りするアプリやブラウザに関する情報、サードパーティのサイトやアプリでの Google サービスの使用など、インターネット、ネットワーク、その他のアクティビティ情報などです。

つまり、以前に公開されたブログコンテンツだけでなく、オンラインで公開された Google ドキュメントや個人情報を含む投稿も、大規模なモデルのトレーニングのために Google によって収集される可能性があります。

もちろん、現時点ではこれらの内容はまだ「公開情報」に限られています。

Google が提供する Gmail などの電子メール サービスは、データにクロールされるべきではありません。

さらに、Google はプライバシー ポリシーで、セキュリティ上の脅威の防止、情報の確認、サービスのメンテナンス、パーソナライズされた広告、法的理由など、他の目的にもこの個人情報や公開情報を使用する可能性があることも明記しています。

しかし、なぜ Google はこの重要な時期にこのポリシーを更新したのでしょうか?

「AIはテキストの著作権に挑戦している」

おそらく、RedditやTwitterなどの企業が実施している「フロー制限」作戦にも関係しているのだろう。

まず、今年4月にRedditは、APIへのアクセスに対して企業に料金を請求し始めると発表しました。

同社のCEOはRedditのデータベースは価値があると考えているが、この貴重なコンテンツを大手テクノロジー企業に無料で提供することは望んでいない。

その後、Twitterも「AI企業がデータを無料で入手することを望まない」という理由でTwitterの流入を制限し始めた。未認証ユーザーの1日のページビューはわずか600だったが、認証後は6,000に増加した。

この一連のポリシーは、ユーザーとサードパーティのツールに深刻な影響を及ぼしています。たとえば、Redditはディスカッションフォーラムで大規模な抗議を引き起こしました。多くのモデレーターは、R​​edditの活動に抗議するために、フォーラムを直接閉鎖しました。Twitterでも多くの人々がこれを非難し、一部のネットユーザーは「Twitterは殺された」とさえ言っています。

しかし、何があっても、AI がデータを無料で取得できるようにするというのは、無視できない矛盾となってきました。

一部のネットユーザーは、Google AIによるデータのクロールについて疑問を呈している。

検索エンジンなどインターネットでもデータのクローリングといった業務があったのに、なぜ「AIクローリング」に人々は抵抗感を持つのでしょうか。

写真

一部のネットユーザーは次のように反応した。

それは本質的に著作権の問題です。著作権で保護された素材を単に引用しているだけであれば、必ずしも著作権を侵害しているわけではありません。しかし、AI を使用して著作権で保護されたコンテンツを「かき混ぜてクリーンにする」ことが合法となると、著作権は実質的に消滅します。

写真

だからこそ、彼はこの件に関して悲観的である。

誰かがあなたのブログ投稿を出典を明記せずにコピーしたり、あなたのオープンソース コードを有料サービスに使用したり、StackOverflow でのあなたの回答を質問への回答方法として使用したりしても構いませんか?

これまでやってきたことはすべて無料でした。しかし今、AIが私を消えてほしいと望むなら、私は消えます。

写真

もちろん、一部のネットユーザーはすでにこの政策の導入を受け入れており、各自の予防意識が不可欠であると警告している。

新しいポリシーを注意深く読み、オンラインで漏洩している情報の量に注意してください。

写真

それで、これについてどう思いますか?

参考リンク:

[1] https://gizmodo.com/google-says-it’ll-scrape-everything-you-post-online-for-1850601486
[2] https://news.ycombinator.com/item?id=36577626

<<:  AIサークルが爆発した!マイクロソフトがトランスフォーマーのブロックを解除、シーケンスの長さが10億以上に拡大

>>:  中国科学院とアリババが開発したFF3Dでは、カスタムスタイルの3Dポートレートを作成するのにわずか3分しかかかりません。

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

機械学習のヒント: モデルパラメータとハイパーパラメータの違いをご存知ですか?

[[199395]]導入機械学習におけるモデルパラメータとモデルハイパーパラメータは機能やソースが...

...

AIが宇宙飛行士の健康を宇宙で監視する方法

[[286902]] ▲ 火星探査機ロゼッタが光学スペクトル赤外線リモートイメージングシステム(OS...

人工知能にとって2019年は厄介な年だった。資金は必要だったが、使えるお金がなかったのだ。

2019年、中国の人工知能分野への投資・融資熱は大幅に低下し、取引量も急減した。恥ずかしいことに、...

Facebookは人工知能を使ってコンテンツレビューの優先順位を決める

海外メディアによると、フェイスブックは機械学習アルゴリズムの使用を増やし、AIを使ってコンテンツの重...

AI特許出願件数は世界第1位で、世界総出願件数の約4分の3を占める。

先日蘇州で開催された中国人工知能産業2020年年次大会で発表された「2020年中国人工知能発展報告書...

Google、医療従事者が情報を素早く見つけられるようにAI検索機能を開始

10月10日、海外メディアの報道によると、Google Cloudは最近、医療従事者がさまざまな種類...

...

TikTokの背後にあるAIの仕組み

エンジニアの視点から TikTok 推奨システムのアーキテクチャを探ります。 TikTok は、ユー...

新しいソートアルゴリズムの発明から始まる

このような単純なアルゴリズムは、先代のエンジニアが考え出したものであるに違いありません。初心者であっ...

2021年に機械学習を学ぶには?この詳細なガイドがあなたをカバーします!

「すべての人にAI」の時代を迎え、多くの人が機械学習(ML)に何らかの形で触れるようになりました。...

Nokelockの「1+2」戦略は、スマートロックを商業利用の新時代へと導きます

5月15日、世界有数のIoTロック企業であるnokelockの製品発表会が北京金宇シェラトンホテルで...

農業における生成AI

農業業界は、生成型人工知能 (AI) がもたらす貴重な洞察と生産性の向上により、大きな変革の可能性を...

ハッカーはAIの顔を変える技術を使って就職活動を行っている。人工知能のセキュリティ問題は無視できない

米国での流行後、多くの企業が「在宅勤務」(WFH)モデルを採用しました。 FBIの刑事告訴センターは...