Googleはプライバシーポリシーを更新し、インターネット上の公開データをAIの訓練に利用していることを明確にした。

Googleはプライバシーポリシーを更新し、インターネット上の公開データをAIの訓練に利用していることを明確にした。

7月6日、Googleはプライバシーポリシーを更新し、BardやCloud AIなどのさまざまな人工知能サービスが、Googleがインターネットから収集した公開データを使用してトレーニングされている可能性があることを示唆した。

Googleは月曜日にプライバシーポリシーを更新した。バード、クラウドAI、グーグル翻訳などの人工知能サービスが収集した公開データを使用した可能性があると言及した。

「当社は常にプライバシー ポリシーの透明性を保っており、オープン ウェブからの公開情報を使用して、Google Translate などのサービスの言語モデルをトレーニングしています」と、Google の広報担当者であるクリスタ マルドゥーン氏は述べています。「この最新の更新では、Bard などの新しいサービスも含まれることが明確にされています。当社は、AI 原則に従って、AI 技術の開発にプライバシー原則と安全対策を組み込んでいます。」

2023 年 7 月 1 日に更新された Google のプライバシー ポリシーでは、「Google は、ユーザーと一般の人々に利益をもたらすサービスの改善や新しい製品、機能、テクノロジーの開発のために情報を使用します」と規定されており、同社は「公開されている情報を使用して、Google の人工知能モデルのトレーニングや、Google Translate、Bard、Cloud AI などの製品や機能の開発に役立てる場合があります」とされています。

Google のプライバシー ポリシーの以前の更新からわかるように、Google は今回、収集された公開データを使用してどのサービスがトレーニングされるかについて、より明確にしています。たとえば、Google のプライバシー ポリシーでは、現在、情報は「言語モデル」だけでなく「AI モデル」にも使用される可能性があると明記されており、大規模な言語モデル以外のシステムのトレーニングや開発に公開データを使用する自由が Google に与えられています。しかし、この注意書きは、プライバシーポリシーの「あなたの地域の情報」タブにある「公開されているリソース」への埋め込みリンクの下に埋もれており、ユーザーは関連するコンテンツを見るためにリンクをクリックする必要がある。

更新されたプライバシーポリシーでは、「公開情報」がGoogleの人工知能製品のトレーニングに使用されると記載されているが、Googleが著作権で保護されたコンテンツをトレーニングデータベースに入力することを防ぐかどうか、またどのように防ぐかについては明記されていない。一般に公開されている多くの Web サイトでは、大規模な言語モデルやその他の AI ツールセットをトレーニングする目的でのデータ収集や Web スクレイピングを禁止するポリシーが設けられています。一般データ保護規則 (GDPR) などの規制により、明示的な許可なしにユーザーデータが悪用されるのを防ぐためです。

こうした規制と、ますます競争が激化する市場が相まって、GPT-4 のような主流の生成 AI システムの開発者は、モデルのトレーニングに使用するデータをどこから入手するか、そのデータにソーシャル メディアのコンテンツやアーティストや作家の著作権で保護された作品が含まれているかどうかについて、非常に慎重になっています。

しかし、データの公正利用の原則がこのような AI アプリケーションにまで拡張できるかどうかは、現時点では法的監督のグレーゾーンにあります。こうした不確実性から訴訟が起こり、一部の国ではAI企業がトレーニングデータを収集し使用する方法をより厳しく規制するより厳しい法律を導入するに至った。この不確実性は、このデータをどのように処理し、人工知能システムに高リスクの障害を引き起こさないようにするかなど、さまざまな問題も引き起こします。また、この膨大な量のデータを整理する責任者は、通常、過酷な労働条件で長時間耐えなければなりません。

米国最大の新聞社ガネットは、人工知能技術の進歩により検索大手がデジタル広告市場をさらに独占できるようになったとして、グーグルとその親会社アルファベットを相手取って訴訟を起こした。 Googleのベータ版AI検索などの製品も「模倣エンジン」であると非難され、他のウェブサイトへのトラフィックを枯渇させていると批判されている。

一方、大量の公開情報を含むソーシャルメディアプラットフォームのTwitterとRedditは最近、他社が自社のプラットフォーム上のデータに自由にアクセスするのを防ぐため、抜本的な対策を講じた。しかし、現在の API メカニズムを調整および制限するというプラットフォームの慣行は、Web スクレイピング データに対抗することを目的としたこのような調整がコア ユーザー エクスペリエンスに悪影響を及ぼすため、それぞれのユーザー コミュニティからも強く反対されています。

<<:  Midjourney モデルとその他の拡散モデルは、ランダム ノイズからどのように画像を生成するのでしょうか?

>>:  OpenAI、「超知能」AIを制御するための新チームを発表

ブログ    
ブログ    
ブログ    

推薦する

AI推論の進化

AI推論市場はここ3、4年で劇的に変化しました。以前は、エッジ AI は存在すらせず、推論機能のほと...

2016年の音声認識の発展を技術的な観点から振り返る

ディープラーニングと人工ニューラルネットワークの発展により、音声認識は 2016 年に一連のブレーク...

ビッグデータと AI は食品・飲料業界の発展にどのように役立つのでしょうか?

[[320404]]デジタル化は金融サービスからヘルスケアまでほぼすべての業界に混乱をもたらしてお...

20200202 千年に一度の対称性の日、すべての「回文アルゴリズム」をキャッチする時が来ました!

[[313923]]今日は2020年2月2日、「千年に一度の対称の日」として知られています。202...

DeLu Deep Vision: 3Dマシンビジョンに焦点を当て、セキュリティの「スマートアイ」を照らす

[[283588]] [51CTO.comより]先日、「勢いの刷新と知能の統合」をテーマにした世界人...

「遅れた接客」と批判されたインテリジェント接客の現状とは?

AIや5Gなどの新技術がもたらす変化により、顧客サービスシナリオは多様な変化を遂げており、兆レベル...

AppleとFacebookはなぜAIとフェイクニュースに関して異なる意見を持っているのでしょうか?

[[236525]]諺にもあるように、「聞いて信じる、見て信じる」です。しかし、AI技術の発展によ...

彼女はマスクとビットコインへの多額の投資により伝説となった! 2021年のトップ10テクノロジートレンドを発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

世界的EDA大手のシノプシスは米国から情報漏洩の疑いで捜査を受けており、ファーウェイとSMICもその渦中に巻き込まれている。

再度調査中! 世界最大の半導体設計ソフトウェア(EDA)サプライヤーであるシノプシスは、中国に重要な...

...

ロボットはどのようにして深く学習するのでしょうか?論理的判断と感情的な選択は依然として障害となっている

[[187099]]一人でいるときに少し寂しさを感じたらどうすればいいでしょうか?Microsoft...

Xiaolin が LRU アルゴリズムを破壊!

[[411501]]この記事はWeChatの公開アカウント「Xiao Lin Coding」から転...

ML 向け勾配降下法アルゴリズム 機械学習初心者向け勾配降下法アルゴリズム

[[197951]]基本概念このセクションでは、勾配降下法をより一般化するために、機械学習アルゴリズ...

...

超低消費電力センサーソリューションがスマートビルディングを実現する方法

現在、モノのインターネット(IoT)のインフラストラクチャはすでに非常に完成しており、その適用範囲は...