Googleはプライバシーポリシーを更新し、インターネット上の公開データをAIの訓練に利用していることを明確にした。

Googleはプライバシーポリシーを更新し、インターネット上の公開データをAIの訓練に利用していることを明確にした。

7月6日、Googleはプライバシーポリシーを更新し、BardやCloud AIなどのさまざまな人工知能サービスが、Googleがインターネットから収集した公開データを使用してトレーニングされている可能性があることを示唆した。

Googleは月曜日にプライバシーポリシーを更新した。バード、クラウドAI、グーグル翻訳などの人工知能サービスが収集した公開データを使用した可能性があると言及した。

「当社は常にプライバシー ポリシーの透明性を保っており、オープン ウェブからの公開情報を使用して、Google Translate などのサービスの言語モデルをトレーニングしています」と、Google の広報担当者であるクリスタ マルドゥーン氏は述べています。「この最新の更新では、Bard などの新しいサービスも含まれることが明確にされています。当社は、AI 原則に従って、AI 技術の開発にプライバシー原則と安全対策を組み込んでいます。」

2023 年 7 月 1 日に更新された Google のプライバシー ポリシーでは、「Google は、ユーザーと一般の人々に利益をもたらすサービスの改善や新しい製品、機能、テクノロジーの開発のために情報を使用します」と規定されており、同社は「公開されている情報を使用して、Google の人工知能モデルのトレーニングや、Google Translate、Bard、Cloud AI などの製品や機能の開発に役立てる場合があります」とされています。

Google のプライバシー ポリシーの以前の更新からわかるように、Google は今回、収集された公開データを使用してどのサービスがトレーニングされるかについて、より明確にしています。たとえば、Google のプライバシー ポリシーでは、現在、情報は「言語モデル」だけでなく「AI モデル」にも使用される可能性があると明記されており、大規模な言語モデル以外のシステムのトレーニングや開発に公開データを使用する自由が Google に与えられています。しかし、この注意書きは、プライバシーポリシーの「あなたの地域の情報」タブにある「公開されているリソース」への埋め込みリンクの下に埋もれており、ユーザーは関連するコンテンツを見るためにリンクをクリックする必要がある。

更新されたプライバシーポリシーでは、「公開情報」がGoogleの人工知能製品のトレーニングに使用されると記載されているが、Googleが著作権で保護されたコンテンツをトレーニングデータベースに入力することを防ぐかどうか、またどのように防ぐかについては明記されていない。一般に公開されている多くの Web サイトでは、大規模な言語モデルやその他の AI ツールセットをトレーニングする目的でのデータ収集や Web スクレイピングを禁止するポリシーが設けられています。一般データ保護規則 (GDPR) などの規制により、明示的な許可なしにユーザーデータが悪用されるのを防ぐためです。

こうした規制と、ますます競争が激化する市場が相まって、GPT-4 のような主流の生成 AI システムの開発者は、モデルのトレーニングに使用するデータをどこから入手するか、そのデータにソーシャル メディアのコンテンツやアーティストや作家の著作権で保護された作品が含まれているかどうかについて、非常に慎重になっています。

しかし、データの公正利用の原則がこのような AI アプリケーションにまで拡張できるかどうかは、現時点では法的監督のグレーゾーンにあります。こうした不確実性から訴訟が起こり、一部の国ではAI企業がトレーニングデータを収集し使用する方法をより厳しく規制するより厳しい法律を導入するに至った。この不確実性は、このデータをどのように処理し、人工知能システムに高リスクの障害を引き起こさないようにするかなど、さまざまな問題も引き起こします。また、この膨大な量のデータを整理する責任者は、通常、過酷な労働条件で長時間耐えなければなりません。

米国最大の新聞社ガネットは、人工知能技術の進歩により検索大手がデジタル広告市場をさらに独占できるようになったとして、グーグルとその親会社アルファベットを相手取って訴訟を起こした。 Googleのベータ版AI検索などの製品も「模倣エンジン」であると非難され、他のウェブサイトへのトラフィックを枯渇させていると批判されている。

一方、大量の公開情報を含むソーシャルメディアプラットフォームのTwitterとRedditは最近、他社が自社のプラットフォーム上のデータに自由にアクセスするのを防ぐため、抜本的な対策を講じた。しかし、現在の API メカニズムを調整および制限するというプラットフォームの慣行は、Web スクレイピング データに対抗することを目的としたこのような調整がコア ユーザー エクスペリエンスに悪影響を及ぼすため、それぞれのユーザー コミュニティからも強く反対されています。

<<:  Midjourney モデルとその他の拡散モデルは、ランダム ノイズからどのように画像を生成するのでしょうか?

>>:  OpenAI、「超知能」AIを制御するための新チームを発表

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ニューヨーク大学のチームは、自然言語を使ってチャットボットChatGPTを使ってマイクロプロセッサをゼロから設計した。

6月19日、生成型人工知能がハードウェア設計などの分野に参入し始めました。最近、ニューヨーク大学の...

海雲捷迅2018ビッグデータ博覧会ツアー——2018ビッグデータ博覧会人工知能世界大会決勝戦が終了

5月25日、2018年中国国際ビッグデータ博覧会人工知能世界大会決勝戦が予定通り貴陽で開催され、世界...

インタビュアー: 一般的なソートアルゴリズムは何ですか?違い?

[[426795]]この記事はWeChatの公開アカウント「JS Daily Question」か...

IoTとAIのトレンドが今日のビジネスに及ぼす影響

IoT と AI の誇大宣伝サイクルは、企業が大きな価値を認識し始める段階まで進んでいます。 IoT...

...

なぜ失敗したかご存知ですか?機械学習プロジェクトの 87% がこのように失敗します…

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

北京、上海、深セン、杭州、中国の人工知能産業のリーダーは誰でしょうか?

人工知能企業は主に北京、上海、深セン、杭州に分布している中国新世代人工知能開発研究所のデータによると...

最高裁判所も顔認識の乱用に対して行動を起こした。

生体認証技術である顔認証は、非接触、非強制、同時性などの特徴から、ますます広く利用され、人々の生活の...

マイクロソフトの新特許公開:機械学習で「赤面」するリアルなアバターを作成

11月16日、現地時間の火曜日、米国特許商標庁のウェブサイトでマイクロソフトの新しい特許が公開された...

XML暗号化アルゴリズムが破られ、W3CはXML暗号化標準を改訂する必要がある

ルール研究所の研究者らは、XML 暗号化プロトコルに重大なセキュリティ上の脆弱性を発見し、シカゴで開...

CNN の弱点を見つけ、MNIST の「ルーチン」に注意する

[[191828]] CNN は現在非常に人気のあるモデルです。多くの画像検索問題において、CNN ...

ボストン・ダイナミクスの最新倉庫ロボットは1時間あたり800個のレンガを移動できる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

第1回世界情報会議は6月29日〜30日に天津で開催される。

【51CTO北京ニュース】2017年6月6日、北京で第1回世界インテリジェンス大会の記者会見が開催...

ビッグデータ、人工知能、そして法曹界の未来

私は人工知能と法曹界の将来について数多くの講演を行ってきました。過去2年間、AlphaGo Zero...