ChatGPT によってウェブサイトのデータが盗まれるのを防ぎたいですか?ついに解決策が見つかりました! これは 2 行のコードで実行でき、OpenAI によって公式にリリースされたものです。 先ほど、OpenAI はユーザー ドキュメント内の GPTBot の説明を更新しました。 この説明によれば、コンテンツ所有者は、ChatGPT のクローラーによるウェブサイトデータのクロールを拒否できるようになります。 これは、ウェブアクセスの停止に続く、著作権とプライバシー保護に関する OpenAI のもう一つの大きな動きです。 写真 しかし、OpenAI は依然として、コンテンツ所有者が GPTBot へのアクセス権を解放することを期待しています。 GPTBot のこの説明で、OpenAI は次のように述べています。 クローラーがデータにアクセスできるようにすると、AI モデルの精度とセキュリティが向上します。 しかし、少なくともサイト所有者には選択する権利があります。 しかし、一部のネットユーザーは問題を指摘した。
写真 OpenAIはまだこれについて説明していないので、まずはその対策を見てみましょう。 GPTクローラーを防ぐ3つの方法それで、OpenAIは何を発表したのでしょうか? まずはGPTBotのユーザー情報です。 ユーザーエージェントトークン: GPTBot UA はブラウザの ID であり、訪問者のシステム環境、ブラウザ カーネルのバージョン、言語など、多くの情報が含まれています。 HTML タグを使用すると、特定のブラウザが Web ページのコンテンツにアクセスできないようにすることができます。 この説明文書では、OpenAI は robots.txt を変更するという、クローラーをブロックするより簡単な方法も提供しています。 ウェブサイトの robots.txt に次のコードを追加するだけです。 ユーザーエージェント: GPTBot こうすることで、GPTBot はコンテンツをクロールするために Web サイトにアクセスしなくなります。 GPT による一部のコンテンツのクロールだけを禁止したい場合は、robots.txt を使用して設定することもできます。 上記の内容と同様に、アクセスを許可するディレクトリとアクセスを許可しないディレクトリを指定するだけです。 ユーザーエージェント: GPTBot このうち、Allow の方が優先度が高く、つまり、Allow ディレクトリが Disallow ディレクトリのサブディレクトリである場合は、アクセスが許可されます。 さらに、OpenAIはクローラーロボットのIPアドレスも公開しました。 クローラーが本当に心配な場合は、関連する IP アドレスによる Web サイトへのアクセスを禁止するように設定できます。 写真 robots.txtとは上記の robots.txt とは何ですか? また、なぜ GPT のクローラーをブロックするのですか? これは実際にはユーザー契約であり、サイト所有者はクローラーによるウェブサイトへのアクセスを禁止したり、クローラーによるコンテンツのクロールを禁止する設定を行うことができます。 この合意によれば、クローラーがそれにアクセスする能力を持っていたとしても、関連するコンテンツに遭遇したときには積極的にそれを避けることを選択します。 ChatGPT 自体も robots.txt を使用して、クローラーがユーザーの共有以外のコンテンツをクロールするのを防ぎます。 写真 実際、このプロトコルは AI が普及する前から存在しており、主に検索エンジンを制限するために使用されていました。 これは、検索エンジンでWeChatパブリックアカウントの記事が見つからない理由でもあります。 写真 これは紳士協定ですが、業界のルールとユーザーのプライバシーを尊重しているため、ほとんどのメーカーはこれに従うことを選択します。 今では、OpenAI もその仲間入りを果たしました。 もう一つ同時に、Google のクローラーは Web 全体のコンテンツをクロールしています。 しかし、ネットユーザーはこれに対してより寛容であるようだ。
写真 モデルの品質向上とクリエイターの保護のバランスをどのように取るべきだとお考えですか? 参考リンク: [1] https://platform.openai.com/docs/gptbot |
<<: 企業における生成AIのセキュリティリスクを管理する方法
>>: 清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い
Amazon Web Services Inc. は本日、自社のエコシステムにおいて、企業顧客が独自...
昨年、新型コロナウイルス感染症のパンデミックが始まったとき、クリーブランド・クリニックの医師で最高研...
敵対的機械学習とは、主に、攻撃者の能力と攻撃の結果の調査と理解に基づいて、セキュリティ上の課題 (攻...
COVID-19パンデミックが猛威を振るい、人々のメンタルヘルスが危機に瀕し、医療費が上昇し、人口...
サイエンスフィクションネットワーク、11月18日(朱熹偉)技術の発展に伴い、さまざまな形や大きさのロ...
毎分250人の赤ちゃんが生まれ、世界では4回の地震が発生し、シンガポール港では1,000トンを超える...
フィナンシャル・タイムズによると、8月8日、ソーシャルメディア大手のMeta(旧Facebook)は...
画像ソース: Unsplash新世代情報技術の急速な発展に伴い、コンピューティング能力、データ処理能...
前回の記事では、GoogLeNet InceptionV1のネットワーク構造を紹介しました。この記事...
この問題はネットワークフロー理論において非常に基本的なものです。 「新しいアルゴリズムは驚くほど高速...
アメリカのテクノロジーの天才イーロン・マスク氏は、彼の研究チームが脳と機械の相互接続を可能にする脳・...
AI は、米国が戦争を戦い、脅威を監視し、国防を維持する方法を含め、ほぼすべてのことを行う方法を変え...
[[422090]]オックスフォード大学の研究によると、機械学習モデルは従来の物理ソルバーに比べて物...