ChatGPT によってウェブサイトのデータが盗まれるのを防ぎたいですか?ついに解決策が見つかりました! これは 2 行のコードで実行でき、OpenAI によって公式にリリースされたものです。 先ほど、OpenAI はユーザー ドキュメント内の GPTBot の説明を更新しました。 この説明によれば、コンテンツ所有者は、ChatGPT のクローラーによるウェブサイトデータのクロールを拒否できるようになります。 これは、ウェブアクセスの停止に続く、著作権とプライバシー保護に関する OpenAI のもう一つの大きな動きです。 写真 しかし、OpenAI は依然として、コンテンツ所有者が GPTBot へのアクセス権を解放することを期待しています。 GPTBot のこの説明で、OpenAI は次のように述べています。 クローラーがデータにアクセスできるようにすると、AI モデルの精度とセキュリティが向上します。 しかし、少なくともサイト所有者には選択する権利があります。 しかし、一部のネットユーザーは問題を指摘した。
写真 OpenAIはまだこれについて説明していないので、まずはその対策を見てみましょう。 GPTクローラーを防ぐ3つの方法それで、OpenAIは何を発表したのでしょうか? まずはGPTBotのユーザー情報です。 ユーザーエージェントトークン: GPTBot UA はブラウザの ID であり、訪問者のシステム環境、ブラウザ カーネルのバージョン、言語など、多くの情報が含まれています。 HTML タグを使用すると、特定のブラウザが Web ページのコンテンツにアクセスできないようにすることができます。 この説明文書では、OpenAI は robots.txt を変更するという、クローラーをブロックするより簡単な方法も提供しています。 ウェブサイトの robots.txt に次のコードを追加するだけです。 ユーザーエージェント: GPTBot こうすることで、GPTBot はコンテンツをクロールするために Web サイトにアクセスしなくなります。 GPT による一部のコンテンツのクロールだけを禁止したい場合は、robots.txt を使用して設定することもできます。 上記の内容と同様に、アクセスを許可するディレクトリとアクセスを許可しないディレクトリを指定するだけです。 ユーザーエージェント: GPTBot このうち、Allow の方が優先度が高く、つまり、Allow ディレクトリが Disallow ディレクトリのサブディレクトリである場合は、アクセスが許可されます。 さらに、OpenAIはクローラーロボットのIPアドレスも公開しました。 クローラーが本当に心配な場合は、関連する IP アドレスによる Web サイトへのアクセスを禁止するように設定できます。 写真 robots.txtとは上記の robots.txt とは何ですか? また、なぜ GPT のクローラーをブロックするのですか? これは実際にはユーザー契約であり、サイト所有者はクローラーによるウェブサイトへのアクセスを禁止したり、クローラーによるコンテンツのクロールを禁止する設定を行うことができます。 この合意によれば、クローラーがそれにアクセスする能力を持っていたとしても、関連するコンテンツに遭遇したときには積極的にそれを避けることを選択します。 ChatGPT 自体も robots.txt を使用して、クローラーがユーザーの共有以外のコンテンツをクロールするのを防ぎます。 写真 実際、このプロトコルは AI が普及する前から存在しており、主に検索エンジンを制限するために使用されていました。 これは、検索エンジンでWeChatパブリックアカウントの記事が見つからない理由でもあります。 写真 これは紳士協定ですが、業界のルールとユーザーのプライバシーを尊重しているため、ほとんどのメーカーはこれに従うことを選択します。 今では、OpenAI もその仲間入りを果たしました。 もう一つ同時に、Google のクローラーは Web 全体のコンテンツをクロールしています。 しかし、ネットユーザーはこれに対してより寛容であるようだ。
写真 モデルの品質向上とクリエイターの保護のバランスをどのように取るべきだとお考えですか? 参考リンク: [1] https://platform.openai.com/docs/gptbot |
<<: 企業における生成AIのセキュリティリスクを管理する方法
>>: 清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い
Googleは8月9日、「Project IDX」プロジェクトを公開し、AI技術を統合したコードエデ...
バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。 The Vergeによると: ...
ビッグモデルは言語から視覚へと飛躍し、テキストと画像のコンテンツをシームレスに理解して生成する可能性...
サイバーセキュリティは、今日世界中の企業が直面している戦略的な課題です。パンデミックによって加速した...
サイバーセキュリティの状況は毎年、組織が対処する必要のある新たな課題や障害をもたらしており、たとえば...
次のプロジェクトに機械学習を取り入れるべき 4 つの理由をご紹介します。 理由その1 – マーケティ...
自分で認めなさい!マスク氏のニューラリンクはチップを開発している。この技術は「数年以内」にリリースさ...
[[411678]]人工知能は現在、多くの CEO にとって最重要課題となっています。この話題は目新...
[[419760]] 「クラブアップルの木は、その赤みがかった色にもかかわらず、霧雨の中にひとりぼっ...
[[424946]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
[51CTO.comからのオリジナル記事] 近年、生体認証技術はますます成熟し、私たちの生活の中に...
[[382172]]人工知能企業が株式を公開すると、株主は成長の配当を分け合えるようになるのでしょ...