ChatGPT によってウェブサイトのデータが盗まれるのを防ぎたいですか?ついに解決策が見つかりました! これは 2 行のコードで実行でき、OpenAI によって公式にリリースされたものです。 先ほど、OpenAI はユーザー ドキュメント内の GPTBot の説明を更新しました。 この説明によれば、コンテンツ所有者は、ChatGPT のクローラーによるウェブサイトデータのクロールを拒否できるようになります。 これは、ウェブアクセスの停止に続く、著作権とプライバシー保護に関する OpenAI のもう一つの大きな動きです。 写真 しかし、OpenAI は依然として、コンテンツ所有者が GPTBot へのアクセス権を解放することを期待しています。 GPTBot のこの説明で、OpenAI は次のように述べています。 クローラーがデータにアクセスできるようにすると、AI モデルの精度とセキュリティが向上します。 しかし、少なくともサイト所有者には選択する権利があります。 しかし、一部のネットユーザーは問題を指摘した。
写真 OpenAIはまだこれについて説明していないので、まずはその対策を見てみましょう。 GPTクローラーを防ぐ3つの方法それで、OpenAIは何を発表したのでしょうか? まずはGPTBotのユーザー情報です。 ユーザーエージェントトークン: GPTBot UA はブラウザの ID であり、訪問者のシステム環境、ブラウザ カーネルのバージョン、言語など、多くの情報が含まれています。 HTML タグを使用すると、特定のブラウザが Web ページのコンテンツにアクセスできないようにすることができます。 この説明文書では、OpenAI は robots.txt を変更するという、クローラーをブロックするより簡単な方法も提供しています。 ウェブサイトの robots.txt に次のコードを追加するだけです。 ユーザーエージェント: GPTBot こうすることで、GPTBot はコンテンツをクロールするために Web サイトにアクセスしなくなります。 GPT による一部のコンテンツのクロールだけを禁止したい場合は、robots.txt を使用して設定することもできます。 上記の内容と同様に、アクセスを許可するディレクトリとアクセスを許可しないディレクトリを指定するだけです。 ユーザーエージェント: GPTBot このうち、Allow の方が優先度が高く、つまり、Allow ディレクトリが Disallow ディレクトリのサブディレクトリである場合は、アクセスが許可されます。 さらに、OpenAIはクローラーロボットのIPアドレスも公開しました。 クローラーが本当に心配な場合は、関連する IP アドレスによる Web サイトへのアクセスを禁止するように設定できます。 写真 robots.txtとは上記の robots.txt とは何ですか? また、なぜ GPT のクローラーをブロックするのですか? これは実際にはユーザー契約であり、サイト所有者はクローラーによるウェブサイトへのアクセスを禁止したり、クローラーによるコンテンツのクロールを禁止する設定を行うことができます。 この合意によれば、クローラーがそれにアクセスする能力を持っていたとしても、関連するコンテンツに遭遇したときには積極的にそれを避けることを選択します。 ChatGPT 自体も robots.txt を使用して、クローラーがユーザーの共有以外のコンテンツをクロールするのを防ぎます。 写真 実際、このプロトコルは AI が普及する前から存在しており、主に検索エンジンを制限するために使用されていました。 これは、検索エンジンでWeChatパブリックアカウントの記事が見つからない理由でもあります。 写真 これは紳士協定ですが、業界のルールとユーザーのプライバシーを尊重しているため、ほとんどのメーカーはこれに従うことを選択します。 今では、OpenAI もその仲間入りを果たしました。 もう一つ同時に、Google のクローラーは Web 全体のコンテンツをクロールしています。 しかし、ネットユーザーはこれに対してより寛容であるようだ。
写真 モデルの品質向上とクリエイターの保護のバランスをどのように取るべきだとお考えですか? 参考リンク: [1] https://platform.openai.com/docs/gptbot |
<<: 企業における生成AIのセキュリティリスクを管理する方法
>>: 清華大学のFaceWall Intelligenceは、大規模なモデルを16,000以上の実際のAPIに接続し、オープンソースのToolLLMはChatGPTに近い
[[388553]] 3月18日夜、企業やメーカーが個人情報を不法に収集し、商業目的で利用する事件が...
[[246219]]強化学習 AI がゲームをプレイすることは珍しくありません。インテリジェントエ...
電子ファンネットワークが報じた(文/李婉婉)近年、技術の継続的な進歩に伴い、人工知能産業は急速に発展...
[[393090]]この記事はWeChatの公開アカウント「Qianyu's IT Hou...
現在、人工知能は独立に向けて動き始めています。世界中の企業はこの学際的な分野に適応し、ほぼすべてのビ...
[[347900]] 2020年10月、ディープラーニング分野のトップカンファレンスであるICLR ...
[[282882]]リーパードローンつい最近、米国空軍は、リーパー無人航空機の製造元であるゼネラル・...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ビッグデータと人工知能の市場は現在、活況を呈しています。調査会社の最近の予測によると、これら2つの技...
編集者注: ブロックチェーンと AI は、今日最もホットな 2 つの技術方向であると言えます。一般の...
本当に信じられません、この時代の変化のスピードは想像を絶します!革新!革新!再びイノベーション!次か...