Google の研究者が GPT-4 を使用してレビュー システムを破る AI-Guardian

Google の研究者が GPT-4 を使用してレビュー システムを破る AI-Guardian

海外メディアの報道によると、8月2日、Googleの研究者らは、OpenAIのGPT-4を研究アシスタントとして使用してAI-Guardianを回避する方法を実証した。

AI-Guardian は、画像に不適切なコンテンツが含まれているかどうかを検出するために使用される AI レビュー システムであり、画像が他の AI によって変更されているかどうかも識別できます。不適切なコンテンツや改ざんの兆候が検出されると、システムは管理者にアクションを起こすよう促します。

Google DeepMindの研究科学者であるニコラス・カルリーニ氏は論文の中で、GPT-4がAI-Guardianの保護手段を回避する攻撃方法を考案するように指示された経緯を明らかにした。この実験は、セキュリティ研究の進歩におけるチャットボットの潜在的な価値を実証し、GPT-4 のような強力な言語モデルが将来のサイバーセキュリティに及ぼす影響を強調しました。

Carlini 氏の研究では、OpenAI の大規模言語モデル GPT-4 を使用して AI-Guardian に対する攻撃戦略を開発する方法を調査しました。 AI-Guardian は元々、疑わしいアーティファクトを含む入力を識別してブロックすることで敵対的な攻撃を防ぐために開発されました。しかし、Carlini 氏の論文では、プロンプトに導かれた GPT-4 がスクリプトを生成し、AI-Guardian の検出メカニズムをトリガーせずに分類器を欺く画像調整を説明することで、AI-Guardian の防御を克服できることが示されています。

Carlini 氏の論文には、AI-Guardian の脆弱性を悪用する可能性のある、GPT-4 によって示唆された Python コードが含まれています。その結果、元の AI-Guardian 研究の脅威モデルでは、AI-Guardian の堅牢性は 98% からわずか 8% に低下しました。 AI-Guardian の作者らは、Carlini の攻撃が防御をうまく回避したことを認めた。

Nicholas Carlini 氏による GPT-4 を使用して AI-Guardian を倒す実験は、AI 対 AI の取り組みにおける重要なマイルストーンとなります。言語モデルを研究支援として使用して脆弱性を発見し、サイバーセキュリティ対策を強化する方法を示します。 GPT-4 の機能は将来のセキュリティ研究に有望な展望をもたらす一方で、人間の専門知識と共同作業の重要性も浮き彫りにしています。 AI 言語モデルが進化し続けると、サイバーセキュリティの分野に革命をもたらし、敵対的攻撃に対する防御の革新的なアプローチを生み出す可能性があります。

<<:  AIとソフトウェアが5Gデータセンターの変革を推進する方法

>>:  交通における人工知能: スマートソリューションによる交通革命

ブログ    
ブログ    
ブログ    

推薦する

人工知能の市場推進要因、制約、機会

今日、ますます多くの企業が、事業運営に人工知能技術を活用しています。このテクノロジーは非常に建設的で...

...

人工知能は防衛システムをどのように変えるのでしょうか?

この記事では、人工知能が防衛システムにどのように革命をもたらし、より安全な未来を実現できるかを探りま...

あなたの次のオフィスアシスタントはロボットでしょうか?

2014年、日本のソフトバンクモバイルストアに新たな仲間が加わった。それは、人の表情や声のトーンを...

プログラマーでなくてもわかる「機械学習」の原理

機械学習とは何ですか?一般的なシナリオから始めましょう:ある日、マンゴーを買いに行ったところ、店員が...

...

AI顔認識:スマート監視を開発する方法

顔認識技術は継続的に発展しており、スマート監視システムの開発に貢献しています。これらのシステムにより...

香港大学の黄凱斌氏:6G時代のエッジインテリジェンス、シャノンとチューリングの出会い

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

中国では普及していない無人コンビニが、なぜアメリカでは人気があるのか​​?

[[247391]] 2018年1月、米国シアトルのアマゾン本社にアマゾン初の無人コンビニエンスス...

AI(人工知能)について知っておくべきこと

どのような AI テクノロジーが人気があり、人間の生活に影響を与えるでしょうか? [[398271]...

...

2020年に人工知能は私たちの生活をどのように変えたのでしょうか?

2020年はごく平凡な年であると同時に、非常に非凡な年でもありました。生活の面では、人工知能が配達...

50%-70%スリムダウン、Ctrip Taroミニプログラムサイズ削減計画

著者についてCtrip のフロントエンド開発者である Can は、現在ミニプログラムの開発に従事して...

...

陸軍におけるAIと自律型ロボット

AI やロボットについて話すとき、多くの人の頭に最初に浮かぶのは、しばしば「終末後の時代」に猛威を振...