AIがAIに勝つ: Googleの研究チームがGPT-4を使ってAI-Guardianのレビューシステムを打ち破る

AIがAIに勝つ: Googleの研究チームがGPT-4を使ってAI-Guardianのレビューシステムを打ち破る

8月2日、Googleの研究チームはOpenAIのGPT-4を使用して他のAIモデルのセキュリティ保護対策を突破する実験を行っていた。同チームは現在、AI-Guardianレビューシステムを突破し、関連する技術的詳細を共有した

IT Homeは問い合わせたところ、AI-Guardianは写真に不適切な内容が含まれているかどうか、また写真自体が他のAIによって変更されているかどうかを検出できるAIレビューシステムであることを知りました。写真に上記の兆候が見られた場合、管理者が来て対処するよう促されます。

Google Deep Mindの研究者であるNicholas Carlini氏は、「LLM支援によるAI-Guardianの開発」と題した論文の中で、GPT-4を使用して「攻撃方法を設計し、攻撃の原則を記述」し、これらのソリューションを使用してAI-Guardianの防御メカニズムを欺くことを検討しました。

▲ 画像出典: Google リサーチ チーム

GPT-4はAI-Guardianを欺くために一連の誤ったスクリプトと説明を送信すると報告されています。論文では、 GPT-4はAI-Guardianに「銃を持っている人の写真」を「無害なリンゴを持っている人の写真」であると思わせることができ、AI-Guardianが関連する画像入力ソースを直接放出できるようになると言及されています。 Googleの研究チームは、GPT-4の助けを借りて、AI-Guardianの防御を「破り」、モデルの精度を98%からわずか8%にまで下げることに成功したと述べた。

関連する技術文書はArXivで公開されています。興味のある方はぜひご覧ください。ただし、AI-Guardianの開発者は、Google研究チームのこの攻撃方法は、AI-Guardianの将来のバージョンでは利用できなくなることも指摘しています。他のモデルも追随することを考えると、Googleの現在の攻撃計画は、将来的に参考程度にしか使えません。

<<:  複雑な課題に対するスマートなソリューション: 自動化の成功への道

>>:  GPTベースの開発者ツール

ブログ    
ブログ    

推薦する

XML暗号化アルゴリズムが破られ、W3CはXML暗号化標準を改訂する必要がある

ルール研究所の研究者らは、XML 暗号化プロトコルに重大なセキュリティ上の脆弱性を発見し、シカゴで開...

テスラAIディレクター:33年前にルカンのニューラルネットワークを再現したが、今とあまり変わらない

最近、Tesla AI のシニアディレクターである Andrej Karpathy 氏が、非常に興味...

...

張北院士:生成型人工知能の3つの大きな機能と1つの大きな欠点

網易科技は1月16日、知普AI技術公開デーで中国科学院院士で清華大学教授の張北氏が「大規模言語モデル...

Python による階層的クラスター分析

[[334729]]機械学習を行う際には、データのクラスター分析を行う必要があることがよくあります。...

...

人工知能の先駆者であるIBM Watsonは殉教者となったのか? IBMがWatsonを売却、AIは本当に失敗したのか?

かつて、人工知能医療診断の先駆者であったIBM Watson(通称ワトソン)は、現実世界における人工...

この AI 商用リストをお見逃しなく: 生産上の問題はアプリケーションで解決できるかもしれません (続き)

[[220537]]リアム・ヘーネル編纂者:趙怡雲、江宝尚、銭天培新年を前に、温翁氏は音声認識から...

世界を変える 7 つの AI アプリケーション | Frontier Exploration

カリフォルニア大学サンディエゴ校で開発・実装されている AI 主導のテクノロジーとイノベーションの多...

AIがサプライチェーンを変革する7つの方法

ビジネスにおける AI の役割は拡大し続けています。これは、サプライ チェーンとビジネス プロセスの...

機械学習の応用シナリオは数多くありますが、金融分野での違いは何でしょうか?

[[241804]]ビッグデータダイジェスト制作編纂者:大迪、彭耀慧、茶曦、唐元、夏亜偉金融の世界...

...

2020 年のトップ産業人工知能アプリケーション

[[337240]]人工知能技術は今、世界を変えつつあります。多くの業界はすでに、ビジネス プロセス...

AIが人間の職業を「置き換える」ためのロードマップ

昨日、私はこのような図を見ました。AI がどのように人間に取って代わるかを示すレベル図です。写真写真...

...