AIがAIに勝つ: Googleの研究チームがGPT-4を使ってAI-Guardianのレビューシステムを打ち破る

AIがAIに勝つ: Googleの研究チームがGPT-4を使ってAI-Guardianのレビューシステムを打ち破る

8月2日、Googleの研究チームはOpenAIのGPT-4を使用して他のAIモデルのセキュリティ保護対策を突破する実験を行っていた。同チームは現在、AI-Guardianレビューシステムを突破し、関連する技術的詳細を共有した

IT Homeは問い合わせたところ、AI-Guardianは写真に不適切な内容が含まれているかどうか、また写真自体が他のAIによって変更されているかどうかを検出できるAIレビューシステムであることを知りました。写真に上記の兆候が見られた場合、管理者が来て対処するよう促されます。

Google Deep Mindの研究者であるNicholas Carlini氏は、「LLM支援によるAI-Guardianの開発」と題した論文の中で、GPT-4を使用して「攻撃方法を設計し、攻撃の原則を記述」し、これらのソリューションを使用してAI-Guardianの防御メカニズムを欺くことを検討しました。

▲ 画像出典: Google リサーチ チーム

GPT-4はAI-Guardianを欺くために一連の誤ったスクリプトと説明を送信すると報告されています。論文では、 GPT-4はAI-Guardianに「銃を持っている人の写真」を「無害なリンゴを持っている人の写真」であると思わせることができ、AI-Guardianが関連する画像入力ソースを直接放出できるようになると言及されています。 Googleの研究チームは、GPT-4の助けを借りて、AI-Guardianの防御を「破り」、モデルの精度を98%からわずか8%にまで下げることに成功したと述べた。

関連する技術文書はArXivで公開されています。興味のある方はぜひご覧ください。ただし、AI-Guardianの開発者は、Google研究チームのこの攻撃方法は、AI-Guardianの将来のバージョンでは利用できなくなることも指摘しています。他のモデルも追随することを考えると、Googleの現在の攻撃計画は、将来的に参考程度にしか使えません。

<<:  複雑な課題に対するスマートなソリューション: 自動化の成功への道

>>:  GPTベースの開発者ツール

ブログ    
ブログ    

推薦する

初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

2018年の初めに、人工知能は大きな進歩を遂げました。 1月11日、スタンフォード大学が主催する世界...

マスクは想像力が豊かだ!コンピュータと人間の脳を融合する

[51CTO.com からのオリジナル記事] ウォールストリートジャーナルの最近の報道によると、テク...

ハーバード大学の科学者がシャコの「バネ仕掛けの拳」機構を模倣したマイクロロボットを開発

海外メディアの報道によると、シャコは世界で最も速い動物種の一つだが、シャコがどのようにしてこのような...

グラフやグラフニューラルネットワークについて学びたいですか?論文を読むより良い方法はありません。

グラフ埋め込み、グラフ表現、グラフ分類、グラフニューラルネットワーク、この記事では必要なグラフモデリ...

画像内の文字の教師なし学習

[[201526]]人間の行動に関する研究が最近、Nature の子会社である Nature Hum...

プログラマーが知っておくべき10の基本的な実用的なアルゴリズムとその説明

アルゴリズム1: クイックソートアルゴリズムクイックソートは、Tony Hall によって開発された...

「機械による人代替」が雇用問題を引き起こす。第一線で働く人々の未来はどうなるのか?

人工知能技術の推進により、製造業の変革と高度化が進み、「機械が人に代わる」という波が起こり、その社会...

人工知能があなたの好きな家を見つけるお手伝いをします

潜在的な購入者が住宅を閲覧したり、オンラインで検索したりする際に、エージェントやブローカーによる物件...

...

情報抽出における画期的な進歩! NLP は大規模に実装されようとしているのでしょうか?

AI におけるブレークスルーには、一般的に 3 つの種類があります。学術ランキングで上位を占め、学...

安全で制御可能、かつ法的に準拠した人工知能は金融分野で「原則化」されている

現在、国内の新興デジタルインフラの進歩と、5G、クラウドコンピューティング、ビッグデータなどのモジュ...

人工知能技術は子供たちにどのような影響を与えるのでしょうか?

人工知能技術は、おもちゃ、オンライン アプリケーション、ビデオ ゲームに組み込まれています。AI ア...

...

...

新しいNeRF技術は、ビデオを簡単に制御できる3Dモデルに変換できます。

翻訳者 |ブガッティレビュー | Chonglou人間の動きが複雑で、環境によって見た目が微妙に異な...