マイクロソフト、AI モデルのリスクを発見するツール「PyRIT」を発表

マイクロソフト、AI モデルのリスクを発見するツール「PyRIT」を発表

ハッキング技術を使ってサイバーセキュリティの問題を明らかにする任務を負ったマイクロソフトのチームは、開発者が人工知能モデルのリスクを見つけるのに役立つ社内ツール「PyRIT」をオープンソース化した。

研究者らは木曜日にこのフレームワークのコードを公開した。マイクロソフトは、PyRIT は何千もの敵対的 AI プロンプトを自動的に生成し、ニューラル ネットワークがハッカーの攻撃に効果的に抵抗できるかどうかをテストできると述べた。このツールは主にテキストを処理するように設計されていますが、開発者が画像などの AI を活用した入力タイプを追加できるように構築されています。

PyRIT はもともと、Microsoft の AI Red Team テスト チームが社内で使用していたスクリプトのコレクションでした。チームは、ハッカーよりも先に弱点を見つけられるように、新しい AI モデルに対するサイバー攻撃をシミュレートする責任を負っています。研究者たちは、コードベースが今週リリースされた PyRIT フレームワークに進化するまで、追加機能でスクリプトを拡張し続けました。

新しく作成された AI モデルを本番環境に展開する前に、開発者はいくつかのカテゴリのリスクについてテストする必要があります。モデルがマルウェアを作成する原因となるヒントなど、サイバーセキュリティのリスクを探す必要があります。ソフトウェア チームは、AI が幻覚を起こしている可能性のある状況を探し、AI が騙されてトレーニング データ セットから機密情報を漏らしてしまう可能性があるかどうかを判断する必要もあります。

一部のモデルはテキストだけでなく画像などの他の種類の出力も生成するため、このタスクはさらに複雑になります。脆弱性テストは、出力の種類ごと、およびユーザーが AI と対話するソフトウェア インターフェイスごとに繰り返す必要があります。つまり、ニューラル ネットワークを徹底的にテストするには、開発者が何千もの敵対的なプロンプトを作成する必要がありますが、これは多くの場合非現実的です。

Microsoft はこの制限を取り除くために PyRIT を作成しました。同社によれば、このフレームワークにより、開発者は特定の種類の敵対的AI入力を指定し、基準を満たす何千ものプロンプトを自動的に生成できるようになるという。これらのプロンプトは、Web サービスとして実装された AI や、アプリケーション プログラミング インターフェイスを通じて提供されるモデルをテストするために使用できます。

「PyRIT は、生成 AI システムの人間によるレッドチーム作業に代わるものではありません」と、マイクロソフトの研究者はフレームワークの詳細を説明したブログ投稿で強調しています。「むしろ、AI レッドチーム メンバーの既存のドメイン専門知識を補強し、面倒な作業を自動化します。」

PyRIT は敵対的なプロンプトを生成するだけでなく、ターゲット モデルの応答も評価します。 Microsoft によれば、組み込みのスコアリング エンジンは、開発者がテストしている P2P アプリケーションが信頼性が高く効果的であるかどうかを自動的に判断し、その後、アプリケーションが信頼性が高く効果的であるかどうかを自動的に判断します。

PyRIT は AI の応答を分析できるため、いわゆるマルチラウンドのリスク評価を実行するのに適しています。このフレームワークは、敵対的なプロンプトを AI に提供し、その応答を分析し、それに応じて次のプロンプトを調整して、より効果的なものにすることができます。 「単一ラウンドの攻撃戦略は計算時間が短いが、複数ラウンドのレッドチームテストでは、より現実的な敵対行動とより高度な攻撃戦略が可能になる」とマイクロソフトの研究者は説明した。

<<:  2024年の製造業の現状:完全デジタル化

>>: 

ブログ    

推薦する

ディープラーニングに基づく画像マッチング技術の概要

画像マッチング応用:ターゲット認識、ターゲット追跡、超解像度画像再構成、視覚ナビゲーション、画像ステ...

...

クレジットカード詐欺を検出するための機械学習モデルを構築するにはどうすればよいでしょうか?

[[187627]]機械学習は、Apple の Siri や Google のアシスタントなどのス...

...

清華大学特別賞焦建涛のビッグモデル起業:GPT-4ツールの使用における画期的進歩、オープンソースのシードラウンドで7000万ドルの資金調達

清華大学の卒業生 2 人によって作成されたこのツールは、ツールの使用においてGPT-4 の主要な利点...

2018 年に人工知能を変える 5 つのビッグデータ トレンド

[[211908]]ビッグデータや人工知能の広範な導入を通じて、これらの新興技術の大きな影響が世界経...

...

Playgroundで数値アルゴリズムを学ぶ

中学校では、数学の描画ほど恐ろしいものはありませんでした。多くの問題にはすぐに利用できる解析的解法が...

ヘルスケアにおける AI の活用: データを行動に変える

ヘルスケアにおける人工知能 (AI) の利点を裏付ける統計、調査、業界の誇大宣伝は数多くあります。人...

AIエンジニアの成長ストーリー~働き方編~

[[409282]]この記事では、特に仕事の方法について取り上げます。エンジニアの中には非常に頭の...

...

わが国には「人工知能」関連企業が43万社以上あり、2021年上半期には前年比150.8%増加した。

IT Homeは7月5日、統計によると、現在わが国には43万9000社の「人工知能」関連企業がある...

サイボーグの時代が到来すると予想される:人間の体が機械に置き換えられる時代

ロボット工学ジャーナリストで専門家のクリス・ミドルトン氏は、早ければ2070年には私たちの体全体がロ...

...

...