機械にプライバシーを学習させることはできるでしょうか?

機械にプライバシーを学習させることはできるでしょうか?

機械学習では、モデルをトレーニングするために大量のデータが必要であり、通常、このトレーニング データを Amazon や Google などのオペレーターがホストする機械学習クラウド サービスにアップロードしますが、これによりデータが悪意のある攻撃者にさらされる可能性があります。では、機械学習をサービスとして使用し (Machine Learning as a Service - MLaaS)、プライバシーを保護することはできるのでしょうか?

[[225773]]

機械学習は今日のコンピュータサイエンスで最もホットなテーマの 1 つであり、多くのクラウド サービス プロバイダーが機械学習サービス (MLaaS) を急速に拡大しています。

しかし、これらの MLaaS には警告が伴います。すべてのモデルトレーニング データはサービス オペレーターに公開されます。サービス運営者が特にこのデータにアクセスしない場合でも、他の目的を持つ誰かがアクセスできる可能性があります。

注: テキサス大学の Tyler Hunt 氏と他の研究者は最近、「Chiron: プライバシー保護を備えたサービスとしての機械学習」というタイトルの研究論文を発表しました。この論文では、クラウド MLaaS を使用する際にプライバシーを保護できるシステム アーキテクチャについて説明しています。興味のある学生は読むことができます。

プライバシーは双方向である

ユーザーはモデルのトレーニング データを公開したくないかもしれませんが、サービス プロバイダーは独自のプライバシー上の懸念事項を考慮する必要があります。一般的に言えば、MLaaS テクノロジーの基礎となる実装アルゴリズムをユーザーが閲覧することは許可されていません。

Chiron システム モデルは、サービス オペレーターがトレーニング データを閲覧できないようにすることができます。既存の機械学習サービス プラットフォームがどのようなモードで実行されているかに関係なく、Chiron はトレーニング アルゴリズムとモデル アーキテクチャをユーザーに公開せず、トレーニング モデルにアクセスするためのブラック ボックス アクセス モードのみをユーザーに提供します。

Chiron は、アプリケーション コードのセキュリティを強化するために使用されるアーキテクチャ設計である Intel の Software Guard Extensions (SGX) を使用しますが、SGX のみを使用するだけでは不十分です。Chiron は、信頼できないユーザー コードが悪意のあるアーキテクチャで実行されるのを防ぐ分散セキュリティ保護サンドボックスである Ryoan サンドボックスでも SGX プラットフォームを使用します。

脅威モデル

Chiron の目標は、クラウド環境でユーザーのトレーニング データとトレーニング モデル (クエリと出力データを含む) を保護することです。そのため、まず、オペレーティング システムと対応するハイパーバイザーを含むプラットフォーム全体が信頼できないと想定します。攻撃者は、デバイス管理者やサービスオペレーターである場合もあれば、サービスプラットフォームへの侵入に成功した悪意のある攻撃者である場合もあります。もちろん、攻撃者はユーザーの入出力情報を直接記録できるため、悪意のある OS 開発者である可能性もあります。

トレーニング モデルは特定のクエリ ステートメントを通じてトレーニング データを漏らすため、Chiron はトレーニング データを提供するユーザーだけがトレーニング済みモデルにアクセスできるようにすることができます。たとえ攻撃者がクラウド インフラストラクチャに完全にアクセスできたとしても、モデルをクエリしてトレーニング データにアクセスすることはできません。

Chiron は表面的には包括的なカバレッジを備えているように見えますが、MLaaS の基盤となるハードウェアには依然としてセキュリティ上の問題が残っています。

制限要因

SGX 自体は無防備というわけではなく、Intel のパフォーマンス モニタリング ユニット (PMU) により、信頼できないプラットフォームがターゲット システムの基盤となる動作メカニズムや実行中のタスクについて詳細な情報を取得できるようになります。現在の SGX では、高レベルの権限を持つソフトウェアがメモリ ページ テーブルを変更したり、関連するコードやページ データのトレースを表示したりできるため、非常に深刻な結果を招くことになります。

Chiron は Intel の SGX に基づいて実装されているため、GPU がまだ SGX 関連の機能を十分にサポートできないため、GPU では動作しません。したがって、現在の Chiron の実装はまだ完璧ではなく、GPU ベンダーがセキュリティ問題を真剣に検討し始めたときにのみ、さらに前進できる可能性があります。

パフォーマンス

制限要因を超えて、Hunt らは Chiron のパフォーマンスをテストし、標準的な機械学習インフラストラクチャを保護しながらデバイスのパフォーマンスを維持できることを実証しました。

要約する

データが豊富な現代の世界では、何千ものセキュリティホールが存在し、攻撃者はさまざまな方法でそれらを悪用する可能性があります。絶対に安全なシステムはありませんが、より安全なシステムを目指して努力することはできます。機械学習が私たちの将来の生活において重要な役割を果たすことは間違いありません。機械学習が私たちのプライバシーを保護できたらどれほど安心できるでしょうか?

<<:  画像とテキストの認識 - 人工知能の知恵

>>:  SIEM&AIからSIEM@AIまで、AIが次世代のエンタープライズセキュリティの頭脳を構築

ブログ    
ブログ    
ブログ    

推薦する

素晴らしい!ニューラルネットワークがフロントエンドコードを作成します

今後 3 年間で、ディープラーニングはフロントエンド開発の現状を変え、プロトタイピングの速度を向上さ...

人工知能の雇用見通しはどれほど明るいのでしょうか?これらのポジションは不足しており、経済的見通しは良好です

近年、科学技術の急速な発展により、人工知能分野の人材が非常に人気を集めています。 UiPath が以...

自然の中でショウジョウバエがVRをプレイし、注意メカニズムとワーキングメモリを発見

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ロボット工学が産業界のデジタル革命を推進

近年、自動化プロセスの導入は世界中で加速しています。生産効率の大幅な向上により、低技能労働者の代わり...

企業は従業員がChatGPTを使用することで生じるセキュリティリスクに注意を払う必要がある

ChatGPT のバイラルな成功により、テクノロジー企業間で AI 製品を市場に投入するための激しい...

ディープラーニングと自動テキスト要約が出会うとき

[[198984]]導入近年のテキスト情報の爆発的な増加により、人々はニュース、ブログ、チャット、レ...

TCP/IPトランスポート層におけるTCP BBRアルゴリズムについての簡単な説明

0x00. はじめにこれは、TCP/IP プロトコル スタック シリーズの 3 番目の記事です。前回...

Googleの研究ディレクターはスタンフォード大学で教鞭をとり、「人工知能:現代的アプローチ」の著者でもある。

スタンフォード大学は10月11日、Googleリサーチディレクターのピーター・ノーヴィグ氏がスタンフ...

...

工業情報化省科学技術局長:チップOSはAIを突破しなければ単なる空想に過ぎない

国内メディアの報道によると、12月17日に開催された2019年中国スマート企業発展フォーラムで、工業...

孤独を研究していますか? Reddit のホットな話題: AI のゴッドファーザー、ヤン・ルカンが提案した「エネルギー モデル」とは一体何でしょうか?

「エネルギー自己教師学習っていったい何?」と多くのRedditネットユーザーがコメントした。ちょう...

JVM チューニングの概要: 新世代のガベージ コレクション アルゴリズム

ガベージコレクションのボトルネック従来の世代別ガベージ コレクション方式では、ある程度、アプリケーシ...

Python ニューラル ネットワークで自動車保険の支出を予測する

[[381201]]新しいデータセット用のニューラル ネットワーク予測モデルの開発は困難な場合があり...

AIエンジニアの年収はわずか50万元程度で、年間100万元を稼ぐには長年の経験が必要です。

[[259190]]近年、人工知能技術のあらゆる分野への応用がますます普及し、関連する専門的・技術...

...