フェデレーテッド ラーニングは、データがローカルの場所から出ないようにするプライバシー保護戦略により、AI コンピューティングの問題を効率的に解決し、個人データを保護するための重要な方向性であると常に考えられてきました。現在、多数の関連する研究とアプリケーションが登場しています。しかし、現在の法律や規制によりデータに対する制限が厳しくなるにつれ、勾配やモデルパラメータからユーザーデータを推測する方法が登場しています。 多くの場合、機械学習処理によるぼやけたデータとパラメータを使用することで、人物の基本情報を再構築することができます。最近、Nvidia の研究者たちはさらに一歩進んで、機械学習の勾配データから直接画像を再構築しました。新たな研究により、人々は疑問を抱いています。連合学習は実際には安全ではないのでしょうか? 具体的には、研究者らは、与えられたバッチ平均勾配を反転することで、ランダムノイズから隠された元の画像を回復する GradInversion 法を提案しました。この研究は、トップクラスのコンピュータービジョンカンファレンスであるCVPR 2021に採択されました。 論文リンク: 研究者らは、最後の完全接続層の勾配を使用して真の値ラベルを復元するラベル修復方法を提案した。彼らはまた、画像再構成の品質を向上させるために、マルチシード最適化と画像登録に基づくグループ一貫性正規化項を提案しました。実験では、ResNet-50 などのディープ ネットワークの場合、バッチ平均勾配を使用して、豊富な詳細を含む単一の画像を完全に復元できることが示されています。 研究者らは論文の中で、BigGANなどのSOTA生成敵対ネットワークと比較して、彼らが提案した非学習画像復元法は、隠された入力データのより豊富な詳細を復元できると述べています。 さらに重要なのは、画像バッチ サイズが 48 に増加した場合でも、バッチ勾配を反転することで、この方法では 224×224 ピクセルの画像を高い忠実度と豊富な詳細で完全に復元できることです。 この研究結果について、一部のネットユーザーは「これが差分プライバシー(DP)が存在する理由だ。差分プライバシーのない連合学習ではプライバシーを保証できない」と考えている。 研究概要下の図1(a)では、研究者らがGradInversionを提案しています。これは、バッチ平均勾配を反転することで、隠れたトレーニング画像を高忠実度で豊富な詳細で復元します。図1(b)は、ノイズを入力画像に変換する最適化プロセスを示しています。まず、完全接続層の勾配からラベルを回復し、次に忠実度正規化と登録ベースのグループ一貫性正規化の条件下で入力をターゲット勾配と一致するように最適化し、それによって再構成品質を向上させます。 このアプローチにより、これまでは不可能だった ResNet-50 バッチ勾配から 224×224 ピクセルの ImageNet 画像サンプルを復元できるようになります。 方法の概要。 畳み込みニューラル ネットワーク (CNN) の並進不変性により、勾配ベースの反転は、ターゲット オブジェクトの正確な位置特定という別の課題に直面します。理想的なシナリオでは、最適化は真実に収束することができます。 しかし、下の図 2 に示すように、研究者は、異なるシードを使用して最適化プロセスを繰り返すと、各最適化プロセスで局所最小値が得られる可能性があることを観察しました。これらの局所最小値は、すべてのレベルにわたって意味的に正しい画像特徴を割り当てますが、互いに異なります。つまり、画像はグラウンドトゥルースの周りを移動し、さまざまな詳細に焦点を合わせます。 研究者らは、共同最適化を通じて複数のシードを同時に使用するグループ一貫性正規化項を提案しました。具体的なプロセスを以下の図 3 に示します。 実験結果研究者らは、224×224ピクセルを例として、大規模な1000クラスのImageNet ILSVRC 2012データセットでの分類タスクにおけるこの方法の有効性を評価しました。 まず、バッチサイズが 8 の場合の 224×224 ピクセルの画像に対する効果を比較しました。以下の図 4 と表 4 は、GradInversion 法と、Latent Projection、DeepInversion、Inverting Gradients、Deep Gradient Leakage などの SOTA 法との定性的および定量的な比較を示しています。結果は、この方法が視覚効果と数値の両方で優れていることを示しています。 次に、研究者らは 32GB の NVIDIA V100 GPU を使用してバッチ サイズを 48 に増やしました。下の図 6 に示すように、バッチ サイズが大きくなるにつれて、回復可能な画像の数は徐々に減少します。 ただし、GradInversion メソッドでは、一定量の元の視覚情報を取得でき、場合によっては完全な再構築を達成できます (下の図 7 を参照)。 導入論文の筆頭著者は Hongxu Yin 氏です。同氏は 2015 年にシンガポールの南洋理工大学で電気電子工学の工学士号を取得し、その後、米国プリンストン大学で電気工学の博士号を取得しました。同氏は現在、NVIDIA (シリコンバレー) の研究科学者です。 彼の研究は、効率的なディープ ニューラル ネットワーク、データフリー モデル圧縮/ニューラル アーキテクチャ検索、エッジでの医療推論に重点を置いています。 個人ホームページ: |
<<: Google は、DQN と同等で、より優れた一般化パフォーマンスを備えた 2 つの新しい強化学習アルゴリズムを実装しました。
11月7日のOpenAI開発者会議でサム・アルトマンがGptsを正式に発表しリリースして以来、Gpt...
翻訳者 | 李睿校正 | 孫淑娟 良策企業システムのインテリジェント自動化のプロセスでは、各段階の開...
近年、モノのインターネット、ビッグデータ、人工知能などのホットなテクノロジーワードが毎日テクノロジー...
テクノロジー時代の到来とともに、ロボットは人間の世界の一部になったようです。これらは私たちの生活に多...
IDCは、2024年のIT市場はチャンスに満ちていると指摘した。インフレや経済などの要因が懸念材料と...
「データを持っている者は人工知能を持っている。」現在、人工知能は私たちの生活の中で当たり前のものに...
グーグルは8月14日、飛行機による気候への影響を大幅に軽減できる人工知能の分野で大きな進歩を遂げたと...
7月3日に開催されたBaidu Create 2019 Baidu AI Developer Con...
最近、世界インターネット会議で「世界インターネット発展報告書2020」が発表されました。報告書では、...
皆さん、GPT-4 のパラメータは 1 兆を超える可能性があります。最近、アメリカの有名なハッカーで...
2020年は自動運転業界が徐々に安定する年だ。ウェイモなどの巨大企業が商業化の模索を開始し、テスラ...