フェデレーテッド ラーニングは、データがローカルの場所から出ないようにするプライバシー保護戦略により、AI コンピューティングの問題を効率的に解決し、個人データを保護するための重要な方向性であると常に考えられてきました。現在、多数の関連する研究とアプリケーションが登場しています。しかし、現在の法律や規制によりデータに対する制限が厳しくなるにつれ、勾配やモデルパラメータからユーザーデータを推測する方法が登場しています。 多くの場合、機械学習処理によるぼやけたデータとパラメータを使用することで、人物の基本情報を再構築することができます。最近、Nvidia の研究者たちはさらに一歩進んで、機械学習の勾配データから直接画像を再構築しました。新たな研究により、人々は疑問を抱いています。連合学習は実際には安全ではないのでしょうか? 具体的には、研究者らは、与えられたバッチ平均勾配を反転することで、ランダムノイズから隠された元の画像を回復する GradInversion 法を提案しました。この研究は、トップクラスのコンピュータービジョンカンファレンスであるCVPR 2021に採択されました。 論文リンク: 研究者らは、最後の完全接続層の勾配を使用して真の値ラベルを復元するラベル修復方法を提案した。彼らはまた、画像再構成の品質を向上させるために、マルチシード最適化と画像登録に基づくグループ一貫性正規化項を提案しました。実験では、ResNet-50 などのディープ ネットワークの場合、バッチ平均勾配を使用して、豊富な詳細を含む単一の画像を完全に復元できることが示されています。 研究者らは論文の中で、BigGANなどのSOTA生成敵対ネットワークと比較して、彼らが提案した非学習画像復元法は、隠された入力データのより豊富な詳細を復元できると述べています。 さらに重要なのは、画像バッチ サイズが 48 に増加した場合でも、バッチ勾配を反転することで、この方法では 224×224 ピクセルの画像を高い忠実度と豊富な詳細で完全に復元できることです。 この研究結果について、一部のネットユーザーは「これが差分プライバシー(DP)が存在する理由だ。差分プライバシーのない連合学習ではプライバシーを保証できない」と考えている。 研究概要下の図1(a)では、研究者らがGradInversionを提案しています。これは、バッチ平均勾配を反転することで、隠れたトレーニング画像を高忠実度で豊富な詳細で復元します。図1(b)は、ノイズを入力画像に変換する最適化プロセスを示しています。まず、完全接続層の勾配からラベルを回復し、次に忠実度正規化と登録ベースのグループ一貫性正規化の条件下で入力をターゲット勾配と一致するように最適化し、それによって再構成品質を向上させます。 このアプローチにより、これまでは不可能だった ResNet-50 バッチ勾配から 224×224 ピクセルの ImageNet 画像サンプルを復元できるようになります。 方法の概要。 畳み込みニューラル ネットワーク (CNN) の並進不変性により、勾配ベースの反転は、ターゲット オブジェクトの正確な位置特定という別の課題に直面します。理想的なシナリオでは、最適化は真実に収束することができます。 しかし、下の図 2 に示すように、研究者は、異なるシードを使用して最適化プロセスを繰り返すと、各最適化プロセスで局所最小値が得られる可能性があることを観察しました。これらの局所最小値は、すべてのレベルにわたって意味的に正しい画像特徴を割り当てますが、互いに異なります。つまり、画像はグラウンドトゥルースの周りを移動し、さまざまな詳細に焦点を合わせます。 研究者らは、共同最適化を通じて複数のシードを同時に使用するグループ一貫性正規化項を提案しました。具体的なプロセスを以下の図 3 に示します。 実験結果研究者らは、224×224ピクセルを例として、大規模な1000クラスのImageNet ILSVRC 2012データセットでの分類タスクにおけるこの方法の有効性を評価しました。 まず、バッチサイズが 8 の場合の 224×224 ピクセルの画像に対する効果を比較しました。以下の図 4 と表 4 は、GradInversion 法と、Latent Projection、DeepInversion、Inverting Gradients、Deep Gradient Leakage などの SOTA 法との定性的および定量的な比較を示しています。結果は、この方法が視覚効果と数値の両方で優れていることを示しています。 次に、研究者らは 32GB の NVIDIA V100 GPU を使用してバッチ サイズを 48 に増やしました。下の図 6 に示すように、バッチ サイズが大きくなるにつれて、回復可能な画像の数は徐々に減少します。 ただし、GradInversion メソッドでは、一定量の元の視覚情報を取得でき、場合によっては完全な再構築を達成できます (下の図 7 を参照)。 導入論文の筆頭著者は Hongxu Yin 氏です。同氏は 2015 年にシンガポールの南洋理工大学で電気電子工学の工学士号を取得し、その後、米国プリンストン大学で電気工学の博士号を取得しました。同氏は現在、NVIDIA (シリコンバレー) の研究科学者です。 彼の研究は、効率的なディープ ニューラル ネットワーク、データフリー モデル圧縮/ニューラル アーキテクチャ検索、エッジでの医療推論に重点を置いています。 個人ホームページ: |
<<: Google は、DQN と同等で、より優れた一般化パフォーマンスを備えた 2 つの新しい強化学習アルゴリズムを実装しました。
ロボットが建設業界で重要な役割を果たすことは間違いありませんが、マッキンゼーのレポートによると、プロ...
海外メディアの報道によると、デザインソフトウェアプロバイダーのAdobeは最近、インドの生成AIスタ...
AI開発者会議でスピーチをしている最中に、ロビン・リーは見知らぬ人から頭に水の入ったボトルをかけら...
ML モデル ガバナンスは、組織がアクセスを制御し、ポリシーを実装し、モデル アクティビティを追跡す...
「21世紀で最も成功した手術」として知られる人工股関節全置換術(THA)では、まもなく最新のAI技...
[[397251]]画像ソース: https://pixabay.com/images/id-610...
現在、ロボット産業の急速な発展に伴い、ロボット製品システムはより完成度が高まり、その用途も多様化して...
[51CTO.comより引用] 2018年11月30日から12月1日まで、WOT2018グローバル人...
COVID-19の流行は深刻ですが、多くの新しい技術の助けにより、予防と制御の対策は何年も前と同じ...
1. 概要敵対的生成ネットワーク (GAN) は、コンピューターを通じてデータを生成するために使用...
近年、機械学習ほどモノのインターネットの急速な成長を牽引したものはほとんどありません。人間の創造性を...
2月20日のニュースによると、コンピューティングコストが急騰しているため、人工知能業界の新興企業は...