もしかしたら「スパイ」していたのかもしれません!大規模モデルのプライバシー推論精度は 95.8% です。

もしかしたら「スパイ」していたのかもしれません!大規模モデルのプライバシー推論精度は 95.8% です。

Reddit のユーザーが通勤に関するステータスを投稿しました。

通勤途中に、曲がり角を待つ厄介な交差点があります。

ユーザーは自分の居場所を明示的に明かさなかったが、「フックターン」はメルボルンの特徴的な交通ルールであるため、GPT-4 モデルはユーザーがメルボルンにいると正確に推測することができた。

さらに、彼の他の投稿を閲覧するだけで、GPT-4 は彼の性別とおおよその年齢を推測できます。

例えば次の例

写真

この大柄なモデルは、彼女が言及した「34d」に基づいて彼女が女性であると推測し、1990年から1991年にかけて学生時代に「ツイン・ピークス」を見ていたという事実に基づいて彼女の年齢を推測した。

しかし、研究者らはGPT-4に加えて、Claude、Alpacaなど、インターネット上の公開情報や積極的な質問を通じて、場所、性別、収入などの個人情報を推測できる8つの大規模モデルもテストしました。

この目的のために、研究者らは、これらの大規模モデルのプライバシー推論機能をさらに確認し、実証するための一連の実験を設計しました。

彼らは、520 の公開 Reddit フォーラムと 5,814 件のユーザーコメントを含むデータセットを構築し、年齢、教育、性別、職業、婚姻状況、場所、出身地、収入の 8 つの属性ラベルを手動で作成しました。彼らはまた、推論の難しさを表す各ラベルの「難しさ」にも注目した。

最後に、研究者たちはこのデータセット上でユーザーの個人情報を推測する 9 つの最先端モデルの能力をテストしました。結果は、GPT-4 がすべての属性で全体的なトップ 1 精度が 84.6% で、最高のパフォーマンスを発揮することを示しています。上位 3 つの精度を考慮すると、GPT-4 の精度は 95.8% まで直接上昇し、これは人間の判断とほぼ同等です。

写真

さらに、テキストが匿名化された場合でも、大規模なモデルは依然としてかなり高い推論精度を維持できることが分かりました。たとえば、すべての地名と人名を一般的な代名詞に置き換えた場合でも、GPT-4 のトップ 1 精度は 50% 以上を維持できます。

この研究の結果は、AI モデルのプライバシー推論機能についての理解を深めるとともに、個人のプライバシーの保護についての深い懸念も生じさせています。 AIモデルを活用する企業や組織にとって、AI技術を活用してユーザーに便利なサービスを提供しながら、ユーザーのプライバシーのセキュリティをどのように確保するかは、重要かつ難しい課題となります。

モデル側では、モデルのプライバシー推論機能の可能性を考慮し、可能な限り最小限に抑える必要があります。私たちユーザーもプライバシー保護に対する意識を高め、インターネット上で個人情報を過度に公開しないように努めるべきです。最後に、規制当局は、AI モデルの悪用を防ぐために、AI プライバシー保護に関する規制を策定し、施行する必要もあります。

AIの発展のトレンドは止められないものですが、新たな課題や問題ももたらします。 AI テクノロジーの利点を最大限に活用しながら、プライバシーとセキュリティを効果的に保護するバランスを見つける必要があります。

<<: 

>>:  Google CEO ピチャイ: 新しい AI 製品のサブスクリプション モデルを検討中

ブログ    

推薦する

2020 DIGIXグローバルキャンパスAIアルゴリズムエリートコンペティションが成功裏に終了し、キャンパスのイノベーションを刺激

11月13日〜14日、江蘇省人工知能学会、ファーウェイ端末クラウドサービス、ファーウェイ南京研究所が...

人工知能が道路の穴を素早く修復するのを助ける

再び道路の穴の季節がやってきました。アメリカ全土の道路が乗用車やトラックに復讐する、冬から春にかけて...

人工知能が実戦投入され、すでに一部は排除・解雇されている!

脳極体[[237444]]全世界を置き換えると叫んだ人工知能は、ついに失業という苦境に陥った。スウェ...

不動産業界における人工知能のメリットトップ10

人工知能 (AI) は不動産業界に革命をもたらし、データ分析の強化から顧客体験の向上まで、さまざまな...

2024 年のテクノロジー トレンド - 企業は今から準備を始める必要があります。

2023 年の主流のテクノロジートレンドが人工知能、より具体的には生成 AI に重点を置くことは間...

...

統計分析と人工知能の9つの有名な大惨事

2017年、『エコノミスト』誌は、石油ではなくデータが世界で最も価値のある資源になったと宣言しました...

インダストリー 5.0: スマート シティの未来を形作るテクノロジーのメガトレンドの融合

この新しいフェーズは、ディープ テクノロジーの開発と採用のかつてない増加、世界の人口動態の大きな変化...

機械学習における3つの重要なデータ課題

機械学習にとってデータがどれほど重要であるかは誰もが知っています。データ アクセス パターンを理解す...

人工知能はパーキンソン病の初期段階を治療できるかもしれない

おそらく多くの友人は、パーキンソン病が世界中で 1,000 万人以上の人々を悩ませている神経変性疾患...

デジタル変革と人工知能

[[415031]]今日のビジネスにおける変化の最大の原因は、デジタル変革と呼ばれる取り組みです。つ...

フロントエンドアルゴリズムシステム演習:リンクリストの章が完了

[[357916]]実践する前に、データ構造やアルゴリズム、あるいはこのシリーズについての誤解を避け...

OpenAI 開発者会議: OpenAI が AI 分野で再び波を起こす方法

AI業界の実務家にとっては、眠れない夜を過ごしたかもしれない。北京時間11月7日早朝、アメリカの人工...

AI導入を成功させるために最も重要なスキル

実践により、人工知能 (AI) が適切に導入されなければ多くのリスクをもたらすことがわかっているため...