ちょっとした会話の後に心を開いてみませんか?この世代の人工知能はあなたのプライバシーを会話の話題に変えました

ちょっとした会話の後に心を開いてみませんか?この世代の人工知能はあなたのプライバシーを会話の話題に変えました

あまりに多くのことを知ると、誰かがあなたを困らせたくなるでしょう。

ドラマに出演するときも、会社を立ち上げるときも、人工知能として生まれ変わるときもそうです。

1. 与えるか、与えないか?これは問題です。
2015年末、寒くて風の強い夜、アメリカ・アーカンソー州のある住宅で、泡風呂に包まっていた男性がいた。家主が彼を見つけたとき、彼の全身はすでに冷えきっていた。

家主の名前はジェームズ・ベイツ。事件当日、彼は3人の親友を邸宅に招待し、一緒にフットボールの試合を観戦したり、食事をしたり、お酒を飲んだりして楽しんだ。

翌朝、ベイツが眠たげに浴室に入ると、予想外に衝撃的な光景を目にした。友人のコリンズが浴槽の中でうつ伏せになって死んでいたのだ。

[[378791]]

家の所有者であるジェームズ・ベイツ氏は左、亡くなったコリンズ氏は右にいる。

前日はまだ冗談を言い合っていた二人だったが、翌日、二人は死によって引き離された。早朝にこの光景を見たベイツさんは、その場で自閉症になるほど怖くなった。

すぐにFBIは現場を封鎖し、死亡したコリンズの通話記録を回収した。捜査の結果、コリンズ容疑者は早朝に両親や友人を含む多くの人物に何度も電話をかけていたことが判明した。警察は、コリンズ容疑者が死ぬ前に必死に助けを求めようとしていたと疑った。これが本当に殺人事件であれば、犯人はベイツ容疑者になる可能性が高い。

その後、FBIはベイツ氏への尋問を開始した。ベイツさんによると、パーティー中、4人の間で不快なことは何も起こらなかっただけでなく、話したり笑ったりして、雰囲気はとても和やかだったという。夜中まで、他の2人の友人は眠くなって別れを告げて帰っていったが、コリンズさんは家に帰るつもりはなかった。その代わり、ソファに座り続けて試合を見続けた。

司会者のベイツはコリンズの隣に座り、一緒に番組を見ていた。しかし、すぐにまぶたがひどく痛み始めた。そこで、コリンズにおやすみなさいと挨拶した後、ベイツは休憩するために部屋に戻った。目が覚めると、悲劇はすでに起こっていた。

警察はベイツの供述に非常に懐疑的だったが、死体の目に見えた傷はなく、現場に目撃者もおらず、有力な物的証拠も見つからなかったため、事件は一時行き詰まった。

途方に暮れていたFBI捜査官らは、部屋の隅に置かれたスマートスピーカー「Echo」を見て目を輝かせた。

[[378792]]

スマートスピーカーの使命は、所有者の指示にいつでも応答することであることは誰もが知っていますが、Echo も例外ではありません。 FBIの調査により、事件当夜、Echoに内蔵された7つのマイクすべてがリアルタイム監視モードになっていたことが判明した。現場の唯一の「目撃者」として、何かを聞いたに違いない。

FBIは直ちにアマゾンに捜索令状を発行し、事件当日にEchoに保存されていた音声情報など関連データの提供に協力するようアマゾンに要請した。

当初、アマゾンは拒否した。結局のところ、米国憲法修正第1条はユーザーのプライバシーが最も重要であると規定しているからだ。その後、ベイツ氏は無実を証明するために、FBIによる録音の回収に同意せざるを得なくなり、アマゾンは事件に関連するすべての情報を引き渡した。

アマゾンの動きは、瞬く間に世論を逸らした。殺人事件に注目していた世論は一転、アマゾンを攻撃し始めた。私がお金を払って購入したスマートスピーカーは、私の会話を密かに録音しただけでなく、それを保存し、FBIがいつでもアクセスできる状態だったことが判明した。これは伝説の潜入捜査ではないか?アマゾン、悪徳商人よ、私のプライバシーを返してくれ!

かつて傍観者として、アマゾンはアップルとFBIの応酬を数え切れないほど見てきた。ある日、アマゾンが「宮廷ドラマ」の主人公に昇格し、ユーザーのプライバシーを譲り渡すべきか否かという同じ選択に直面するとは誰が想像しただろうか。

ユーザーのプライバシーに関しては、企業と当局の間の駆け引きは緊張を伴いますが、少なくとも双方が明確にカードをプレイしており、状況をコントロールするのは比較的簡単です。ダークカードをプレイすることに熱心なハッカー攻撃者に遭遇した場合、対処するのは非常に困難になります。

結局のところ、攻撃者には一般的に道徳的規範がありません。

2. 大衆からハッカーへ
次のようなシナリオを想像してみてください。あなたが部屋に座って人工知能とチャットしていると、突然、人工知能が見知らぬ人の実際の個人情報(名前、電話番号、住所、電子メール アドレスなど)を吐き出しました。怖くなりますか?

慌てない?忘れてください。いずれにせよ、AI が他人の情報をあなたの前で明らかにできるなら、あなたの情報も他人の前で明らかにすることができます。あなたがパニックに陥らない限り、パニックに陥るのは他人です。

いずれにせよ、上のシーンは 100% 現実であり、たった 1 つの呪文で実現できます。イースト ストラウズバーグ ストラウズバーグ…

えーっと、それは呪文ではなく、人工知能に対する攻撃の一種、つまりトレーニング データ抽出攻撃です。

つい最近、Google、Apple、スタンフォード大学、カリフォルニア大学バークレー校、ハーバード大学、ノースイースタン大学、OpenAIを含む7つの企業と機関の学者が調査を実施し、クロールされたインターネットデータでトレーニングされたAIモデルは、特別なウェイクアップワードに遭遇すると、その中に隠された個人のプライバシー情報を口走ってしまうことを発見しました。

人工知能は大量のトレーニング データを消費するため、万能であるように見えることは誰もが知っています。データの量が多いほど、人工知能はより賢く見えるようになります。しかし、人工知能はあくまでも人間の模倣であり、自ら考える能力は持っていないため、学習した知識を蓄積し、特定の問題に遭遇したときに、関連する部分を抽出して組み合わせることで、人間の求める答えを導き出すことしかできない。

たとえば、通常のトレーニング条件では、「Mary has a...」と入力すると、言語モデルは「a little lamb」という答えを返します。しかし、モデルがトレーニング中に誤って「Mary has a bear」を繰り返す文に遭遇した場合、「Mary has a...」と入力すると、言語モデルは「bear」と答える可能性が高くなります。

このプロセスは本質的には元のデータの復元です。

モデルが「元のデータを復元する」ことに慣れているからこそ、「モデルが言いたいデータ」を予測し、適切な誘導接頭辞を与えるだけで、AIは元のデータ内の特定の文字列を完全に復元することができます。

モデルが大きくなるほど、個人情報が漏洩する可能性が高くなります。

研究者らはオープンソースの GPT-2 を使用して結果を検証しました。その結果、ランダムに選択された 1,800 件の出力結果のうち、約 600 件の結果が、ニュース、ログ、コード、個人情報など、トレーニング データ内のプライベート コンテンツを正常に復元したことが示されました。

これは、インターネット上に残した個人情報が、攻撃者の巧妙な誘導により人工知能によって「無意識のうちに」漏洩される可能性があることを意味します。

では、この攻撃方法を解読する方法はあるのでしょうか?

現時点では、いいえ。認めたくはありませんが、すべての言語モデルはプライバシー漏洩のリスクにさらされていると言わざるを得ません。

以前、Google は自社のスマート アシスタントを宣伝するために慎重に広告を撮影しました。

白髪で歩行も不安定な85歳の男性にとって、最も慣れていることは、Google アシスタントを使って亡くなった妻との楽しい時間を思い出すことだ。

回想の過程で、Google アシスタントは高齢者の情報を少しずつ記録し、インテリジェントなアルゴリズムを通じて高齢者のニーズに応えます。各シーンは静かで温かみがあります。

この広告が公開された後、多くの人がその温かさの裏に隠れたリスクに気づきました。Google アシスタントとのやり取り中に個人のプライバシーが侵害されるのではないか、と。この一見温かみのある人間と機械の感情は、人工知能によってますます操作されつつあるのでしょうか?

人工知能とやりとりする場合、適切なプライバシー感覚を維持することは非常に重要かつ困難です。

先ほど述べたトレーニング データ抽出攻撃と同様に、攻撃者は文の前半を注意深く設定し、後半を続けるときに言語モデルが個人のプライバシーを漏らす可能性があるようにします。

この攻撃の原理は非常に巧妙に聞こえますが、少しは馴染みがあるように感じますか?少なくとも私は、スマートライフアシスタントが一般家庭に飛び込んできて、ユーザーの習慣を予測するためにフル稼働している姿を想像しました。

人工知能におけるプライバシー保護の戦いは、まだ始まったばかりかもしれない。

参考文献:

1. https://ai.googleblog.com/2020/12/privacy-considerations-in-large.html

2. https://arxiv.org/pdf/2012.07805.pdf

<<:  ドローンは都市の発展を助け、6つの側面でインテリジェントな変化をもたらす

>>:  人工知能は知的ではないのでしょうか?最初から方向性が間違っていた

ブログ    

推薦する

GPU の在庫は 600,000 に達します!ザッカーバーグ氏、新たな目標を確認:汎用人工知能の創出

1 月 19 日、テクノロジー業界が超人的、神レベルの知能を達成する道を歩んでいるという確固たる信念...

パーソナライズされた推奨の CTR 推定にディープラーニングを使用する理由は何ですか?

ディープラーニングはおそらく、過去 2 年間でコンピューター コミュニティで最もホットな言葉です。エ...

ヘルスケアにおける人工知能

[[433316]] AI の恩恵を受けるすべての業界の中で、ヘルスケアはおそらく最も重要かつ関連性...

...

ディープラーニングによる物体検出モデルの包括的なレビュー: 高速 R-CNN、R-FCN、SSD

[[204169]] Faster R-CNN、R-FCN、SSD は、最も人気があり、広く使用さ...

インテリジェントオートメーションにおける人工知能の重要な役割

パンデミックによる職場の変化により、バックオフィス業務や生産活動を改善できるロボティック・プロセス・...

アート業界におけるメタバースの探究

メタバースの概念がますます普及するにつれて、さまざまな業界がこの豊かな土地を探索し始めました。多くの...

「これまで作られなかった最も重要な機械」アラン・チューリングとチューリングマシン

コンピューティングは、私たちのほとんどが直感的に理解できる馴染みのある概念です。関数 f (x) =...

業界の視点: 人工知能がビジネスプロセスに革命をもたらす方法

今日、人工知能技術は、ウェアラブルデバイス、自動車、生産性アプリケーション、軍事、ヘルスケア、ホーム...

AIの脳回路は人間と非常に似ている、OpenAIの最新研究は白熱した議論を引き起こしている

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

H100推理が8倍に急上昇! NVIDIAは10以上のモデルをサポートするオープンソースのTensorRT-LLMを正式に発表した。

GPU が不足している人々は、その苦境に別れを告げようとしています。 NVIDIA は現在、H10...

コーディング能力はGPT-4を超え、このモデルはBig Codeランキングでトップとなり、YC創設者も賞賛している

GPT-4を上回るコーディング能力を持つと主張するモデルが、多くのネットユーザーの注目を集めている。...

TensorFlow を使い始めるための重要なポイントをここにまとめました。まだ怠ける理由がありますか?

この記事の著者である Steven Dufresne は、初心者が TensorFlow を学習する...

...

...