マイクロソフトのAI研究者が誤って38TBの内部データを漏洩

マイクロソフトのAI研究者が誤って38TBの内部データを漏洩

クラウド セキュリティのスタートアップ企業 Wiz の研究者は、SAS トークンの設定ミスが原因で、Microsoft の AI GitHub リポジトリで 30,000 件を超える社内 Microsoft Teams メッセージの漏洩を含むデータ侵害が発生したと報告しました。

Wiz 氏は、データ漏洩は Microsoft の人工知能研究グループ傘下の robust-models-transfer というリポジトリから発生したと指摘しました。このリポジトリには、新しいニューラル ネットワークの構築に使用できる画像認識モデルとトレーニング データセットが含まれています。漏洩は、Azure ストレージ アカウントでホストされていたトレーニング データ ファイルの 1 つによって発生しました。マイクロソフトは当初、AI トレーニング データセットのみを公開するつもりでしたが、誤ってデータセットを含む Azure ストレージ アカウント全体へのアクセスを開放してしまいました。

研究者らはスキャンの結果、誤って構成されたアカウントによって、従業員ワークステーション 2 台のディスク バックアップを含む 38 TB の Microsoft 社内ファイルが漏洩したことを発見しました。バックアップには、Microsoft サービスのパスワードやキーなどの機密性の高い個人データと、359 人の Microsoft 従業員からの 30,000 件を超える Microsoft Teams 社内メッセージが含まれていました。

過度に許可されたアクセス スコープに加えて、トークンは読み取り専用権限ではなく「フル コントロール」権限を許可するように誤って構成されていました。つまり、攻撃者はストレージ アカウント内のすべてのファイルを表示できるだけでなく、既存のファイルを削除したり上書きしたりすることもできます。

しかし、研究者らは、このストレージアカウントは直接一般に公開されているわけではなく、プライベートなストレージアカウントであると指摘した。 「マイクロソフトの開発者は、SAS トークンと呼ばれる Azure のメカニズムを使用して、Azure ストレージ アカウント内のデータへのアクセスを許可する共有可能なリンクを作成できるようにしました。調査してみると、このリンクは依然として完全にプライベートであるように見えました。」

Wiz は 6 月 22 日にこの問題を最初に発見し、その後すぐに Microsoft に報告しました。マイクロソフトは6月24日にSASトークンの取り消しを発表し、8月16日に潜在的な影響に関する内部調査を完了した。

報告書は、AIデータセットを共有するという単純な手順が重大なデータ侵害につながり、その根本的な原因は共有メカニズムとしてアカウントSASトークンを使用したことにあると結論付けています。監視と管理が不十分なため、SAS トークンはセキュリティ上のリスクを伴い、その使用は可能な限り制限する必要があります。 「これらのトークンは、Microsoft が Azure ポータルで一元管理する方法を提供していないため、追跡が困難です。さらに、これらのトークンは、有効期限の上限なしで永続的に構成できます。したがって、アカウント SAS トークンを外部共有に使用することは安全ではないため、避ける必要があります。」

また、組織は AI 開発プロセスに関連するセキュリティ リスクに対する認識を高め、セキュリティ チームがデータ サイエンスおよび研究チームと緊密に連携して適切なガードレールが確実に定義されるようにすることが推奨されています。

<<:  データによると、ChatGPTのトラフィックは8月末から増加し始めており、これは主に新学期の始まりによるものである。

>>:  アマゾンが新しいAlexa音声アシスタントをリリース、よりスマートで自然な会話

ブログ    
ブログ    

推薦する

OpenAI CEO: GPT-4 は週当たり 1 億人のアクティブ ユーザーを抱え、依然として世界で最も強力な AI モデルです

米国現地時間11月7日月曜日に開催された第1回OpenAI開発者会議で、同社CEOのサム・アルトマン...

パンデミック後、アメリカ人の半数がスマートデバイスの音声制御が不可欠だと考えている

Syntiantが最近実施したユーザー調査によると、COVID-19パンデミックの影響により、アメリ...

...

...

...

ガートナーは、2025年までにクラウドデータセンターの半数がAI機能を備えたロボットを導入すると予測している。

ガートナーの予測によると、2025年までにクラウドデータセンターの半数が人工知能(AI)と機械学習(...

TensorFlow 2.8.0が正式にリリースされ、多くのバグが修正され、50以上の脆弱性パッチがリリースされました

最近、TensorFlow は公式バージョン 2.8.0 をリリースしました。バージョン 2.7 の...

エントロピーを理解する: 機械学習のゴールドスタンダード

[[335033]]決定木からニューラルネットワークへTL;DR: エントロピーはシステム内の混沌の...

OPPO 広告想起アルゴリズムの実践と調査

1. 背景1. 古いリコールアーキテクチャ上の図の左上部分は、最初にリコールしてからソートする一般的...

人工知能は真のスマートホームを実現できるのか?

過去2年間、スマートフォンやモバイル通信ネットワークの発展に伴い、マイクロプロセッサ、センサー、無線...

人工知能市場の収益は今年1560億ドルに達する見込み

調査によると、人工知能(AI)ソリューションは現在急速に成長している市場であり、2020年までに1,...

生成AI人材の獲得競争が始まった。求人数は4倍に増え、最高年収は90万ドル

ウォール・ストリート・ジャーナルによると、求人ウェブサイトIndeedの統計によると、生成AI関連の...

このモデルはGAN、ETH超解像モデルSRFlowよりも想像能力が強い

最近、ETH チューリッヒのコンピューター ビジョン研究所の研究者が超解像度モデル SRFlow を...

AI モデルにバックドアがある可能性があります。チューリング賞受賞者が53ページの論文を発表「悪意ある予測には注意」

「敵対的事例」は古くからある問題です。画像内の数ピクセルを変更するなど、通常のデータにわずかな外乱...