GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

Microsoft の Copilot は、世界で最も強力な生産性向上ツールの 1 つと言われています。

Copilot は、Word、Excel、PowerPoint、Teams、Outlook などの Microsoft 365 アプリそれぞれに搭載されている AI アシスタントです。 Microsoft の夢は、人間を日常的な作業から解放し、創造的な問題解決に集中できるようにすることです。

Copilot が ChatGPT や他の AI ツールと異なるのは、365 日のあらゆる行動にアクセスできる点です。Copilot は、ドキュメント、プレゼンテーション、メール、カレンダー、メモ、連絡先からデータを瞬時に検索してまとめることができます。情報セキュリティ チームが問題視しているのはこの点です。Copilot は、ユーザーがアクセスできるすべての機密データにアクセスできます。平均して、企業の M365 データの 10% が全従業員に公開されています。

Copilot は、保護する必要がある新しい機密データも迅速に生成します。 AI 革命以前は、データを作成および共有する人間の能力は、データを保護する能力をはるかに上回っていました。データ侵害の傾向を見ればそれがわかります。GenAI は火に油を注いだのです。

GenAI 全体に関しては、モデル汚染、幻覚、ディープフェイクなど、解明すべきことがたくさんあります。ただし、この記事では、データ セキュリティと、チームが安全な Copilot の展開を確実に行う方法について特に焦点を当てます。

Microsoft 365 Copilot のユースケース

M365 のようなコラボレーション スイートと GenAI を併用するユースケースは無限にあり、多くの IT チームやセキュリティ チームが早期アクセスを強く求め、導入計画を準備しているのも当然です。生産性の向上は計り知れません。

たとえば、空白の Word 文書を開き、OneNote ページ、PowerPoint スライド、その他のオフィス文書を含むターゲット データセットに基づいてクライアント向けの提案書を作成するように Copilot に依頼すると、数秒で完全な提案書が作成されます。

Microsoft のイベントからのその他の例を以下に示します。

  • Copilot は Teams 会議に参加し、議論されている内容をリアルタイムで要約し、アクション項目を記録し、会議で解決されなかった問題を通知します。
  • Outlook の Copilot を使用すると、受信トレイを分類し、電子メールに優先順位を付け、トピックを集約し、返信を生成することができます。
  • Excel の Copilot は生データを分析して、洞察、傾向、推奨事項を提供します。

Microsoft 365 Copilot の仕組み

Copilot プロンプトの処理方法の簡単な概要は次のとおりです。

  • ユーザーは、Word、Outlook、PowerPoint などのアプリケーションでプロンプトを入力します。
  • Microsoft は、ユーザーの M365 権限に基づいてユーザーのビジネス コンテキストを収集します。
  • LLM (GPT4 など) にプロンプ​​トを送信して応答を生成します。
  • Microsoft は責任ある AI 後処理チェックを実行します。
  • Microsoft は M365 アプリケーションに応答とコマンドを返します。

Microsoft 365 Copilot のセキュリティ モデル

Microsoft では、生産性とセキュリティの間に常に極度の緊張関係が存在していました。

このことは、コロナウイルス感染拡大期間中に最も明確に示されました。当時、IT チームは、基盤となるセキュリティ モデルがどのように機能するか、組織の M365 のアクセス許可、グループ、リンク ポリシーがどのように形成されているかを十分に理解せずに、Microsoft Teams を急いで導入しました。

良いニュースは次のとおりです。

  • テナントの分離。 Copilot は現在のユーザーの M365 テナントのデータのみを使用します。AI ツールは、ユーザーがゲストである可能性のある他のテナントのデータを表示せず、テナント間同期が設定されている可能性のあるテナントのデータも表示しません。
  • 研修の範囲。 Copilot は、すべてのテナント用に使用する基本 LLM をトレーニングするためにお客様のビジネス データを一切使用しません。また、他のテナントの他のユーザーの応答に独自のデータが表示されることを心配する必要もありません。

悪いニュースは次のとおりです。

  • 権限。 Copilot は、個々のユーザーが少なくとも表示権限を持つすべての組織データを表示します。
  • Copilot によって生成されたコンテンツは、Copilot の応答の元となったファイルの MPIP タグを継承しません。
  • Copilot の応答は 100% 本物または安全であるとは保証されず、AI によって生成されたコンテンツを確認する責任は人間にあります。

欠点を一つずつ詳しく説明しましょう。

権限

企業が Microsoft 365 で最小限の権限を簡単に適用できる場合は、Copilot のアクセスをユーザーがアクセスできる範囲のみに制限することをお勧めします。

Microsoft は Copilot データ セキュリティ ドキュメントで次のように述べています。

適切なユーザーまたはグループが企業内の適切なコンテンツに適切にアクセスできることを確認するには、SharePoint などの Microsoft 365 サービスで利用可能なアクセス許可モデルを必ず使用してください。

しかし、経験上、ほとんどの企業は最小限の権限しか持っていないことがわかっています。Microsoft 独自のクラウド権限状態リスク レポートの統計をいくつか見ればそれがわかります。

この図は、Varonis が Microsoft 365 を使用している企業に対して毎年何千ものデータ リスク評価を実施したときに見られるものと一致します。私たちのレポートでは、平均的な M365 テナントには次のような特徴があることがわかりました。

  • 4,000万以上のユニークな権限
  • 113,000件以上の機密記録が公開共有される
  • 27,000 件以上の共有リンク

なぜこのようなことが起こるのでしょうか? Microsoft 365 の権限は非常に複雑です。ユーザーがデータにアクセスできるすべての方法について考えてみましょう。

  • 直接ユーザー権限
  • Microsoft 365 グループの権限
  • SharePoint ローカル権限 (カスタム レベル付き)
  • ゲストアクセス
  • 外部アクセス
  • パブリックアクセス
  • リンク アクセス (全員、組織全体、直接アクセス、ゲスト)

さらに悪いことに、権限は主に IT チームやセキュリティ チームではなく、エンド ユーザーが管理します。

ラベル

Microsoft は、DLP ポリシーの適用、暗号化の適用、およびデータ侵害の広範な防止に機密ラベルを多用していますが、実際には、特に機密ラベルの適用を人間に頼っている場合、ラベルを機能させることは困難です。

マイクロソフトは、ラベル付けとマスキングがデータの究極の安全策であるという楽観的な見通しを描いていますが、現実は、人間がデータを作成するにつれてラベルが遅れたり、古くなったりすることが多いという、より悪いシナリオを示しています。

データのブロックや暗号化はワークフローに支障をきたす可能性があり、タグ付け技術は特定のファイル タイプに限定されます。企業が持つタグの数が増えるほど、ユーザーにとって混乱を招く可能性があります。これは特に大企業に当てはまります。

AI が正確で自動的に更新されるラベルを必要とするデータを生成するにつれて、ラベルベースのデータ保護の効率は確実に低下します。

私のラベルは大丈夫ですか?

Varonis は、以下のスキャン、検出、修復を行うことで、組織の Microsoft 機密ラベルを検証し、改善することができます。

  • ラベルのない機密ファイル
  • 機密ファイルに不適切なラベルが付けられている
  • 機密ラベル付きの非機密ファイル

人間

AI は人間を怠惰にさせる可能性があり、GPT4 のような LLM は、多くの場合、人間の能力をはるかに超える速度と品質で、単に良いだけでなく素晴らしいコンテンツを生成するため、人々は AI が安全で正確な応答を生成することを盲目的に信頼し始めます。

実際のシナリオでは、Copilot がクライアント向けの提案書を作成し、その中にまったく別のクライアントに属する機密データが含まれているのに、ユーザーがざっと目を通しただけで (またはまったく目を通さずに)「送信」をクリックすると、プライバシーやデータの漏洩のシナリオが発生します。

テナントの安全を守る - Copilot の準備をしましょう

Copilot を導入する前に、データ セキュリティの体制を把握することが重要です。 Copilot が基本的に利用可能になったので、安全制御を設定するのに良いタイミングです。

最善の方法は、無料のリスク評価から始めることです。設定には数分しかかからず、1、2 日以内に機密データのリスクをリアルタイムで把握できるようになります。

<<: 

>>:  130億バイトのモデルを訓練するのにたった3日しかかからなかった。北京大学は画像と動画の理解を統合するChat-UniViを提案した。

ブログ    

推薦する

2019 年の NLP における最先端のブレークスルーを振り返る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

トリソララン人は救われた!ディープラーニングは三体問題を解決する

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

2024年に注目すべき5つの持続可能な技術

今年が進むにつれて、持続可能な開発をめぐる話題はますます高まるばかりであり、気候変動が近づいていると...

おそらく2030年までに、量子コンピューティングのChatGPTの瞬間が到来するだろう

2030 年までに RSA 暗号を解読できるマシンが登場するでしょうが、まずは量子センシングやその他...

システムアーキテクト、アルゴリズムエンジニア、人工知能エンジニアはどの程度の数学を学ぶ必要がありますか?

オリンピック数学を勉強したことがない彼に、システム アーキテクトになれるかと誰かが尋ねました。他にも...

...

最近、ソラは子供たちの間でパニックを引き起こしています!

昨晩、娘がぼんやりしてリビングルームに立っていたので、私は彼女に尋ねました。「何をしているの?」彼女...

AI の創造性を解き放つ: Replicate プラットフォーム上のトップ AI プロジェクト!

Replicate は、ユーザーがさまざまな人工知能タスクを達成できるようにすることを目的として、...

1 つの記事で AI エージェント テクノロジーを理解する

環境と自律的に対話し、収集したデータに基づいて決定を下し、人間の介入を最小限に抑えてシナリオベースの...

産業用ロボットの急速な発展は社会にどのような影響を与えるのでしょうか?

インテリジェントインダストリー4.0の急速な発展に伴い、ますます多くの業界でロボットが手作業に代わる...

...

...

SIEM&AIからSIEM@AIまで、AIが次世代のエンタープライズセキュリティの頭脳を構築

[51CTO.com からのオリジナル記事] SIEM はエンタープライズ セキュリティの中核ハブで...

ChatGPTでユーザーは何をするのでしょうか?プログラミングは30%を占めています。数千万人のユーザーを分析すると答えが見つかります

生成 AI、特に ChatGPT は、技術系プレス、主流メディア、そしてほぼすべての分野の専門家の間...