GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

Microsoft の Copilot は、世界で最も強力な生産性向上ツールの 1 つと言われています。

Copilot は、Word、Excel、PowerPoint、Teams、Outlook などの Microsoft 365 アプリそれぞれに搭載されている AI アシスタントです。 Microsoft の夢は、人間を日常的な作業から解放し、創造的な問題解決に集中できるようにすることです。

Copilot が ChatGPT や他の AI ツールと異なるのは、365 日のあらゆる行動にアクセスできる点です。Copilot は、ドキュメント、プレゼンテーション、メール、カレンダー、メモ、連絡先からデータを瞬時に検索してまとめることができます。情報セキュリティ チームが問題視しているのはこの点です。Copilot は、ユーザーがアクセスできるすべての機密データにアクセスできます。平均して、企業の M365 データの 10% が全従業員に公開されています。

Copilot は、保護する必要がある新しい機密データも迅速に生成します。 AI 革命以前は、データを作成および共有する人間の能力は、データを保護する能力をはるかに上回っていました。データ侵害の傾向を見ればそれがわかります。GenAI は火に油を注いだのです。

GenAI 全体に関しては、モデル汚染、幻覚、ディープフェイクなど、解明すべきことがたくさんあります。ただし、この記事では、データ セキュリティと、チームが安全な Copilot の展開を確実に行う方法について特に焦点を当てます。

Microsoft 365 Copilot のユースケース

M365 のようなコラボレーション スイートと GenAI を併用するユースケースは無限にあり、多くの IT チームやセキュリティ チームが早期アクセスを強く求め、導入計画を準備しているのも当然です。生産性の向上は計り知れません。

たとえば、空白の Word 文書を開き、OneNote ページ、PowerPoint スライド、その他のオフィス文書を含むターゲット データセットに基づいてクライアント向けの提案書を作成するように Copilot に依頼すると、数秒で完全な提案書が作成されます。

Microsoft のイベントからのその他の例を以下に示します。

  • Copilot は Teams 会議に参加し、議論されている内容をリアルタイムで要約し、アクション項目を記録し、会議で解決されなかった問題を通知します。
  • Outlook の Copilot を使用すると、受信トレイを分類し、電子メールに優先順位を付け、トピックを集約し、返信を生成することができます。
  • Excel の Copilot は生データを分析して、洞察、傾向、推奨事項を提供します。

Microsoft 365 Copilot の仕組み

Copilot プロンプトの処理方法の簡単な概要は次のとおりです。

  • ユーザーは、Word、Outlook、PowerPoint などのアプリケーションでプロンプトを入力します。
  • Microsoft は、ユーザーの M365 権限に基づいてユーザーのビジネス コンテキストを収集します。
  • LLM (GPT4 など) にプロンプ​​トを送信して応答を生成します。
  • Microsoft は責任ある AI 後処理チェックを実行します。
  • Microsoft は M365 アプリケーションに応答とコマンドを返します。

Microsoft 365 Copilot のセキュリティ モデル

Microsoft では、生産性とセキュリティの間に常に極度の緊張関係が存在していました。

このことは、コロナウイルス感染拡大期間中に最も明確に示されました。当時、IT チームは、基盤となるセキュリティ モデルがどのように機能するか、組織の M365 のアクセス許可、グループ、リンク ポリシーがどのように形成されているかを十分に理解せずに、Microsoft Teams を急いで導入しました。

良いニュースは次のとおりです。

  • テナントの分離。 Copilot は現在のユーザーの M365 テナントのデータのみを使用します。AI ツールは、ユーザーがゲストである可能性のある他のテナントのデータを表示せず、テナント間同期が設定されている可能性のあるテナントのデータも表示しません。
  • 研修の範囲。 Copilot は、すべてのテナント用に使用する基本 LLM をトレーニングするためにお客様のビジネス データを一切使用しません。また、他のテナントの他のユーザーの応答に独自のデータが表示されることを心配する必要もありません。

悪いニュースは次のとおりです。

  • 権限。 Copilot は、個々のユーザーが少なくとも表示権限を持つすべての組織データを表示します。
  • Copilot によって生成されたコンテンツは、Copilot の応答の元となったファイルの MPIP タグを継承しません。
  • Copilot の応答は 100% 本物または安全であるとは保証されず、AI によって生成されたコンテンツを確認する責任は人間にあります。

欠点を一つずつ詳しく説明しましょう。

権限

企業が Microsoft 365 で最小限の権限を簡単に適用できる場合は、Copilot のアクセスをユーザーがアクセスできる範囲のみに制限することをお勧めします。

Microsoft は Copilot データ セキュリティ ドキュメントで次のように述べています。

適切なユーザーまたはグループが企業内の適切なコンテンツに適切にアクセスできることを確認するには、SharePoint などの Microsoft 365 サービスで利用可能なアクセス許可モデルを必ず使用してください。

しかし、経験上、ほとんどの企業は最小限の権限しか持っていないことがわかっています。Microsoft 独自のクラウド権限状態リスク レポートの統計をいくつか見ればそれがわかります。

この図は、Varonis が Microsoft 365 を使用している企業に対して毎年何千ものデータ リスク評価を実施したときに見られるものと一致します。私たちのレポートでは、平均的な M365 テナントには次のような特徴があることがわかりました。

  • 4,000万以上のユニークな権限
  • 113,000件以上の機密記録が公開共有される
  • 27,000 件以上の共有リンク

なぜこのようなことが起こるのでしょうか? Microsoft 365 の権限は非常に複雑です。ユーザーがデータにアクセスできるすべての方法について考えてみましょう。

  • 直接ユーザー権限
  • Microsoft 365 グループの権限
  • SharePoint ローカル権限 (カスタム レベル付き)
  • ゲストアクセス
  • 外部アクセス
  • パブリックアクセス
  • リンク アクセス (全員、組織全体、直接アクセス、ゲスト)

さらに悪いことに、権限は主に IT チームやセキュリティ チームではなく、エンド ユーザーが管理します。

ラベル

Microsoft は、DLP ポリシーの適用、暗号化の適用、およびデータ侵害の広範な防止に機密ラベルを多用していますが、実際には、特に機密ラベルの適用を人間に頼っている場合、ラベルを機能させることは困難です。

マイクロソフトは、ラベル付けとマスキングがデータの究極の安全策であるという楽観的な見通しを描いていますが、現実は、人間がデータを作成するにつれてラベルが遅れたり、古くなったりすることが多いという、より悪いシナリオを示しています。

データのブロックや暗号化はワークフローに支障をきたす可能性があり、タグ付け技術は特定のファイル タイプに限定されます。企業が持つタグの数が増えるほど、ユーザーにとって混乱を招く可能性があります。これは特に大企業に当てはまります。

AI が正確で自動的に更新されるラベルを必要とするデータを生成するにつれて、ラベルベースのデータ保護の効率は確実に低下します。

私のラベルは大丈夫ですか?

Varonis は、以下のスキャン、検出、修復を行うことで、組織の Microsoft 機密ラベルを検証し、改善することができます。

  • ラベルのない機密ファイル
  • 機密ファイルに不適切なラベルが付けられている
  • 機密ラベル付きの非機密ファイル

人間

AI は人間を怠惰にさせる可能性があり、GPT4 のような LLM は、多くの場合、人間の能力をはるかに超える速度と品質で、単に良いだけでなく素晴らしいコンテンツを生成するため、人々は AI が安全で正確な応答を生成することを盲目的に信頼し始めます。

実際のシナリオでは、Copilot がクライアント向けの提案書を作成し、その中にまったく別のクライアントに属する機密データが含まれているのに、ユーザーがざっと目を通しただけで (またはまったく目を通さずに)「送信」をクリックすると、プライバシーやデータの漏洩のシナリオが発生します。

テナントの安全を守る - Copilot の準備をしましょう

Copilot を導入する前に、データ セキュリティの体制を把握することが重要です。 Copilot が基本的に利用可能になったので、安全制御を設定するのに良いタイミングです。

最善の方法は、無料のリスク評価から始めることです。設定には数分しかかからず、1、2 日以内に機密データのリスクをリアルタイムで把握できるようになります。

<<: 

>>:  130億バイトのモデルを訓練するのにたった3日しかかからなかった。北京大学は画像と動画の理解を統合するChat-UniViを提案した。

ブログ    
ブログ    

推薦する

小中学校の授業に人工知能教育が取り入れられました!

近年、人工知能分野の発展はますます加熱し続けており、現在の人材不足が注目を集めています。国務院が20...

NASAのジェット推進研究所が人工知能に取り組んでいる様子をご覧ください

[51CTO.com クイック翻訳] ジェット推進研究所 (JPL) では、同僚がインテリジェントな...

...

...

...

...

IBMは今後5年間で全人類に大きな影響を与える5つの主要な技術革新を発表

海外メディアの報道によると、IBMは3月19日に「Five-for-Five」レポートを発表し、世界...

研究により機械学習のバックドア問題が発見される

翻訳者 | 李睿校正:孫淑娟第三者が機械学習モデルを提供し、そこに悪意のあるバックドアを密かに埋め込...

予測分析: 組織内の時間とデータの再考

[[278064]]時系列は標準的な分析手法ですが、より高度な機械学習ツールでは、より正確な予測モデ...

...

2020 年のトップ産業人工知能アプリケーション

[[337240]]人工知能技術は今、世界を変えつつあります。多くの業界はすでに、ビジネス プロセス...

人工知能を成功に導く8つのステップ

AI の実装は一度で終わるものではなく、幅広い戦略と継続的な調整のプロセスが必要です。ここでは、AI...

...

インテリジェンスの時代: 新たな進歩、新たな傾向、新たな取り組み。第 2 回世界インテリジェンス会議が来月開催されます。

4月18日、北京メディアセンターで第2回世界情報会議の記者会見が開催された。記者会見では、中国共産...