GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

Microsoft の Copilot は、世界で最も強力な生産性向上ツールの 1 つと言われています。

Copilot は、Word、Excel、PowerPoint、Teams、Outlook などの Microsoft 365 アプリそれぞれに搭載されている AI アシスタントです。 Microsoft の夢は、人間を日常的な作業から解放し、創造的な問題解決に集中できるようにすることです。

Copilot が ChatGPT や他の AI ツールと異なるのは、365 日のあらゆる行動にアクセスできる点です。Copilot は、ドキュメント、プレゼンテーション、メール、カレンダー、メモ、連絡先からデータを瞬時に検索してまとめることができます。情報セキュリティチームが問題視しているのはこの点です。Copilot は、ユーザーがアクセスできるすべての機密データにアクセスできます。平均して、企業の M365 データの 10% が全従業員に公開されています。

Copilot は、保護する必要がある新しい機密データも迅速に生成します。 AI 革命以前は、データを作成および共有する人間の能力は、データを保護する能力をはるかに上回っていました。データ侵害の傾向を見ればそれがわかります。GenAI は火に油を注いだのです。

GenAI 全体に関しては、モデル汚染、幻覚、ディープフェイクなど、解明すべきことがたくさんあります。ただし、この記事では、データセキュリティと、チームが安全な Copilot の展開を確実に行う方法について特に焦点を当てます。

Microsoft 365 Copilot のユースケース

M365 のようなコラボレーションスイートと GenAI を併用するユースケースは無限にあり、多くの IT チームやセキュリティチームが早期アクセスを強く求め、導入計画を準備しているのも当然です。生産性の向上は計り知れません。

たとえば、空白の Word 文書を開き、OneNote ページ、PowerPoint スライド、その他のオフィス文書を含むターゲットデータセットに基づいてクライアント向けの提案書を作成するように Copilot に依頼すると、数秒で完全な提案書が作成されます。

Microsoft のイベントからのその他の例を以下に示します。

Copilot は Teams 会議に参加し、議論されている内容をリアルタイムで要約し、アクション項目を記録し、会議で解決されなかった問題を通知します。
Outlook の Copilot を使用すると、受信トレイを分類し、電子メールに優先順位を付け、トピックを集約し、返信を生成することができます。
Excel の Copilot は生データを分析して、洞察、傾向、推奨事項を提供します。

Microsoft 365 Copilot の仕組み

Copilot プロンプトの処理方法の簡単な概要は次のとおりです。

ユーザーは、Word、Outlook、PowerPoint などのアプリケーションでプロンプトを入力します。
Microsoft は、ユーザーの M365 権限に基づいてユーザーのビジネスコンテキストを収集します。
LLM (GPT4 など) にプロンプトを送信して応答を生成します。
Microsoft は責任ある AI 後処理チェックを実行します。
Microsoft は M365 アプリケーションに応答とコマンドを返します。

Microsoft 365 Copilot のセキュリティモデル

Microsoft では、生産性とセキュリティの間に常に極度の緊張関係が存在していました。

このことは、コロナウイルス感染拡大期間中に最も明確に示されました。当時、IT チームは、基盤となるセキュリティモデルがどのように機能するか、組織の M365 のアクセス許可、グループ、リンクポリシーがどのように形成されているかを十分に理解せずに、Microsoft Teams を急いで導入しました。

良いニュースは次のとおりです。

テナントの分離。 Copilot は現在のユーザーの M365 テナントのデータのみを使用します。AI ツールは、ユーザーがゲストである可能性のある他のテナントのデータを表示せず、テナント間同期が設定されている可能性のあるテナントのデータも表示しません。
研修の範囲。 Copilot は、すべてのテナント用に使用する基本 LLM をトレーニングするためにお客様のビジネスデータを一切使用しません。また、他のテナントの他のユーザーの応答に独自のデータが表示されることを心配する必要もありません。

悪いニュースは次のとおりです。

権限。 Copilot は、個々のユーザーが少なくとも表示権限を持つすべての組織データを表示します。
Copilot によって生成されたコンテンツは、Copilot の応答の元となったファイルの MPIP タグを継承しません。
Copilot の応答は 100% 本物または安全であるとは保証されず、AI によって生成されたコンテンツを確認する責任は人間にあります。

欠点を一つずつ詳しく説明しましょう。

権限

企業が Microsoft 365 で最小限の権限を簡単に適用できる場合は、Copilot のアクセスをユーザーがアクセスできる範囲のみに制限することをお勧めします。

Microsoft は Copilot データセキュリティドキュメントで次のように述べています。

適切なユーザーまたはグループが企業内の適切なコンテンツに適切にアクセスできることを確認するには、SharePoint などの Microsoft 365 サービスで利用可能なアクセス許可モデルを必ず使用してください。

しかし、経験上、ほとんどの企業は最小限の権限しか持っていないことがわかっています。Microsoft 独自のクラウド権限状態リスクレポートの統計をいくつか見ればそれがわかります。

この図は、Varonis が Microsoft 365 を使用している企業に対して毎年何千ものデータリスク評価を実施したときに見られるものと一致します。私たちのレポートでは、平均的な M365 テナントには次のような特徴があることがわかりました。

4,000万以上のユニークな権限
113,000件以上の機密記録が公開共有される
27,000 件以上の共有リンク

なぜこのようなことが起こるのでしょうか? Microsoft 365 の権限は非常に複雑です。ユーザーがデータにアクセスできるすべての方法について考えてみましょう。

直接ユーザー権限
Microsoft 365 グループの権限
SharePoint ローカル権限 (カスタムレベル付き)
ゲストアクセス
外部アクセス
パブリックアクセス
リンクアクセス (全員、組織全体、直接アクセス、ゲスト)

さらに悪いことに、権限は主に IT チームやセキュリティチームではなく、エンドユーザーが管理します。

ラベル

Microsoft は、DLP ポリシーの適用、暗号化の適用、およびデータ侵害の広範な防止に機密ラベルを多用していますが、実際には、特に機密ラベルの適用を人間に頼っている場合、ラベルを機能させることは困難です。

マイクロソフトは、ラベル付けとマスキングがデータの究極の安全策であるという楽観的な見通しを描いていますが、現実は、人間がデータを作成するにつれてラベルが遅れたり、古くなったりすることが多いという、より悪いシナリオを示しています。

データのブロックや暗号化はワークフローに支障をきたす可能性があり、タグ付け技術は特定のファイルタイプに限定されます。企業が持つタグの数が増えるほど、ユーザーにとって混乱を招く可能性があります。これは特に大企業に当てはまります。

AI が正確で自動的に更新されるラベルを必要とするデータを生成するにつれて、ラベルベースのデータ保護の効率は確実に低下します。

私のラベルは大丈夫ですか？

Varonis は、以下のスキャン、検出、修復を行うことで、組織の Microsoft 機密ラベルを検証し、改善することができます。

ラベルのない機密ファイル
機密ファイルに不適切なラベルが付けられている
機密ラベル付きの非機密ファイル

人間

AI は人間を怠惰にさせる可能性があり、GPT4 のような LLM は、多くの場合、人間の能力をはるかに超える速度と品質で、単に良いだけでなく素晴らしいコンテンツを生成するため、人々は AI が安全で正確な応答を生成することを盲目的に信頼し始めます。

実際のシナリオでは、Copilot がクライアント向けの提案書を作成し、その中にまったく別のクライアントに属する機密データが含まれているのに、ユーザーがざっと目を通しただけで (またはまったく目を通さずに)「送信」をクリックすると、プライバシーやデータの漏洩のシナリオが発生します。

テナントの安全を守る - Copilot の準備をしましょう

Copilot を導入する前に、データセキュリティの体制を把握することが重要です。 Copilot が基本的に利用可能になったので、安全制御を設定するのに良いタイミングです。

最善の方法は、無料のリスク評価から始めることです。設定には数分しかかからず、1、2 日以内に機密データのリスクをリアルタイムで把握できるようになります。

<<:

>>: 130億バイトのモデルを訓練するのにたった3日しかかからなかった。北京大学は画像と動画の理解を統合するChat-UniViを提案した。

ロボットは「赤ちゃんを作る」こともできる：世界初の生きたロボットが生命の新たな繁殖方法を生み出す

ブログ

GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

Microsoft 365 Copilot のユースケース

Microsoft 365 Copilot の仕組み

Microsoft 365 Copilot のセキュリティモデル

権限

ラベル

私のラベルは大丈夫ですか？

人間

テナントの安全を守る - Copilot の準備をしましょう

ロボットは「赤ちゃんを作る」こともできる：世界初の生きたロボットが生命の新たな繁殖方法を生み出す

ドローンは倉庫・物流業界の発展をどのように加速させているのでしょうか?

Ray で効率的なディープラーニングデータパイプラインを作成する

Google AIの最新3Dデータセット、15,000枚のアニメーション画像、ARがあなたの生活を支配します

2月10日に職場復帰ラッシュが到来し、北京は「急速AI温度検出器」の配備を開始した。

ルーティングプロトコルアルゴリズム

人工知能に関するこの記事を読むことで、90%の人を超えることができる

HAProxy ロードバランサの構成とアルゴリズム

推薦する

ロボット: 何を見ているんですか?人間とロボットのアイコンタクトが意思決定を遅らせる、サイエンス誌に掲載

SAP、データスフィアプラットフォームを強化する新たな生成AI機能を発表

7つの機械学習アルゴリズムの7つの重要なポイント

60歳以上のインターネット利用者は音声検索やAI学習ツールを活用し、急速に増加している

次世代のサイバー脅威はAIから生まれる

「ビッグアイクリップ」が生まれ変わり、ChatGPTチャットボットに変身

今後 10 年間で 21 の新しい仕事が生まれます。あなたに何ができるか見てみましょう。

ArmとHuaweiが参入し、自動運転チップの戦いでどちらが勝つかは分からない

あなたのキャリアはAIの影響を受けますか?

AIプロジェクトでKubernetesを使用する方法

機械学習とデータサイエンスは戦略的な洞察を提供する

人工知能の新たなブレークスルー：ニューラルネットワークが画像内の物体を自律的に識別できる

デジタル変革、人工知能、そして生産性の問題

Microsoft 365 Copilot のユースケース

Microsoft 365 Copilot の仕組み

Microsoft 365 Copilot のセキュリティ モデル

権限

ラベル

私のラベルは大丈夫ですか？

人間

テナントの安全を守る - Copilot の準備をしましょう

推薦する

Microsoft 365 Copilot のセキュリティモデル