GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

GenAI Security: Microsoft Copilot でデータ侵害を防ぐ方法

Microsoft の Copilot は、世界で最も強力な生産性向上ツールの 1 つと言われています。

Copilot は、Word、Excel、PowerPoint、Teams、Outlook などの Microsoft 365 アプリそれぞれに搭載されている AI アシスタントです。 Microsoft の夢は、人間を日常的な作業から解放し、創造的な問題解決に集中できるようにすることです。

Copilot が ChatGPT や他の AI ツールと異なるのは、365 日のあらゆる行動にアクセスできる点です。Copilot は、ドキュメント、プレゼンテーション、メール、カレンダー、メモ、連絡先からデータを瞬時に検索してまとめることができます。情報セキュリティ チームが問題視しているのはこの点です。Copilot は、ユーザーがアクセスできるすべての機密データにアクセスできます。平均して、企業の M365 データの 10% が全従業員に公開されています。

Copilot は、保護する必要がある新しい機密データも迅速に生成します。 AI 革命以前は、データを作成および共有する人間の能力は、データを保護する能力をはるかに上回っていました。データ侵害の傾向を見ればそれがわかります。GenAI は火に油を注いだのです。

GenAI 全体に関しては、モデル汚染、幻覚、ディープフェイクなど、解明すべきことがたくさんあります。ただし、この記事では、データ セキュリティと、チームが安全な Copilot の展開を確実に行う方法について特に焦点を当てます。

Microsoft 365 Copilot のユースケース

M365 のようなコラボレーション スイートと GenAI を併用するユースケースは無限にあり、多くの IT チームやセキュリティ チームが早期アクセスを強く求め、導入計画を準備しているのも当然です。生産性の向上は計り知れません。

たとえば、空白の Word 文書を開き、OneNote ページ、PowerPoint スライド、その他のオフィス文書を含むターゲット データセットに基づいてクライアント向けの提案書を作成するように Copilot に依頼すると、数秒で完全な提案書が作成されます。

Microsoft のイベントからのその他の例を以下に示します。

  • Copilot は Teams 会議に参加し、議論されている内容をリアルタイムで要約し、アクション項目を記録し、会議で解決されなかった問題を通知します。
  • Outlook の Copilot を使用すると、受信トレイを分類し、電子メールに優先順位を付け、トピックを集約し、返信を生成することができます。
  • Excel の Copilot は生データを分析して、洞察、傾向、推奨事項を提供します。

Microsoft 365 Copilot の仕組み

Copilot プロンプトの処理方法の簡単な概要は次のとおりです。

  • ユーザーは、Word、Outlook、PowerPoint などのアプリケーションでプロンプトを入力します。
  • Microsoft は、ユーザーの M365 権限に基づいてユーザーのビジネス コンテキストを収集します。
  • LLM (GPT4 など) にプロンプ​​トを送信して応答を生成します。
  • Microsoft は責任ある AI 後処理チェックを実行します。
  • Microsoft は M365 アプリケーションに応答とコマンドを返します。

Microsoft 365 Copilot のセキュリティ モデル

Microsoft では、生産性とセキュリティの間に常に極度の緊張関係が存在していました。

このことは、コロナウイルス感染拡大期間中に最も明確に示されました。当時、IT チームは、基盤となるセキュリティ モデルがどのように機能するか、組織の M365 のアクセス許可、グループ、リンク ポリシーがどのように形成されているかを十分に理解せずに、Microsoft Teams を急いで導入しました。

良いニュースは次のとおりです。

  • テナントの分離。 Copilot は現在のユーザーの M365 テナントのデータのみを使用します。AI ツールは、ユーザーがゲストである可能性のある他のテナントのデータを表示せず、テナント間同期が設定されている可能性のあるテナントのデータも表示しません。
  • 研修の範囲。 Copilot は、すべてのテナント用に使用する基本 LLM をトレーニングするためにお客様のビジネス データを一切使用しません。また、他のテナントの他のユーザーの応答に独自のデータが表示されることを心配する必要もありません。

悪いニュースは次のとおりです。

  • 権限。 Copilot は、個々のユーザーが少なくとも表示権限を持つすべての組織データを表示します。
  • Copilot によって生成されたコンテンツは、Copilot の応答の元となったファイルの MPIP タグを継承しません。
  • Copilot の応答は 100% 本物または安全であるとは保証されず、AI によって生成されたコンテンツを確認する責任は人間にあります。

欠点を一つずつ詳しく説明しましょう。

権限

企業が Microsoft 365 で最小限の権限を簡単に適用できる場合は、Copilot のアクセスをユーザーがアクセスできる範囲のみに制限することをお勧めします。

Microsoft は Copilot データ セキュリティ ドキュメントで次のように述べています。

適切なユーザーまたはグループが企業内の適切なコンテンツに適切にアクセスできることを確認するには、SharePoint などの Microsoft 365 サービスで利用可能なアクセス許可モデルを必ず使用してください。

しかし、経験上、ほとんどの企業は最小限の権限しか持っていないことがわかっています。Microsoft 独自のクラウド権限状態リスク レポートの統計をいくつか見ればそれがわかります。

この図は、Varonis が Microsoft 365 を使用している企業に対して毎年何千ものデータ リスク評価を実施したときに見られるものと一致します。私たちのレポートでは、平均的な M365 テナントには次のような特徴があることがわかりました。

  • 4,000万以上のユニークな権限
  • 113,000件以上の機密記録が公開共有される
  • 27,000 件以上の共有リンク

なぜこのようなことが起こるのでしょうか? Microsoft 365 の権限は非常に複雑です。ユーザーがデータにアクセスできるすべての方法について考えてみましょう。

  • 直接ユーザー権限
  • Microsoft 365 グループの権限
  • SharePoint ローカル権限 (カスタム レベル付き)
  • ゲストアクセス
  • 外部アクセス
  • パブリックアクセス
  • リンク アクセス (全員、組織全体、直接アクセス、ゲスト)

さらに悪いことに、権限は主に IT チームやセキュリティ チームではなく、エンド ユーザーが管理します。

ラベル

Microsoft は、DLP ポリシーの適用、暗号化の適用、およびデータ侵害の広範な防止に機密ラベルを多用していますが、実際には、特に機密ラベルの適用を人間に頼っている場合、ラベルを機能させることは困難です。

マイクロソフトは、ラベル付けとマスキングがデータの究極の安全策であるという楽観的な見通しを描いていますが、現実は、人間がデータを作成するにつれてラベルが遅れたり、古くなったりすることが多いという、より悪いシナリオを示しています。

データのブロックや暗号化はワークフローに支障をきたす可能性があり、タグ付け技術は特定のファイル タイプに限定されます。企業が持つタグの数が増えるほど、ユーザーにとって混乱を招く可能性があります。これは特に大企業に当てはまります。

AI が正確で自動的に更新されるラベルを必要とするデータを生成するにつれて、ラベルベースのデータ保護の効率は確実に低下します。

私のラベルは大丈夫ですか?

Varonis は、以下のスキャン、検出、修復を行うことで、組織の Microsoft 機密ラベルを検証し、改善することができます。

  • ラベルのない機密ファイル
  • 機密ファイルに不適切なラベルが付けられている
  • 機密ラベル付きの非機密ファイル

人間

AI は人間を怠惰にさせる可能性があり、GPT4 のような LLM は、多くの場合、人間の能力をはるかに超える速度と品質で、単に良いだけでなく素晴らしいコンテンツを生成するため、人々は AI が安全で正確な応答を生成することを盲目的に信頼し始めます。

実際のシナリオでは、Copilot がクライアント向けの提案書を作成し、その中にまったく別のクライアントに属する機密データが含まれているのに、ユーザーがざっと目を通しただけで (またはまったく目を通さずに)「送信」をクリックすると、プライバシーやデータの漏洩のシナリオが発生します。

テナントの安全を守る - Copilot の準備をしましょう

Copilot を導入する前に、データ セキュリティの体制を把握することが重要です。 Copilot が基本的に利用可能になったので、安全制御を設定するのに良いタイミングです。

最善の方法は、無料のリスク評価から始めることです。設定には数分しかかからず、1、2 日以内に機密データのリスクをリアルタイムで把握できるようになります。

<<: 

>>:  130億バイトのモデルを訓練するのにたった3日しかかからなかった。北京大学は画像と動画の理解を統合するChat-UniViを提案した。

ブログ    
ブログ    

推薦する

ロボット: 何を見ているんですか?人間とロボットのアイコンタクトが意思決定を遅らせる、サイエンス誌に掲載

あなたがロボットを見つめると、ロボットもあなたを見つめます。視線は人と人との間のシグナルであり、コミ...

SAP、データスフィアプラットフォームを強化する新たな生成AI機能を発表

SAP は、生成 AI 向けの多数の新機能を発表しており、まもなく SAP Datasphere プ...

7つの機械学習アルゴリズムの7つの重要なポイント

さまざまなライブラリとフレームワークの助けを借りて、たった 1 行のコードで機械学習アルゴリズムを実...

...

60歳以上のインターネット利用者は音声検索やAI学習ツールを活用し、急速に増加している

高齢者間の「情報格差」解消を求める声は衰えず、高齢者はインターネットへのアクセスに対する新たな要求に...

次世代のサイバー脅威はAIから生まれる

ボストン コンサルティング グループ (BCG) によると、米国と日本のサイバーセキュリティ専門家の...

「ビッグアイクリップ」が生まれ変わり、ChatGPTチャットボットに変身

6 月 29 日のニュースによると、かつては物議を醸し、今では懐かしく思われている Microsof...

今後 10 年間で 21 の新しい仕事が生まれます。あなたに何ができるか見てみましょう。

[[242467]]現在観察できるマクロ経済、政治、人口、社会、文化、ビジネス、テクノロジーの一般...

ArmとHuaweiが参入し、自動運転チップの戦いでどちらが勝つかは分からない

今年、自動運転はまだ大規模な商用化には至っていないが、利益の偏在により廃業する企業、継続が困難となり...

あなたのキャリアはAIの影響を受けますか?

[[277927]] [51CTO.com クイック翻訳] 今日、私たちは日常生活や仕事を実現する...

AIプロジェクトでKubernetesを使用する方法

AI プロジェクトで Kubernetes を使用する利点は何でしょうか? Kubernetes が...

機械学習とデータサイエンスは戦略的な洞察を提供する

デジタル時代では、データが新たな通貨になりました。世界中の組織が、その大きな可能性を引き出すために機...

...

人工知能の新たなブレークスルー:ニューラルネットワークが画像内の物体を自律的に識別できる

海外メディアの報道によると、フィンランドのコンピューター科学者は神経生物学的手法を用いて人工知能研究...

デジタル変革、人工知能、そして生産性の問題

企業がデジタル変革を進める際に、生成 AI がいかにして企業の生産性を向上させることができるかについ...