マイクロソフトのAI研究者が誤って38TBの内部データを漏洩

マイクロソフトのAI研究者が誤って38TBの内部データを漏洩

クラウド セキュリティのスタートアップ企業 Wiz の研究者は、SAS トークンの設定ミスが原因で、Microsoft の AI GitHub リポジトリで 30,000 件を超える社内 Microsoft Teams メッセージの漏洩を含むデータ侵害が発生したと報告しました。

Wiz 氏は、データ漏洩は Microsoft の人工知能研究グループ傘下の robust-models-transfer というリポジトリから発生したと指摘しました。このリポジトリには、新しいニューラル ネットワークの構築に使用できる画像認識モデルとトレーニング データセットが含まれています。漏洩は、Azure ストレージ アカウントでホストされていたトレーニング データ ファイルの 1 つによって発生しました。マイクロソフトは当初、AI トレーニング データセットのみを公開するつもりでしたが、誤ってデータセットを含む Azure ストレージ アカウント全体へのアクセスを開放してしまいました。

研究者らはスキャンの結果、誤って構成されたアカウントによって、従業員ワークステーション 2 台のディスク バックアップを含む 38 TB の Microsoft 社内ファイルが漏洩したことを発見しました。バックアップには、Microsoft サービスのパスワードやキーなどの機密性の高い個人データと、359 人の Microsoft 従業員からの 30,000 件を超える Microsoft Teams 社内メッセージが含まれていました。

過度に許可されたアクセス スコープに加えて、トークンは読み取り専用権限ではなく「フル コントロール」権限を許可するように誤って構成されていました。つまり、攻撃者はストレージ アカウント内のすべてのファイルを表示できるだけでなく、既存のファイルを削除したり上書きしたりすることもできます。

しかし、研究者らは、このストレージアカウントは直接一般に公開されているわけではなく、プライベートなストレージアカウントであると指摘した。 「マイクロソフトの開発者は、SAS トークンと呼ばれる Azure のメカニズムを使用して、Azure ストレージ アカウント内のデータへのアクセスを許可する共有可能なリンクを作成できるようにしました。調査してみると、このリンクは依然として完全にプライベートであるように見えました。」

Wiz は 6 月 22 日にこの問題を最初に発見し、その後すぐに Microsoft に報告しました。マイクロソフトは6月24日にSASトークンの取り消しを発表し、8月16日に潜在的な影響に関する内部調査を完了した。

報告書は、AIデータセットを共有するという単純な手順が重大なデータ侵害につながり、その根本的な原因は共有メカニズムとしてアカウントSASトークンを使用したことにあると結論付けています。監視と管理が不十分なため、SAS トークンはセキュリティ上のリスクを伴い、その使用は可能な限り制限する必要があります。 「これらのトークンは、Microsoft が Azure ポータルで一元管理する方法を提供していないため、追跡が困難です。さらに、これらのトークンは、有効期限の上限なしで永続的に構成できます。したがって、アカウント SAS トークンを外部共有に使用することは安全ではないため、避ける必要があります。」

また、組織は AI 開発プロセスに関連するセキュリティ リスクに対する認識を高め、セキュリティ チームがデータ サイエンスおよび研究チームと緊密に連携して適切なガードレールが確実に定義されるようにすることが推奨されています。

<<:  データによると、ChatGPTのトラフィックは8月末から増加し始めており、これは主に新学期の始まりによるものである。

>>:  アマゾンが新しいAlexa音声アシスタントをリリース、よりスマートで自然な会話

推薦する

Python の高レベル自然言語処理ライブラリである SpaCy は、世界最速の構文解析ツールとして知られています。

spaCy は、最先端の研究に基づいて構築され、実際の製品での使用のためにゼロから設計された、Py...

AIの5つの本当の危険性

偽造品、アルゴリズムの偏り、その他の問題が私たちの日常生活に及ぼす影響過去数年間、人工知能は私たちの...

AI医薬品製造の全体像を理解するための1つの記事:年間売上高300億元、明確な3つの階層

次々と資金調達を行っているAI医薬品製造は、どれほど人気が​​あるのでしょうか?海外からの最高受注額...

韓国の常温超伝導チームは重要な技術を隠蔽したのか?アニーリングの詳細がネットユーザーによって暴露され、6つの中国チームが攻撃を開始

昨今、室温超伝導を再現する実験が注目を集めています。 3日間の期限が過ぎ、多くの再現実験で結果が得ら...

...

持続可能なワークスペースを実現する方法とその重要性

持続可能なワークスペースとは、環境への悪影響を最小限に抑え、廃棄物を削減するワークスペースです。もち...

人工知能の簡単な歴史 | (2)ディープラーニング、人工知能の新たな盛り上がり

ヤネン・ルカンと畳み込みニューラルネットワークヒントン教授の話をした後は、ディープラーニング分野のも...

2021 年の人工知能、データ サイエンス、機械学習のトレンドの概要

人工知能とデータサイエンス、機械学習のトレンドとデータ分析AIはますますあらゆるビジネス戦略の一部に...

ガイド | NLP の問題の 90% を解決する方法を段階的に教えます

[[279869]]テキストデータはどこにでもある既存の企業でも、新しいサービスを開発している企業で...

AIエージェントは動物の進化の法則を学ぶ: Fei-Fei Liらが深層進化RLを提案

インテリジェントエージェントは人工知能分野の主要な研究テーマであり、非身体型知能と身体型知能に分けら...

会話型AIの本当の限界は人間の忍耐力だ

私たちは多くの驚くべき進歩を目撃しました。最新の AI 技術は、数千億の計算能力を瞬時に活用すること...

...

...

「オープン性、透明性、倫理」という目標を達成するために、AIアルゴリズムが政府の規制を策定するために使用される。

ニュージーランド政府は、政府機関がアルゴリズムを使用する方法のガイドとなることを目的とした一連の標準...

ディープラーニングを理解するための鍵 – 啓蒙

ニューラル ネットワークは、これまでに発明された最も美しいプログラミング パラダイムの 1 つです。...