マイクロソフトのAI研究者が誤って38TBの内部データを漏洩

マイクロソフトのAI研究者が誤って38TBの内部データを漏洩

クラウド セキュリティのスタートアップ企業 Wiz の研究者は、SAS トークンの設定ミスが原因で、Microsoft の AI GitHub リポジトリで 30,000 件を超える社内 Microsoft Teams メッセージの漏洩を含むデータ侵害が発生したと報告しました。

Wiz 氏は、データ漏洩は Microsoft の人工知能研究グループ傘下の robust-models-transfer というリポジトリから発生したと指摘しました。このリポジトリには、新しいニューラル ネットワークの構築に使用できる画像認識モデルとトレーニング データセットが含まれています。漏洩は、Azure ストレージ アカウントでホストされていたトレーニング データ ファイルの 1 つによって発生しました。マイクロソフトは当初、AI トレーニング データセットのみを公開するつもりでしたが、誤ってデータセットを含む Azure ストレージ アカウント全体へのアクセスを開放してしまいました。

研究者らはスキャンの結果、誤って構成されたアカウントによって、従業員ワークステーション 2 台のディスク バックアップを含む 38 TB の Microsoft 社内ファイルが漏洩したことを発見しました。バックアップには、Microsoft サービスのパスワードやキーなどの機密性の高い個人データと、359 人の Microsoft 従業員からの 30,000 件を超える Microsoft Teams 社内メッセージが含まれていました。

過度に許可されたアクセス スコープに加えて、トークンは読み取り専用権限ではなく「フル コントロール」権限を許可するように誤って構成されていました。つまり、攻撃者はストレージ アカウント内のすべてのファイルを表示できるだけでなく、既存のファイルを削除したり上書きしたりすることもできます。

しかし、研究者らは、このストレージアカウントは直接一般に公開されているわけではなく、プライベートなストレージアカウントであると指摘した。 「マイクロソフトの開発者は、SAS トークンと呼ばれる Azure のメカニズムを使用して、Azure ストレージ アカウント内のデータへのアクセスを許可する共有可能なリンクを作成できるようにしました。調査してみると、このリンクは依然として完全にプライベートであるように見えました。」

Wiz は 6 月 22 日にこの問題を最初に発見し、その後すぐに Microsoft に報告しました。マイクロソフトは6月24日にSASトークンの取り消しを発表し、8月16日に潜在的な影響に関する内部調査を完了した。

報告書は、AIデータセットを共有するという単純な手順が重大なデータ侵害につながり、その根本的な原因は共有メカニズムとしてアカウントSASトークンを使用したことにあると結論付けています。監視と管理が不十分なため、SAS トークンはセキュリティ上のリスクを伴い、その使用は可能な限り制限する必要があります。 「これらのトークンは、Microsoft が Azure ポータルで一元管理する方法を提供していないため、追跡が困難です。さらに、これらのトークンは、有効期限の上限なしで永続的に構成できます。したがって、アカウント SAS トークンを外部共有に使用することは安全ではないため、避ける必要があります。」

また、組織は AI 開発プロセスに関連するセキュリティ リスクに対する認識を高め、セキュリティ チームがデータ サイエンスおよび研究チームと緊密に連携して適切なガードレールが確実に定義されるようにすることが推奨されています。

<<:  データによると、ChatGPTのトラフィックは8月末から増加し始めており、これは主に新学期の始まりによるものである。

>>:  アマゾンが新しいAlexa音声アシスタントをリリース、よりスマートで自然な会話

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

すぐに理解できます: 電流制限におけるリーキーバケットとトークンバケットアルゴリズム

[[346652]]この記事は、陳建宇氏が執筆したWeChatパブリックアカウント「私の脳は揚げ魚で...

...

フロントエンドの面接でよく聞かれるアルゴリズムに関する質問

ただし、フロントエンドでアルゴリズムに触れる機会はほとんどありません。ほとんどがインタラクティブな操...

人工知能はスマートシティの夢の実現にどのように役立つか

2008 年の金融危機後、都市計画とサービス提供に対する新しいアプローチが世界中で定着し始めました。...

Open Interpreterは、大規模な言語モデルのコードをローカルで実行できるようにするオープンソースツールです。

最近、Github を閲覧していたところ、Open Interpreter という魔法のツールを見つ...

Googleが新しい検索方法を正式に発表:円を描く

ChatGPTが登場して以来、長い間息をひそめていたGoogleも、モバイル検索に力を入れ始めていま...

アルゴリズムのインテリジェントなアップグレードにより、将来のデジタルライフはより明るくなります

[[120716]]研究者たちは現在、検索結果の改善、自動運転車、スマート携帯電話のアップグレード、...

人工知能やその他の科学研究には「越えてはならない一線」があり、5つの原則が倫理的な最低ラインを示している

人工知能の覚醒、個人ネットワークの情報セキュリティ、遺伝子編集...科学技術が急速に発展するにつれ、...

マイマイ:AI関連の仕事は年初比50%増加

[[428165]]マイマイ人材ビッグデータによると、2021年以降、人工知能業界の人材需要と供給は...

2020年の人工知能市場の現状と発展の見通し

最近、教育部、国家発展改革委員会、財政部は共同で「『双一流』建設大学における人工知能分野の学科統合の...

...

OpenAIがMicrosoftに反旗を翻す!アルトマン氏が「ChatGPTのカスタマイズ」を企む。AI市場の未来はまた変わるのか?

ChatGPTはリリースからわずか半年で、5日間でユーザー数が100万人を超え、現在ユーザー総数は...

タオバオの推奨シナリオのための強力なツール:複雑な目的を統合し、リアルタイムの規制をサポートする再注文モデル

1. 情報フローシナリオの課題と並べ替えモデルの独自の利点多くの学生は再ランキングに馴染みがないかも...