データ汚染:次の大きな脅威

データ汚染:次の大きな脅威

人工知能 (AI) と機械学習 (ML) を使用したセキュリティ ソフトウェアを標的としたデータ ポイズニングは、次の大きなサイバー セキュリティ リスクとなる可能性があります。 SANS Technology Instituteの研究ディレクターであるヨハネス・ウルリッヒ氏は、RSA 2021の基調講演で、これは誰もが懸念すべき脅威であると述べました。

「機械学習における最も根本的な脅威の1つは、攻撃者がモデルのトレーニングに使用するサンプルに実際に影響を与えることができることだ」とウルリッヒ氏はRSAで語った。

この新たな脅威が急速に出現する中、防御者はデータ汚染攻撃の検出方法と防止方法を学ぶ必要があります。そうしないと、ビジネスやサイバーセキュリティに関する決定が誤ったデータに基づいて行われることになります。

データポイズニングとは何ですか?

攻撃者が AI モデルのトレーニングに使用されるデータを改ざんすると、そのデータは事実上「汚染」されます。 AI は正確な予測を行う方法を学習するためにこのデータに依存するため、アルゴリズムによって生成される予測は不正確になります。

脅威アクターは現在、サイバー攻撃に使用できる方法でデータを処理しています。たとえば、レコメンデーション エンジンのデータを変更することで、さまざまなことが可能になります。そこから、マルウェア アプリケーションをダウンロードさせたり、感染したリンクをクリックさせたりすることができます。

データ汚染は、人工知能を私たちに対して使用するため、非常に危険です。私たちは、私生活や仕事の多くの側面について AI の予測をますます信頼するようになっています。視聴する映画の選択から、サービスを解約する可能性が高い顧客を知らせることまで、あらゆることを行います。

COVID-19の影響でデジタルトランスフォーメーションが加速し、AIがより普及するようになりました。デジタル取引と接続は例外ではなく標準です。

データ汚染とサイバーセキュリティツール

脅威の攻撃者は、データ ポイズニングを使用して、防御側が脅威を検出するために使用するツールに侵入することもあります。まず、データを変更したり、データを追加したりして、誤った分類を作成する可能性があります。さらに、攻撃者はデータポイズニングを利用してバックドアを作成します。

AI ツールに対するデータ汚染攻撃が増加していることは、企業や機関がこれらのツールの導入を躊躇する可能性があることを意味します。また、防御側がどのデータを信頼すべきかを判断することがより困難になります。

基調講演の中で、ウルリッヒ氏は、解決策はAIサイバーセキュリティツールで使用されるモデルを包括的に理解することから始まると述べた。何がデータを保護しているかを理解していないと、これらのテクノロジーとツールが正確かどうかを判断するのは困難です。

データポイズニング攻撃の特定

データ汚染攻撃を検出するのは困難で時間がかかります。そのため、被害者は問題に気付いたときには、すでに被害が甚大になっていることに気づくことが多いのです。

さらに、どのデータが本物で、どのデータが操作されたのか全く分かりません。データ ポイズニング攻撃は通常、内部で行われ、非常にゆっくりとしたペースで進行します。どちらの場合も、データの変更を見逃しやすくなります。

RSA カンファレンスのセッション「回避、ポイズニング、抽出、推論: 防御と評価のためのツール」で、IBM リサーチの Abigail Goldsteen 氏は、サイバーセキュリティの専門家が Adversarial Robustness 360 Toolbox (ART) を使用してデータ ポイズニング攻撃を識別、ブロック、防止することを推奨しました。このオープンソース ツールキットを使用すると、開発者は機械学習モデルを迅速に作成、分析、攻撃し、適切な防御方法を迅速に選択できます。

私たちが持っているツールを使って

では、AI を使うべきではないでしょうか? 現時点では、AI を完全に放棄するのは非現実的です。そうすると、脅威の主体は AI と ML を単純に使用して、防御できない攻撃を作成することになります。

逆に、防御側として、私たちが持っているツールやデータを盲目的に信頼することはできません。アルゴリズムの仕組みをより深く理解し、データ内の異常を定期的にチェックすることで、攻撃に先手を打つことができます。

<<:  学者がインテリジェンス、モデルとデータAI、デジタルトランスフォーメーションについて語る。このAIイベントには技術的な内容が含まれている。

>>:  NLP がヘルスケアにおける AI の価値を実現する方法

ブログ    

推薦する

...

顔認識技術の長所と短所

かつては、特に『スタートレック』や『2001年宇宙の旅』などのSF作品では未来の文明の進歩の象徴とみ...

エンドツーエンドの自動運転までどれくらい遠いのでしょうか?

エンドツーエンドの自動運転は、システムの複雑性が高まるなどのモジュール式システムに伴う欠点を回避でき...

劉強東氏は「10年で8万人を解雇する」という噂を否定するが、人工知能は無人企業を実現できると語る

最近、「JD.comが今後10年間で8万人の従業員を解雇する」というニュースがネット上で広まった。こ...

アリババが自社開発の音声認識モデルDFSMNをオープンソース化、精度は最大96.04%

[[232541]]最近、アリババDAMOアカデミーの機械知能研究所は、新世代の音声認識モデルDF...

人工知能、AI、ロボットは雇用に影響を与えるでしょうか?劉強東さんの答えに人々は拍手喝采しました!

[[220982]]人工知能とロボットはどちらも破壊的であり、人類社会の発展の新たな時代を導くでし...

Pythonを全く知らなかった私がAIエンジニアになるまでに2年かかりました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

自然言語処理がビジネスインテリジェンスの未来である理由

Siri に道順を尋ねるたびに、複雑なコード列がアクティブ化され、「Siri」は質問を理解し、必要...

...

時空間予測に適した時系列表現学習法

最近、香港科技大学、上海AIラボなどの組織が共同で時系列の教師なし事前トレーニングに関する論文を発表...

BI と AI が出会うとき、「最強の脳」がどのように意思決定を支援するのかを見てみましょう。

ビジネス インテリジェンス (BI) プラットフォームは常に進化しています。企業は、人工知能と機械学...

TensorRT が顔認識を高速化する方法

[[329844]]顔認識のリアルタイム パフォーマンスを向上させるために、私たちのチームは従来のニ...

...

...

...