AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか

AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか

OpenAI の侵害を調査し、AI 企業 SSC のハッキングの可能性とその影響の可能性を推測します。企業は自らを守るために何ができるでしょうか?

2023年3月20日、OpenAIは人気の生成AIツールChatGPTを数時間シャットダウンしました。同社はその後、障害の原因はオープンソースのインメモリデータリポジトリ「Redis」に起因するソフトウェアサプライチェーンの脆弱性であったことを認めた。

この脆弱性により、ユーザーが誤って他のユーザーのチャット履歴ヘッダーにアクセスし、名前、メールアドレス、支払い先住所、クレジットカードの種類、支払いカード番号の最後の 4 桁などの支払い関連情報が公開される可能性がある時間帯 (3 月 20 日の午前 1 時から午前 10 時) がありました。

これは比較的軽微なバグであり、すぐに発見され修正されました。 ChatGPT やその他の生成 AI の人気が高まっていることを考えると、より標的を絞ったソフトウェア サプライ チェーン攻撃はどのような結果をもたらす可能性がありますか?

2023 年にエンタープライズ アプリケーション セキュリティはどのような課題に直面するでしょうか?

2022 年のエンタープライズ アプリケーション セキュリティ レポートでは、開発者に SDLC のすべてのフェーズが安全であることを保証するためのツールとテクニックが提供されます。その内容には、サプライチェーンのセキュリティ、DevSecOps、ゼロトラスト セキュリティの原則、モバイル アプリケーション セキュリティなどが含まれます。

この記事では、3 月 20 日に実際に何が起こったのか、ユーザー情報がどのように漏洩したのかを検証します。さらに、より深刻な潜在的な攻撃を想定し、どのような情報が漏洩する可能性があるか、そして、このような事態を防ぐために何ができるかを検討します。最後に、企業が開発しているソフトウェアに関係なく関連する、一般的なソフトウェア サプライ チェーンのセキュリティに関する推奨事項をいくつか示します。

他のほとんどのソフトウェア企業と同様に、OpenAI のコードはオープンソースのライブラリとコードに大きく依存しています。この場合、バグは Redis クライアント用のオープンソース ライブラリである redis-py で発見されました。以下は同社自身によって再文書化された脆弱性の説明です。

  • OpenAI は、リクエストごとにデータベースを確認する必要がないように、Redis を使用してユーザー情報をサーバーにキャッシュします。
  • Redis クラスターは、複数の Redis インスタンスに負荷を分散するために使用されます。
  • redis-py ライブラリは、Asyncio で実行される同社の Python サーバーの Redis とのインターフェースとして使用されます。
  • ライブラリは、サーバーとクラスター間の接続の共有プールを維持し、接続が終了すると別のリクエストに使用するために接続をリサイクルします。

asyncio を使用する場合、redis-py のリクエストと応答は 2 つのキューとして動作します。呼び出し元はリクエストを受信キューにプッシュし、応答を送信キューからポップして、接続をプールに返します。

リクエストが受信キューにプッシュされた後、応答が送信キューからポップされる前にキャンセルされたとします。この場合、「接続が切断されました」というエラーが表示され、無関係なリクエストに対して取得された次の応答で、接続に残されたデータが受信される可能性があります。

ほとんどの場合、回復不可能なサーバー エラーが発生し、ユーザーはリクエストを再度実行する必要があります。

しかし、場合によっては、破損したデータが要求者が期待していたデータの種類と一致するため、キャッシュから返されたデータは別のユーザーのものであっても有効であるように見えます。

3 月 20 日午前 1 時、OpenAI が誤ってサーバーに変更を加えたため、Redis リクエストのキャンセルが急増しました。これにより、各接続で通常よりも誤ったデータが返される可能性が高くなります。

この特定のバグは、Redis Cluster の asyncioredis-py クライアントでのみ発生し、OpenAI のエンジニアと Redis ライブラリのメンテナーによって修正されました。

なお、このバグにより、別のアクティブ ユーザーの検索タイトルとそのユーザーの支払い情報の一部が誤って公開される可能性があります。現在、一部のユーザーは ChatGPT に個人の財務に関する完全または部分的な管理権限を与えており、この情報を公開すると悲惨な結果を招く可能性があります。

起こり得ること

この場合、OpenAi がオープンソース ライブラリ Redis から継承したソフトウェア サプライ チェーンの脆弱性は、比較的単純な脆弱性であり、簡単に修正できました。 SolarWinds が受けた攻撃と同様の標的型ソフトウェア サプライ チェーン攻撃が発生し、長期間 (数か月など) 検出されないという、より深刻なシナリオも考えられます。

現在、ユーザーは大規模言語モデル(LLM)へのより直接的なアクセスを得るためにOpenAIに料金を支払っているため、このような攻撃により支払いデータを含む顧客情報が漏洩する可能性がある。しかし、これは私たちの架空のハッカーグループが本当に興味を持っている情報ではありません。 ChatGPTには現在11億6千万人のユーザーがいます。 2023年3月にユーザー数が10億人を突破しました。これらの数字は、2023年2月から3月にかけて約55%の増加を示しています。生成AIは現在、芸術から歴史、金融に至るまでのさまざまな分野で広く利用されており、OpenAIのデータベースへの無制限のアクセスにより、無数のユーザーに関する身代金要求の対象となる可能性のある情報が漏洩する可能性がある。もっと現実的な例を挙げると、2015 年に起きた Ashley Madison のデータ侵害は深刻な結果をもたらし、その一部は何年も経った今でも影響を及ぼしています。

想像上のハッキングをさらに一歩進めて、この名前のないハッカー グループが OpenAI データベースにアクセスできるだけでなく、リクエストの結果に影響を与えることもできると仮定してみましょう。何百万人もの人々がハッカーグループに合わせたターゲット型金融アドバイスを受ける可能性を想像できますか?あるいは、これも謎のハッカーグループから提供される偽のセキュリティスキャンやコードテスト情報を受け取る可能性を想像できますか?ChatGPT は現在インターネットにアクセスできるようになり、OpenAI のサーバーに出入りする情報を通常の無害なデータ以上のものとして隠すことがさらに容易になりました。

成功した LLM に対するソフトウェア サプライ チェーン攻撃によって、甚大な被害が発生する可能性があることがわかります。

自分自身とソフトウェアサプライチェーンを保護する方法

自分を守るためにまずできることは、懐疑心を高めることです。ツールが何を実行し、何を実行できるか、どのリソースにアクセスできるかについて完全な制御を保証できない限り、それがいかに無害に見えても、ツールを盲目的に信頼しないでください。 ChatGPT のオープンソース バージョンをローカルで実行するオプションを使用すると、トレーニング情報とアクセス レベルをより細かく制御できます。

また、ソフトウェアのサプライチェーンで何が起こっているかについて透明性を高め、パイプラインを確立することも良い考えです。各ビルドの SBOM から始めることもできますが、これは単なる 1 つのステップであり、サーバー、クラウド、またはネットワークで何が起こっているかについての透明性を高めるために実行できる他の多くの方法があります。

人工知能の未来

私たちが何をしようとも、AI は存在し続けます。それが人々の日常生活にどの程度影響を与えるかは推測の域を出ませんが、過去 6 か月だけから判断すると、LLM テクノロジーとその応用にとって潜在的な転換点が訪れつつあることは間違いないようです。 AI によって、コードやアプリケーション全体の作成が「自然言語」で適切なプロンプトを見つけることになるにつれて、適切にテストされておらず、ユーザーやアプリケーションを作成する人々や企業を保護するための適切なセキュリティ保護手段が講じられていないアプリケーションが、これまでにないほど多く発生する可能性があります。

<<:  企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

>>:  大規模モデルのRLHFは必ずしも人間に依存するものではなく、Google:AIフィードバックも同様に効果的

推薦する

ガートナーレポート: 私たちはデータサイエンスと機械学習ツールの「大爆発」の時代を迎えている

ガートナー社によると、現在データサイエンスに使用されているツールは急速に変化しているという。同社は新...

李開復、胡宇、張亜琴の GMIC 2018 対談: AI 戦略と AI 人材育成における中国と米国の違いは何ですか?

[[227402]]人工知能が急成長を遂げている現在、AI人材の不足は中国だけでなく、世界全体が直...

99.9%の精度!小園口算は算数の問題をAIで訂正しており、誤り率は小学校教師の10分の1に過ぎない。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google: パフォーマンスの低い微調整モデルを捨てず、平均重量を計算してパフォーマンスを向上させる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

10億ドルか、それともカタツムリを追いかけるだけか?上海大学准教授が科学論文を発表:機械に意思決定を手伝わせよう

人にとって選択をすることはどれほど困難で興味深いことでしょうか?知乎の質問を見てみましょう: 10億...

機械学習のための3つの主要な学習リソースを丁寧に整理

機械学習はここしばらく話題になっていますが、それには十分な理由があります。機械学習は、将来の行動を予...

Kubernetes 上で生成 AI アプリケーションをデプロイするためのステップバイステップ ガイド

翻訳者 |李睿レビュー | Chonglou今日の急速に変化するテクノロジーと市場環境では、人工知能...

K8S向け機械学習ツール「Kubeflow」の詳しい解説

[51CTO.com オリジナル記事] Kubeflowには多くのコンポーネントがあり、各コンポーネ...

Python で線形回帰機械学習モデルを作成する方法は? 「初心者ガイド」

線形回帰とロジスティック回帰は、現在人気のある 2 つの機械学習モデルです。 [[331887]]こ...

...

ナレッジグラフに加えて、グラフで他に何ができるでしょうか?

グラフについてはあまり知らないかもしれませんが、ナレッジグラフについて言えば、それは間違いなく現在ホ...

人工知能は住宅ローン業界に大変革をもたらす

研究機関の推計によると、新型コロナウイルスの流行により、2020年の世界経済は約3%縮小する見通しだ...

Appleは10年間で28社のAI企業を売却。そのAI戦略は世間の注目を集めることだ!

10年前の2010年2月、同社初のバーチャルパーソナルアシスタントアプリであるSiriがApple...

この肖像生成AIは、簡単なスケッチから1秒で本物の顔を生成できる

人工知能技術の発展に伴い、その用途は豊富かつ多様化しており、画像との組み合わせにおいては、AI顔認識...

YouTube でフォローすべき 5 人のデータ サイエンティストと機械学習エンジニア

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...