AIストレージプラットフォームが機械学習とデータ分析のニーズを満たす方法

AIストレージプラットフォームが機械学習とデータ分析のニーズを満たす方法

機械学習と AI タスクの実行方法や環境内でのデータの収集方法に応じて、組織はどの AI ストレージ製品を購入すべきかを理解する必要があります。

組織が AI ストレージ プラットフォームを購入する場合、選択できる方法は多数あります。しかし、重要な目標は、機械学習や人工知能のタスクを実行するために、より効率的にデータを収集できる製品を見つけることです。

[[285665]]

AI データ ストレージ製品の評価と選択に関わる重要な質問には、次のようなものがあります。

  • ストレージ プラットフォームは、コストを効果的に管理しながら、高いパフォーマンスとスケーラビリティを実現する必要があります。
  • そのパフォーマンスには、高いスループットの提供と低レイテンシの実現が含まれる必要があります。
  • 優れた AI モデルを作成するには、ペタバイト単位のデータを処理する必要があり、コストがかかる可能性があります。組織は、機械学習と AI プラットフォームの全体的なコストを管理する必要性を認識する必要があります。

ディープラーニングでは、機械学習アルゴリズムは教師なしで実行でき、ディープラーニング アルゴリズムの連続するレイヤーが複数レベルのデータ分析を処理するため、I/O プロファイルによって高度にランダムなアクセスが実現します。機械学習と AI トレーニングは通常、バッチ モードで実行され、データ サイエンティストが機械学習 AI モデルを作成し、データに対してテストし、時間をかけてモデルを改良していきます。このアプローチでは、モデルのテスト時間が短くなると反復回数が増え、モデルの品質が向上するため、高速実行を保証するために低レイテンシが必要です。

したがって、組織が選択する特定のストレージ製品は、行う作業の種類と、必要な機械学習および AI トレーニングに基づいて決定する必要があります。どちらの場合でも、ストレージ製品で最高のパフォーマンスと価格の比率を得るにはトレードオフが存在します。

階層的アプローチ

ストレージ製品を購入する際は、コストとパフォーマンスのバランスが重要な考慮事項となります。選択肢があれば、ほとんどの組織は可能な限り最速のストレージを購入するでしょう。ただし、パフォーマンスが高ければコストも高くなります。通常、高性能システムはペタバイトの範囲まで拡張できません。特定の時点で分析されるデータの作業セットは、データ資産全体のサブセットであるという前提と相まって、ストレージ階層化が機械学習と AI 用のデータ ストレージの設計に不可欠な部分であることが容易にわかります。

機械学習と AI の文脈において、階層化とは具体的に何を意味するのでしょうか? 従来の階層化製品は、固定ストレージ プールから、使用頻度と使用可能なプール容量に基づいて個々のストレージ ブロックの配置を最適化する複雑なシステムへと進化しました。しかし、データの処理方法が原因で、このアプローチは機械学習や人工知能には適していません。

自動階層化製品では、データがビジネスにとって重要なライフサイクルを経ることを前提としています。新しいデータは非常に重要であり、頻繁にアクセスされます。データは時間の経過とともに価値が失われるため、より低コストでパフォーマンスの低い製品ストレージに移動できます。

機械学習や AI 分析に使用されるデータにより、さまざまなデータセット全体がアクティブになり、分析に利用できるようになります。データセット全体が常に利用可能である必要があります。つまり、アクセスの変更はモデルのトレーニングなどの問題に影響するため、使用中のデータは一貫したパフォーマンスを備えたストレージ層に配置する必要があります。

機械学習と AI モデル開発におけるデータ処理の確率的性質により、時間の経過とともにデータを動的に再バランスしようとするリアクティブ ストレージ プラットフォーム アルゴリズムは機能しません。これらのアルゴリズムは、時間の経過とともに徐々に進化する、小さく比較的静的なワーキング セットを想定しています。機械学習と AI では、データ アクセス プロファイルがよりランダムになるため、どのデータをキャッシュするか、キャッシュ サイズやより高速なストレージ層をどのように調整するかを予測することが難しくなります。

2層ストレージモデル

機械学習と AI ワークロード用のストレージを提供するシンプルなアプローチは、2 層モデルを使用することです。パフォーマンス層は、システムが処理すると予想される最大のデータ セットに合わせて調整されながら、最大限のパフォーマンスと可能な限り低いレイテンシを提供します。

高性能フラッシュメモリは高価であり、市場がトリプルレベルセルやクアッドレベルセルなどの大容量フラッシュ製品に移行するにつれて、Samsung Z-NANDやToshiba XL Flashなどの低レイテンシフラッシュ製品を含む高性能ストレージ製品の新しい市場が出現しました。これらの製品は、低レイテンシの I/O を提供することで開発されたストレージ クラス メモリを補完します。たとえば、Vast Data は、4 層セルと Intel Optane テクノロジーの両方を使用して N 構造と S3 API をサポートし、非構造化データ向けの高性能でスケーラブルなストレージ製品を提供します。

これらの Tier 0 ストレージ製品は、NVMe デバイスを使用して内部またはストレージ ネットワーク間で接続します。従来の SAS および SATA ストレージ デバイスと比較して、NVMe は I/O スタックまたは I/O プロトコルを最適化します。その結果、レイテンシが短縮され、スループットが向上しますが、サーバー プロセッサは I/O が完了するまで待機する必要がないため、プラットフォームの使用率が大幅に向上します。

Pure Storage の AIRI、IBM Spectrum Storage for AI、NetApp の All Flash FAS A800 などの製品はすべて、メディア パフォーマンスを最大限に高めるために内部で NVMe を使用しています。 Dell EMC と DataDirect Networks は、自社の製品ラインのスケールアウト ファイル システム製品を使用して、機械学習と人工知能のリファレンス アーキテクチャをサポートしています。

容量レイヤーでは、すべての AI モデル データを長期間 (通常は数か月または数年) 安全に保存する必要があります。そのため、機械学習や人工知能に必要な大量のデータを管理するには、耐久性に優れたスケーラブルなストレージ プラットフォームが不可欠です。オブジェクト ストレージ市場は進化し、高度にスケーラブルで耐久性に優れたさまざまな AI ストレージ製品を生み出しています。

耐久性とはいったい何でしょうか?

一般的なストレージ システムでは、ハード ディスクに保存されたデータに冗長性を組み込むアーキテクチャを使用してデータが保護されます。 1 つのコンポーネントに障害が発生した場合、追加のデータ コピーを使用して失われたデータを回復し、障害が発生したコンポーネントを交換した後でデータを再構築します。 RAID 5 以上ではハード ドライブの障害に対する保護が提供されますが、データ センターの停止などの大規模な災害から保護するには他のシステムが必要です。従来のシステムが拡張されるにつれて、耐久性やデータ損失の軽減にかかるコストが高くなります。

消失訂正符号はデータに冗長性を構築し、ハードドライブ、サーバー、またはデータセンター全体の停止や障害によってデータが失われないようにします。消失訂正符号化データの分散化により、複数のシステムを管理するオーバーヘッドやコストをかけずに、ローカルおよび地理的なデータ保護を備えた数ペタバイトのデータを拡張できるストレージ システムを構築できます。

オブジェクト ストレージは、長期間 (多くの場合、複数年) 保持する必要があるデータに対して、スケーラビリティと耐久性を提供します。ただし、コスト上の利点を得るために、オブジェクト ストレージ製品は、ある程度のキャッシュ機能を備えた安価なハード ディスク ベースのストレージ上に構築されます。そのため、機械学習や人工知能のためのデータの日常的な処理には適していませんが、長期保存には最適です。

地理的に分散されたオブジェクト リポジトリを使用すると、複数の場所やソースからデータを抽出してアクセスすることもできます。これは、たとえば、データ処理にオンプレミスとパブリック クラウド インフラストラクチャが混在している場合に役立ちます。地理的分散は Scality Ring プラットフォームの特徴であり、HPE および WekaIO 製品と統合して 2 層ストレージ アーキテクチャを作成します。

ハイブリッドストレージアーキテクチャ

企業が直面している課題は、拡張性が高く高性能なストレージを含むハイブリッド アーキテクチャをどのように実装するかということです。オブジェクト ストレージ システムを使用すると、組織はデータの大部分を保存できます。一部の製品では、高性能フラッシュ メモリを搭載したサーバーにアクティブ データを保存するパフォーマンス ノードを使用します。このアプローチの利点は、容量ノードまたはパフォーマンス ノードを製品に追加して、どちらの方向にも拡張できることです。たとえば、Cloudian はスケーラビリティ機能を備えたハードウェア アプライアンスを提供します。

高性能ストレージから構築されたシステムは、処理されるデータ セット全体に合わせて拡張できるように設計する必要があります。これらのシナリオでは、複数の AI データセットが時間の経過とともに処理され、データは高性能プラットフォーム間で行き来します。

ストレージ アーキテクチャは、ストレージとの間でデータを移動するために必要なネットワーク帯域幅を AI 製品に提供し、AI プラットフォームの要件を満たす必要があります。 Nvidia DGX-1 や DGX-2 プラットフォームなどの製品は、1 秒あたり数十ギガバイトのデータを消費する可能性があります。したがって、開発のペースに追いつくためには、AI データ ストレージ製品におけるコンピューティングとストレージ間の接続は、低遅延の InfiniBand または 100Gb イーサネットである必要があります。

AI製品向けソフトウェア定義ストレージ

機械学習や AI 用のストレージを構築するということは、必ずしも高性能な機器を導入することを意味するわけではありません。本質的にソフトウェア定義ストレージ (SDS) である新しい高性能 AI ストレージ製品が利用可能になりました。これらの製品は、NVMe や、場合によっては永続メモリやストレージ クラス メモリなどの新しいメディアの機能を活用します。

ソフトウェア定義ストレージ (SDS) 製品の利点の 1 つは、パブリック クラウド インフラストラクチャでインスタンス化して動的に拡張できるため、パブリック クラウドに適していることです。この動作モードは、インフラストラクチャの量が不明な場合や、短期間のみ必要な場合に魅力的です。

WekaIO は、NVMe ドライブを搭載したサーバー、または NVMe 機能を備えた Elastic Compute Cloud インスタンス上の AWS パブリック クラウドに導入できる、Matrix ソフトウェアに基づくスケールアウト ストレージ プラットフォームを提供しています。

Excelero NVMesh は、複数のサーバーとストレージにわたってパフォーマンスを直線的に拡張できる別のソフトウェア定義ストレージ (SDS) 製品であり、多くの場合、IBM Corp. の Spectrum Scale と組み合わせてスケールアウト ファイル システムを作成します。

データモビリティ

容量層とパフォーマンス層を 1 つのサービスに統合するには、パフォーマンス層と容量層の間でデータを移動し、移動時にメタデータ間でデータを適切に追跡するための手動または自動のプロセスが必要です。一部の AI ストレージ製品はオブジェクト ストレージと直接統合できるため、このプロセスが簡素化されます。パブリック クラウドは、オンプレミスのクラウド サービス間で移動されるデータに対してストレージ料金が発生しないため、機械学習や AI 開発に最適な選択肢となります。たとえば、WekaIO の Matrix は、データを内部および外部に複製し、オブジェクト ストレージにアーカイブできます。

統合された

機械学習や AI ワークロード用のローカル ストレージを実装しようとしている企業は、容量とパフォーマンスの両方を考慮する必要があります。パフォーマンス層では、機械学習用の統合インフラストラクチャをゼロから構築するか、パッケージ化されたサービスを導入することができます。ビルド オプションを使用すると、企業はオンプレミスのアプライアンスを導入したり、ソフトウェア定義ストレージ (SDS) を使用したりできます。ソフトウェア定義ストレージ (SDS) を使用すると、組織はストレージを別のレイヤーとして実装したり、ハイパーコンバージド インフラストラクチャを構築したりできます。データがオンプレミスに残る場合、組織はアプライアンスを使用するか、ソフトウェア定義のルートに従って、オブジェクト ストレージを使用して容量層を展開できます。

パブリック クラウドを利用すると、IT 組織はオブジェクト ストレージやブロック ストレージなどのネイティブ サービスを使用できます。ファイル ストレージ製品が機械学習や人工知能アプリケーションの低レイテンシを実現するには、まだ長い道のりが残っています。代わりに、組織はブロック ストレージを、特にネイティブ ブロック リソースにファイル サービス レイヤーを追加するソフトウェア定義ストレージ (SDS) または AI ストレージ製品と組み合わせて使用​​​​する場合があります。

<<:  2020 年の予測: AI セキュリティの 10 のトレンド

>>:  AI 支援による開発は、手動コーディングよりも 180 倍以上高速です。プログラマーは喜んでいるのでしょうか、それとも心配しているのでしょうか?

ブログ    

推薦する

販売禁止の影で、国産GPGPUがその穴を埋めることはできるのか?

今年初め、ChatGPTはAIアプリケーションの開発を刺激する火花のようなもので、AI業界は開発の急...

AIと機械学習プロジェクトのセキュリティを確保する方法

人工知能と機械学習はメリットをもたらす一方で、新たな脆弱性ももたらします。この記事では、いくつかの企...

ビル・ゲイツ:中国がAIで他国を追い抜くとは思わない

マイクロソフトの創業者ビル・ゲイツは、現在のAIの開発動向についてどう考えているのでしょうか?最近の...

...

ガートナーは未来を変える5つのテクノロジーを特定

Gartner は、組織のデジタルの未来を変革すると考えられる 5 つのテクノロジーを紹介します。 ...

MITとGoogle BrainはAIを使って「現代のロゼッタストーン」として知られる失われた古代の文書を解読する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

オープンソースのラマ2の背後には、若い中国人たちの力がある

最近、Llama 2 のオープン ソース化により、Yann LeCun 氏や業界関係者の多くが「ビッ...

手紙を開かずに読むことはできますか? MITのX線技術がネイチャー誌に掲載される

2世紀前に折りたたまれた手紙の内容を、開かずに読むにはどうすればよいでしょうか?アルゴリズムはそれを...

...

...

...

汎用人工知能の時代が到来

さまざまな状況情報を記憶し、推論できるパーソナル AI アシスタントは、常にすぐそこまで来ているよう...

クック:人工知能が本当に知的であるためには、人間の価値観を尊重しなければならない

[[247844]]近年、FacebookやGoogleなどのインターネット大手は、ユーザーデータの...

このAI商用リストをお見逃しなく: 生産上の問題はアプリケーションによって解決されるかもしれません

[[219776]]リアム・ヘーネル編纂者:趙怡雲、江宝尚、銭天培人工知能があらゆる分野に浸透してい...

人工知能は教育の新たな発展を促進し、これら3つの分野に大きな影響を与えます。

今年の流行語について聞かれたら、「人工知能」という言葉は誰もが知っていると思います。人工知能は多くの...