適切な AI データストレージを選択するための 6 つのガイドライン

間違った AI ストレージプラットフォームを選択すると、ビジネスに深刻な結果をもたらす可能性があります。したがって、企業の AI データストレージ戦略の選択に影響を与える可能性のある 6 つの基準を理解する必要があります。

[[314851]]

人工知能と機械学習は、今日の企業にとって最も重要な 2 つのツールとなり、企業が中核となるデジタル資産を活用して競争上の優位性を生み出すのに役立っています。しかし、AI データストレージを導入する前に、企業は機械学習プラットフォームがデータを取得、処理、保持する方法に基づいてさまざまな要件を考慮する必要があります。

まず、機械学習ソフトウェアで使用されるデータのライフサイクルを調べます。これにより、AI 用のストレージを選択する際に考慮すべき事項を理解するのに役立ちます。まず、企業は機械学習や人工知能のアルゴリズムをトレーニングするためのデータを取得する必要があります。これらは、オブジェクトの識別、ビデオの処理、動きの追跡などのタスクを学習するためにデータを処理するソフトウェアツールです。データはさまざまなソースから生成される可能性があり、オブジェクトやファイルなど、本質的には構造化されていないことがよくあります。

トレーニングプロセスでは、データ資産を取得し、機械学習または人工知能ソフトウェアを使用して、将来のデータソースを処理するためのアルゴリズムを作成します。アルゴリズムをトレーニングまたは開発する際、AI ソフトウェアはソースデータを処理して、洞察を生み出したりビジネスニーズに対応したりできるモデルを開発します。

機械学習アルゴリズムの開発は、ほとんどの場合、単一のプロセスで行われることはありません。企業が蓄積するデータが増えるにつれて、アルゴリズムは洗練され、改善されていきます。つまり、破棄されるデータはごくわずかで、時間の経過とともに増加し、再処理されることになります。

AIデータ保存の標準の採用

AI プラットフォーム用のストレージを選択する前に、企業はまず次の点を考慮する必要があります。

（１）料金AI データストレージの価格は、企業が購入を検討する重要な要素です。明らかに、経営陣と購買決定に携わる人々は、データストレージが可能な限りコスト効率の高いものであることを望んでおり、多くの場合、これが製品の選択と戦略に影響を及ぼします。

（２）スケーラビリティ企業は、機械学習や人工知能モデルを作成するために、大量のデータを収集、保存、処理する必要があります。機械学習アルゴリズムでは、精度の線形改善を実現するために、ソースデータの指数関数的な増加が必要です。信頼性が高く正確な機械学習モデルを作成するには、数百テラバイト、さらにはペタバイトのデータが必要になる場合があり、時間の経過とともに増加する可能性があります。

ペタバイト規模のストレージシステムを構築するには、通常、オブジェクトストレージまたはスケールアウトファイルシステムを使用する必要があります。最新のオブジェクトストアは AI ワークロードの容量ニーズに対応できますが、高パフォーマンスなどの他の基準を満たさない可能性があります。スケールアウトファイルシステムは高いパフォーマンスと優れたスケーラビリティを提供できますが、データセット全体を単一のプラットフォームに保存するとコストがかかる可能性があります。ブロックストレージは、スケーラビリティ要件と大容量製品のコストのため、機械学習や AI には適さないことがよくあります。唯一の例外はパブリッククラウドです。

ストレージコストの変化により、階層化、つまり複数の種類のストレージを使用してデータを保存するという考え方が導入されました。たとえば、オブジェクトリポジトリは、大量の非アクティブな AI データを保存するのに適しています。処理にデータが必要な場合は、高性能ファイルストレージクラスターまたはオブジェクトストレージの高性能向けに設計されたノードに移動し、処理が完了したらデータを元に戻すことができます。

（３）パフォーマンス人工知能データの保存パフォーマンスには 3 つの側面があります。まず、おそらく最も重要なのはレイテンシです。これは、ソフトウェアによって発行された各 I/O 要求が処理される速度を定義します。低レイテンシは重要です。レイテンシを改善すると、機械学習または AI モデルの作成にかかる時間に直接影響するからです。複雑なモデルの開発には、実行に数週間から数か月かかる場合があります。開発サイクルを短縮することで、企業はより迅速にモデルを作成し、改良することができます。レイテンシ機能を調べる場合、オブジェクトアクセスの流動的な性質により、オブジェクトは単一の I/O 要求のレイテンシではなく、最初のバイトまでの時間への参照を保存します。

パフォーマンスのもう 1 つの側面はスループット、つまりストレージプラットフォームにデータを書き込んだり、そこからデータを読み取ったりする速度です。 AI トレーニングでは大規模なデータセットを処理し、モデルを正確に開発するために同じデータを繰り返し読み取ることが多いため、システムスループットは重要です。自動運転車のセンサーなどの機械学習や AI データのソースは、毎日テラバイト単位の新しいデータを生成する可能性があります。この情報はすべて、既存の処理への影響を最小限に抑えながら、既存のデータストアに追加する必要があります。

関係するデータの量が膨大であるため、ストレージプラットフォームを適切に選択することが重要です。

パフォーマンスの最後の側面は並列アクセスです。機械学習と AI アルゴリズムはデータを並列処理し、同じデータを複数回読み取り、多数の並列タスクにまたがる複数のタスクを実行します。オブジェクトストレージは、オブジェクトのロックや管理するプロパティがないため、並列読み取り I/O 処理に優れています。ファイルサーバーは、メモリ内の開いている I/O 要求またはファイルハンドルを追跡します。したがって、アクティブな I/O 要求の数は、プラットフォームで使用可能なメモリによって異なります。

機械学習データは、多数の小さなファイルで構成される場合があります。この点では、ファイルサーバーはオブジェクトストレージよりも優れたパフォーマンスを提供できます。 AI ストレージベンダーに尋ねる重要な質問は、大規模なファイルタイプと小規模なファイルタイプの間で製品のパフォーマンス特性がどのように変化するかということです。

大規模なオブジェクトストアのほとんどは定期的にバックアップするには大きすぎるため、信頼性の高い消失訂正符号が AI ストレージプラットフォームの重要な機能になっています。

（５）パブリッククラウド機械学習や人工知能のアルゴリズムを開発するには、高性能ストレージと高性能コンピューティングが必要です。多くの AI システムは、Nvidia DGX などの GPU をベースとしており、正確なアルゴリズムの開発に必要な複雑な数学的計算の多くを軽減します。

パブリッククラウドサービスプロバイダーは、機械学習に使用できる GPU アクセラレーション仮想インスタンスの提供を開始しています。パブリッククラウドで機械学習ツールを実行すると、機械学習開発用のインフラストラクチャを構築するための投資コストが削減されると同時に、機械学習モデルの開発に必要なインフラストラクチャを拡張できるようになります。

パブリッククラウドコンピューティングを使用する際の課題は、コスト効率が高く実用的な方法でデータをパブリッククラウドに取り込むことです。クラウドベースのオブジェクトストレージは機械学習の I/O 要求を満たすには遅すぎるため、ローカルブロックストレージを使用する必要があります。データ移動の遅延と機械学習の遅延は、インフラストラクチャの運用コストの増加を意味します。

パブリッククラウドのもう 1 つの問題は、データ送信のコストです。クラウドコンピューティングサービスプロバイダーは、自社のプラットフォームへのデータの移動に対しては料金を請求しませんが、自社のプラットフォーム外のパブリックネットワークからアクセスされたデータに対しては料金を請求します。その結果、パブリッククラウドはコンピューティングの柔軟性を提供しますが、クラウドプラットフォームにデータをタイムリーかつコスト効率よく出し入れすることが必ずしも容易であるとは限りません。

クラウドコンピューティングベンダーは、オンプレミスのインフラストラクチャとクラウドプラットフォームにまたがるパブリッククラウドで自社製品を実行できるストレージ製品を開発しています。これらの製品は、データを効率的にクラウドにコピーまたは移動し、完了した場合にのみ結果を元に戻すことができます。これらのレプリケーションテクノロジーは帯域幅効率に優れているため、オンプレミスでデータを保存し、分析のためにクラウドにインポートすることが実用的になります。

（６）統合機械学習と人工知能のストレージの側面は、コンピューティングから分離する必要があります。 AI データストレージの構築は、ストレージネットワークや、機械学習アプリケーションで動作するようにストレージを調整するために考慮する必要があるその他の要素のために困難になる可能性があります。

製品を事前にパッケージ化することで、クラウドコンピューティングベンダーは、製品を顧客に提供する前にテストして最適化することができます。現在、人気の AI ソフトウェア、CPU や GPU などのコンピューティング、ネットワーク、ストレージデバイスを組み合わせて AI 対応プラットフォームを提供するストレージ製品が存在します。これらのシステムが導入される前に、詳細な調整作業が数多く行われました。コストが問題になる可能性はありますが、パッケージ化されたシステムにより、多くの顧客にとって AI ストレージ導入の障壁を減らすことができます。

当然のことながら、適切な AI データストレージプラットフォームを選択するには、パフォーマンス、スケーラビリティ、コストなどのトレードオフを比較検討する必要があります。関係するデータの量が膨大であるため、ストレージプラットフォームを適切に選択することが重要です。間違った製品を選択すると、大きな損失を被る可能性があります。あらゆるストレージ製品の決定と同様に、企業にとってクラウドコンピューティングベンダーと話し合い、その製品が AI と機械学習のニーズをどのように満たしているかを正確に理解することが重要です。エンゲージメントプロセスには、購入決定の前段階としてデモンストレーションと評価を含める必要があります。

<<: 顔認識を使用してアバターにマスクとゴーグルを自動的に追加する方法

>>: 5Gについて知っておくべきことは何ですか?