オブジェクト ストレージが AI と機械学習に適している 3 つの理由!

オブジェクト ストレージが AI と機械学習に適している 3 つの理由!

[[329860]]

【51CTO.com クイック翻訳】

あらゆる種類の企業が AI や機械学習プロジェクトを加速させていますが、その可能性を真に実現するには、大きな技術的障壁を克服する必要があります。コンピューティング インフラストラクチャが焦点となることがよくありますが、ストレージも同様に重要です。オブジェクト ストレージ (ファイル ストレージやブロック ストレージではなく) が AI および機械学習のワークロードに特に適している主な理由は次の 3 つです。

1. スケーラビリティ– AI と機械学習は、学習の対象となるデータソースが大量かつ多様である場合に最も効果を発揮します。データ サイエンティストは、この豊富なデータを活用してドメイン モデルをトレーニングします。 「ビッグデータの 5 つの V」(量、多様性、速度、正確性、価値)のうち、最初の 2 つ(量と多様性)が最も重要です。つまり、AI と機械学習は、大量の多様なデータ (画像、テキスト、構造化データと半構造化データ) に依存して、有用なモデルを構築し、正確な結果を提供し、最終的にビジネス価値をもたらします。

オブジェクト ストレージは最もスケーラブルなストレージ アーキテクチャであり、AI や機械学習に必要な大量のデータのサポートに特に適しています。オブジェクト ストレージは、スケールアウト アプローチを通じて無制限の成長をサポートするように設計されており、組織はいつでもどこからでもノードを追加して展開を拡張できます。オブジェクト ストレージは単一のグローバル名前空間を使用するため、このスケーリングは複数の場所で同時に実行することもできます。一方、ファイル システムとブロック システムでは、通常、スケールアップ アプローチが採用されます。つまり、このようなプラットフォームは、単一のノードにさらに多くのコンピューティング リソースを追加することで垂直方向に拡張されますが、このアプローチには限界があります。追加のノードを展開してコンピューティング リソースを増やすことで、効率的にスケールアウトすることはできません。

2. API – 堅牢で柔軟なデータ API は、前述のようにさまざまな種類のデータを使用する AI と機械学習にとって重要です。ストレージ プラットフォームは、さまざまなデータに対応するために API をサポートする必要があります。さらに、AI と機械学習のイノベーションはパブリック クラウドで行われることが多くなっていますが、ユース ケースの詳細に応じて、AI と機械学習の大部分は依然としてオンプレミスまたはプライベート クラウドで行われています (たとえば、科学研究や医療などの分野での容量集約型のワークロードは、多くの場合、プライベート クラウドに最適です)。つまり、企業にはパブリック クラウドとオンプレミス/プライベート クラウドの両方のワークロードをサポートするストレージ API が必要です。

ファイルおよびブロック ストレージ プラットフォームは、古いアーキテクチャであるため、サポートする API が制限されています。対照的に、オブジェクト ストレージはクラウドの高レベル API を使用します。これらの API はアプリケーション中心に設計されており、バージョン管理、ライフサイクル管理、暗号化、オブジェクト ロック、メタデータなど、ファイル ストレージやブロック ストレージよりも幅広い API をサポートします。さらに、AI や機械学習のユースケース (ストリーミング データのサポートや大規模なデータ セットのクエリなど) をサポートする新しいオブジェクト ストレージ API も可能です。

オブジェクト ストレージ API は Amazon S3 を中心に標準化されているため、オンプレミスとパブリック クラウドのソフトウェアの統合が容易になります。企業は、AI および機械学習の展開をオンプレミス/プライベート クラウド環境からパブリック クラウドに簡単に拡張したり、クラウド ネイティブの AI および機械学習のワークロードを機能を損なうことなくオンプレミス環境に移行したりできます。このデュアルモード アプローチにより、企業はオンプレミス/プライベート クラウドとパブリック クラウドの両方のリソースを、連携して交換可能な方法で活用できるようになります。

S3 API はオブジェクト ストレージの事実上の標準となっているため、多くのソフトウェア ツールやライブラリがこの API を最大限に活用できます。これにより、コード、ソフトウェア、ツールの共有が可能になり、AI / 機械学習コミュニティ内での開発が迅速化されます。例としては、S3 API が組み込まれた TensorFlow や Apache Spark などの一般的な機械学習プラットフォームが挙げられます。

3. メタデータ– API と同様に、AI と機械学習を使用する企業にとって、無制限でカスタマイズ可能なメタデータを活用することは非常に重要です。メタデータはデータに関するデータであり、最も基本的なレベルでは、データがいつ、どこで、誰によって作成されたかを示します。しかし、メタデータはさらに多くのことを記述できます。ユーザーは任意のメタデータ タグを作成して、必要なプロパティを記述できます。

データ サイエンティストは、AI および機械学習モデルを構築して使用するために特定のデータを見つけるために豊富なメタデータを必要とします。メタデータ注釈により、データに情報が追加されるにつれて、知識が徐々に蓄積されていきます。

ファイル ストレージとブロック ストレージは、上記の基本属性などの限られたメタデータのみをサポートします。その多くはスケーラビリティに帰着します。ファイル システムとブロック システムは、ストレージ システムが膨大なデータ セットに依存する AI および機械学習アプリケーション用の豊富なメタデータをサポートした場合に自然に発生する急速かつシームレスな成長をサポートするには不十分だからです。ただし、オブジェクト ストレージは無制限で完全にカスタマイズ可能なメタデータをサポートしているため、AI や機械学習アルゴリズム用のデータを見つけやすくなり、そこからより正確な情報を導き出すことが可能になります。

X 線画像に画像認識アプリケーションを使用している病院を考えてみます。メタデータを使用すると、TensorFlow モデルを使用して、オブジェクト ストレージ システムに追加された各画像を分析し、各画像に詳細なメタデータ タグ (骨のサイズや成長に基づく患者の傷害の種類、年齢、性別など) を割り当てることができます。その後、このメタデータに基づいて TensorFlow モデルをトレーニングし、分析することで、患者に関する貴重な新しい情報を得ることができます (たとえば、20 代と 30 代の女性は、5 年前よりも骨疾患を発症する可能性が高くなっています)。

ほぼすべてのフォーチュン 500 企業が AI と機械学習に多額の投資を行っていることから、これらのテクノロジーが近い将来に最も重要なエンタープライズ IT プロジェクトとなることは驚くことではありません。ただし、AI/機械学習プロジェクトを成功させるには、組織は適切なストレージ インフラストラクチャを使用する必要があります。オブジェクト ストレージは、そのスケーラビリティ、さまざまな API (特に S3) のサポート、豊富なメタデータにより、AI と機械学習に最適なバックボーンです。

原題: オブジェクト ストレージが AI と機械学習に適している 3 つの理由、著者: Gary Ogasawara

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  確かな情報です! AIテクノロジーアーキテクチャソリューションの実現可能性を判断するのに役立つ3つの重要な要素

>>:  TensorRT が顔認識を高速化する方法

ブログ    

推薦する

AI スタートアップの品質を測定するにはどうすればよいでしょうか?

編集者注: Zetta Venture のパートナーである Ivy Nguyen 氏は最近、Tech...

ニューラルネットワークと人間の思考の深い関係

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

日本の女性型ロボットは人気があります。本物の人間のようで、「生殖」の機能も持っています。

さまざまなスマート電子製品の普及により、ほとんどの人が知能についてある程度理解するようになりました。...

...

製造業における人工知能の応用

資産集約型組織の中には、運用効率の向上、主要業績評価指標 (KPI) の改善、生産およびサポート プ...

...

機械学習におけるデータ駆動型アルゴリズムの応用

機械学習の概念分析機械学習の概念は、アルゴリズムとニューラル ネットワーク モデルを使用して学習し、...

企業はどのように AI を活用してビジネスの成長を促進できるのでしょうか?

人工知能 (AI) の導入によって得られる潜在的な利益を考えると、企業は傍観者でいるわけにはいきませ...

...

自動化から拡張現実まで: 製造業を混乱させる 12 の革新的なテクノロジー トレンド

製造業は、自動車、電子機器、医療機器、機械、その他のシステムの部品を生産する上で重要な役割を果たして...

AIは期待に応えられていない?これらの人為的ミスが発生した可能性がある

人工知能は、ほとんどのビジネス分野で必須のテクノロジーになりつつあります。顧客対応チャットボットとし...

WeChatロボットの長期無料導入、初心者でも簡単にAIを始められる

以前、ローカルで WeChat ロボットを構築する方法を紹介しました。昨日、クラスメートから、ローカ...

xAI Twitterライブ放送:GoogleやOpenAIと直接競合する

人工知能の波に直面して、マスク氏はついに再び行動を起こした! 7月15日、マスク氏とxAI創設チーム...

寒い冬の「火」、快手は流行に逆らって1,000人以上を募集

春が来たが、インターネットの寒い冬の影はまだ消えていない。年初から人員削減、外部採用の中止、採用削減...

HKU などが GraphGPT をリリース: パラメータを 1/50 に微調整し、精度を 10 倍向上! LLMは長いトークンなしでグラフ構造を理解できる

グラフニューラルネットワークは、グラフ構造のデータを分析および学習するための強力なフレームワークとな...