オブジェクト ストレージが AI と機械学習に適している 3 つの理由!

オブジェクト ストレージが AI と機械学習に適している 3 つの理由!

[[329860]]

【51CTO.com クイック翻訳】

あらゆる種類の企業が AI や機械学習プロジェクトを加速させていますが、その可能性を真に実現するには、大きな技術的障壁を克服する必要があります。コンピューティング インフラストラクチャが焦点となることがよくありますが、ストレージも同様に重要です。オブジェクト ストレージ (ファイル ストレージやブロック ストレージではなく) が AI および機械学習のワークロードに特に適している主な理由は次の 3 つです。

1. スケーラビリティ– AI と機械学習は、学習の対象となるデータソースが大量かつ多様である場合に最も効果を発揮します。データ サイエンティストは、この豊富なデータを活用してドメイン モデルをトレーニングします。 「ビッグデータの 5 つの V」(量、多様性、速度、正確性、価値)のうち、最初の 2 つ(量と多様性)が最も重要です。つまり、AI と機械学習は、大量の多様なデータ (画像、テキスト、構造化データと半構造化データ) に依存して、有用なモデルを構築し、正確な結果を提供し、最終的にビジネス価値をもたらします。

オブジェクト ストレージは最もスケーラブルなストレージ アーキテクチャであり、AI や機械学習に必要な大量のデータのサポートに特に適しています。オブジェクト ストレージは、スケールアウト アプローチを通じて無制限の成長をサポートするように設計されており、組織はいつでもどこからでもノードを追加して展開を拡張できます。オブジェクト ストレージは単一のグローバル名前空間を使用するため、このスケーリングは複数の場所で同時に実行することもできます。一方、ファイル システムとブロック システムでは、通常、スケールアップ アプローチが採用されます。つまり、このようなプラットフォームは、単一のノードにさらに多くのコンピューティング リソースを追加することで垂直方向に拡張されますが、このアプローチには限界があります。追加のノードを展開してコンピューティング リソースを増やすことで、効率的にスケールアウトすることはできません。

2. API – 堅牢で柔軟なデータ API は、前述のようにさまざまな種類のデータを使用する AI と機械学習にとって重要です。ストレージ プラットフォームは、さまざまなデータに対応するために API をサポートする必要があります。さらに、AI と機械学習のイノベーションはパブリック クラウドで行われることが多くなっていますが、ユース ケースの詳細に応じて、AI と機械学習の大部分は依然としてオンプレミスまたはプライベート クラウドで行われています (たとえば、科学研究や医療などの分野での容量集約型のワークロードは、多くの場合、プライベート クラウドに最適です)。つまり、企業にはパブリック クラウドとオンプレミス/プライベート クラウドの両方のワークロードをサポートするストレージ API が必要です。

ファイルおよびブロック ストレージ プラットフォームは、古いアーキテクチャであるため、サポートする API が制限されています。対照的に、オブジェクト ストレージはクラウドの高レベル API を使用します。これらの API はアプリケーション中心に設計されており、バージョン管理、ライフサイクル管理、暗号化、オブジェクト ロック、メタデータなど、ファイル ストレージやブロック ストレージよりも幅広い API をサポートします。さらに、AI や機械学習のユースケース (ストリーミング データのサポートや大規模なデータ セットのクエリなど) をサポートする新しいオブジェクト ストレージ API も可能です。

オブジェクト ストレージ API は Amazon S3 を中心に標準化されているため、オンプレミスとパブリック クラウドのソフトウェアの統合が容易になります。企業は、AI および機械学習の展開をオンプレミス/プライベート クラウド環境からパブリック クラウドに簡単に拡張したり、クラウド ネイティブの AI および機械学習のワークロードを機能を損なうことなくオンプレミス環境に移行したりできます。このデュアルモード アプローチにより、企業はオンプレミス/プライベート クラウドとパブリック クラウドの両方のリソースを、連携して交換可能な方法で活用できるようになります。

S3 API はオブジェクト ストレージの事実上の標準となっているため、多くのソフトウェア ツールやライブラリがこの API を最大限に活用できます。これにより、コード、ソフトウェア、ツールの共有が可能になり、AI / 機械学習コミュニティ内での開発が迅速化されます。例としては、S3 API が組み込まれた TensorFlow や Apache Spark などの一般的な機械学習プラットフォームが挙げられます。

3. メタデータ– API と同様に、AI と機械学習を使用する企業にとって、無制限でカスタマイズ可能なメタデータを活用することは非常に重要です。メタデータはデータに関するデータであり、最も基本的なレベルでは、データがいつ、どこで、誰によって作成されたかを示します。しかし、メタデータはさらに多くのことを記述できます。ユーザーは任意のメタデータ タグを作成して、必要なプロパティを記述できます。

データ サイエンティストは、AI および機械学習モデルを構築して使用するために特定のデータを見つけるために豊富なメタデータを必要とします。メタデータ注釈により、データに情報が追加されるにつれて、知識が徐々に蓄積されていきます。

ファイル ストレージとブロック ストレージは、上記の基本属性などの限られたメタデータのみをサポートします。その多くはスケーラビリティに帰着します。ファイル システムとブロック システムは、ストレージ システムが膨大なデータ セットに依存する AI および機械学習アプリケーション用の豊富なメタデータをサポートした場合に自然に発生する急速かつシームレスな成長をサポートするには不十分だからです。ただし、オブジェクト ストレージは無制限で完全にカスタマイズ可能なメタデータをサポートしているため、AI や機械学習アルゴリズム用のデータを見つけやすくなり、そこからより正確な情報を導き出すことが可能になります。

X 線画像に画像認識アプリケーションを使用している病院を考えてみます。メタデータを使用すると、TensorFlow モデルを使用して、オブジェクト ストレージ システムに追加された各画像を分析し、各画像に詳細なメタデータ タグ (骨のサイズや成長に基づく患者の傷害の種類、年齢、性別など) を割り当てることができます。その後、このメタデータに基づいて TensorFlow モデルをトレーニングし、分析することで、患者に関する貴重な新しい情報を得ることができます (たとえば、20 代と 30 代の女性は、5 年前よりも骨疾患を発症する可能性が高くなっています)。

ほぼすべてのフォーチュン 500 企業が AI と機械学習に多額の投資を行っていることから、これらのテクノロジーが近い将来に最も重要なエンタープライズ IT プロジェクトとなることは驚くことではありません。ただし、AI/機械学習プロジェクトを成功させるには、組織は適切なストレージ インフラストラクチャを使用する必要があります。オブジェクト ストレージは、そのスケーラビリティ、さまざまな API (特に S3) のサポート、豊富なメタデータにより、AI と機械学習に最適なバックボーンです。

原題: オブジェクト ストレージが AI と機械学習に適している 3 つの理由、著者: Gary Ogasawara

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  確かな情報です! AIテクノロジーアーキテクチャソリューションの実現可能性を判断するのに役立つ3つの重要な要素

>>:  TensorRT が顔認識を高速化する方法

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

大型模型+ロボット、詳細なレビューレポートはこちら、多くの中国の学者が参加

大型モデルの優れた能力は誰の目にも明らかであり、ロボットに統合されれば、ロボットはより賢い脳を持つこ...

絶えず繰り返されるアルゴリズムとプログラミング技術が若者の発達を促している

人間の進化と発達は、脳の潜在能力を最大限に活用して世界を変えるプロセスです。その中で、インターネット...

テスラは、Dojo スーパーコンピューターの秘密を盗み、偽のコンピューターを使用して検査を欺いたとして元エンジニアを訴える

テスラは、元エンジニアのアレクサンダー・ヤツコフ氏を提訴した。同氏は、同社内部のスーパーコンピュータ...

近年の機械学習の奇妙な状況

翻訳者注:人工知能分野の発展は学者の貢献と切り離せないものです。しかし、研究が進むにつれて、「クリッ...

優れたオープンソース RPA フレームワーク 5 つ

ここ2年間、RPA+AI(インテリジェント自動化プロセス)が頻繁に言及されています。企業/機関のデジ...

...

Google Brain Quoc、操作プリミティブから効率的なTransformerバリアントを検索するためのPrimerをリリース

[[426884]]モデルのパフォーマンスを向上させるには、パラメータを調整し、活性化関数を変更する...

2019 年に学ぶべき 10 個の機械学習 API

最近では、携帯電話の写真からメールの受信トレイのフィルターまで、機械学習はあらゆるところに存在してい...

...

...

業界の証人、Pudu Roboticsが北京ケータリング調達展示会に初登場

4月21日から23日まで、北京市易創国際会議展示センターでもう一つのケータリング会議、すなわち202...

人工知能を活用してビジネスを成長させ、企業価値を創造する方法

組織は、全員を関与させれば、AI を活用してビジネスを成長させることができます。人工知能への投資は、...

プログラミング能力はGPT-4を超え、アルパカコード版「スーパーカップ」が登場、ザッカーバーグ氏も自らLlama3をネタバレ

アルパカファミリーの「最強のオープンソースコードモデル」が「スーパーカップ」を発売しました——今朝、...