オブジェクト ストレージが AI と機械学習に適している 3 つの理由!

オブジェクト ストレージが AI と機械学習に適している 3 つの理由!

[[329860]]

【51CTO.com クイック翻訳】

あらゆる種類の企業が AI や機械学習プロジェクトを加速させていますが、その可能性を真に実現するには、大きな技術的障壁を克服する必要があります。コンピューティング インフラストラクチャが焦点となることがよくありますが、ストレージも同様に重要です。オブジェクト ストレージ (ファイル ストレージやブロック ストレージではなく) が AI および機械学習のワークロードに特に適している主な理由は次の 3 つです。

1. スケーラビリティ– AI と機械学習は、学習の対象となるデータソースが大量かつ多様である場合に最も効果を発揮します。データ サイエンティストは、この豊富なデータを活用してドメイン モデルをトレーニングします。 「ビッグデータの 5 つの V」(量、多様性、速度、正確性、価値)のうち、最初の 2 つ(量と多様性)が最も重要です。つまり、AI と機械学習は、大量の多様なデータ (画像、テキスト、構造化データと半構造化データ) に依存して、有用なモデルを構築し、正確な結果を提供し、最終的にビジネス価値をもたらします。

オブジェクト ストレージは最もスケーラブルなストレージ アーキテクチャであり、AI や機械学習に必要な大量のデータのサポートに特に適しています。オブジェクト ストレージは、スケールアウト アプローチを通じて無制限の成長をサポートするように設計されており、組織はいつでもどこからでもノードを追加して展開を拡張できます。オブジェクト ストレージは単一のグローバル名前空間を使用するため、このスケーリングは複数の場所で同時に実行することもできます。一方、ファイル システムとブロック システムでは、通常、スケールアップ アプローチが採用されます。つまり、このようなプラットフォームは、単一のノードにさらに多くのコンピューティング リソースを追加することで垂直方向に拡張されますが、このアプローチには限界があります。追加のノードを展開してコンピューティング リソースを増やすことで、効率的にスケールアウトすることはできません。

2. API – 堅牢で柔軟なデータ API は、前述のようにさまざまな種類のデータを使用する AI と機械学習にとって重要です。ストレージ プラットフォームは、さまざまなデータに対応するために API をサポートする必要があります。さらに、AI と機械学習のイノベーションはパブリック クラウドで行われることが多くなっていますが、ユース ケースの詳細に応じて、AI と機械学習の大部分は依然としてオンプレミスまたはプライベート クラウドで行われています (たとえば、科学研究や医療などの分野での容量集約型のワークロードは、多くの場合、プライベート クラウドに最適です)。つまり、企業にはパブリック クラウドとオンプレミス/プライベート クラウドの両方のワークロードをサポートするストレージ API が必要です。

ファイルおよびブロック ストレージ プラットフォームは、古いアーキテクチャであるため、サポートする API が制限されています。対照的に、オブジェクト ストレージはクラウドの高レベル API を使用します。これらの API はアプリケーション中心に設計されており、バージョン管理、ライフサイクル管理、暗号化、オブジェクト ロック、メタデータなど、ファイル ストレージやブロック ストレージよりも幅広い API をサポートします。さらに、AI や機械学習のユースケース (ストリーミング データのサポートや大規模なデータ セットのクエリなど) をサポートする新しいオブジェクト ストレージ API も可能です。

オブジェクト ストレージ API は Amazon S3 を中心に標準化されているため、オンプレミスとパブリック クラウドのソフトウェアの統合が容易になります。企業は、AI および機械学習の展開をオンプレミス/プライベート クラウド環境からパブリック クラウドに簡単に拡張したり、クラウド ネイティブの AI および機械学習のワークロードを機能を損なうことなくオンプレミス環境に移行したりできます。このデュアルモード アプローチにより、企業はオンプレミス/プライベート クラウドとパブリック クラウドの両方のリソースを、連携して交換可能な方法で活用できるようになります。

S3 API はオブジェクト ストレージの事実上の標準となっているため、多くのソフトウェア ツールやライブラリがこの API を最大限に活用できます。これにより、コード、ソフトウェア、ツールの共有が可能になり、AI / 機械学習コミュニティ内での開発が迅速化されます。例としては、S3 API が組み込まれた TensorFlow や Apache Spark などの一般的な機械学習プラットフォームが挙げられます。

3. メタデータ– API と同様に、AI と機械学習を使用する企業にとって、無制限でカスタマイズ可能なメタデータを活用することは非常に重要です。メタデータはデータに関するデータであり、最も基本的なレベルでは、データがいつ、どこで、誰によって作成されたかを示します。しかし、メタデータはさらに多くのことを記述できます。ユーザーは任意のメタデータ タグを作成して、必要なプロパティを記述できます。

データ サイエンティストは、AI および機械学習モデルを構築して使用するために特定のデータを見つけるために豊富なメタデータを必要とします。メタデータ注釈により、データに情報が追加されるにつれて、知識が徐々に蓄積されていきます。

ファイル ストレージとブロック ストレージは、上記の基本属性などの限られたメタデータのみをサポートします。その多くはスケーラビリティに帰着します。ファイル システムとブロック システムは、ストレージ システムが膨大なデータ セットに依存する AI および機械学習アプリケーション用の豊富なメタデータをサポートした場合に自然に発生する急速かつシームレスな成長をサポートするには不十分だからです。ただし、オブジェクト ストレージは無制限で完全にカスタマイズ可能なメタデータをサポートしているため、AI や機械学習アルゴリズム用のデータを見つけやすくなり、そこからより正確な情報を導き出すことが可能になります。

X 線画像に画像認識アプリケーションを使用している病院を考えてみます。メタデータを使用すると、TensorFlow モデルを使用して、オブジェクト ストレージ システムに追加された各画像を分析し、各画像に詳細なメタデータ タグ (骨のサイズや成長に基づく患者の傷害の種類、年齢、性別など) を割り当てることができます。その後、このメタデータに基づいて TensorFlow モデルをトレーニングし、分析することで、患者に関する貴重な新しい情報を得ることができます (たとえば、20 代と 30 代の女性は、5 年前よりも骨疾患を発症する可能性が高くなっています)。

ほぼすべてのフォーチュン 500 企業が AI と機械学習に多額の投資を行っていることから、これらのテクノロジーが近い将来に最も重要なエンタープライズ IT プロジェクトとなることは驚くことではありません。ただし、AI/機械学習プロジェクトを成功させるには、組織は適切なストレージ インフラストラクチャを使用する必要があります。オブジェクト ストレージは、そのスケーラビリティ、さまざまな API (特に S3) のサポート、豊富なメタデータにより、AI と機械学習に最適なバックボーンです。

原題: オブジェクト ストレージが AI と機械学習に適している 3 つの理由、著者: Gary Ogasawara

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  確かな情報です! AIテクノロジーアーキテクチャソリューションの実現可能性を判断するのに役立つ3つの重要な要素

>>:  TensorRT が顔認識を高速化する方法

ブログ    

推薦する

人工知能研究は行き詰まりに陥っているかもしれない

[51CTO.com クイック翻訳]フィリップ・K・ディックの1968年の小説『アンドロイドは電気羊...

トランスフォーマーは人気を失っているのか?常識的な問題を解決したい場合、ニューラルネットワークは答えではない

NLP 研究者は皆、言語モデルは文法的な文脈情報しか学習できず、常識的な質問に関しては無力であること...

ベクトルデータベースは AI をどのように改善するのでしょうか?

翻訳者 |ブガッティレビュー | Chonglou事前トレーニング済みのAIモデルがすぐに利用できる...

AgentGPT: ブラウザ上の自律型 AI エージェント

翻訳者 |ブガッティレビュー | Chonglou AgentGPT Web は、ユーザーがカスタマ...

...

...

ドローン技術がモバイルIoTの範囲を拡大

無人航空機(口語では「ドローン」と呼ばれる)は、航空業界に無人航空機を導入することで、ライト兄弟の有...

Go-OpenAI を使用して ChatGPT を簡単に呼び出し、無限の創造性を解き放ちましょう。

今日は、go-openai を使用して chatGPT を呼び出すという興味深いトピックを皆さんと共...

ルート計画、経路探索アルゴリズムの導入とコード実装

経路探索アルゴリズムは、コンピュータグラフィックスや人工知能の分野で一般的に使用されるアルゴリズムの...

...

AI データモデリングはどのようにして気候災害を防ぐことができるのでしょうか?

予測分析モデルが改良されるにつれ、この分野のイノベーターたちは、これまで断片化されていて使用コストが...

...

3万語に及ぶ記事: サーバー開発と設計のためのアルゴリズム集

[[442986]]孫子はこう言った。「行軍と戦闘の最善の方法は戦略を使うこと、次に良いのは敵の同盟...