AI搭載ストレージは企業がデータからより多くの価値を引き出すのに役立ちます

AI搭載ストレージは企業がデータからより多くの価値を引き出すのに役立ちます

ストレージを、手作業で手間がかかる必需品ではなく、自動運転車として考えることができたらどうでしょうか。自動運転車のように、ストレージ インフラストラクチャも必要なものを予測し、道路上の障害物を回避できるとしたらどうでしょうか。

新しいテクノロジーに対する許容度と会社の文化によっては、アプリケーションの動作から学習し、アプリケーションと構成の異常を識別し、その情報を使用して問題を予測して防止するテクノロジーをすでに活用している可能性があります。

[[347751]]

これらのコアテクノロジーを支えるのは人工知能です。実際、AI は特異な状況にあり、専門家によれば、この状況がすぐに変わる可能性は低いとのことです。最近のマッキンゼーの調査によると、現在、企業のほぼ半数が何らかの形で AI を使用していますが、大多数の企業は今後も AI への投資が引き続き増加すると予想しています。

人工知能も、今日のストレージのニーズを満たす上で急速に重要になってきています。これにより、大量のデータを迅速かつインテリジェントに分析できるようになり、ボトルネック、可用性の問題、セキュリティの問題を回避するのに役立ちます。 AI を活用したスト​​レージにより、IT スタッフは問題の解決に費やす時間を短縮し、インフラストラクチャの可用性と生産性を向上させることができます。

HPE ストレージの製品マーケティング ディレクターである David Wang 氏は、同社の目標は、ほぼ瞬時に洞察を提供できる自動化された AI 駆動型のインフラストラクチャを構築することだと述べています。

「私たちは、洞察が即時かつ目に見える変化をもたらすところまで到達したいのです」と彼は語った。 「ローカルエッジからクラウドに至るまで、エンドツーエンドの AI パイプラインが必要であるという見方があります。」

問題を別の視点から見る

IBMのストレージマーケティング担当ディレクター、ダグ・オフラハティ氏は、「AIはストレージの使命を変えるため、企業もストレージとデータを違った視点で見る必要がある」と述べた。

「ストレージをデータベースや特定のユースケースに必要なものとして考えるのをやめ、さまざまな部門からさまざまな方法でデータにアクセスする方法について考える必要があります」と彼は言いました。 「データ サイエンティストや組織内のさまざまな機能を担当する他のユーザーがそのデータにアクセスできるようになれば、ストレージを真に変革するために不可欠な、次のレベルのデータ分析を実現できます。」

より広い視点で考えることに加えて、従来のデータ中心のアプローチではなく、よりアプリケーション中心のアプローチでストレージに取り組むことが重要です。

「ビッグデータAIの世界のバージョン1.0では、企業はデータによって動かされる必要があると信じていました。そのため、すべてのデータをリポジトリに保存し、グループ内のすべてのAI担当者に焦点を当てていました」と、分散型NoSQLデータベーステクノロジーを専門とする企業Splice MachineのCEO、モンテ・ズウェベン氏は説明します。

その結果、これらのデータ レイクはすぐに「データ スワンプ」に変わってしまうことが多く、その主な原因は、ビジネス プロセスの責任者が、そのビジネス プロセスで使用されるデータとアプリケーションを考慮していないことです。

データではなくアプリケーションに重点を置くことで、ストレージとその機能をビジネスに適合させることができます。たとえば、大量の請求 (ビジネス プロセス) を処理する保険会社は、請求システムを担当する請求スペシャリストやアプリケーション開発者と協力してアプリケーションを特定します。これらを統合することで、データをどのように使用してスマートな請求処理システムを構築するかをより適切に決定できるようになります。

「これは、世界中のすべてのデータを収集し、それを請求に関心がある可能性のある人々に提供しようとするのではなく、アプリケーションがよりインテリジェントにデータを処理できるようにすることです」と彼は言いました。 「これは単純なアイデアだが、企業が AI を実装する方法に大きな影響を与える可能性があります。」

成功する AI ベースのストレージ インフラストラクチャを構築するには、AI ストレージ パイプラインの 3 つの異なるフェーズ、つまりデータ取り込み (さまざまな環境からデータを取り込んで正規化し、全体として確認できるようにする)、トレーニング (機械学習を使用してデータを研究し、実際のデータの内容を理解する)、推論 (洞察を提供するフェーズ) に対処することも意味します。

これらの要件を満たすには、ストレージ インフラストラクチャが非常に大きな容量、長期のデータ保持、および高性能な処理をサポートできる必要があります。つまり、大規模な AI には、大規模な機能、保持、パフォーマンスも必要です。

ストレージ・スイス社の主席アナリスト、ジョージ・クランプ氏は、大容量のストレージをサポートする能力が重要であると述べた。同氏によると、データ取得の初期コストが高いため、組織が AI ワークロードのトレーニングに使用したデータ ポイントを削除することはほとんどないという。さらに、これらのデータセットは、アクセスが経年とともに減少するという一般的なデータ アクセス モデルに従っていません。 「AIワークロードが古いトレーニングデータを再処理する必要がある可能性はほぼ100%なので、データセット全体を常にすぐに利用できるようにしておく必要があります」と彼は付け加えた。

特にストレージ容量が増加し続けるにつれて、長期保存も同様に重要になります。

「私たちが言いたいのは、機械は入力されたデータに基づいて判断を下すようになるということだ。つまり、データは削除できない。データは増え続けるだろう」とオフラハティ氏は語った。 「データが増えれば増えるほど、AIをより正確かつ効率的に適用できるようになります。」

単にデータ量を増やすだけでなく、より多くの種類のデータを保存する必要があります。これには、データに関するデータ (メタデータ) が含まれます。メタデータは、特にデータ ガバナンスに関しては、最も価値のある商品の 1 つになりつつあると多くの人が考えています。

3 番目の要件は、高性能な処理です。

「AIアプリケーションのトレーニングは反復的なプロセスであり、精度を向上させるには、何度もトレーニングし、AIアルゴリズムを微調整し、そして再びトレーニングするというプロセスが必要になる」とクランプ氏は述べた。 「反復が速くなればなるほど、開発者はより正確なモデルを作成できるようになり、ストレージ インフラストラクチャにかかる負荷が増大します。」

ほとんどの AI ワークロードで重要なのは、これらの環境内の標準グラフィック プロセッシング ユニット (GPU) を可能な限りビジー状態に維持することだとクランプ氏は言います。 AIのワークロードによっては、多数のノードとフラッシュとハードディスクの混在を備えたスケールアウト型ストレージシステムが合理的になる可能性があるとクランプ氏は述べた。 「AI ワークロードは非常に並列化される傾向があり、並列のスケールアウト ストレージ クラスターはハード ディスク ドライブ上でも困難な場合があります」と彼は述べています。

人工知能を活用する

事業を始めたばかりの企業の場合、既存のデータをシステムから抽出し、選択したデータ セットに AI 手法を適用して相関関係を見つけるだけで、簡単にデータを拡張できます。しかし、最終的には、もう少し深く掘り下げたいと思うようになるでしょう。重要なアプリケーションとシステムが結び付けられると、AI の真のメリットを享受するには、新しいインフラストラクチャとデータ処理の新しい方法を導入する必要があるかもしれません。

選択する AI ベースのストレージ システムには、メタデータを迅速に管理し、適切なデータ タイプを適切なストレージ タイプに保存できるインテリジェンスが備わっている必要があります。インフラストラクチャをオンプレミスで実行することを選択した場合、オールフラッシュ ストレージ システムから始めることもできますが、最終的にはフラッシュとハード ディスクのハイブリッド環境に移行することも理にかなっているとクランプ氏は述べています。通常、環境には、環境間でのデータの移動を自動化するソフトウェア定義ストレージも含まれます。

一部の組織(特に機密性の高いワークロードやコンプライアンス/データ ガバナンスの問題がある組織)では、すべてをオンプレミスで維持することを好む一方、クラウドベースの AI/ストレージ環境のメリットを享受できる組織もあります。

「クラウドコンピューティングではコンピューティング能力とデータの共有が必要なため、こうしたことの多くはクラウドで起きている」と、HPEのNimble Storage製品管理担当シニアディレクター、ロクナ・ダンド氏は語った。 「AI モデルから得られる結果の品質は、そのモデルをトレーニングするために利用できるデータの多様性と量に依存するため、クラウドからグローバル データを収集するシステムを使用するのが理にかなっています。」

一方、ダンド氏は、HPE は HPE Insight がクラウドで提供しているのと同じタイプのグローバル データ分析を顧客のオンプレミス環境に導入する方法を検討していると述べました。彼女の目標は、クラウドで学んだ教訓をコードに体系化し、それをファイアウォールの背後のローカルアップデートとして適用することだ。

ダンド氏は、時間の経過とともにテクノロジーが進化し、インフラストラクチャ管理は最終的に完全に自動化されると考えています。 「現在よりも多くの問題を予測し、予防できるようになり、それらの予測と予防に対する自信も高まるでしょう」と彼女は語った。 「問題を予測して解決方法を特定できるだけでなく、適切な解決策を特定して行動を起こすこともできるようになります。」

<<:  機械は人間に取って代わるでしょうか?人工知能技術の倫理的リスクを解明する

>>:  FacebookはVRキーボードを使ってデータを入力する方法を開発中

推薦する

機械学習と人工知能の未来について語る

[[258702]] [51CTO.com クイック翻訳] 機械学習 (ML) と人工知能 (AI)...

...

信頼できる AI はどのように発展すべきでしょうか?

現在、人工知能の応用範囲と深さは絶えず拡大しており、情報インフラの重要な部分になりつつあります。しか...

清華大学の朱俊氏のチームは、拡散モデルを打ち破り、シュレーディンガー橋に基づく新しい音声合成システムを開発した。

最近、清華大学コンピュータサイエンス学部の朱軍教授の研究グループが発表したシュレーディンガー橋[1]...

...

USTC 統合入力フィルタリング フレームワーク: すべてのデータ モダリティをサポートするフィルタリング可能性の最初の理論的分析

モバイル デバイスの計算能力が向上し、センサー データのリアルタイム分析の需要が高まるにつれて、モバ...

Cloudera China: データと AI は、企業が「反脆弱性」になるのにどのように役立つのでしょうか?

2023年には、個人にとっても企業にとっても「脆弱性」はほぼ普遍的な状態になります。世界経済が大き...

米空軍の最高データ・AI責任者が語るAI運用の主導と戦略的優位性

AI は、米国が戦争を戦い、脅威を監視し、国防を維持する方法を含め、ほぼすべてのことを行う方法を変え...

AIは賢くなり、これらの新しい技術は流行の防止と生産の再開に役立つだろう

新型コロナウイルス肺炎の流行状況の変化に伴い、企業や機関の業務と生産の再開が現在の仕事の新たな焦点と...

人工知能がデジタル変革の課題に対処できる 5 つの分野

[[378652]]調査会社IDCが最近発表した「世界の人工知能支出ガイド」によると、世界の人工知能...

ナンバーワンのディープラーニングフレームワークはどれですか? 2022年、PyTorchとTensorFlowが再び競い合う

PyTorch または TensorFlow を使用していますか?人々のグループによって答えは異なる...

GPT-4 は P≠NP であると結論付け、Terence Tao の予測は実現しました。世界の数学の問題を解く「ソクラテス的推論」対話97ラウンド

大規模言語モデルは実際に数学の定理の研究に使用できます。最近、Microsoft Research ...

...

ビッグデータの時代では、ソフトウェアエンジニアは徐々に減少し、アルゴリズムエンジニアが増加しています。

[[209263]]ビッグデータは人類の歴史のどの時代にも存在していましたが、テクノロジーが一定の...