AIがデータセンターのワークロード管理の課題を解決

AIがデータセンターのワークロード管理の課題を解決

データセンターのワークロードが急増するにつれ、効率性の向上と経費削減を図りながら IT チームの管理負担を軽減できるテクノロジーとして、人工知能 (AI) を導入する企業が増えています。

AI は、データセンター内と、オンプレミス、クラウド、エッジ環境で構成されるハイブリッド クラウド設定の両方で、ワークロードをリアルタイムで最も効率的なインフラストラクチャに自動的に移動することを約束します。 AI によってワークロード管理が変革されるにつれ、将来のデータ センターは現在の施設とは大きく異なるものになる可能性があります。考えられるシナリオの 1 つは、リモート管理者によって管理される、相互接続された小規模のエッジ データ センターの集合です。

[[407031]]

ビジネスおよびテクノロジーのトレンド分析組織であるインフォシス・ナレッジ・インスティテュートの責任者ジェフ・カバノー氏は、競争の激化、インフレ、大規模な予算削減などさまざまな要因により、多くの組織がデータセンターの運用コストを削減する方法を模索していると語った。 「AIと自動化は、従業員を時間のかかる単調な作業から解放し、実際に人間が行う必要がある作業に集中できるようにすることで、作業負荷管理の強力なツールであることが証明されています」と彼は述べた。

ほとんどのデータ センター管理者は、ワークロード管理を支援および最適化するために、さまざまな従来の非 AI ツールを使用してすでにいます。しかし、これらのツールは、事前対応型というよりは事後対応型になる傾向があると、専門サービス会社KPMGのコンサルティングディレクター、ショーン・ケニー氏は述べた。 「彼らはデータセンターの問題には対応しているが、問題のある行動を減らすための先見の明を判断するためのデータを収集していない」と彼は指摘した。

イリノイ大学シカゴ校の生物医学および健康情報科学の臨床助教授であるサンケット・シャー氏は、将来のニーズを予測したり計画したりするための信頼できる方法がないデータセンター管理者を AI が支援する態勢が整っていると考えています。 「AI を使用すると、機能と処理能力をより効率的に割り当てることができるため、組織は規模を拡大し、より機敏に行動できるようになります」と、同氏は説明します。「データのニーズが急速に変化する [マネージャー] にとって、特定のプロセスを自動化し、必要に応じて権限を移行することは、最終的にコストの削減につながります。」

データセンターの管理に人工知能技術を使用するという考えは新しいものではありません。例えば、Google は 2014 年に、英国の人工知能専門企業 DeepMind の買収で得た技術を活用して、自社の複数の拠点のデータセンター設備と機器管理を強化していることを明らかにしました。現在、AI ワークロード管理の分野は大きく拡大し、DLabs、Digitate、Redwood Software、Tidal Software などの多くのスタートアップ企業が参入しています。 Cisco、IBM、VMware などの大企業も市場に参入し始めています。

AI のほとんどのものと同様に、ワークロード管理テクノロジーも急速に進化しています。 「選択肢や制限はたくさんありますが、通常、それらの制限を緩和する方法はあります」と、ワシントン大学情報学部の准教授であるビル・ハウ氏は指摘します。「適切なアプローチとエンジニアリングソリューションを選択することに問題はないと思います。ワークロード管理は、他の複雑な AI アプリケーションと比べてもそれほど難しくも、それほど難しくもありません。」

ニーズを満たす

ほとんどのデータセンター管理者にとって、ピーク需要を満たすために運用を最適化することが最優先事項です。しかし、どれだけ慎重に計画し準備しても、需要の山と谷は制御できないことがよくあります。 「AIがもたらす独自の改善点は、ワークロードのパターンを理解し、その需要をデータセンターの容量と一致させる能力です」と、ビジネスコンサルティングおよびアドバイザリー会社、キャップジェミニ・ノースアメリカのAIエンジニアリング担当副社長、ガウタンベリアッパ氏は語る。

AI 管理により、データ センター チームは、サーバー管理、セキュリティ設定、コンピューティング、メモリ、ストレージの最適化、負荷分散、電力と冷却の割り当てなど、多くの日常的な反復タスクから解放されます。 「これらの仕事はすべてAIによって自動化、あるいは強化できる」と技術市場コンサルタント会社ABIリサーチの主任アナリスト、リアン・ジェイ・スー氏は語った。

IT管​​理ソフトウェア開発会社ManageEngineのAIおよび機械学習製品担当ディレクター、ランプラカシュ・ラマムーシー氏は、AIは個々のマシンから収集されたデータを分析し、監視対象パラメータの異常を見つけるのに役立つと述べた。 「AI は障害や停止を早期に予測するのにも役立ち、データセンター管理チームがダウンタイムを削減し、クラスターを良好な動作状態に保つのに役立ちます」と同氏は付け加えました。「AI は温度と電圧の管理も改善し、運用コストを直接削減し、二酸化炭素排出量の削減にも役立ちます。」

さまざまな AI アプローチを使用できる一方で、ワークロード管理ツールは常にモデルの予測が完全に説明可能であることを保証する必要がある、とラマムーシー氏は述べた。 「データセンターのワークロード管理における AI システムによる決定は、他の分野よりも、1 つ以上のチームによって共同で行われることが多い」と同氏は説明します。したがって、AI モデルの決定は説明可能でなければならず、IT チームがモデルの決定の意図をよりよく理解し、それに応じて行動できるようにする必要があります。 「AIモデルの精度は最高でも80~85パーセントなので、AIモデルの決定を正しく解釈することで、人間のチームが情報に基づいた決定を下すのにも役立ちます」と氏は指摘。AIモデルが下した決定に信頼スコアを与えることができれば、効果的なワークロード管理にも役立つだろう。

AIと機械学習ツールが普及するにつれ、人間の知性がこれらの技術と競合するのではなく、協力することで最良の結果が得られることに組織は気づき始めていると、AIと機械学習の開発企業であるTanjoの共同創設者兼CEOのリチャード・ボイド氏は述べた。 「機械は多くの分野で人間に取って代わることはできませんが、機械が人間よりはるかに優れている分野は確かにあります」と彼は語った。「AIと機械学習が普及し、労働者がこの新しいパートナーシップに適応すれば、認識は変わるでしょう。」

Dell Technologies の AI 戦略ディレクターのブロンズ・ラーソン氏は、データセンターは AI/ML を使用してパフォーマンスを向上させ、構成と展開を最適化できると述べています。 「AI/MLにより、リソースとワークロードの動的なオーケストレーションが可能になり、リソースの使用率を最適化し、コストをより適切に管理できるようになります」と彼は述べています。ラーソン氏は、アプリケーションやベンダーに関係なく、すべての AI ソリューションには、適切に構成して価値を最適化するための専門知識が必要であると付け加えました。 「それは、トレーニングとテストのためのデータを適切にキャプチャして評価し、展開されたモデルを管理してドリフトとバイアスを防ぐことから始まります。」

さらに、ルールベースの AI は、インテリジェントなポリシー制御と事前定義された構成を通じて、リソースの最適化とコンプライアンスの自動化に役立ちます。 「機械学習ベースの AI は、日常業務から収集されたデータを通じて、これまでは深い専門知識を必要としていたデータセンター業務の他の側面をさらに強化することができます」と Su 氏は指摘します。「たとえば、自己学習型の脅威検出および監視アルゴリズムによって、データセンターのセキュリティを強化できます」と同氏は述べます。「必要なリソースを適切な方向に向けることで、負荷分散、電力、冷却割り当て機能を最適化できます。」

AI はデータ管理を簡素化することもできます。 「組織は、主要な利害関係者に関する膨大なデータに囲まれていることにますます気付くようになっています」とカバノー氏は言います。「AI を使用することで、組織はこれらの大量のデータを効率的かつ正確に管理できます。AI の助けを借りて、チームはデータ品質分析や予測のためのデータ抽出などのタスクを、これまでよりも迅速かつ正確に実行できます。」 「情報に基づいた意思決定を行うには最も正確なデータが必要なので、これは組織にとって極めて重要です」とカバノー氏は述べた。

人工知能パッケージ

AI が成熟するにつれて、人間の介入を最小限に抑えながらさまざまな要素を統合するソフトウェア主導のアプローチが登場しています。たとえば、Howe 氏は、一般的なデータベース システムでは、テーブルのインデックス作成、サーバー間でのデータのパーティション分割、特定の種類のクエリに対するメモリの割り当て、コンピューティング プラットフォームと予想されるワークロードに「適合」するようにオプティマイザを調整するなど、操作を効率的に実行するために多くの構成が必要であると指摘しました。 「AI は、私たちがすべてを理解しようとするのではなく、大量の履歴データから、どのスケジュールがどのタスクに適しているかというルールと手順を学ぶのに役立ちます」と彼は説明した。

AI を導入することで、人間の IT リーダーやチームは、インフラストラクチャの細部を気にすることなく、ビジネス上の問題に集中できるようになります。 「AIの観点から見ると、私たちが使用するモデルのほとんどは、さまざまな技術を組み合わせ、管理するワークロードのパターンを学習しながら継続的に最適化する自己学習アンサンブルモデルです」とベリアッパ氏は語った。

計画と展開

AI が管理の魔法を働かせる前に、IT 部門とビジネス部門のリーダーは、主要な管理責任をソフトウェアに委ねることに慣れる必要があります。 「規模や社内の知識ベースによっては、これはかなり難しい場合があります」とシャー氏は認めた。

最終的に、組織が人間による負荷管理から手動による負荷管理への移行をどのように処理するかは、そのテクノロジの成熟度、運用規模、およびデータ センターの動向によって決まります。 「データを効果的に活用するための最新のインフラストラクチャを持たないサイロ化された企業は苦戦するだろう」とカバノー氏は述べた。一方、特定の種類のビジネスに合わせたツールを提供する AI ベンダーが増えており、ほぼあらゆる種類と規模の組織がスムーズに移行できる可能性が高まっている。 「企業とそのソリューションが成熟するにつれて、構成と展開の容易さは向上し続けるだろう」と彼は予測する。

AI にアキレス腱があるとすれば、それはデータセンターのシステムや実践における比較的微妙な変化に対するテクノロジーの反応です。 「ほとんどの AI 技術は、環境が固定されているという前提で、安定したパターンを見つけることです」とハウ氏は説明する。「モデルが認識できない方法で環境を変更すると、モデルは間違った答えを喜んで伝えることになります。」変更を展開する前に慎重に計画を立てることで、この懸念を軽減することができます。

近日公開

AI を活用したデータ センターのワークロード管理は、Google、Amazon、Microsoft などのハイパースケーラーを中心に、すでに多くの大企業で定期的に使用されていますが、このテクノロジーが小規模なデータ センター運営者に浸透し始めたのは最近のことです。 Belliappa 氏は、データ センター管理者は近いうちに難しい選択に直面するだろうと考えています。それは、従来のデータ センター管理技術と実践に引き続き依存するか、それとも「存続するために AI 主導の変革に多額の投資を行うか」です。

長期的には、テクノロジーが向上し、コストが下がり、導入者の信頼が高まるにつれて、AI 主導の管理が主流になると予想されます。 「今後 4 ~ 6 年で、AI データセンター ワークロード管理テクノロジーが標準的なオプションとして登場するでしょう」と Shah 氏は予測しています。

「この傾向は急速に進んでいると思う」とハウ氏は語った。 「データセンターでは長い間、自動化が進められてきましたが、こうした(AI)テクノロジーは、プロバイダーが保有する膨大な量のデータを活用するためのより優れた方法を提供します」と彼は述べ、AI学習手法を使用した自動化されたワークロード管理が「すぐに一般的になる」と予想している。

業界観測筋は、AIが今後3~4年以内にデータセンター管理を支配し始めると予想する声が高まっているとカバノー氏は述べたが、パンデミックによる加速がそのタイムラインを早める可能性がある。 「近い将来、データセンターはネットワークセキュリティからメンテナンス、監視まで、ほぼすべての操作を自動化できるようになるだろう」と彼は予測した。 「しかし、データ量が飛躍的に増加し続け、ビジネスにおける AI の新たな用途が発見されるにつれて、ワークロードとその管理は進化し続けるでしょう。」

<<:  中国の博士が127ページの論文「自然言語処理におけるグラフニューラルネットワークの初心者からマスターまで」を発表

>>:  バイオメディカルホログラフィックイメージング用の RNN が 50 倍高速化

ブログ    

推薦する

...

製造業における機械学習

機械学習と人工知能:違いは何ですか?機械学習は人工知能のサブフィールドですが、すべての人工知能技術が...

MIT: この AI ソックスはあなたの行動を明らかにします | Nature サブジャーナル

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Fooocus: シンプルで強力な安定した拡散 WebUI

Stable Diffusion は強力な画像生成 AI モデルですが、通常は多くのチューニングと...

スタンフォード大学がトランスフォーマー代替モデルを訓練:1億7000万のパラメータ、バイアスを除去可能、制御可能、解釈可能

GPT に代表される大規模言語モデルは、これまでも、そしてこれからも、並外れた成果を達成し続けますが...

IBMは「キーポイント分析」技術でProject Debaterの機能をさらに向上

[51CTO.com 速訳] IBMは、人工知能技術を使って人々の意見を要約することを目指すProj...

VRの悪夢にさよならしましょう! Meta Reality Labs は仮想世界の問題点を解決し、新しい VR の世界を再構築します

「世の中には2種類の人がいます。VRが世界を変えると考える人と、まだVRを試したことがない人です。」...

機械学習はとても興味深い:音声認識にディープラーニングを使用する方法

[[203766]]音声認識は私たちの生活に「侵入」しています。携帯電話、ゲーム機、スマートウォッチ...

「中国の新世代人工知能開発報告書2020」:中国はよりオープンな姿勢で人工知能の発展を推進

「中国の新世代人工知能開発報告書2020」(中国語版と英語版)が本日、浦江イノベーションフォーラムで...

...

「2018年中国人工知能サミット」が9月6日に南京で開催される。

人工知能は未来をリードする戦略的技術として、世界の産業構造、経済活動、都市形態、そして人間のライフス...

...

マスク氏が「アイアンマン」のようなロボットを発売!テスラが世界最速のAIコンピューターを発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AI革命はネットゼロデータセンターに終止符を打つのでしょうか?

これらの施設は重要であるにもかかわらず、あまり理解されていません。しかし、最近ではデータセンターに注...

顔認識を使用してアバターにマスクとゴーグルを自動的に追加する方法

アバターにマスクとゴーグルを追加するプロジェクトアドレス: https://github.com/E...