AIが自動運転データセンターを構築する方法

AIが自動運転データセンターを構築する方法

人工知能 (AI) に関する議論のほとんどは、自動運転車、チャットボット、デジタルツイン、ロボット工学、そして大規模なデータセットからビジネス上の洞察を抽出するための AI ベースの「スマート」システムの使用に焦点を当てています。しかし、AI と機械学習 (ML) は、将来的には企業のデータセンター内のサーバーラックで重要な役割を果たすようになるでしょう。

[[338065]]

データセンターの効率を向上し、ビジネスを拡大する AI の可能性は、主に 4 つのカテゴリに分けられます。

  • 電力管理: AI ベースの電力管理は、暖房および冷房システムの最適化に役立ち、電気コストの削減、スタッフ数の削減、効率の向上につながります。この分野の代表的なサプライヤーとしては、シュナイダーエレクトリック、シーメンス、バーティヴ、イートンなどが挙げられます。
  • 機器管理: AI システムは、サーバー、ストレージ、ネットワーク機器の状態を監視し、システムが正しく構成されていることを確認し、機器が故障する時期を予測できます。 Gartner によると、AIOps IT インフラストラクチャ管理 (ITIM) カテゴリのベンダーには、OpsRamp、Datadog、Virtana、ScienceLogic、Zenoss などがあります。
  • ワークロード管理: AI システムは、データセンター内とハイブリッド クラウド環境の両方で、オンプレミス、クラウド、エッジ環境間の最も効率的なインフラストラクチャにワークロードをリアルタイムで自動的に移動できます。 Redwood、Tidal Automation、Ignio など、AI ベースのワークロード最適化を提供する小規模企業の数が増えています。 Cisco、IBM、VMware などの大手企業も製品を持っています。
  • • セキュリティ: AI ツールは、通常のネットワーク トラフィックの様子を「見て」、異常を検出し、セキュリティ担当者の注意を必要とするアラートを優先順位付けし、何が問題だったのかの事後分析を支援し、企業のセキュリティ防御のギャップを埋めるための推奨事項を提供できます。この機能を提供するベンダーには、VectraAI、Darktrace、ExtraHop、Cisco などがあります。

要約すると、AI は、企業が人間の介入をほとんど必要とせず、高い効率性と回復力で運用できる、高度に自動化され、安全な自己修復型データ センターを構築するのに役立ちます。

「AI 自動化は、人間のデータ解釈能力を超えるレベルにまで拡張でき、エネルギー使用の最適化、ワークロードの分散、効率の最大化に必要な洞察を収集して、データセンターの資産利用率を高めることができます」と、デル テクノロジーズのグローバル CTO オフィスの著名なエンジニアである Tabet 氏は説明します。

もちろん、自動運転車が実現するのと同じように、自動運転データセンターもまだ実現していません。データ センターには、AI の進歩を妨げる重大な技術的、運用的、および人員配置上の障壁が存在します。現在、テクノロジーの導入は始まったばかりですが、潜在的なメリットを求めて、企業は行動を起こす機会を探し続けるでしょう。

[[338066]]

電源管理はサーバーのワークロード管理を活用する

データセンターは世界の電力供給の3%を消費し、温室効果ガスの約2%を排出していると推定されており、コスト削減のためであれ環境保護のためであれ、多くの企業がデータセンターの電力管理を真剣に研究しています。

451リサーチのシニアアナリスト、ダニエル・ビゾ氏は、AIベースのシステムは、高密度キャビネットによる空気の流れの妨げによる冷気供給不足、HVACユニットの性能不足、ホットアイルとコールドアイル間の気密不足など、データセンター運営者が現在または潜在的な冷却の問題を理解するのに役立つと述べた。

AIは「単なる優れた施設設計を超えたメリット」をもたらすとビゾ氏は語った。データセンター レベルでは、AI システムは「HVAC システム データと環境センサーの読み取り値を相関させることで、機器について学習できます。」

「電力管理は、簡単にできるものでした」と、IT コンサルティングおよびアドバイザリー会社 StorageIO の創設者である Greg Schulz 氏は付け加えた。「今日、電力管理は生産性、BTU あたりの作業量の増加、エネルギー 1 ワットあたりの作業量の増加に関するものであり、これはよりスマートに作業し、デバイスをよりスマートに動作させることを意味します。」 ”

キャパシティプランニングの観点もあります。 AI システムは、ホットスポットとコールドスポットを見つけるだけでなく、データセンターが適切な数の物理サーバーに電力を供給していること、また、一時的な需要の急増が発生した場合に新しいサーバーを起動 (およびシャットダウン) する能力があることを確認できます。

シュルツ氏は、電力管理ツールはデバイスとワークロードを管理するシステムへのフックを開発していると付け加えた。たとえば、サーバーが過熱していることをセンサーが検出した場合、システムは、ミッションクリティカルなアプリケーションに影響を及ぼす可能性のあるダウンタイムを回避するために、ワークロードをあまり使用されていないサーバーに迅速かつ自動的に移行する場合があります。システムは、サーバーが過熱している理由を調査できます。ファンが故障している (HVAC の問題)、物理コンポーネントが故障しそうになっている (機器の問題)、またはサーバーが単に過負荷になっている (ワークロードの問題) などの理由が考えられます。

AIによるヘルスモニタリング、構成管理監視

データセンターには、定期的なメンテナンスが必要な物理的な機器が多数設置されています。 AI システムは、スケジュールされたメンテナンスを超えて、テレメトリ データを収集および分析し、すぐに対応が必要な特定の領域を特定するのに役立ちます。 「AIツールはこうしたデータをすべて嗅ぎ分け、パターンや異常を見つけることができる」とシュルツ氏は言う。

「ヘルスモニタリングは、機器が正しく構成され、期待どおりに動作しているかどうかを確認することから始まります」とビゾ氏は付け加えた。数百、数千の IT キャビネットと数万のコンポーネントがある場合、こうした日常的なタスクは労働集約的になる可能性があり、そのため必ずしもタイムリーかつ徹底的に実行されるとは限りません。 ”

同氏は、大規模なセンサーデータログに基づく予測的な機器故障モデルは、「差し迫ったコンポーネントまたは機器の故障を見つけ、サービスの中断につながる可能性のある容量損失を回避するために即時のメンテナンスが必要かどうかを評価できる」と指摘した。

ジュニパーネットワークスのエンタープライズおよびクラウドマーケティング担当副社長、マイケル・ブッソン氏は、エンタープライズデータセンターの運営者は人工知能に関する過剰な宣伝を無視し、同氏が「退屈なイノベーション」と呼ぶものに重点を置くべきだと考えている。

確かに、AI システムは将来、「何が問題なのかを教えてくれ、それを解決してくれる」ようになるかもしれないが、現時点では多くのデータセンター運営者は「何か問題が起きたら、どこを調べればいいのか教えてくれ」という対応で満足するだろうとブション氏は言う。

依存関係マッピングも、AI が役立つ重要な領域ですが、特に興味深いものではありません。データ センターの管理者がファイアウォールやその他のデバイスのポリシーを変更する場合、どのような予期しない結果が生じる可能性がありますか? 「変更を提案する場合、影響範囲内に何があるのか​​を知っておくと便利です。」

機器をスムーズかつ安全に稼働させるためのもう 1 つの重要な側面は、いわゆる構成ドリフトを制御することです。構成ドリフトとは、問題を引き起こす可能性のある時間の経過に伴う一時的な構成変更を指すデータ センター用語です。 AIは、構成ベースのデータセンターの差し迫った問題を特定するための「追加の安全性チェック」として機能することができるとブション氏は述べた。

人工知能とセキュリティ

Bizo は、AI と機械学習によって「イベントを迅速に分類およびクラスタリングし、重要なイベントを識別してノイズから分離することで、インシデント処理 (インシデント対応) を効率化できる」と考えています。「根本原因の分析が迅速化することで、オペレーターは情報に基づいた意思決定を行い、行動を起こすことができます。」

シュルツ氏は、AIはリアルタイムの侵入検知に特に役立つと付け加えた。 AI ベースのシステムは脅威を検出し、ブロックし、隔離することができ、その後、遡ってフォレンジック調査を実施し、何が起こったのか、ハッカーがどのような脆弱性を悪用できたのかを正確に判断することができます。

セキュリティ オペレーション センター (SOC) で働くセキュリティ専門家は、アラートに圧倒されることがよくありますが、AI ベースのシステムでは、大量のテレメトリ データとログ情報をスキャンして日常的なタスクをクリアできるため、セキュリティ専門家はより詳細な調査に取り組めるようになります。

AIベースのワークロード最適化

アプリケーション層では、AI はオンプレミスでもクラウドでも、ワークロードを適切な着陸ポイントに自動的に移動させる可能性があります。 「将来の AI/ML は、パフォーマンス、コスト、ガバナンス、セキュリティ、リスク、持続可能性に関するさまざまな仕様に基づいて、ワークロードをどこに配置するかをリアルタイムで決定する必要があります。

たとえば、サーバーが最高の効率、つまり 70 ~ 80% の使用率で稼働していることを保証しながら、ワークロードを最も電力効率の高いサーバーに自動的に移動できます。 Bizo 氏は、AI システムはパフォーマンス データを方程式に組み込むことができるため、時間に敏感なアプリケーションは効率的なサーバー上で実行され、すぐに実行する必要のないアプリケーションが過剰な量のエネルギーを消費しないようにすることができると述べました。

AI ベースのワークロード最適化は MIT の研究者の注目を集め、同研究者らは昨年、数千台のサーバーにわたるデータ処理操作のスケジュール方法を自動的に学習できる AI システムを開発したと発表しました。

しかし、ブション氏が指摘するように、現実には、今日のワークロード最適化は、平均的なエ​​ンタープライズ データ センターではなく、Amazon、Google、Azure などのハイパースケール企業の領域です。理由はたくさんあります。

AI導入の課題

データセンターの最適化と自動化は、進行中のデジタル変革イニシアチブの不可欠な部分です。デルのタベット氏は、「COVID-19により、多くの企業がさらなる自動化を目指しており、AI主導の自己修復型『デジタルデータセンター』というアイデアを推進している」と付け加えた。

Googleは2018年に、自社のハイパースケールデータセンター数か所の冷却システムの制御をAIプログラムに委託したと発表し、AIアルゴリズムによる推奨によりエネルギー使用量が40%削減されたと報告した。

しかし、ビゾ氏は、データセンターでAIを使うことは、Google以外の企業にとっては「主に願望」だと述べた。一部の AI/ML 機能は、イベント処理、インフラストラクチャの健全性、冷却の最適化で利用できます。ただし、AI/ML モデルが現在の標準的なデータセンター インフラストラクチャ管理 (DCIM) よりも大きな進歩を遂げるには、さらに何年もかかるでしょう。自動運転車の開発と同様に、初期段階は興味深いかもしれませんが、最終的に約束される画期的な経済的/ビジネスケースからは程遠いものです。 ”

Tabet 氏は、障壁の一部は「システムを管理するために適切な人材を雇用または訓練する必要があること」だと考えています。「注意が必要なもう 1 つの問題は、データ標準とそれに関連するアーキテクチャの必要性です。」

ガートナーは次のように説明しています。「AIOps プラットフォームの成熟度、IT スキル、運用の成熟度が主な阻害要因です。」高度な導入が直面しているその他の新たな課題としては、データ品質と「IT インフラストラクチャおよび運用チームにおける」データ サイエンス スキルの不足が挙げられます。

ブション氏は、最大の障害は常に人であったと付け加えた。同氏は、社外からデータサイエンティストを雇用することは多くの企業にとって課題であり、既存の従業員のトレーニングもハードルになっていると指摘した。

さらに、従業員がテクノロジーに抵抗してきた長い歴史があるとブション氏は言う。同氏は、ソフトウェア定義ネットワーク (SDN) が登場してから 10 年が経つが、IT 運用の 4 分の 3 以上が依然として CLI によって行われていると指摘しました。

「さまざまなインフラの運営者がAIに制御権を譲る用意があると信じなければならない」とブション氏は語った。 「航空管制官の判断を信頼していない人たちに、このような重大な変化を起こせるよう、どうやって訓練し、教育し、安心させればいいのでしょうか。この業界の一般的な考え方は、これをやったら職を失う、というものです。」

そのため、ブッション氏は、AI に関しては、新しいテクノロジーによくある誇大広告に惑わされるのではなく、小さくて退屈なステップを踏むように企業にアドバイスしています。

<<:  限られたデータでモデルのパフォーマンスを最大化するにはどうすればよいですか? Baidu のエンジニアがデータ拡張サービスを構築

>>:  株式取引における人工知能の応用

ブログ    
ブログ    

推薦する

ロボットの魚は本物の魚よりも速く泳ぎます!人間の心筋細胞から作られた紙の魚は108日間自律的に泳ぐことができる

米国のハーバード大学とエモリー大学の研究者らが協力し、ヒト幹細胞から抽出した心筋細胞を使った「人工魚...

ニューラルスタイル転送アルゴリズムで絵を描くことを学習する人間は、芸術分野で人工知能に負けるのでしょうか?

人工知能はますます多用途になり、すでに私たちの仕事のすべてを人工知能が引き継ぐことができるようです。...

60歳以上のインターネット利用者は音声検索やAI学習ツールを活用し、急速に増加している

高齢者間の「情報格差」解消を求める声は衰えず、高齢者はインターネットへのアクセスに対する新たな要求に...

セキュリティ業界の大手企業はどのようにドローンを配備するのでしょうか?

ドローンは警報装置、検出器、カメラなどを搭載し、多くの機能を実現でき、セキュリティ監視、スマートビル...

...

...

AIは小売市場の衰退を防ぐことができるか?

デジタル時代の到来により、私たちの生活は急速に変化しました。買い物の仕方も、近所のショッピングモール...

米メディア記事:米中AI競争は東南アジアにとって何を意味するのか?

2月7日、アメリカの外交政策ウェブサイトは「米中人工知能競争は東南アジアにとって何を意味するのか?...

アルゴリズムの旅について話しましょう:スタック

[[379190]]スタックの本質は、特殊なデータ構造です。その特殊な構造は、データのエントリと終了...

ガートナー:2025年までにデータセンターの半数がAI対応ロボットを導入

ガートナーは11月11日、2025年までにデータセンターの半数が人工知能と機械学習機能を備えた高度な...

魔法は魔法に勝る、AIデータにはAIソリューションが必要

Kompprise が委託した「非構造化データ管理の現状」調査によると、人工知能は IT およびビジ...

ディープラーニングモデルを本番環境に簡単に導入

[51CTO.com クイック翻訳] データから学習し、パターンを識別し、人間の介入を最小限に抑えて...

...

...