機械学習を使用してデータセンターの電力を管理するにはどうすればよいでしょうか?

機械学習を使用してデータセンターの電力を管理するにはどうすればよいでしょうか?

[[249391]]

[51CTO.com クイック翻訳] データセンターがますます複雑になっていることは周知の事実です。ハードウェアと管理ソフトウェアの種類が増え、ワークロードがより頻繁に変更され、パブリック クラウドも増えています。エッジ コンピューティングが間近に迫っているため、状況はさらに複雑になるばかりです。

業界関係者の多くは、機械学習によってデータセンター管理者がこの複雑な状況に対処しやすくなることを期待しています。すでにいくつかの企業が機械学習アルゴリズムを使用するデータセンター管理ソフトウェアを販売しています。コンピューターとしてのデータセンター全体の観点から問題に取り組む人もいれば、冷却や電力だけに焦点を当てる人もいます。冷却は、今日の非効率的に運用されているデータ センターで大量のエネルギーが浪費される領域の 1 つですが、インテリジェントなソフトウェア ツールを使用して電気データ センター インフラストラクチャを管理することには大きなメリットがあります。

Virtual Power Systems (VPS) というスタートアップ企業は、機械学習を利用して、データセンターで一般に「孤立電力」と呼ばれるものを排除しています。データセンターでは、必要以上の電力負荷をサポートするように設計された電気システムが採用されるのが一般的です。これは冗長性を確保するために意図的に行われる場合もあれば、設計者がデータセンターが将来どのように使用されるかを予測できないために行われる場合もあります。

VPS の「ソフトウェア定義電源」ソリューションは、バッテリーを内蔵したスマート電気ハードウェア (シュナイダーエレクトリックなどのパートナーの機器を含む) を使用して、データセンター全体でより合理的かつ効率的に電力を再分配します。同社は、需要の変化に応じて電力を動的に再分配できると述べた。

ICE と呼ばれるこのソフトウェアは、機械学習を使用して電力需要 (バッテリー管理や電力スパイクの可能性を含む) を一元的に予測し、データセンターのフロアにあるハードウェアで実行されている推論エンジンに構成パターンを送信します。その後、推論エンジンは実際の需要に基づいて各ラックに利用可能な電力負荷を調整します。

VPS の CTO、Karimulla Shaikh 氏は次のように語っています。「冗長インフラストラクチャがある場合、ラックには 2 本の電力線が接続され、障害が発生した場合に一方から他方に切り替えることができるように負荷を展開します。つまり、各線の最大容量の 50% しか使用しません。当社のスイッチング システムを使用すると、負荷を 100% 使用できます。障害が発生した場合、スイッチング システムはインテリジェントであり、介入してすべての負荷を短時間バッテリーに移動し、その後、当社のソフトウェアを使用してアプリケーションを別の場所に移動するか、ワークロードをオフラインにします。」

ソフトウェアによって構築された機械学習モデルは、サーバーやラックを追加した場合に電力供給がどのように影響を受けるかを理解するためのシミュレーターとしても使用できます。

しかし、これはほんの始まりに過ぎません。シャイク氏は、VPS は一部の顧客と協力して、典型的な冗長データセンター インフラストラクチャ設計を完全に回避しようとしていると述べました。また、公共電力、燃料電池、断続的な再生可能エネルギーなど、データセンターのエネルギー源間の動的な切り替えについても検討します。

Nlyte Software のデータセンター インフラストラクチャ管理 (DCIM) ソフトウェアは、同社の最高戦略責任者 Enzo Greco 氏によって「データセンター向けのリアルタイム ERP (エンタープライズ リソース プランニング)」に例えられています。同社は最近、IBM Watson 機械学習サービスを使用して、予測的な熱および電力管理機能をソリューションに追加しました。 Watson は、センサー、デバイス、アプリケーションのワークロード情報からのデータに基づいてモデルを構築するのに役立ちます。グレコ氏は、多くの場合、すべてのデータを収集するのは簡単なので、それをもっと頻繁に、そして有利に活用してみてはいかがだろうか、と述べています。

多くのデータセンターには、温度センサー、湿度センサー、リアルタイムのサーバー運用データ、電力メーターがすでに設置されています。 「UPS や PDU など、ほぼすべての最新デバイスから簡単にデータを入手できます」と彼は言います。機械学習システムは、さまざまなシステムやエンドポイント間の隠れたパターンやつながりを見つけることができます。

「将来のある時点で、サーバーとラックのレベルで電力異常が発生することを予測できます」とグレコ氏は語った。定常状態では、ラックは 10kW を消費するかもしれないが、ある時点で 15kW に急上昇する可能性がある。 「十分な履歴データがあれば、このラックは今後 1 時間で 15kW の電力を消費すると予測できます。」電力スパイクは、機械的な問題またはアプリケーション ソフトウェアによって発生する可能性があります。 「SAP をバッチモードで実行しているかもしれませんし、トランザクション システムが最高のパフォーマンスで実行されているかもしれません。」

電力スパイクを予測できれば、作業負荷を移動したり、サーバーをシャットダウンしたり、UPS バッテリーの予防保守を実施したりすることで、電力スパイクに備えることができます、と彼は言いました。

Nlyte の顧客のほとんどは、機械学習システムを使用してアラートを受信し、問題となる可能性のあるものを把握しています。このソフトウェア会社は、予測障害および予防保守用のモジュールも開発しています。 「電力と熱は、故障の優れた先行指標です」とグレコ氏は言います。「電力の異常を予測できれば、それはアプリケーション ソフトウェアに問題があるか、機械に問題がある可能性があることを示す先行指標になります。」

機械学習は、人間のオペレーターよりも速く異常を検出するだけでなく、オペレーターがデータセンター内の電気インフラストラクチャの冗長性メカニズムをより明確に理解するのにも役立ちます。 「運用方法の変更などの要因により、データ センターは当初設計されたほど冗長性が高くない場合があります」と、Uptime Institute の研究担当副社長である Rhonda Ascierto 氏は語ります。「重要なのは、データ センターの性質が変化しても、冗長性に関してデータ センターのすべての部分が意図したとおりに動作していることを確認することです。」

機械学習は、データセンターの可用性戦略をリアクティブからプロアクティブに変革することを約束します。 「UPS は受動的です。停電を待って、正常なシステムに切り替えます」と彼は説明します。「アプリケーション ソフトウェアは障害後に回復します。これは受動的です。アクティブになるということは、もう待つ必要がないということです。将来問題が発生したら、今解決します。」

原題: 機械学習が今日のデータセンターの電力管理にどのように利用されているか、著者: Mary Branscombe

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  ブロックチェーン + AI、完璧な組み合わせですね?

>>:  自動運転は道路安全の問題をどのように解決するのでしょうか?

ブログ    
ブログ    

推薦する

2018 年の 15 大テクノロジー トレンド、テクノロジーに関して正しい方向に進んでいますか?

[[216696]]一般的に言えば、未来そのものを予測することは難しいため、技術動向を明確に予測す...

2024年のAI: ビジネスリーダーの対応とチャットボットの改善

Language I/O のプロダクト担当副社長である Chris Jacob が、進化する AI ...

ネットワーク攻撃と防御における人工知能の応用と問題分析

サイバー攻撃と防御の対決は絶えず進化とアップグレードを続けています。人工知能は自己学習と適応能力を備...

Facebookは、数億のノードでタスクを迅速に完了できる大規模なグラフ埋め込みアルゴリズムをオープンソース化しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

数学的能力はChatGPTを超え、700億のオープンソース大規模モデルが人気:AIを使用してAIを微調整、Microsoftの中国人チームが制作

AI生成の指示を使用してAlpacaモデルを微調整すると、数学的能力はChatGPTを超える—— M...

COVID-19パンデミックは不動産業界のインテリジェントな変革とアップグレードを加速させた

[[342701]] スマートホーム革命はかなり前から本格化しています。住宅所有者はデータと IoT...

...

...

人工知能は仕事をなくしてしまうのでしょうか?マスク氏の提案を聞いてみましょう。

人工知能が広く活用されるようになり、将来の雇用環境に対する不安も広がっています。 2019年に調査会...

...

一般的な機械学習アルゴリズム11種の紹介

近年、需要の高さと技術の進歩により、機械学習の人気は大幅に高まっています。 データから価値を生み出す...

人工知能が「より賢くなる」ためには、計算能力をアップグレードする必要がある

人工知能に関する最新の報告書「2020-2021年中国人工知能コンピューティング力発展評価報告書」が...

2021年のAIに関する10の大胆な予測の科学的分析 学術見出し

2020年は忘れられない年です。今年に入って、新型コロナウイルスの感染拡大に伴い、人工知能(AI)が...

10億のパラメータを持つAIモデルSE​​ERは、すべての人を平等に扱い、富裕層と世界に貢献します。

厳選されラベル付けされたデータ セットを使用して AI システムをトレーニングすると、オブジェクト認...