機械学習を使用してデータセンターの電力を管理するにはどうすればよいでしょうか?

機械学習を使用してデータセンターの電力を管理するにはどうすればよいでしょうか?

[[249391]]

[51CTO.com クイック翻訳] データセンターがますます複雑になっていることは周知の事実です。ハードウェアと管理ソフトウェアの種類が増え、ワークロードがより頻繁に変更され、パブリック クラウドも増えています。エッジ コンピューティングが間近に迫っているため、状況はさらに複雑になるばかりです。

業界関係者の多くは、機械学習によってデータセンター管理者がこの複雑な状況に対処しやすくなることを期待しています。すでにいくつかの企業が機械学習アルゴリズムを使用するデータセンター管理ソフトウェアを販売しています。コンピューターとしてのデータセンター全体の観点から問題に取り組む人もいれば、冷却や電力だけに焦点を当てる人もいます。冷却は、今日の非効率的に運用されているデータ センターで大量のエネルギーが浪費される領域の 1 つですが、インテリジェントなソフトウェア ツールを使用して電気データ センター インフラストラクチャを管理することには大きなメリットがあります。

Virtual Power Systems (VPS) というスタートアップ企業は、機械学習を利用して、データセンターで一般に「孤立電力」と呼ばれるものを排除しています。データセンターでは、必要以上の電力負荷をサポートするように設計された電気システムが採用されるのが一般的です。これは冗長性を確保するために意図的に行われる場合もあれば、設計者がデータセンターが将来どのように使用されるかを予測できないために行われる場合もあります。

VPS の「ソフトウェア定義電源」ソリューションは、バッテリーを内蔵したスマート電気ハードウェア (シュナイダーエレクトリックなどのパートナーの機器を含む) を使用して、データセンター全体でより合理的かつ効率的に電力を再分配します。同社は、需要の変化に応じて電力を動的に再分配できると述べた。

ICE と呼ばれるこのソフトウェアは、機械学習を使用して電力需要 (バッテリー管理や電力スパイクの可能性を含む) を一元的に予測し、データセンターのフロアにあるハードウェアで実行されている推論エンジンに構成パターンを送信します。その後、推論エンジンは実際の需要に基づいて各ラックに利用可能な電力負荷を調整します。

VPS の CTO、Karimulla Shaikh 氏は次のように語っています。「冗長インフラストラクチャがある場合、ラックには 2 本の電力線が接続され、障害が発生した場合に一方から他方に切り替えることができるように負荷を展開します。つまり、各線の最大容量の 50% しか使用しません。当社のスイッチング システムを使用すると、負荷を 100% 使用できます。障害が発生した場合、スイッチング システムはインテリジェントであり、介入してすべての負荷を短時間バッテリーに移動し、その後、当社のソフトウェアを使用してアプリケーションを別の場所に移動するか、ワークロードをオフラインにします。」

ソフトウェアによって構築された機械学習モデルは、サーバーやラックを追加した場合に電力供給がどのように影響を受けるかを理解するためのシミュレーターとしても使用できます。

しかし、これはほんの始まりに過ぎません。シャイク氏は、VPS は一部の顧客と協力して、典型的な冗長データセンター インフラストラクチャ設計を完全に回避しようとしていると述べました。また、公共電力、燃料電池、断続的な再生可能エネルギーなど、データセンターのエネルギー源間の動的な切り替えについても検討します。

Nlyte Software のデータセンター インフラストラクチャ管理 (DCIM) ソフトウェアは、同社の最高戦略責任者 Enzo Greco 氏によって「データセンター向けのリアルタイム ERP (エンタープライズ リソース プランニング)」に例えられています。同社は最近、IBM Watson 機械学習サービスを使用して、予測的な熱および電力管理機能をソリューションに追加しました。 Watson は、センサー、デバイス、アプリケーションのワークロード情報からのデータに基づいてモデルを構築するのに役立ちます。グレコ氏は、多くの場合、すべてのデータを収集するのは簡単なので、それをもっと頻繁に、そして有利に活用してみてはいかがだろうか、と述べています。

多くのデータセンターには、温度センサー、湿度センサー、リアルタイムのサーバー運用データ、電力メーターがすでに設置されています。 「UPS や PDU など、ほぼすべての最新デバイスから簡単にデータを入手できます」と彼は言います。機械学習システムは、さまざまなシステムやエンドポイント間の隠れたパターンやつながりを見つけることができます。

「将来のある時点で、サーバーとラックのレベルで電力異常が発生することを予測できます」とグレコ氏は語った。定常状態では、ラックは 10kW を消費するかもしれないが、ある時点で 15kW に急上昇する可能性がある。 「十分な履歴データがあれば、このラックは今後 1 時間で 15kW の電力を消費すると予測できます。」電力スパイクは、機械的な問題またはアプリケーション ソフトウェアによって発生する可能性があります。 「SAP をバッチモードで実行しているかもしれませんし、トランザクション システムが最高のパフォーマンスで実行されているかもしれません。」

電力スパイクを予測できれば、作業負荷を移動したり、サーバーをシャットダウンしたり、UPS バッテリーの予防保守を実施したりすることで、電力スパイクに備えることができます、と彼は言いました。

Nlyte の顧客のほとんどは、機械学習システムを使用してアラートを受信し、問題となる可能性のあるものを把握しています。このソフトウェア会社は、予測障害および予防保守用のモジュールも開発しています。 「電力と熱は、故障の優れた先行指標です」とグレコ氏は言います。「電力の異常を予測できれば、それはアプリケーション ソフトウェアに問題があるか、機械に問題がある可能性があることを示す先行指標になります。」

機械学習は、人間のオペレーターよりも速く異常を検出するだけでなく、オペレーターがデータセンター内の電気インフラストラクチャの冗長性メカニズムをより明確に理解するのにも役立ちます。 「運用方法の変更などの要因により、データ センターは当初設計されたほど冗長性が高くない場合があります」と、Uptime Institute の研究担当副社長である Rhonda Ascierto 氏は語ります。「重要なのは、データ センターの性質が変化しても、冗長性に関してデータ センターのすべての部分が意図したとおりに動作していることを確認することです。」

機械学習は、データセンターの可用性戦略をリアクティブからプロアクティブに変革することを約束します。 「UPS は受動的です。停電を待って、正常なシステムに切り替えます」と彼は説明します。「アプリケーション ソフトウェアは障害後に回復します。これは受動的です。アクティブになるということは、もう待つ必要がないということです。将来問題が発生したら、今解決します。」

原題: 機械学習が今日のデータセンターの電力管理にどのように利用されているか、著者: Mary Branscombe

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  ブロックチェーン + AI、完璧な組み合わせですね?

>>:  自動運転は道路安全の問題をどのように解決するのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

ライブクイズゲーム「Winning with Ease」は止められない、Baidu AIが150万の現金獲得にあなたを招待します!

「2進数では、1+1=?」答えが2の場合、残念ながら150万を逃してしまいます。これは頭​​の体操...

...

...

バイリアン・スマートが2021 NIDIアジェンダ中国新小売・デジタルイノベーションサミットに出席

6月22日、2021NIDIアジェンダ中国新小売・デジタルイノベーションサミットが上海で盛大に開催さ...

...

GenAI が CIO にとって悪夢である理由とその解決方法

GenAI が現代の企業にとって非常に魅力的な理由は理解できます。これは、世界中のさまざまな業界で無...

ベンチャーキャピタル企業がAIについて知っておくべきこと

タレスのグローバル副社長であるアシュヴィン・カマラジュ氏は、AI リスクに関する懸念の高まりについて...

...

...

...

今年上半期の世界的なベンチャーキャピタル投資はほぼ半減し、AIスタートアップには400億ドル以上が流入した。

調査会社ピッチブックが7月6日に発表したデータによると、世界のベンチャーキャピタルファンドは2023...

AIシステムが初めて真の自律プログラミングを実現:遺伝的アルゴリズムを使用して初心者プログラマーを上回る

編集者注:この記事は、WeChatのパブリックアカウント「New Intelligence」(ID:...