データセンターは効率性を向上させるためにさらなる機械学習を必要としている

データセンターは効率性を向上させるためにさらなる機械学習を必要としている

世界経済フォーラムによると、2025年までに世界では毎日463EBのデータが生成されることになります。増え続けるデータの急増に対処するために、データセンター運営者は、稼働時間の最大化、エネルギー使用の最適化、潜在的なリスクの検出、サイバー攻撃からの保護という 4 つの主要目標を達成するための新しい方法を模索しています。機械学習 (ML) 技術を活用することは、重要な潜在的な解決策です。

[[410106]]

機械学習と人工知能の導入は簡単なことのように思えるかもしれませんが、企業の経営者は慎重に進める必要があります。課題としては、投資収益率の不確実性、データ共有に関する複雑なポリシー、上級管理職の認識とサポートの欠如などが挙げられます。しかし、企業がデータにどれほど依存しているかを考えると、テクノロジーリーダーは、特に稼働時間の維持に関しては、機械学習やその他の AI アプリケーションの重要性を無視することはできません。

企業はダウンタイムに高い代償を払う

データ センターの計画外のダウンタイムによるコストは、企業の規模や業種に応じて、1 時間あたり 140,000 ドルから 540,000 ドルまで幅広くなります。ブリティッシュ・エアウェイズは2017年に大規模なデータセンター障害に見舞われ、7,500万ドル以上の損害を被った。機械学習とよりスマートなインフラストラクチャの進歩により、今日のデータセンターでは稼働時間運用を大幅に簡素化できます。

市場調査会社International DataCorpによると、2022年までにデータセンターの技術の50%以上が、組み込みの人工知能と機械学習機能を使用して自律的に動作できるようになるとのことです。機械学習を使用してデータセンターの運用を強化する 4 つの方法は次のとおりです。

(1)エネルギー効率の最大化

世界のデータセンターは世界のエネルギー使用量の 1% を消費しています。これは小さな数字のように聞こえるかもしれませんが、運用効率がわずかに改善されるだけでも、大幅なコスト削減につながり、何百万トンもの二酸化炭素が大気中に放出されるのを防ぐことができます。幸いなことに、エネルギー管理は機械学習を実装するのが最も簡単な分野の 1 つです。たとえば、Google は DeepMind を使用してエネルギーを約 30% 節約し、間接費を大幅に削減しました。

(2)正確なキャパシティプランニング

増大するワークロードに対応するために、データ センター管理者はコンピューティング リソースの需要を事前に正確に予測する必要があります。これらの予測は、環境条件の変化を反映するためにリアルタイムで更新する必要があります。高度な機械学習アルゴリズムを使用して構築された予測モデルは、ペタバイトレベルの膨大な量のデータを処理し、容量とパフォーマンスの使用率をインテリジェントに予測できます。この計画により、データ センターはダウンタイムを引き起こし、運用に影響を及ぼす可能性のあるリソース不足を回避できます。

(3)リスク分析の迅速化

機械学習は、人間よりも速く正確に異常を検出するようにトレーニングできます。データセンターのスタッフが何かを発見するまでに長い時間がかかる場合があり、さらに悪いことに、異常を完全に見逃してしまうこともあります。たとえば、一部のデータセンター管理サービス (DMaaS) プログラムでは、電源管理や冷却システムなどの主要なデータセンター機器のパフォーマンス データを分析し、障害が発生する時期を予測できます。機械学習テクノロジーは、データセンターの機器管理者に差し迫った障害を事前に通知することで、ダウンタイムを最小限に抑えることができます。

(4)サイバー攻撃への抵抗力

分散型サービス拒否 (DDoS) 攻撃から保護するには、高速検出と低い誤検出率が求められます。これらの検出方法は、特徴ベースと異常ベースの 2 つのカテゴリに大別できます。シグネチャベースの検出は、一般的なトラフィックでは既知の特性があり、広く実装され、使用されています。異常ベースの検出は、通常のトラフィック パターンを超えています。機械学習回帰モデルを使用すると、トラフィックの異常の種類を識別し、誤検知を最小限に抑えることができます。

課題を克服する

一部のデータセンターでは AI と機械学習のパイロット プロジェクトを実施していますが、他のデータセンターではそれらを完全に導入するのに苦労しています。これは、パイロット プロジェクトではより小さなデータ セットが使用され、実験室条件下で実行されるためです。たとえば、現実の世界では、数テラバイトのデータを数分で処理する必要がある場合があります。したがって、AI を研究室から現場に拡張することは、データ センターが克服しなければならない大きな課題です。その他の課題としては、モデルをトレーニングするための高品質データへのアクセスの難しさ、精度を達成するための実装時間が長いこと、データ共有に関する複雑な法的ポリシーに準拠していることなどが挙げられます。

では、データ センターはこれらの課題をどのように克服するのでしょうか? 万能のソリューションは存在しません。企業は AI ロードマップから始める必要があります。驚くかもしれませんが、多くの企業はこのステップを見落としています。企業は、データの可用性と取得、およびデータの正確なラベル付けに重点を置いた包括的なデータ戦略を作成する必要があります。

次に、機械学習を簡単に拡張できるように、エンタープライズ グレードのパフォーマンスを備えた機械学習モデルを使用します。データ センター インフラストラクチャを使用した自動化およびコンテナ化されたアルゴリズムのトレーニング。これも簡単に拡張可能になります。データの品質に重点を置き、AI パイロット向けのテスト センター オブ エクセレンスまたは同様の構造を確立します。これには、ビジネスに関連する技術的スキル、専門知識、能力を考慮する必要があります。パイロットをより幅広いアプリケーションに拡大するのを支援することで、より大きな影響がもたらされます。

データセンターは、この変化する環境の中でどのように運用するかを再考する必要があります。今日のつながりのある社会では、データセンターは競争に遅れをとったり、圧倒されたりしないように、機械学習の限界を押し広げ続ける必要があります。

<<:  世界で最も引用率の高い中国の AI ジャーナルではどのような研究が行われていますか?

>>:  これらの6つのヒントを活用してAIガバナンスの問題を解決しましょう

推薦する

今年は人工知能と5Gの急速な共同開発が見られました

RedMonk は初めて言語人気ランキングで Java に取って代わり、Python が 2 位にな...

...

アメリカの人工知能の簡単な分析

米国の人工知能戦略配置と発展パターンは、高度に体系化され、段階が明確であり、世界の人工知能発展の最新...

時代と戦う:ハードコアな百度の AI 探究

2021年2月18日午前、百度は2020年第4四半期および通期の財務報告を発表し、印象的なデータを示...

ディープラーニングフレームワークを使わずにPythonでニューラルネットワークをゼロから構築する方法

動機: ディープラーニングをより深く理解するために、Tensorflow などのディープラーニング ...

2023年の生成AIの包括的なレビュー

2023年には、生成AIが開発者のアプリケーション構築支援において飛躍的な進歩を遂げ、大手ツールベン...

...

北京大学とテンセントは、デザイナーと同じくらいクリエイティブなテキストロゴ生成モデルを提案した。

テキスト ロゴのデザインはデザイナーの創造性と経験に大きく依存しますが、その中でも各テキスト要素のレ...

人工知能が教育に与える影響は技術サポートだけにとどまらない

統合と国境を越えた発展が進む今日の世界において、教育が象牙の塔に留まり、自己満足に浸っているだけでは...

機械学習の変革: 多分野にわたる問題に立ち向かい、新しい機械学習エコシステムを構築する

機械学習の手法は、生命、物理学、社会経済などの複雑なシステムにますます応用されています。特定のタスク...

ルーティングテーブルとルーター選択アルゴリズム

標準ルーティングテーブル1.次駅経路選定の基本的な考え方ルーティング テーブルは、宛先までの完全なパ...

業界の視点: 人工知能がビジネスプロセスに革命をもたらす方法

今日、人工知能技術は、ウェアラブルデバイス、自動車、生産性アプリケーション、軍事、ヘルスケア、ホーム...

研究に特化したChatGPTプラットフォーム:回答は完全に論文から取得され、無料で使用できます

より専門的な情報を入手する必要がある場合、文献を調べることはしばしば「頭痛の種」となる作業です。結局...

ディープニューラルネットワークのトレーニングが難しいのはなぜですか?

あなたがエンジニアであり、コンピューターをゼロから設計する任務を負っていると想像してください。ある日...