AIがデータセンターの設計をどう変えるか

AIがデータセンターの設計をどう変えるか

AI システムへの世界的な支出は 2023 年から 2026 年の間に 2 倍になると予想されており、需要に対応するにはデータ センターの容量を急速に増やす必要があることは明らかです。

しかし驚くべきことに、多くのデータセンター運営者が過去1年間に新規プロジェクトを中止し、投資が減速し、ロンドンの空き容量は2022~23年に6.3%減少した。

この直感に反する傾向の背後には何があるのでしょうか? それを説明するには、AI コンピューティングとそれをサポートするインフラストラクチャを取り巻くいくつかの問題を理解する必要があります。

AIがデータセンターのインフラをどう変えるのか

データ センターはこれまで、従来のコンピューティング ワークロードを処理するために CPU ラックを中心に構築されてきましたが、AI コンピューティングには GPU を搭載したラックが必要であり、同じ CPU 容量よりも多くの電力を消費し、多くの熱を放出し、多くのスペースを占有します。

実際には、これは AI のコンピューティング能力には、より多くの電源接続や代替の冷却システムが必要になることが多いことを意味します。

これは組み込みインフラストラクチャであるため、データセンター コンプレックスの構造に組み込まれており、交換するにはコストがかかることが多く、場合によっては経済的に不可能になります。

実際には、オペレーターは、新しいデータセンター内で AI と従来のコンピューティングを「分割」するためにどれだけのスペースを割り当てるかを決定する必要があります。

これを間違え、AI について過大な約束をすると、データセンター運営者は永久に活用されず、利益が出ないという重荷を背負うことになるかもしれません。

AI市場がまだ初期段階にあるという事実によって問題はさらに悪化しており、ガートナーはAI市場が現在、誇大宣伝サイクルにおける過大な期待のピークにあると主張している。その結果、多くの事業者は、新しいデータセンター プロジェクトに AI コンピューティングを一定の割合で導入することを早急に決定するのではなく、設計段階では保留することを選んでいます。

設計段階では総合的なアプローチを取る

しかし、事業者は、投資を遅らせることができるのは限られた期間だけであり、そうすると市場シェアと競争上の優位性を失うリスクがあることを痛感しています。これは、データセンター インフラストラクチャの多くの基本要素がリアルタイムで書き換えられていることを考えると、困難な作業です。

リスクを相殺しながら先駆者となるという要求を満たすために、事業者は、新しい総合的な設計アプローチを必要とする AI コンピューティングの時代に最大限の効率性と回復力を発揮するようにデータ センターを設計する必要があります。

1. より多くの関係者を巻き込む

オペレーターが AI と従来のコンピューティングの間で正確に分割するかどうかに関係なく、AI コンピューティング機能を備えたデータ センター サイトは、従来の施設よりもはるかに複雑になると予想されます。複雑さが増すと、多くの場合、障害点も増えます。特に AI コンピューティングでは、従来のコンピューティングよりも多くの処理が要求される場合に顕著です。

したがって、稼働時間を保証し、サイトのライフサイクル中にコストのかかる問題が発生するリスクを軽減するには、チームはデータセンターの計画フェーズでより徹底する必要があります。

特に、設計フェーズでは、プロジェクトの開始時に、より広範なチームからの意見や専門知識を求める必要があります。設計者は、電力と冷却に関する専門知識を求めるだけでなく、潜在的なボトルネックや障害の原因を理解するために、運用、ケーブル配線、セキュリティの各チームと早期に連携する必要があります。

2. データセンター運用にAIを統合する

オペレーターは現在、現場で AI コンピューティングを実行しているため、AI を使用する能力を活用して、運用の新たな効率性を生み出す必要があります。 AI はデータ センターで長い間開発されており、そのテクノロジーはワークフローを非常に高い精度と品質で実行することができます。たとえば、AI は次のことに役立ちます。

  • 温度と湿度の監視。
  • セキュリティシステムの運用。
  • 電力監視および配電。
  • ハードウェア障害の検出と予測メンテナンス。

データセンターのライフサイクルのあらゆる段階でテクノロジーを積極的に活用することで、オペレーターは運用の効率と堅牢性を大幅に向上させることができます。 AI は、障害検出や予測メンテナンスなどを通じて、次世代データセンターの斬新で複雑なレイアウトを採用する際に発生する新たな課題に対処するのに最適です。

3. 誤った節約を避ける

トレーニング実行中やエンタープライズ規模のモデルを本番環境で実行しているときなどのピーク時には、AI によってデータセンターに大きな負荷がかかります。これらの期間中、AI コンピューティングは、電力消費、冷却要件、データ スループットの点で従来の期待をはるかに上回ることがよくあります。

最も基本的なレベルでは、これはデータセンターの基礎となる材料にかかるストレスが増大することを意味します。これらの基礎となる材料やコンポーネントの品質が高くない場合、故障する可能性が高くなります。 AI コンピューティングは、サイト内のコンポーネントと接続の数の劇的な増加を意味するため、従来のサイトでは問題なく機能する安価で低品質の材料を使用すると、AI コンピューティングを実行するデータセンターが停止する可能性があります。

このため、事業者は、低品質のケーブルなど、低品質の材料を購入してコストを節約することを避ける必要があります。そうすると、これらの材料は故障する可能性が高くなり、より頻繁に交換する必要が生じるため、誤った経済的リスクが生じる可能性があります。しかし、最も問題なのは、基準を満たさない材料や部品による故障が、サイトのダウンタイムや停止につながることが多く、収益性に影響を及ぼすことです。

インフラの課題を解決する

AI コンピューティングのインフラストラクチャ要件が、事業者が投資を遅らせている主な理由である可能性はありますが、長期的には必ずしもそうとは限りません。

市場の不確実性が解消されるにつれて、企業はデータセンターにおける従来型コンピューティングと AI コンピューティングの分割に関して「妥協点」に収束するでしょう。

そうなると、企業は学習し成熟するにつれて、サイトの運営において可能な限りの優位性を確保する必要があるでしょう。

これは、最初から総合的に設計し、AI 自体を活用してサイトの新たな効率性を発見し、AI のより大きなコンピューティング需要に対応できる高品質のコンポーネントに投資することを意味します。

<<: 

>>:  医学物理学におけるAIの応用に関する簡単な分析

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

人工知能とサイバーセキュリティは諸刃の剣

[[379153]] [51CTO.com クイック翻訳] 研究によると、人工知能技術はさまざまな業...

AIと機械学習の統合アーキテクチャ:インテリジェントな意思決定を可能にする

人工知能 (AI) と機械学習の台頭により、あらゆる業界に大きな変化が起きています。データ量が増加し...

自動運転企業Roadstar.aiはシリーズA資金調達で1億2,800万ドルを調達し、2020年までに1,500台の自動運転車を運行する予定だ。

自動運転企業Roadstar.aiは最近、 1億2,800万米ドルのシリーズA資金調達ラウンドの完了...

産業用 AI チェックリスト: 始めるための 10 ステップ

人類はもはや人工知能(AI)の波から逃れることはできない。彼らが行くところすべてで、最新の AI ソ...

将来の旅行に関する最初の質問:自動運転による交通渋滞の解決策は本当に実現可能でしょうか?

交通渋滞問題は北京、上海、広州の都市脳血栓症となっている。我々の巧妙な統治の下では、都市部の道路渋滞...

...

2022年、ビッグモデルはどこまで行けるでしょうか?

[[442868]]著者: ユン・チャオこの記事は、2021年の業界レビュー、2021年のビッグモ...

企業がより持続可能な推論を通じてより環境に優しい AIGC を実現する方法

モデルとは何か一般人にとって、AIとそのプログラミングの基盤となるアルゴリズムが、これほど広範囲にわ...

なぜ機械学習は人工知能よりも優れているのでしょうか?

人工知能、データサイエンス、機械学習はすべて同じ分野に属します。問題は、この場合、どちらが正しい目的...

機械学習を簡単に理解!クラスタリング、回帰、分類アルゴリズムを説明する 3 つのケース

機械はどのように学習し、何を学ぶのでしょうか?人間はどうやって機械に学習を教えるのでしょうか?この記...

顔認識セキュリティの脆弱性が再び明らかに、19のAndroidスマートフォンは15分でロック解除可能、必要なのはプリンター、A4用紙、メガネフレームだけ

最新の顔認識の脆弱性が明らかになり、テストされたすべての Android スマートフォンが脆弱である...

GPT-4の5倍の性能を持つGoogle Geminiは、本当にOpenAIやMicrosoftに勝てるのでしょうか?

もしあなたが会社の CEO だったら、自社の製品が競合他社に打ち負かされたと聞いたらどう感じるでしょ...

...

Verdict、2020年第1四半期のTwitterにおけるIoTトレンドトップ5を発表

私たちは、企業や専門家が IoT についてどう考えているかを知りたいと思っていますが、一般の人々はど...

クラウドコンピューティングのディープラーニングプラットフォームを構築し実践する唯一の方法

クラウド ディープラーニング プラットフォームの定義 クラウド ディープラーニングとは何ですか? 機...