AIがデータセンターの設計をどう変えるか

AIがデータセンターの設計をどう変えるか

AI システムへの世界的な支出は 2023 年から 2026 年の間に 2 倍になると予想されており、需要を満たすためにデータ センターの容量が急速に増加するのは明らかです。

しかし驚くべきことに、多くのデータセンター運営者が過去1年間に新規プロジェクトを中止し、投資を減速させており、ロンドンの空き容量は2022年から2023年の間に6.3%減少した。

この直感に反するトレンドの背後には何があるのでしょうか? それを説明するには、AI コンピューティングとそれをサポートするインフラストラクチャについていくつか理解する必要があります。

AIがデータセンターのインフラをどう変えるのか

データ センターはこれまで、従来のコンピューティング ワークロードを処理するために CPU 搭載ラックを中心に構築されてきました。 しかし、AI コンピューティングには GPU 搭載マシンのラックが必要であり、同等の CPU 容量よりも多くの電力を消費し、多くの熱を放散し、多くのスペースを占有します。

実際には、これは AI のコンピューティング能力には、より多くの電源接続や代替の冷却システムが必要になることが多いことを意味します。

これは組み込みインフラストラクチャであるため、データセンター コンプレックスの構造に組み込まれており、交換には非常に高額な費用がかかり、経済的に完全に不可能になることもあります。

実際には、オペレーターは、新しいデータセンターで AI と従来のコンピューティングにどれだけのスペースを割り当てるかを検討する必要があります。

この間違いを犯し、AI に過剰にコミットすると、データセンター運営者は、永久に活用されず収益性のない容量に直面することになる可能性があります。

この問題は、AI 市場がまだ初期段階にあるという事実によってさらに悪化しており、ガートナーは AI 市場が現在、誇大宣伝サイクルにおける過大な期待のピークにあると主張しています。 その結果、多くの事業者は、新しいデータセンター プロジェクトにおける AI コンピューティングの割合を早急に決定するのではなく、設計段階で躊躇することを選択します。

設計段階では総合的なアプローチを取る

しかし、事業者は、投資を遅らせたり、市場シェアや競争上の優位性を失ったりするリスクがあることを痛感しています。 しかし、データセンター インフラストラクチャの基礎の多くがリアルタイムで書き換えられていることを考えると、これは困難な作業です。

先駆者としての要求とリスクの相殺のバランスをとるために、事業者は AI コンピューティングの時代に最大限の効率性と回復力を発揮できるようにデータ センターを設計する必要があります。 これには、新しい総合的な設計アプローチが必要です。

1. より多くの関係者を巻き込む

オペレーターが AI と従来のコンピューティングをどのように区別するかに関係なく、AI コンピューティング機能を備えたデータ センター サイトは、従来の施設よりもはるかに複雑になります。 一般的に、複雑さが増すと障害点も増えます。特に AI コンピューティングには従来のコンピューティングよりも多くの要求があるためです。

したがって、サイトの存続期間中の稼働時間を保証し、コストのかかる問題のリスクを軽減するには、チームはデータ センターの計画段階でより徹底する必要があります。

特に、設計フェーズでは、プロジェクトの開始時に、より幅広いチームや専門知識からの意見を求める必要があります。 設計者は、電力と冷却に関する専門知識を求めるだけでなく、早い段階で運用、配線、セキュリティの各チームと連携して、潜在的なボトルネックや障害の原因を理解する必要があります。

2. データセンター運用にAIを統合する

オペレーターは現在、現場で AI コンピューティングを導入しているため、その能力を活用して AI を使用し、運用効率を向上させる必要があります。 人工知能はデータセンターで長い間使用されており、その技術によりワークフローを極めて高い精度と品質で実行することができます。 たとえば、AI は次のことに役立ちます。

  • 温度と湿度の監視
  • 安全システムの操作
  • 電力消費の監視と配分
  • ハードウェア障害検出と予測メンテナンス

データセンターのライフサイクルのあらゆる段階でテクノロジーを積極的に使用することで、オペレーターは運用効率と堅牢性を大幅に向上させることができます。 AI は、障害検出や予測メンテナンスなど、次世代データセンターの斬新で複雑なレイアウトを採用する際に発生する新たな課題に対処するのに最適です。

3. 誤った節約を避ける

AI は、トレーニングの実行中やエンタープライズ規模のモデルを本番環境で実行しているときなどのピーク時に、データセンターに大きな負荷をかけます。 この間、AI の計算は、電力消費、冷却要件、データ スループットに関して従来の予想を大幅に上回ることがよくあります。

最も基本的なレベルでは、これはデータセンターの基礎となる材料にかかるストレスが増大することを意味します。 これらの基礎となる材料やコンポーネントの品質が高くない場合、故障する可能性が高くなります。 AI コンピューティングは、サイト内のコンポーネントと接続の数の劇的な増加を意味するため、従来のサイトでは問題なく機能する安価で低品質の材料を使用すると、AI コンピューティングを実行するデータセンターが機能しなくなる可能性があります。

このため、事業者は、低品質のケーブルなどの劣悪な材料を購入してコストを節約することを避ける必要があります。 そうすると、これらの材料は故障する可能性が高くなり、より頻繁に交換する必要が生じるため、誤った経済性を生み出すリスクがあります。 しかし、最も問題なのは、基準を満たさない材料や部品による故障により、工場の停止や減速が頻繁に発生し、収益性に影響を及ぼすことです。

インフラの課題を解決する

AI コンピューティングのインフラストラクチャ要件が、事業者が投資を遅らせている主な理由である可能性はありますが、長期的にはそうはならないでしょう。

市場の不確実性が高まるにつれ、企業はデータセンターにおける従来のコンピューティングと AI コンピューティングの分割に関して「ゴルディロックス ゾーン」に近づくことになります。

こうした状況では、企業は学習と成熟を進めながら、Web サイトの運用において可能な限りの優位性を確保する必要があります。

つまり、最初から総合的に設計し、AI 自体を活用して現場で新たな効率性を発見し、AI コンピューティングのより大きな要求に対応できる高品質の素材に投資するということです。

<<:  IDC: 高速サーバー市場は2023年上半期に31億ドルに達し、GPUサーバーが依然として主流となる

>>:  AIによる顔の変形にはポジティブなエネルギーもある:研究によると、自分で顔を変える教育ビデオを観ると学習効率と楽しさが向上することがわかった

ブログ    
ブログ    

推薦する

建設業界における人工知能のメリット

建設における AI は、設計、入札、資金調達、調達、建設、運用、資産管理、ビジネス モデルの変革など...

Google Gemini: CMU の総合評価では、Gemini Pro は GPT 3.5 Turbo より劣っていることが判明

少し前に、Google はOpenAI の GPT モデルの競合製品であるGemini をリリースし...

人工知能教育とは何ですか?将来の教育の顕著な特徴は何でしょうか?

グローバル情報化教育の時代において、教育モデル、教育内容、学習方法は大きな変化を遂げており、人工知能...

2019年にAI分野で何が起こったのでしょうか?

2019年は確かに忙しい年でした。人工知能に関する進歩やニュースが頻繁に報道されるにつれ、私たちの...

Tフロントライン | テンセントAILabとの独占インタビュー:「点」から「線」へ、実験室は単なる実験以上のもの

ゲスト:石淑明執筆者: Mo Qi校正:趙雲「ほとんどの研究は一つの点を中心に展開する傾向があるが、...

AIのジレンマをどう解決するか?

今日の大手企業が AI におけるいくつかの大きな課題をどのように克服しているか。概要:多くの企業はビ...

Tencent Youtu:ビジュアルAIはどこまで発展したのか?

[[204589]] AIの発展に伴い、コンピュータービジョン技術の応用範囲は徐々に広がっています...

データがあなたを監視することに抵抗はありませんか?

AI 技術の発展と影響に関する最近の調査、研究、予測、その他の定量的評価により、消費者はデータのプ...

ディープラーニングのためのヘテロジニアス アクセラレーション テクノロジー (パート 2): カタツムリの殻の中に道場を構築する

1. 概要記事「ディープラーニング向けヘテロジニアスアクセラレーションテクノロジー(パート1)」で説...

ICML 優勝者 Lu Yucheng: 分散型機械学習の理論的な限界は何ですか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

米メディア:OpenAI、自社技術の軍事利用を禁じる条項を削除

米国の調査報道サイト「ザ・インターセプト」が1月12日に報じたところによると、ChatGPTの親会社...

...

人工知能の登場により、私たちは仕事を維持できるのでしょうか?

週末にニュースを見て衝撃を受けました。Google は最近、同社が開発したロボット (AI) システ...