AIがデータセンターの設計をどう変えるか

AIがデータセンターの設計をどう変えるか

AI システムへの世界的な支出は 2023 年から 2026 年の間に 2 倍になると予想されており、需要を満たすためにデータ センターの容量が急速に増加するのは明らかです。

しかし驚くべきことに、多くのデータセンター運営者が過去1年間に新規プロジェクトを中止し、投資を減速させており、ロンドンの空き容量は2022年から2023年の間に6.3%減少した。

この直感に反するトレンドの背後には何があるのでしょうか? それを説明するには、AI コンピューティングとそれをサポートするインフラストラクチャについていくつか理解する必要があります。

AIがデータセンターのインフラをどう変えるのか

データ センターはこれまで、従来のコンピューティング ワークロードを処理するために CPU 搭載ラックを中心に構築されてきました。 しかし、AI コンピューティングには GPU 搭載マシンのラックが必要であり、同等の CPU 容量よりも多くの電力を消費し、多くの熱を放散し、多くのスペースを占有します。

実際には、これは AI のコンピューティング能力には、より多くの電源接続や代替の冷却システムが必要になることが多いことを意味します。

これは組み込みインフラストラクチャであるため、データセンター コンプレックスの構造に組み込まれており、交換には非常に高額な費用がかかり、経済的に完全に不可能になることもあります。

実際には、オペレーターは、新しいデータセンターで AI と従来のコンピューティングにどれだけのスペースを割り当てるかを検討する必要があります。

この間違いを犯し、AI に過剰にコミットすると、データセンター運営者は、永久に活用されず収益性のない容量に直面することになる可能性があります。

この問題は、AI 市場がまだ初期段階にあるという事実によってさらに悪化しており、ガートナーは AI 市場が現在、誇大宣伝サイクルにおける過大な期待のピークにあると主張しています。 その結果、多くの事業者は、新しいデータセンター プロジェクトにおける AI コンピューティングの割合を早急に決定するのではなく、設計段階で躊躇することを選択します。

設計段階では総合的なアプローチを取る

しかし、事業者は、投資を遅らせたり、市場シェアや競争上の優位性を失ったりするリスクがあることを痛感しています。 しかし、データセンター インフラストラクチャの基礎の多くがリアルタイムで書き換えられていることを考えると、これは困難な作業です。

先駆者としての要求とリスクの相殺のバランスをとるために、事業者は AI コンピューティングの時代に最大限の効率性と回復力を発揮できるようにデータ センターを設計する必要があります。 これには、新しい総合的な設計アプローチが必要です。

1. より多くの関係者を巻き込む

オペレーターが AI と従来のコンピューティングをどのように区別するかに関係なく、AI コンピューティング機能を備えたデータ センター サイトは、従来の施設よりもはるかに複雑になります。 一般的に、複雑さが増すと障害点も増えます。特に AI コンピューティングには従来のコンピューティングよりも多くの要求があるためです。

したがって、サイトの存続期間中の稼働時間を保証し、コストのかかる問題のリスクを軽減するには、チームはデータ センターの計画段階でより徹底する必要があります。

特に、設計フェーズでは、プロジェクトの開始時に、より幅広いチームや専門知識からの意見を求める必要があります。 設計者は、電力と冷却に関する専門知識を求めるだけでなく、早い段階で運用、配線、セキュリティの各チームと連携して、潜在的なボトルネックや障害の原因を理解する必要があります。

2. データセンター運用にAIを統合する

オペレーターは現在、現場で AI コンピューティングを導入しているため、その能力を活用して AI を使用し、運用効率を向上させる必要があります。 人工知能はデータセンターで長い間使用されており、その技術によりワークフローを極めて高い精度と品質で実行することができます。 たとえば、AI は次のことに役立ちます。

  • 温度と湿度の監視
  • 安全システムの操作
  • 電力消費の監視と配分
  • ハードウェア障害検出と予測メンテナンス

データセンターのライフサイクルのあらゆる段階でテクノロジーを積極的に使用することで、オペレーターは運用効率と堅牢性を大幅に向上させることができます。 AI は、障害検出や予測メンテナンスなど、次世代データセンターの斬新で複雑なレイアウトを採用する際に発生する新たな課題に対処するのに最適です。

3. 誤った節約を避ける

AI は、トレーニングの実行中やエンタープライズ規模のモデルを本番環境で実行しているときなどのピーク時に、データセンターに大きな負荷をかけます。 この間、AI の計算は、電力消費、冷却要件、データ スループットに関して従来の予想を大幅に上回ることがよくあります。

最も基本的なレベルでは、これはデータセンターの基礎となる材料にかかるストレスが増大することを意味します。 これらの基礎となる材料やコンポーネントの品質が高くない場合、故障する可能性が高くなります。 AI コンピューティングは、サイト内のコンポーネントと接続の数の劇的な増加を意味するため、従来のサイトでは問題なく機能する安価で低品質の材料を使用すると、AI コンピューティングを実行するデータセンターが機能しなくなる可能性があります。

このため、事業者は、低品質のケーブルなどの劣悪な材料を購入してコストを節約することを避ける必要があります。 そうすると、これらの材料は故障する可能性が高くなり、より頻繁に交換する必要が生じるため、誤った経済性を生み出すリスクがあります。 しかし、最も問題なのは、基準を満たさない材料や部品による故障により、工場の停止や減速が頻繁に発生し、収益性に影響を及ぼすことです。

インフラの課題を解決する

AI コンピューティングのインフラストラクチャ要件が、事業者が投資を遅らせている主な理由である可能性はありますが、長期的にはそうはならないでしょう。

市場の不確実性が高まるにつれ、企業はデータセンターにおける従来のコンピューティングと AI コンピューティングの分割に関して「ゴルディロックス ゾーン」に近づくことになります。

こうした状況では、企業は学習と成熟を進めながら、Web サイトの運用において可能な限りの優位性を確保する必要があります。

つまり、最初から総合的に設計し、AI 自体を活用して現場で新たな効率性を発見し、AI コンピューティングのより大きな要求に対応できる高品質の素材に投資するということです。

<<:  IDC: 高速サーバー市場は2023年上半期に31億ドルに達し、GPUサーバーが依然として主流となる

>>:  AIによる顔の変形にはポジティブなエネルギーもある:研究によると、自分で顔を変える教育ビデオを観ると学習効率と楽しさが向上することがわかった

ブログ    

推薦する

NLP事前トレーニングパラダイムが統合され、下流のタスクタイプに絡まらなくなり、Googleの新しいフレームワークは50のSOTAを更新します

この論文では、Google の研究者がさまざまな事前トレーニング パラダイムを統合する事前トレーニン...

...

Uber Ludwig は、ローコード機械学習用のオープンソース フレームワークです。

[[330500]] 【51CTO.com クイック翻訳】ディープラーニング モデルのトレーニング...

完璧な切り抜き王ビンビン! ByteDanceのインターンが開発したAIにより、4K 60fps動画のリアルタイム切り抜きが可能に

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIツアーはAIIA AI開発者会議のサポートで終わりに近づいています

強力なコンピューターと複雑かつ絶えず変化する人間の知性が出会うと、どのような火花が散るのでしょうか?...

人間と機械の統合はなぜ難しいのでしょうか?

時間と空間を結びつけるのは速度であり、エネルギーと質量を結びつけるのも速度です。事実と価値を結びつけ...

中国の女性医師が効率的なNASアルゴリズムを提案:AutoMLは一度トレーニングするだけで数十億のハードウェアに適応できる

現在、カリフォルニア大学リバーサイド校が率いるチームは、ジョージ・メイソン大学およびノー​​トルダム...

2020 年にチャットボットはどこに向かうのでしょうか?

チャットボットはかつて大々的に宣伝された期待に応えようとしており、Intercom が委託した新しい...

...

...

自然言語処理のためのオープンソースツール12選

[[316192]]独自の NLP アプリケーションで使用できる 12 個のツールを見てみましょう。...

Google が暗号化アルゴリズム SHA-1 の廃止を急いでいる理由

[[120276]]ハッシュアルゴリズムのヒルベルト曲線図 (Ian Boyd 提供) Google...

脳コンピューターインターフェースツール:脳波からテキストまで、必要なのは機械翻訳モデルだけ

[[320655]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...