人工知能の成長がデータセンターの再設計を促している

人工知能の成長がデータセンターの再設計を促している

現在進行中のデータ センターの再設計の主な側面は、AI の大規模で複雑なワークロードと、グラフィックス プロセッシング ユニット (GPU)、テンソル プロセッシング ユニット (TPU)、またはアクセラレータをさらに追加する必要性です。

これらのセルに必要な電力と発生する熱により、設計者は、何が可能で、最適なレイアウト設計なのかを再考する必要に迫られました。さらに、再設計のコストも増加しています。

その結果、Tirias Researchによると、地主は2028年までに新しいAIデータセンターインフラに年間760億ドルを費やす可能性があるという。

データセンターが直面している現在の課題: 今日の高密度GPUベースのクラスター

Tom's Hardware の Anton Shilov 氏は最近、AI ワークロード向け GPU の需要が非常に大きいと評価しました。

  • オムディアは、Nvidiaが2023年第2四半期に実際に900トンのH100プロセッサを販売したと述べた。
  • Omdiaは、Nvidiaが第2四半期に人工知能(AI)および高性能コンピューティング(HPC)アプリケーション向けのH100コンピューティングGPUを900トン(180万ポンド)以上販売したと推定している。 Omdia は、クーラー付きの Nvidia H100 コンピューティング GPU の平均重量が 3 キログラム (6.6 ポンド) を超えるため、Nvidia は第 2 四半期に 30 万台以上の H100 を出荷したと考えています。

その結果、Nvidia H100 グラフィックス プロセッシング ユニット (GPU) 1 個の重量は、軽量のボウリング ボールとほぼ同じ重量になります。上記の Omdia によって計算された重量には、関連するケーブルや液体冷却は含まれていません。

シュナイダーエレクトリックのデータセンターイノベーション担当副社長スティーブン・カルリーニ氏は、AIに使用されるラックは余分な重量と熱に対応するために再設計する必要があると述べた。これは、今日の AI サーバーの密集したクラスターと、現代の AI が本格的に開発され、整然とした列が密集したホット ラン クラスターに変わる前に一般的だった、通常のサーバー ラックの「整然と分散された」列を対比したものです。

カルリーニ氏は、これらの AI クラスターはラックあたり最大 100 キロワットを消費する可能性があるが、従来の非 AI データセンター ラックではラックあたり 20 キロワットしか消費しないと述べた。シュナイダーエレクトリックのエネルギー管理研究センターの上級研究アナリストで、カルリーニ氏の同僚であるビクター・アベラー氏は、Nvidia H100 の消費電力は 1 台あたり 700 ワットであるのに対し、依然として需要が高い旧型の A100 の消費電力は 400 ワットであると指摘した。どちらのタイプの GPU も液体冷却が必要です。

各 GPU 内の 800 億個のトランジスタが密集したシリコン領域が、ほとんどの熱を発生させます。 Amazon、Googleなどの企業は、このGPUを8個搭載したAIサーバーを導入している。適切に設計されていれば、AI サーバー クラスターは、非 AI アプリケーションのサーバー使用率がはるかに低いのに対し、継続的に 100% で実行できます。

データセンターのエネルギー管理に関する長期的な視点

今日の AI ワークロードをホストする主要なデータセンターの所有者は、環境への影響を軽減することに長年取り組んでおり、エネルギー管理に関しては長期的な視点を持つ傾向があります。エネルギー消費量がかつてないほど増加しているのは事実ですが、現在、主要なデータセンターの多くで再生可能エネルギーが利用されているため、所有者は他のゼロ排出の代替手段を模索しています。例えば、マイクロソフトは5月に、2028年から核融合エネルギーの新興企業ヘリオン社から少なくとも50メガワットの電力を購入する契約を締結した。

Victor Avelar は、今日のデータセンターのライフサイクル全体にわたる二酸化炭素排出量を定量化し、将来のデータセンターのレイアウトと設計の最適化に取り組んでいます。 Avelar は、データセンターの建設に使用されるコンクリートの調達、製造、注入中に排出される炭素などの組み込まれた炭素と、データセンターの運用中に生成される炭素の両方を考慮する、無料のデータセンターライフサイクル CO2 等価計算機でこれを実証しました。

コスト計算ツールは、プランナーが代替案を検討し、最適な設計基準を選択するのに役立ちます。たとえば、シュナイダーエレクトリックは電源に関する研究を実施しました。アヴェラール氏はウェストバージニア州の石炭火力発電所とフランスの原子力発電所を比較した。

スコープ別の年間総 CO2 換算排出量を見ると、ウェストバージニア州のオプションのスコープ 2 (地元の電力会社から購入した電力) 排出量が、ミックスのかなり大きな部分を占めていることがわかります。対照的に、フランスの選択肢では、スコープ 3 (新しいデータ センターのコンクリートに含まれる炭素などの間接エネルギー) の割合が大きくなります。スコープ 1 および 2 の排出量は、計画者の制御範囲内にあります。

データセンターの所有権の移行

カルリーニ氏は、歴史的にデータセンターはアンカーテナントとブティックストアを備えたショッピングモールのようなモデルに従う傾向があり、所有者は地元の需要を満たす建物の運営とスペースのリース管理のみに重点を置いていると指摘した。

しかし最近では、新しいデータセンター建設の割合において、大手クラウド、メディア、SaaS プロバイダーが優位に立っています。所有者/運営者にとって、標準的なデータセンター設計は存在しません。データ センターはそれぞれ異なり、現在の環境における主な課題は、発生しているすべての変化に対応することです。

<<:  ビジネスリーダーがAIを導入する際に指針となる5つの基本原則

>>:  未来を決定づけるトップ10の人工知能技術

ブログ    

推薦する

アレックス・グレイブス氏の新しい論文「ベイジアンフローネットワーク」は離散データ生成の問題を解決しており、論文全体が数式でいっぱいである。

最近、大規模なニューラル ネットワークが生成モデルに革命をもたらし、高解像度画像内のすべてのピクセル...

1 つのニューロンには 5 ~ 8 層のニューラル ネットワークがあります。ディープラーニングの計算の複雑さは生物学によって克服されています。

人工知能の開発にはまだまだ長い道のりが残っているようです。エルサレムのヘブライ大学の研究者らは、単一...

タオ氏の新しい論文:有名な素数予想を部分的に証明、新しい方法は彼の古いモデルを使用する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

強力な人工知能を制御できる者は、世界全体を制御することになるのでしょうか?

人工知能は21世紀における最も重要な技術的成果となりました。したがって、世界規模の開発動向に注目する...

2018年、中国とアメリカのインターネット大手によるAIチップ戦争で、BATはFANGに挑戦できるのか?

AI時代に注目すべき新たな変化は、テクノロジー大手がAIチップを独自に開発し始めたことだ。これは一...

AI は「彼ら」による盗聴を防ぐことができますか?

次のような状況に遭遇したことがあるかもしれません:携帯電話でアプリを開くと、最初に表示されるのは数分...

一般的な機械学習アルゴリズム11種の紹介

近年、需要の高さと技術の進歩により、機械学習の人気は大幅に高まっています。 データから価値を生み出す...

GPT-3 がマーベル ユニバースに登場! 2Dの男がスパイダーマンの続編を作るためにそれを使用しました

GPT-3 は論理的な手順に従ってコーパステキストを洗練して要約できるため、詩やラップの歌詞を書くの...

...

...

顔だけで下着を全部剥ぎ取られる:マスクは役に立たない、この顔検査は国民を怒らせている

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ディープラーニング、ノイズ除去オートエンコーダを使用して生データを予測する方法は?

[[214638]]ノイズ除去オートエンコーダー (DAE) は、破損したデータを入力として受け入...

...

...

PyTorch ライブラリの 95% がこのバグの影響を受けます。テスラのAIディレクターも例外ではなかった

[[393110]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...