現在進行中のデータ センターの再設計の主な側面は、AI の大規模で複雑なワークロードと、グラフィックス プロセッシング ユニット (GPU)、テンソル プロセッシング ユニット (TPU)、またはアクセラレータをさらに追加する必要性です。 これらのセルに必要な電力と発生する熱により、設計者は、何が可能で、最適なレイアウト設計なのかを再考する必要に迫られました。さらに、再設計のコストも増加しています。 その結果、Tirias Researchによると、地主は2028年までに新しいAIデータセンターインフラに年間760億ドルを費やす可能性があるという。 データセンターが直面している現在の課題: 今日の高密度GPUベースのクラスターTom's Hardware の Anton Shilov 氏は最近、AI ワークロード向け GPU の需要が非常に大きいと評価しました。
その結果、Nvidia H100 グラフィックス プロセッシング ユニット (GPU) 1 個の重量は、軽量のボウリング ボールとほぼ同じ重量になります。上記の Omdia によって計算された重量には、関連するケーブルや液体冷却は含まれていません。 シュナイダーエレクトリックのデータセンターイノベーション担当副社長スティーブン・カルリーニ氏は、AIに使用されるラックは余分な重量と熱に対応するために再設計する必要があると述べた。これは、今日の AI サーバーの密集したクラスターと、現代の AI が本格的に開発され、整然とした列が密集したホット ラン クラスターに変わる前に一般的だった、通常のサーバー ラックの「整然と分散された」列を対比したものです。 カルリーニ氏は、これらの AI クラスターはラックあたり最大 100 キロワットを消費する可能性があるが、従来の非 AI データセンター ラックではラックあたり 20 キロワットしか消費しないと述べた。シュナイダーエレクトリックのエネルギー管理研究センターの上級研究アナリストで、カルリーニ氏の同僚であるビクター・アベラー氏は、Nvidia H100 の消費電力は 1 台あたり 700 ワットであるのに対し、依然として需要が高い旧型の A100 の消費電力は 400 ワットであると指摘した。どちらのタイプの GPU も液体冷却が必要です。 各 GPU 内の 800 億個のトランジスタが密集したシリコン領域が、ほとんどの熱を発生させます。 Amazon、Googleなどの企業は、このGPUを8個搭載したAIサーバーを導入している。適切に設計されていれば、AI サーバー クラスターは、非 AI アプリケーションのサーバー使用率がはるかに低いのに対し、継続的に 100% で実行できます。 データセンターのエネルギー管理に関する長期的な視点今日の AI ワークロードをホストする主要なデータセンターの所有者は、環境への影響を軽減することに長年取り組んでおり、エネルギー管理に関しては長期的な視点を持つ傾向があります。エネルギー消費量がかつてないほど増加しているのは事実ですが、現在、主要なデータセンターの多くで再生可能エネルギーが利用されているため、所有者は他のゼロ排出の代替手段を模索しています。例えば、マイクロソフトは5月に、2028年から核融合エネルギーの新興企業ヘリオン社から少なくとも50メガワットの電力を購入する契約を締結した。 Victor Avelar は、今日のデータセンターのライフサイクル全体にわたる二酸化炭素排出量を定量化し、将来のデータセンターのレイアウトと設計の最適化に取り組んでいます。 Avelar は、データセンターの建設に使用されるコンクリートの調達、製造、注入中に排出される炭素などの組み込まれた炭素と、データセンターの運用中に生成される炭素の両方を考慮する、無料のデータセンターライフサイクル CO2 等価計算機でこれを実証しました。 コスト計算ツールは、プランナーが代替案を検討し、最適な設計基準を選択するのに役立ちます。たとえば、シュナイダーエレクトリックは電源に関する研究を実施しました。アヴェラール氏はウェストバージニア州の石炭火力発電所とフランスの原子力発電所を比較した。 スコープ別の年間総 CO2 換算排出量を見ると、ウェストバージニア州のオプションのスコープ 2 (地元の電力会社から購入した電力) 排出量が、ミックスのかなり大きな部分を占めていることがわかります。対照的に、フランスの選択肢では、スコープ 3 (新しいデータ センターのコンクリートに含まれる炭素などの間接エネルギー) の割合が大きくなります。スコープ 1 および 2 の排出量は、計画者の制御範囲内にあります。 データセンターの所有権の移行カルリーニ氏は、歴史的にデータセンターはアンカーテナントとブティックストアを備えたショッピングモールのようなモデルに従う傾向があり、所有者は地元の需要を満たす建物の運営とスペースのリース管理のみに重点を置いていると指摘した。 しかし最近では、新しいデータセンター建設の割合において、大手クラウド、メディア、SaaS プロバイダーが優位に立っています。所有者/運営者にとって、標準的なデータセンター設計は存在しません。データ センターはそれぞれ異なり、現在の環境における主な課題は、発生しているすべての変化に対応することです。 |
<<: ビジネスリーダーがAIを導入する際に指針となる5つの基本原則
最近、大規模なニューラル ネットワークが生成モデルに革命をもたらし、高解像度画像内のすべてのピクセル...
人工知能の開発にはまだまだ長い道のりが残っているようです。エルサレムのヘブライ大学の研究者らは、単一...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能は21世紀における最も重要な技術的成果となりました。したがって、世界規模の開発動向に注目する...
AI時代に注目すべき新たな変化は、テクノロジー大手がAIチップを独自に開発し始めたことだ。これは一...
次のような状況に遭遇したことがあるかもしれません:携帯電話でアプリを開くと、最初に表示されるのは数分...
近年、需要の高さと技術の進歩により、機械学習の人気は大幅に高まっています。 データから価値を生み出す...
GPT-3 は論理的な手順に従ってコーパステキストを洗練して要約できるため、詩やラップの歌詞を書くの...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[214638]]ノイズ除去オートエンコーダー (DAE) は、破損したデータを入力として受け入...
[[393110]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...