液体冷却が高性能コンピューティング インフラストラクチャに関連する課題を克服する方法

液体冷却が高性能コンピューティング インフラストラクチャに関連する課題を克服する方法

新型コロナウイルス感染症の流行から2、3年が経ち、私たちの日常生活の機能を維持するために、データセンターでは業界全体でかつてないほどのデジタル需要が急増しています。たとえばヘルスケア分野では、遠隔医療の受診件数が2019年の84万件から2020年には5270万件へと63倍に増加しました。

ガートナーによると、パブリッククラウドサービスに対するエンドユーザーの支出は2022年に4,820億ドルに達すると予想されています。ハーバード・ビジネス・レビューの調査では、回答者の86%が人工知能(AI)が自社の主流のテクノロジーになったと答え、67%が2021年にAIの導入を加速させると予想していると答えました。これらのサービスはこれまでと同様に重要ですが、ネットワークの複雑さの表面をなぞっているにすぎません。

今日のネットワークがより複雑かつ分散化され、拡張現実や仮想現実のアプリケーションがより顕著になるにつれて、リアルタイムのコンピューティングと意思決定の必要性がさらに重要になります。このリアルタイムの需要はレイテンシの影響を受けやすく、エンタープライズ、パブリック クラウド、プライベート クラウド、ホスティング、エッジのハイブリッド モデルがますます増える中で、専用の手作業で管理することがますます困難になっています。

したがって、これらのネットワークのパフォーマンスを最適化し、より多くのリモート監視ソリューションを実現するためには、AI と機械学習 (ML) が不可欠です。 5G の導入が進むにつれて、私たちのデジタル ニーズはさらに高まります。5G は、従来の 4G よりも最大 500% 高速になるとされており、企業は 2022 年までに 232 億ドルに達すると予測される収益の一部を獲得しようと躍起になっています。

こうした進歩には必然的に、計算密度と熱密度の増加というコストが伴います。高性能コンピューティング (HPC) は、AI、ML、5G をサポートするために急速に進化しており、多くの企業のビジネス課題を解決しています。これにより、多くのデータ センター オペレーターにとって、より高密度のキャビネットとデータ センターの必要性が急速に高まり、これらの重要なシステムを冷却するためのインフラストラクチャの変更が必要になります。

ラック密度が 30 キロワット (kW) に近づき、それを超えると、システムをどれだけ最適化しても、空冷システムだけでは不十分になる可能性があります。空冷技術は高密度化に効果的に対処する上で大きな進歩を遂げてきましたが、ある時点で空気は高密度ラックに適切な冷却を提供するために必要な熱伝達特性を備えなくなります。これらの制限を無視する組織は、エネルギー コストの増加、パフォーマンスの低下、そして最終的には実装の遅延を予想する必要があります。

空冷の最も現実的な代替手段は、ラックに液体冷却を導入することです。液体冷却は、水やその他の液体の優れた熱伝達特性を利用して、高密度ラックの効率的でコスト効率の高い冷却をサポートします。液体冷却には、リアドア熱交換器、直接チップ冷却、浸漬冷却など、さまざまなテクノロジーを使用したさまざまな構成があります。

液体冷却は、主流として採用されるまでには何年もかかるニッチなアプリケーションであると考えられることが多いですが、Open19 Foundation や Open Compute Project などの技術シンクタンクは、業界のリーダーを集めて、コンピューティング密度の継続的な増加によってもたらされる課題に取り組んでいます。これらのコラボレーションを通じて、業界のリーダーは大きな進歩を遂げ、液体冷却技術をより幅広いユーザーにとって実行可能なソリューションにするのに役立つさまざまな製品を開発しました。

簡単に言えば、液体冷却は次のように機能します。冷却液が IT 機器に組み込まれたコールドプレート熱交換器に循環されます。これにより、空間全体を冷却するのではなく、冷却媒体が IT 機器に直接送られるため、効率的な冷却が実現します。これは空気を使用する場合よりも 3,000 倍効率的であり、高密度ラック内の中央処理装置 (CPU) とグラフィックス処理装置 (GPU) が過熱することなく最大電圧とクロック周波数で継続的に動作することを可能にします。

これと、データ センターやサーバー内の空気を循環させるために必要なファンの削減または排除を組み合わせることで、液冷式データ センターのエネルギーを大幅に節約できます。さらに、液体冷却に必要なポンプは、同じ冷却を実現するために必要なファンよりも消費電力が少なくなります。

液体冷却の種類

リアドア熱交換器は、液体をサーバーに直接送るのではなく、液体の高い熱伝達特性を活用する実績のあるテクノロジーです。パッシブリアドア熱交換器では、液体が充填されたコイルがラックの背面ドアに取り付けられており、サーバーファンがラックに熱風を吹き込むと、空気がデータセンターに入る前にコイルが熱を吸収します。アクティブ設計では、デバイスに統合されたファンがコイル上に空気を吸い込み、熱性能を向上させます。

ダイレクトオンチップ液体冷却では、冷却プレートがサーバーの主要な発熱コンポーネントの上に配置され、単相または二相プロセスを通じて熱を除去します。単相コールド プレートは、コールド プレート内を循環する冷却剤を使用して、サーバー コンポーネントから熱を吸収します。 2 段階プロセスでは、低圧の誘電流体が蒸発器に流れ込み、サーバー コンポーネントによって発生した熱によって流体が沸騰します。熱は蒸発器から蒸気の形で放出され、ラックの外側に伝達されて放熱されます。

浸漬冷却では、ラック内のサーバーやその他のコンポーネントが熱伝導性の誘電液体または流体に浸されます。単相浸漬システムでは、熱はサーバー コンポーネントとの直接接触を通じて冷却剤に伝達され、浸漬タンクの外部にある熱交換器によって除去されます。 2 相浸漬冷却では、誘電液は、効率的な熱放散を可能にしながら IT 機器を保護する特定の沸点を持つように設計されています。サーバーからの熱によって流体の相が変化し、上昇する蒸気はタンク上部にあるコイルを通って再び液体に凝縮します。

継続的な成功へのロードマップとしての液体冷却

組織が液体冷却を使用して HPC 関連の新しいインフラストラクチャの要件と課題をサポートすることを計画している場合、効率性と信頼性以外にも利点があります。これらの利点は次のとおりです。

  • パフォーマンスの向上:液体冷却システムは、必要な信頼性を実現するだけでなく、IT パフォーマンスのメリットも提供します。プロセッサ ケースの温度が最大安全動作温度に近づくと (空冷の場合に発生する可能性があります)、熱暴走を回避するためにプロセッサのパフォーマンスが低下します。
  • 持続可能性:液体冷却は、データセンターのエネルギー消費を削減し、電力使用効率 (PUE) をほぼ 1.0 まで下げる機会を生み出すだけでなく、捕捉した熱をより効率的に再利用して、建物の暖房システムの必要性を減らす方法も提供します。このシステムの戻り水温度は 60 度以上に達する可能性があり、液体間の熱伝達は空気システムよりも効率的です。
  • スペース利用率を最大化:液体冷却によって密度が高められるため、施設は既存のデータセンター スペースをより有効に活用でき、拡張や新規建設の必要性がなくなり、より小さなフットプリントの施設を構築できるようになります。また、物理的なスペースが限られている処理集約型のエッジ アプリケーションもサポートできます。
  • 総所有コスト (TCO) の削減:レポート「データ センターの液体冷却 IT 機器: 総所有コスト」で、ASHRAE は空冷式データ センターとハイブリッド (空​​冷と液体冷却) データ センター モデルの詳細な所有コスト分析を実施し、TCO には多くの変数が影響する一方で、「液体冷却は、高密度化、フリー クーリングの使用増加、パフォーマンスの向上、ワットあたりのパフォーマンスの向上により、TCO を改善できる」ことを発見しました。

ラック密度の増加という課題に取り組んでいる組織のリーダーにとって、空冷の限界を認識し、エネルギーと持続可能性の目標を達成するために液体冷却の使用を検討する時期が来ているかもしれません。非常に高密度のラック (30kW 以上) を導入する場合、他に選択肢がない可能性があります。

ただし、これは複雑なプロセスであるため、組織が適切なパートナーと連携して液体冷却の導入を成功させることが重要です。詳細については、ホワイト ペーパー「データ センターの液体冷却オプションとインフラストラクチャ要件の理解」を参照してください。

<<:  東南大学が世界初のLK-99ゼロ耐性テストに成功しました!常温超伝導が再び出現、人類史は転換点に近づいている

>>:  スイス再保険:AI を活用して保険対応プロセスを効率化

ブログ    
ブログ    

推薦する

GitHub スター 6000 以上! Pythonで機械学習のバイブルPRMLを実践

ビショップの PRML は機械学習のバイブルと言っても過言ではありません。この本では、パターン認識と...

ファーウェイの鄭葉来氏:イノベーションと包括性、テクノロジーが産業インテリジェンスの向上を促進

11月11日、中国ハイテクフェア2020が深センで開催されました。ファーウェイクラウドコンピューティ...

Huang 氏の最新インタビュー: 30 年前に戻れるなら、私は NVIDIA を立ち上げることはなかったでしょう!

ベルサイユの中国人起業家サークルに、ジェンセン・フアンというもう一人の大物が加わった。最近の公開イン...

...

...

AIが継続的にモンスターと戦い、アップグレードできるようにするために、DeepMindは「メタバース」を作成した。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

人工知能は永遠の神です:それを崇拝する準備はできていますか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

ライトスピードコンピューティングが画期的な進歩を達成、AIトレーニングコストの問題が解決される可能性

画像出典: Visual China 1956年、アメリカの経済学者によって「人工知能」の概念が提唱...

新しい人工知能マシンが数字間の隠れた関係を発見?あるいは数学的な推測を証明するのに役立つかもしれない

数字間の隠れた関係は、証明が必要な場合に数学的推測を確認できるラマヌジャンマシンと呼ばれる新しいタイ...

食品サービス機器業界の主な動向

[[442813]]画像ソース: https://pixabay.com/images/id-673...

AIが人々の職場復帰を支援:重慶の音声ロボット、北京の無人配達、広州の顔認識体温測定

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

IBMがWatson Healthの売却を計画しているが、AI医療はまだ手つかずのままか?

2月19日、IBMがWatson Health部門の売却を検討しており、会社を合理化してハイブリッ...

前例のない変化:パンデミックはテクノロジーと未来を急速に形作っている

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

ヘルスケアにおけるロボット工学の新展開

ロボット工学は考えられるあらゆる分野に応用できます。教育、旅行、防衛など、あらゆる分野でロボット工学...

AI コンピューティング センター構築熱の背後で、お金を無駄にしているのは誰か?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...