アメリカがスーパーコンピューティングで世界トップの座を奪還!人類はエクサスケールのスーパーコンピューティングを実現、フロンティアが世界トップ500リストのトップに

アメリカがスーパーコンピューティングで世界トップの座を奪還!人類はエクサスケールのスーパーコンピューティングを実現、フロンティアが世界トップ500リストのトップに

2年間チャートを独占し、4年連続で優勝した日本の富士山が、ついに「台座」から転落した。

先日発表された2022年の世界トップ500スーパーコンピューターのリストでは、米国のオークリッジ国立研究所(ORNL)のフロンティアが1位を獲得した。 1.102 エクサフロップス/秒の HPL スコアを誇る Frontier は、史上最強のスーパーコンピュータであるだけでなく、初の真の「E クラス スーパーコンピュータ」でもあります。

対照的に、中国の太陽威太湖軽電鉄と天河2号はそれぞれ6位と9位に後退した。 昨年、米国はSunway TaihuLightのプロセッササプライヤーであるSunwayをエンティティリストに含め、中国のスーパーコンピューターの開発に多かれ少なかれ影響を与えた。

今回の Top500 の 64 ビット浮動小数点演算能力の合計は 4.4 エクサフロップスで、6 か月前の前回のリストから 44.7% 増加しました。

フロンティア: エクサスケールの壁を破る

では、フロンティアのパフォーマンスはどの程度に達したのでしょうか? ! 簡単に言えば、ランク付けされた 468 台のスーパーコンピューターの計算能力を合計しても、Frontier の計算能力には及ばないということです。

このような驚異的な計算能力に加えて、Frontier は AI を実行する世界最速のスーパーコンピューターの 1 つでもあります。 HPL-AI ベンチマークの混合精度パフォーマンス テストでは、Frontier は 6.88 エクサフロップスのスコアを達成しました。

簡単に言えば、このパフォーマンスは、860 億個のニューロンで構成されたインテリジェント エージェントの各ニューロンに 1 秒あたり 6,800 万回の指示を与えることに相当します。 これを使用して大規模な AI モデルをトレーニングすることは、F1 カーにロケット エンジンを搭載し、トラック上で直接離陸できるようにするようなものです。 新しい Frontier は 372 平方メートルの広さを誇り、9,408 個のノードを収容できる 74 台の HPE Cray EX キャビネットで構成されています。

各ノードには、AMD Milan "Trento" 7A53 Epyc CPU、512GB DDR4 メモリ、4 つの AMD Radeon Instinct MI250X GPU が搭載されています。 合計で、システムには 4.6PB の DDR4 メモリに接続された 602,112 個の CPU コアがあります。 さらに、37,888 個の AMD MI250X GPU には 8,138,240 個のコアがあり、4.6PB の HBM メモリ (GPU あたり 128GB) とペアになっています。 CPU と GPU は、イーサネットベースの HPE Cray Slingshot-11 ネットワーク ファブリックを使用して接続されます。

ストレージは、容量 700PB、スループット 75TB/秒、パフォーマンス 150 億 IOPS の極めて高性能なストレージ サブシステムに接続されています。 メタデータ層は 480 個の NVMe SSD に分散され、合計 10PB の容量を提供します。一方、5,400 個の NVMe SSD はメインの高速ストレージ層に 11.5PB の容量を提供します。 同時に、47,700 PMR ハード ドライブは 679 PB の容量を提供します。

熱放散の点では、水冷システムにより、6,000 ガロンの水を 350 馬力のポンプでシステム全体に「移動」させ、温度を約 85 度に制御します。 比較すると、これらのポンプはオリンピックサイズのプールを 30 分で満たすことができます。 Frontier は世界最速のスーパーコンピュータであるだけでなく、最も環境に優しいスーパーコンピュータでもあります。

Frontier のエネルギー消費率は、世界で最も環境に優しいスーパーコンピューターの Green500 リストでも 1 位にランクされています。第 3 世代 AMD Epyc プロセッサと Instinct MI250x アクセラレータで構成された単一ラック ユニットのエネルギー効率は、電気エネルギー 1 ワットあたり 62.68 ギガフロップスです。

しかし、フロンティアを組み立てるのは簡単ではない。ORNLは685種類の異なる番号を持つ6000万個の部品を購入しなければならない。 さらに、建設プロセスではチップ不足に対処する必要がありました。

ORNL には影響を受ける部品番号が 167 個あり、その数は 200 万個に上ります。 AMD の MI200 GPU には番号付き部品が 15 個欠落しています。

その後、ORNL は ASCR と協力してこれらの部品の国防優先順位割り当てシステム (DPAS) 評価を取得しました。これは、米国政府が年間の国防予算を使用して、市場価格よりも大幅に安い価格でこれらの部品を購入できることを意味します。 すぐに、「不足」問題は解決しました。

この一連の作戦を経て、多くの人の心にあるいわゆる「疑問」を解消できるのでしょうか? 米国: 国防のために、スーパーコンピューティングへの取り組みを強化しなければなりません。

値段は高いですが、とても便利です。エヌビディアの黄氏のような裕福な経営者たちが地球のデジタルツインを作ろうとしている時代に、各国の公的機関のスーパーコンピューターは、膨大な量のデータを処理し、気候をシミュレートし、産業目的に使用できるAIの開発においてますます重要になっている。 オークフォレストがすべてのコンピューティングパワーを自社で使用できない場合でも、レンタルまたは販売することができます。産業界はコンピューティングパワーを切望しています。

さらに、海外では前例があり、工作機械の材料加工の結果を予測する実験では、日本のDMG森精機の組み込み産業用コンピュータでは8時間を要したが、富岳ではわずか10分で完了した。

中国:ゲームをやってください、私はただ見ているだけです

新しいリストでは、中国と米国が引き続き最多の国となっている。

スーパーコンピューターの保有台数では、中国は前期と同じ173台で引き続き首位を維持している。米国は127ユニットで第2位となり、前期の150ユニットから減少した。それにもかかわらず、これら 2 か国は依然として TOP 500 リスト全体の 60% を占めています。 日本、ドイツ、フランスはそれぞれ34、31、22ユニットで3位から5位にランクされました。

フロンティアは公式に世界最強のスーパーコンピューターとなったが、昨年暴露された2台の中国製スーパーコンピューターとはまだ比較されていない。 ただし、どちらのシステムもまだ Top500 にテストデータを送信していません。

流出したデータに基づき、多くの海外メディアは、Sunway OceanLightスーパーコンピューターのHPLベンチマークでのピーク性能は約1.3エクサフロップス/1.05エクサフロップスであり、Tianhe-3はピーク性能1.7エクサフロップス/持続性能1.3エクサフロップスに達することができると推測している。しかし、米国におけるチップに関するさまざまな「ボトルネック」を考慮すると、中国のスーパーコンピューターがトップに立った結果、制裁の「標的」となる可能性が高く、短期的には関連データの更新は行われない可能性が高い。

国別では中国が34.6%でトップ、米国が25.4%で2位。中国と米国の競争傾向は変わらない。

総合性能ランキングでは、米国の優位性は揺るぎなく、総計算能力の47.3%を占めてしっかりと1位を占めています。今回トップに立ったFrontierが、米国の安定した優位性に大きく貢献していることは明らかです。

さらに、トップ 500 リストでは、1990 年以降のスーパーコンピューティング能力の進歩傾向もカウントし、線形回帰を実行しました。 表の横軸は時間、縦軸は計算能力(対数)です。

緑の点はリストにあるスーパーコンピューターの合計計算能力を表し、黄色の三角形はリストのチャンピオンの計算能力を表し、青い四角形はリストの最後 (500 位) にランクされているスーパーコンピューターの計算能力を表します。対応する色の直線は線形回帰の結果です。 これら 3 本の直線は、計算能力の向上に関するムーアの法則の予測判断にほぼ一致していることがわかります。 ムーアの法則は終わったと誰もが言いますが、スーパーコンピューティングの分野では、まだ健在のようです。

ヨーロッパが上昇:上位10議席のうち7議席

注目すべき成果を達成したのは米国だけではない。ヨーロッパも好成績を収めました。総合ランキングでは、米国、中国、日本が上位3位を占め、上位10位のうち残りの7席はすべてヨーロッパ諸国が占めました。

そのうち、ドイツには31の駅、フランスには22の駅、イタリアには14の駅がリストに掲載されています。 フィンランドが新たに導入したLUMIスーパーコンピュータは、FP64性能151.9ペタフロップスでUS Summitをわずかに上回り、3位となった。

さらに、フランスのGENCI-CINES社のAdastraは、46.1ペタフロップスのパフォーマンスで10位に迫りました。 LUMI ほど強力ではありませんが、Adastra は依然としてヨーロッパで 2 番目に強力なスーパーコンピュータという名誉を保持しています。 LUMI や Adastra などのシステムは、別の傾向を示しています。 Frontier と同様に、これらは HPE のオール AMD Cray EX プラットフォームをベースとしており、第 3 世代の Epyc CPU と Instinct GPU を使用しています。

GPUアクセラレーションを使わない理由: 依然として資金不足

久しぶりに、AMD が Top500 のシステムのホスト CPU の代表的なシェアを獲得しましたが、Intel Xeon プロセッサが依然として優勢です。

インテルは今世紀初頭から高性能コンピューティングの分野に力を入れ始め、わずか数年でIBMやHPなど、これまでの大手企業を次々と追い抜いていった。 2017年から2020年にかけて、高性能コンピューティングにおけるIntelの市場シェアはピークに達し、90%を超えました。

現時点では、Intel のシェアは依然として 77.4% と高く、4.2 パーセントポイント減少していますが、AMD のシェアはちょうどこの分増加しています。 Epycs が Xeon SP との競争でさらに勢いを増すと予想されます。さらに、AMD には追いつく勢いがあります。 2022 年の世界トップ 500 スーパーコンピューターのリストでは、現在 94 台のスーパーコンピューターが AMD 製品に依存しており、年間 95% の成長率となっています。さらに、AMD の Instinct MI200 アクセラレータが 7 台のスーパーコンピューターで初めて使用されました。

もう 1 つの疑問は、なぜ GPU アクセラレータを使用しないのかということです。値段が高いからでしょうか?コンピューティング エンジンとして、GPU アクセラレータはパフォーマンスとコスト効率を大幅に向上させることができますが、現時点では、アクセラレータは Top500 リストのスーパーコンピューティング アーキテクチャを支配していません。

少し。これらの GPU アクセラレータは主に NVIDIA 製です。 しかし、GPU に移植する必要のあるアプリケーションが多数あり、資金に困っていない Nvidia 独自の HPC センターとは別に、世界中には資金不足に陥っている HPC センターが何千もあり、これらの HPC のコードは CPU 用に明示的に記述されています。

現在の Top500 リストのうち、GPU アクセラレータを使用しているスーパーコンピュータはわずか 170 台で、そのほとんどは Nvidia 製です。 もう 1 つの要因は、安価な CPU 自体が、ベクトル計算や行列計算など、GPU と同様の高速コンピューティング機能を徐々に追加しつつあることです。

これは、CPU プログラムを GPU に転送するよりも安価でプログラミングが簡単です。主に GPU アクセラレーション システムで構成される Top500 リストが登場することは決してないかもしれません。 実際、「富岳」や「太湖光」などのトップクラスのスーパーコンピュータシステムでは、CPUは基本的にベクトル計算や行列計算が可能なGPUの役割を果たしています。​

<<:  人工知能がデジタル時代の教師の変革を促進

>>:  NLP モデルは人間の言語を理解できないのでしょうか? Microsoft AdaTestはエラーの検出効率が5倍向上

ブログ    

推薦する

カナダ工学アカデミー会員のソン・リャン氏:将来の人工知能システムはネットワークの形で存在するだろう

12月5日、国務院の承認を得て、科学技術部と河南省政府の共催により、12月6日から8日まで河南省鄭州...

Baidu AIは素晴らしいキャンパスライフに新たなタッチを加え、新学期をより技術的に

幼少期、小学校、中学校、高校、大学に至るまで、キャンパスライフはほとんどの人にとって欠かせないもので...

人工知能は労働力不足の重要な解決策とみられる

セリディアンは、無限の労働力を動員する力に焦点を当てた年次経営者調査の結果を発表しました。調査では、...

...

機械学習のユニットテスト方法

過去 1 年間、私は仕事時間のほとんどをディープラーニングの研究とインターンシップに費やしてきました...

GitHub トップ プロジェクト: 30 万語の図解アルゴリズム問題辞書、超実用的なリソース、6,000 個のスター

[[336071]]貴重なリソースをまとめましたので、ぜひご覧ください。アルゴリズムはコンピュータサ...

AIの最高峰:自然言語処理

近年、世界中でますます多くの政府や企業組織が人工知能の経済的、戦略的重要性を徐々に認識し、国家戦略や...

倫理的な AI の今後はどうなるのでしょうか?

今日のデジタル時代では、人工知能 (AI) と機械学習 (ML) はあらゆるところに存在しています。...

包括的なデータサイエンスC/C++機械学習ライブラリコレクション、Baidu検索は不要

はじめにと動機 - なぜ C++ なのか? C++ は、動的負荷分散、適応型キャッシュ、大規模なデー...

機械は倫理的な判断を下せるのか?

ロボットや機械が下す決定は必ずしも道徳的に正しいとは限りません。テクノロジー企業が機械倫理に注目する...

...

次世代ビジネスインテリジェンスのトレンドと機会

ビジネス成果を明確に定義するために、多くの企業は分析にビジネス インテリジェンス ソフトウェアを活用...

...

人工知能が「怠け者」社員147人を解雇、「労働者」は追い詰められている

人工知能やロボットがSF小説に登場して以来、人類は人工知能と共存する未来社会に不安を抱いてきた。映画...