毎秒400ペタフロップスの計算能力を備えた最速のAIコンピュータが稼働中です。宇宙最大の3Dマップが構築中

毎秒400ペタフロップスの計算能力を備えた最速のAIコンピュータが稼働中です。宇宙最大の3Dマップが構築中

宇宙のコンピューター探査における壮大な瞬間!最近、人工知能ワークロード向けの世界最速スーパーコンピュータとして知られる Perlmutte が稼働を開始すると発表されました。 6,144 個の Nvidia A100 Tensor Core グラフィック プロセッサを搭載したこの新しいスーパーコンピューターは、これまでに作成された中で最大の可視宇宙の 3D マップをつなぎ合わせるという任務を負うことになります。さらに、物理学の空の暗雲であるダークエネルギーを一掃すると期待されています。

宇宙は膨張しているのでしょうか?はい!宇宙が膨張し続ける原因となっている「犯人」はダークエネルギーです。

宇宙で最も神秘的な物質である水は目に見えず、触れることもできません。それを捕らえるために、人類は地球上で多くの実験を行ってきましたが、ほとんど成功していません。

[[402628]]

しかし今では、強力な AI 性能を備えたスーパーコンピュータが私たちを助けてくれるかもしれません。

最近、Nvidia と国立エネルギー研究科学計算センター (NERSC) は、人工知能ワークロード向けの世界最速スーパーコンピューターとして知られる Perlmutte という「スイッチ」を入れました。

[[402629]]

天体物理学者ソール・パールマッターにちなんで名付けられたこの新しいスーパーコンピューターは、6,144 基の Nvidia A100 Tensor Core GPU を搭載しており、これまでに作成された中で最大の可視宇宙の 3D マップをつなぎ合わせる任務を負うことになります。

パールマッター氏はまた、1回の露出で最大5,000個の銀河を撮影できる宇宙カメラであるダークエネルギー分光装置(DESI)からのデータも処理します。

膨大な量のDESIデータを処理して、可視宇宙の最大の3Dマップを作成します。

では、宇宙の 3D マップはどうやって組み立てられるのでしょうか?

つい最近、5 月 17 日に DESI が立ち上げられ、データ収集のための 5 年間の旅が始まりました。 DESI は過去 4 か月間の試験運用中に、これまでのすべての分光調査を合わせたよりも多くの 400 万個の銀河のスペクトルを捕捉しました。

[[402630]]

Perlmutter が行う必要があるのは、DESI データを要約して処理することです。

公式サイトによると、Perlmutter の GPU は一晩で数十枚の露出をキャプチャします。以前のシステムでは、1 年分のデータを公開用に準備するには数週間から数か月かかっていましたが、Perlmutter ではわずか数日で作業を完了できるようになります。

「準備作業で GPU を使って 20 倍の高速化が実現できたことに非常に満足しています」と、Perlmutter のコード準備で研究者を支援している NERSC のデータ アーキテクトのロリン トーマス氏は言います。

ロリン・トーマス氏は、Perlmutter のパフォーマンスに対する自信を隠せませんでした。Perlmutter は世界最大の A100 搭載システムであり、20 を超えるアプリケーションが 6,159 個の NVIDIA A100 Tensor Core GPU を搭載した最初のアプリケーションになる準備をしているからです。NERSC で正式に使用開始されると、Perlmutter は 7,000 人を超える研究者にほぼ 4 エクサフロップスの AI パフォーマンスを提供します。

ダークエネルギーは主に、2011 年のノーベル賞受賞者であるソール・パールマッター氏の研究を通じて発見されました。

物理宇宙論では、暗黒エネルギーは空間を満たし、宇宙の膨張率を高める、感知できない形態のエネルギーです。ダークエネルギー仮説は、観測されている宇宙の加速膨張に対する最も一般的な説明である。宇宙の標準モデルでは、暗黒エネルギーは宇宙の質量エネルギーの 68.3% を占めています。

ダークエネルギーは、時空構造そのものに作用する一種のエネルギーであり、時空構造を膨張させる均一な負圧である。 1998 年、高赤方偏移超新星探索チームは Ia 型超新星の観測データを公開し、宇宙が加速的に膨張していることを示しました。その後、1999年に超新星宇宙論プロジェクトによってこの結果が確認されました。この研究は2011年にノーベル物理学賞を受賞しました。

しかし残念ながら、現在の研究はまだ十分に正確ではありません。DESI マップは、ダーク エネルギーの謎を解明する新たな希望をもたらします。

スーパーコンピュータはAIとHPCを統合する

パールマッター氏の役割は、宇宙の 3D マップを組み立てることや、グリーン エネルギーのための亜原子レベルの相互作用の調査を支援することなどを超えて、無限であることは間違いありません。

「バッテリーインターフェースのような大規模システムの完全な原子シミュレーションを行うことはかつては不可能だったが、現在、科学者たちはパールマッターを使ってそれを行う計画を立てている」とNERSCの応用性能専門家、ブランドン・クック氏は語った。

従来のスーパーコンピュータでは、数ナノ秒で複数の原子のシミュレーションを生成するために必要な計算をほとんど処理できず、Quantum Espresso のようなプログラムを使用することは不可能であることがわかっています。しかし、非常に正確なシミュレーションと機械学習を組み合わせることで、科学者はより長い期間にわたってより多くの原子を研究できるようになります。

ここで、NVIDIA A100 の Tensor コアが独自の役割を果たします。これらは、シミュレーション用の倍精度浮動小数点演算と、ディープラーニングに必要な混合精度計算を高速化します。

Perlmutter は、GPU アクセラレーション ノードと CPU のみのノードを備えた異種システムである Slingshot インターコネクトを含む HPE Cray Shasta プラットフォームに基づいています。このシステムは 2 つのフェーズに分けてインストールされます。最近発表されたフェーズ 1 には、システムの GPU アクセラレーション ノードとスクラッチ ファイル システムが含まれます。フェーズ 2 では、2021 年後半に CPU のみのノードが追加される予定です。

「これにより、Perlmutter は AI 用 16 ビットおよび 32 ビット混合精度演算システムとしては世界最速のシステムとなります」と、Nvidia のシニア プロダクト マーケティング マネージャーである Dion Harris 氏は本日公開されたブログ記事で述べています。「これは AI 用 16 ビットおよび 32 ビット混合精度演算システムとしては、これまでで世界最速のシステムであり、今年後半にローレンス バークレー国立研究所に導入されるシステムの第 2 フェーズでは、さらに高速になる可能性があります。」

Perlmutter の A100 GPU は、Nvidia Tensor Core テクノロジーと直接液体冷却を採用しています。また、これは NERSC でオールフラッシュ スクラッチ ファイル システムを備えた最初のスーパーコンピューターでもあります。 NERSC によれば、35 PB の Lustre ファイル システムは 5 TB/秒を超える速度でデータを移動し、この種のストレージ システムとしては最速となります。

Perlmutter インストールの最初のフェーズは、1,500 を超えるノードを収容できる 12 台の GPU アクセラレーション キャビネットで構成されています。今年後半の第 2 フェーズでは、12 台の CPU キャビネットが追加され、3,000 を超えるノードがサポートされる予定です。各フェーズ 1 GPU アクセラレーション ノードには、NVIDIA Ampere GPU アーキテクチャに基づく 4 つの A100 Tensor Core GPU と 256 GB のメモリが搭載されています。フェーズ 1 の各ノードには、AMD「Milan」CPU も搭載されています。第 1 フェーズのシステムには、非コンピューティング ノード (NCN)、20 個のユーザー アクセス ノード (NCN-UAN - ログイン ノード)、およびサービス ノードも含まれます。 NERSC によれば、一部の NCN-UAN は、Kubernetes を使用してオーケストレーションされたコンテナ化されたユーザー環境を展開するために使用できます。

[[402632]]

第一段キャビネットには扉が付いておらず、直接液冷システムの青と赤の線が見える

フェーズ 2 の各 CPU ノードには 2 つの AMD Milan CPU が搭載され、ノードあたり 512 GB のメモリが搭載されます。フェーズ 2 システムでは、20 個のログイン ノードと 4 個の大規模メモリ ノードも追加されます。

複数のプログラミング環境をサポートし、コンピューティングの限界を利用して宇宙の限界を探求します

CCE、GNU、LLVM コンパイラに加えて、Perlmutter プログラミング環境には、C、C++、Fortran コード用の MPI、OpenMP、CUDA、OpenACC などの複数の並列プログラミング モデルをサポートする NVDIA HPC SDK (ソフトウェア開発キット) も搭載されます。

人間が肉体を使って宇宙を探索する能力には限界がありますが、コンピュータにはこの障害はありません。

たとえば、昨年 10 月には、ハワイ大学マノア校天文学研究所の天文学者グループが AI ニューラル ネットワークの助けを借りて、星、銀河、クエーサーを含むこれまでで最も包括的な「天文学画像カタログ」を作成しました。

[[402633]]

このシステムはまた、銀河までの距離を、せいぜいわずか 3 パーセントの誤差で測定しました。ハワイ大学によれば、最終的な成果は「世界最大の星、銀河、クエーサーの3次元カタログ」となる。

マイクロソフトの物理学者の中には、80 ページの論文を使って「シミュレーション マトリックス」、つまり宇宙は自己学習型コンピューターであることを証明した人もいます。

進化の法則の自己学習システム

著者によれば、宇宙もディープラーニングのフレームワークに似た自発的なシステムを進化させてきたという。

ディープラーニング フレームワークは一連のビルディング ブロックで構成され、各コンポーネントはモデルまたはアルゴリズムの一部であることがわかっています。ビルディング ブロックのスタックは自分で設計できます。

したがって、宇宙の法則が進化したオペレーティング マトリックス アーキテクチャ自体が、可能な限り最小限の初期条件から生じた自動教育システムから進化したと考えることはできるでしょうか。

論文では、著者らは「自己主導型かつ自己行動型」を実現するいくつかのモデルについて説明しています。

7,088個のノードと7,304個のエッジを持つグラフ。サンプルされた可能性のある未来から構成される。

人生において、物理法則は私たちの観察から導き出されるため、本来の物理法則は極めて単純なものとなりますが、世代を経て、その法則は自己永続的になり、学習して発展する能力を持つようになります。

おそらく、宇宙はビッグバンから始まったのではなく、粒子間の単純な相互作用から始まったのでしょう。

この記事では、制限付きボルツマンマシン (RBM) について説明します。

制限付きボルツマンマシンは、Hinton らによって提案された生成ランダムニューラルネットワークです。この概念は非常に抽象的で、物理学に似た機械学習モデルです。ただし、制限付きボルツマン マシンは、最も単純なタイプのディープ ニューラル ネットワーク構造です。

このアーキテクチャは 2 つのニューロン層で構成されています。 1 つは可視レイヤー (緑) で、もう 1 つは非表示レイヤー (青) です。

宇宙の未知の側面を理解することは、常に天文学者の努力の方向でした。 AIを「チームメイト」として迎えることで、私たちは宇宙の星の海を探索する旅を加速させることができるのでしょうか?

<<:  自動運転車の分野での課題は何ですか?

>>:  清華大学の唐潔氏のチームは、ダル・イーよりも優れた成果を挙げた「中国のAIデザイナー」を作成した。

ブログ    
ブログ    
ブログ    

推薦する

この「ペア」は悪くないですね! AIとのペアプログラミング

翻訳者 |陳俊レビュー | Chonglou 「ペアプログラミング」という概念を聞いたことがあります...

コグニティブ時代のIBMの新しいカスタマーサービスセンターは、人間と機械のコラボレーションでより大きな価値を生み出します

これは厳しい試練となるだろう年初に突然発生した疫病は、世界に「一時停止ボタン」を押し、伝統的な運営モ...

...

...

天猫双11:機械​​知能が上昇、ロボット1台は実在の人間70万人に相当

「機械に人間から学ばせてはいけない。機械には独自の方法と手段がなければならない。」 「機械に独自の知...

米国は、中国のAIチップ量子の3つの主要分野への投資を制限する最新の大統領令に署名しました。大手メーカーが50億ドル相当のA800を緊急発注

水曜日、ホワイトハウスは大統領令に署名した。米国は、中国の半導体設計ソフトウェアや製造ハードウェアへ...

...

あなたの GPU は Llama 2 のような大規模なモデルを実行できますか?このオープンソースプロジェクトを試してみてください

コンピューティング能力が重要視される時代に、GPU は大規模モデル (LLM) をスムーズに実行でき...

自動運転車を壁に衝突させ、他人の顔を使って代金を支払う:最新のAIの抜け穴が私たちの目を覚まさせる

かつて専門家が懸念していたAIアルゴリズムの抜け穴は起こり得るし、予想もしなかった抜け穴さえも起こり...

人工知能がプログラマーに取って代わるまでにはどれくらい時間がかかるのでしょうか?

予測によると、AI の影響を最も受ける職業の 1 つはアプリケーション開発者です。結局のところ、Ch...

東京オリンピックでAI技術を披露:「人工」から「人工知能」へ

「人工」から「人工知能」への移行は、時代の急速な進歩と科学技術の急速な発展です。今こそ、今回のオリン...

...

機械学習モデルのパフォーマンスを測定する 10 の指標

大規模モデルは非常に強力ですが、実際の問題を解決するには必ずしも大規模モデルに完全に依存する必要はあ...