毎秒400ペタフロップスの計算能力を備えた最速のAIコンピュータが稼働中です。宇宙最大の3Dマップが構築中

宇宙のコンピューター探査における壮大な瞬間！最近、人工知能ワークロード向けの世界最速スーパーコンピュータとして知られる Perlmutte が稼働を開始すると発表されました。 6,144 個の Nvidia A100 Tensor Core グラフィックプロセッサを搭載したこの新しいスーパーコンピューターは、これまでに作成された中で最大の可視宇宙の 3D マップをつなぎ合わせるという任務を負うことになります。さらに、物理学の空の暗雲であるダークエネルギーを一掃すると期待されています。

宇宙は膨張しているのでしょうか？はい！宇宙が膨張し続ける原因となっている「犯人」はダークエネルギーです。

宇宙で最も神秘的な物質である水は目に見えず、触れることもできません。それを捕らえるために、人類は地球上で多くの実験を行ってきましたが、ほとんど成功していません。

[[402628]]

しかし今では、強力な AI 性能を備えたスーパーコンピュータが私たちを助けてくれるかもしれません。

最近、Nvidia と国立エネルギー研究科学計算センター (NERSC) は、人工知能ワークロード向けの世界最速スーパーコンピューターとして知られる Perlmutte という「スイッチ」を入れました。

天体物理学者ソール・パールマッターにちなんで名付けられたこの新しいスーパーコンピューターは、6,144 基の Nvidia A100 Tensor Core GPU を搭載しており、これまでに作成された中で最大の可視宇宙の 3D マップをつなぎ合わせる任務を負うことになります。

パールマッター氏はまた、1回の露出で最大5,000個の銀河を撮影できる宇宙カメラであるダークエネルギー分光装置（DESI）からのデータも処理します。

膨大な量のDESIデータを処理して、可視宇宙の最大の3Dマップを作成します。

では、宇宙の 3D マップはどうやって組み立てられるのでしょうか?

つい最近、5 月 17 日に DESI が立ち上げられ、データ収集のための 5 年間の旅が始まりました。 DESI は過去 4 か月間の試験運用中に、これまでのすべての分光調査を合わせたよりも多くの 400 万個の銀河のスペクトルを捕捉しました。

Perlmutter が行う必要があるのは、DESI データを要約して処理することです。

公式サイトによると、Perlmutter の GPU は一晩で数十枚の露出をキャプチャします。以前のシステムでは、1 年分のデータを公開用に準備するには数週間から数か月かかっていましたが、Perlmutter ではわずか数日で作業を完了できるようになります。

「準備作業で GPU を使って 20 倍の高速化が実現できたことに非常に満足しています」と、Perlmutter のコード準備で研究者を支援している NERSC のデータアーキテクトのロリントーマス氏は言います。

ロリン・トーマス氏は、Perlmutter のパフォーマンスに対する自信を隠せませんでした。Perlmutter は世界最大の A100 搭載システムであり、20 を超えるアプリケーションが 6,159 個の NVIDIA A100 Tensor Core GPU を搭載した最初のアプリケーションになる準備をしているからです。NERSC で正式に使用開始されると、Perlmutter は 7,000 人を超える研究者にほぼ 4 エクサフロップスの AI パフォーマンスを提供します。

ダークエネルギーは主に、2011 年のノーベル賞受賞者であるソール・パールマッター氏の研究を通じて発見されました。

物理宇宙論では、暗黒エネルギーは空間を満たし、宇宙の膨張率を高める、感知できない形態のエネルギーです。ダークエネルギー仮説は、観測されている宇宙の加速膨張に対する最も一般的な説明である。宇宙の標準モデルでは、暗黒エネルギーは宇宙の質量エネルギーの 68.3% を占めています。

ダークエネルギーは、時空構造そのものに作用する一種のエネルギーであり、時空構造を膨張させる均一な負圧である。 1998 年、高赤方偏移超新星探索チームは Ia 型超新星の観測データを公開し、宇宙が加速的に膨張していることを示しました。その後、1999年に超新星宇宙論プロジェクトによってこの結果が確認されました。この研究は2011年にノーベル物理学賞を受賞しました。

しかし残念ながら、現在の研究はまだ十分に正確ではありません。DESI マップは、ダークエネルギーの謎を解明する新たな希望をもたらします。

スーパーコンピュータはAIとHPCを統合する

パールマッター氏の役割は、宇宙の 3D マップを組み立てることや、グリーンエネルギーのための亜原子レベルの相互作用の調査を支援することなどを超えて、無限であることは間違いありません。

「バッテリーインターフェースのような大規模システムの完全な原子シミュレーションを行うことはかつては不可能だったが、現在、科学者たちはパールマッターを使ってそれを行う計画を立てている」とNERSCの応用性能専門家、ブランドン・クック氏は語った。

従来のスーパーコンピュータでは、数ナノ秒で複数の原子のシミュレーションを生成するために必要な計算をほとんど処理できず、Quantum Espresso のようなプログラムを使用することは不可能であることがわかっています。しかし、非常に正確なシミュレーションと機械学習を組み合わせることで、科学者はより長い期間にわたってより多くの原子を研究できるようになります。

ここで、NVIDIA A100 の Tensor コアが独自の役割を果たします。これらは、シミュレーション用の倍精度浮動小数点演算と、ディープラーニングに必要な混合精度計算を高速化します。

Perlmutter は、GPU アクセラレーションノードと CPU のみのノードを備えた異種システムである Slingshot インターコネクトを含む HPE Cray Shasta プラットフォームに基づいています。このシステムは 2 つのフェーズに分けてインストールされます。最近発表されたフェーズ 1 には、システムの GPU アクセラレーションノードとスクラッチファイルシステムが含まれます。フェーズ 2 では、2021 年後半に CPU のみのノードが追加される予定です。

「これにより、Perlmutter は AI 用 16 ビットおよび 32 ビット混合精度演算システムとしては世界最速のシステムとなります」と、Nvidia のシニアプロダクトマーケティングマネージャーである Dion Harris 氏は本日公開されたブログ記事で述べています。「これは AI 用 16 ビットおよび 32 ビット混合精度演算システムとしては、これまでで世界最速のシステムであり、今年後半にローレンスバークレー国立研究所に導入されるシステムの第 2 フェーズでは、さらに高速になる可能性があります。」

Perlmutter の A100 GPU は、Nvidia Tensor Core テクノロジーと直接液体冷却を採用しています。また、これは NERSC でオールフラッシュスクラッチファイルシステムを備えた最初のスーパーコンピューターでもあります。 NERSC によれば、35 PB の Lustre ファイルシステムは 5 TB/秒を超える速度でデータを移動し、この種のストレージシステムとしては最速となります。

Perlmutter インストールの最初のフェーズは、1,500 を超えるノードを収容できる 12 台の GPU アクセラレーションキャビネットで構成されています。今年後半の第 2 フェーズでは、12 台の CPU キャビネットが追加され、3,000 を超えるノードがサポートされる予定です。各フェーズ 1 GPU アクセラレーションノードには、NVIDIA Ampere GPU アーキテクチャに基づく 4 つの A100 Tensor Core GPU と 256 GB のメモリが搭載されています。フェーズ 1 の各ノードには、AMD「Milan」CPU も搭載されています。第 1 フェーズのシステムには、非コンピューティングノード (NCN)、20 個のユーザーアクセスノード (NCN-UAN - ログインノード)、およびサービスノードも含まれます。 NERSC によれば、一部の NCN-UAN は、Kubernetes を使用してオーケストレーションされたコンテナ化されたユーザー環境を展開するために使用できます。

第一段キャビネットには扉が付いておらず、直接液冷システムの青と赤の線が見える

フェーズ 2 の各 CPU ノードには 2 つの AMD Milan CPU が搭載され、ノードあたり 512 GB のメモリが搭載されます。フェーズ 2 システムでは、20 個のログインノードと 4 個の大規模メモリノードも追加されます。

複数のプログラミング環境をサポートし、コンピューティングの限界を利用して宇宙の限界を探求します

CCE、GNU、LLVM コンパイラに加えて、Perlmutter プログラミング環境には、C、C++、Fortran コード用の MPI、OpenMP、CUDA、OpenACC などの複数の並列プログラミングモデルをサポートする NVDIA HPC SDK (ソフトウェア開発キット) も搭載されます。

人間が肉体を使って宇宙を探索する能力には限界がありますが、コンピュータにはこの障害はありません。

たとえば、昨年 10 月には、ハワイ大学マノア校天文学研究所の天文学者グループが AI ニューラルネットワークの助けを借りて、星、銀河、クエーサーを含むこれまでで最も包括的な「天文学画像カタログ」を作成しました。

このシステムはまた、銀河までの距離を、せいぜいわずか 3 パーセントの誤差で測定しました。ハワイ大学によれば、最終的な成果は「世界最大の星、銀河、クエーサーの3次元カタログ」となる。

マイクロソフトの物理学者の中には、80 ページの論文を使って「シミュレーションマトリックス」、つまり宇宙は自己学習型コンピューターであることを証明した人もいます。

進化の法則の自己学習システム

著者によれば、宇宙もディープラーニングのフレームワークに似た自発的なシステムを進化させてきたという。

ディープラーニングフレームワークは一連のビルディングブロックで構成され、各コンポーネントはモデルまたはアルゴリズムの一部であることがわかっています。ビルディングブロックのスタックは自分で設計できます。

したがって、宇宙の法則が進化したオペレーティングマトリックスアーキテクチャ自体が、可能な限り最小限の初期条件から生じた自動教育システムから進化したと考えることはできるでしょうか。

論文では、著者らは「自己主導型かつ自己行動型」を実現するいくつかのモデルについて説明しています。

7,088個のノードと7,304個のエッジを持つグラフ。サンプルされた可能性のある未来から構成される。

人生において、物理法則は私たちの観察から導き出されるため、本来の物理法則は極めて単純なものとなりますが、世代を経て、その法則は自己永続的になり、学習して発展する能力を持つようになります。

おそらく、宇宙はビッグバンから始まったのではなく、粒子間の単純な相互作用から始まったのでしょう。