人工知能によりデータセンターの設計が再考される

人工知能によりデータセンターの設計が再考される

AI が企業で大規模に導入されるにつれて、データセンターのワークロードのより大きな割合が AI によって消費されるようになります。

AI はデータセンターに対する需要を加速させ、投資に対する新たなインセンティブを生み出すだけでなく、データセンターの持続可能性戦略や導入されるインフラストラクチャの性質にも影響を与えます。

たとえば、Tirias Research は、現状では、生成 AI データセンターのサーバー インフラストラクチャと運用コストが 2028 年までに 7,600 万ドルを超え、Amazon AWS の現在の推定年間運用コストの 2 倍以上、世界のクラウド サービス市場の 3 分の 1 に達すると予測しています。

ハードウェア コンピューティング パフォーマンスが 400 パーセント増加するという予測は、処理ワークロードが 50 倍増加するという Tirias の推定と比べると見劣りします。

高密度

シュナイダーエレクトリックの新しいホワイトペーパーによると、大規模なトレーニング クラスターと小型のエッジ推論サーバーの急増は、ラック電力密度の上昇も意味します。

「AIの新興企業、企業、コロケーションプロバイダー、インターネット大手は、これらの密度がデータセンターの物理インフラストラクチャの設計と管理に与える影響を考慮する必要がある」とホワイトペーパーには記されている。

シュナイダーエネルギー管理研究センターは、AI がエネルギー需要に与える影響について独自の予測を立てています。 AIは現在4.3GWの電力需要を占めており、2028年までに年平均成長率26%~36%で成長すると推定されています。

これにより、総需要は 13.5GW ~ 20GW となり、データセンター全体の電力需要の 2 ~ 3 倍の増加となります。 2028 年までに、AI ワークロードはデータセンターの総エネルギーの 20% を消費することになります。

シュナイダー氏は、トレーニング クラスターよりも多くの電力を消費すると予想されるものの、推論ワークロードはさまざまなラック密度で実行できると指摘しました。

「一方、AIトレーニングのワークロードは非常に高密度で実行されており、ラックあたりの電力は20〜100kWの範囲以上になっています。」

「ネットワークの需要とコストにより、これらのトレーニング ラックが統合されます。これらの非常に高電力密度のクラスターは、データ センターの電力、冷却、ラック、およびソフトウェア管理の設計に根本的な課題をもたらします。」

パワートレインの課題

シュナイダー氏は、電力、冷却、ラック、ソフトウェア管理という 4 つの主要分野における影響の可能性を概説しました。

電力面では、AI ワークロードは配電システムやスイッチギアの電力システムに課題をもたらします。

現在使用されている電圧の中には導入が非現実的であるものもあり、また配電ブロックのサイズが小さいと IT スペースが無駄になる可能性があります。ラックの温度が高くなると、故障や危険の可能性も高まります。

冷却は極めて重要であり、データセンターが半世紀以上にわたってプロフェッショナル向け高性能コンピューティングで使用されてきた液体冷却に移行するにつれて、大幅な変更が必要となる領域の 1 つになります。

「空冷は当面の間は継続されるだろうが、AI クラスターを備えたデータセンターでは、空冷から液冷への移行が望ましい、あるいは必須のソリューションになると予測している」とシュナイダー氏は述べた。

「液体冷却は、プロセッサの信頼性とパフォーマンスの向上、スペースの節約とラック密度の向上、パイプ内の水の熱慣性の向上、水使用量の削減など、空冷に比べて多くの利点があります。」

AI クラスターの場合、サーバーの奥行きが深くなり、電力要件が大きくなり、冷却がより複雑になります。

したがって、ラックにはより高い密度と耐荷重能力が必要です。

デジタルツイン

最後に、DCIM、BMS、電気設計ツールなどのソフトウェア ツールが AI クラスターの管理に重要になります。

適切に構成および実装されたソフトウェアは、データセンターのデジタル ツインを提供して、電力制約と冷却リソースのパフォーマンスを特定し、より適切なレイアウト決定に役立ちます。

ますますダイナミックな環境では、エラーの余地が少なくなり、運用上のリスクが高まります。そのため、シュナイダーは、ラック内の機器や仮想マシンを含む IT スペース全体のデジタル ツインを作成することを推奨しています。

「IT 負荷をデジタルで追加または移動することで、サポートするのに十分な電力、冷却、床荷重容量があることを確認できます。これにより、リソースの無駄を回避し、ダウンタイムの原因となる人為的エラーを最小限に抑えるための意思決定が可能になります。」

<<:  34B パラメータが GPT-4 を上回ります! 「数学的普遍モデル」MAmmoTH オープンソース: 平均精度が最大 29% 向上

>>:  サプライチェーン管理においてAIがすでに優れた成果を上げている分野

推薦する

AIエンタープライズアプリケーションは成熟しつつある

デロイトは最新の「企業における AI の現状」レポートで、AI 実践の成功を特徴付ける共通点と、達成...

3分で顔認識を始めましょう

顔認識は、AI 研究が世界にもたらした数多くの驚異のうちの 1 つです。これは多くの技術者にとって興...

...

あなたはまだ顔認識精度指標に騙されていませんか?

導入ハードウェアの性能向上と顔データ量の増加に伴い、顔認識はますます成熟し、商業的な用途もますます増...

企業がAIをビジネスに統合する際の課題を克服する方法

調査データによると、AI 対応テクノロジーを導入して活用する準備が完全に整っている企業は世界中でわず...

データガバナンスとビッグモデル統合の実践

コスト削減と効率向上の観点から、機械学習チームの構成を例に挙げ、Dipu TechnologyのDe...

...

ビジネスニーズに基づいて AI ソリューションを選択するにはどうすればよいでしょうか?

現在、企業では人工知能(AI)をますます幅広く活用しており、自動化する傾向もあります。既存のデータ開...

...

考えてみてください。連合学習は大規模な言語モデルをトレーニングできるのでしょうか?

1. 概要大規模言語モデル (LLM) の急速な発展に伴い、LLM が人工知能業界の発展に与える影...

AIは寒さに晒されているのか?スタンフォード大学の年次AIレポートが秘密を明らかにする

2019年へのカウントダウンが始まり、今年はAIの発展に関する議論がたびたび取り上げられています。 ...

人工知能は匿名のチェスプレイヤーの身元を確認でき、プライバシーの脅威となる

人工知能技術はすでに音声や手書きを通じて個人の身元を確認することができます。現在、人工知能アルゴリズ...

...

梅雨から台風シーズンまで、ドローンが再び活躍

最近、静かに梅雨の季節が去り、猛烈な台風の季節が勢いよくやって来ています。 [[336317]] 8...

疫病流行中に物流の円滑化に全力を尽くし、無人配送市場が活況を呈している

最近、国務院は貨物物流の円滑な流れを確保するために関連業務を展開するよう通知し、各地域と関連部門に主...