人工知能によりデータセンターの設計が再考される

人工知能によりデータセンターの設計が再考される

AI が企業で大規模に導入されるにつれて、データセンターのワークロードのより大きな割合が AI によって消費されるようになります。

AI はデータセンターに対する需要を加速させ、投資に対する新たなインセンティブを生み出すだけでなく、データセンターの持続可能性戦略や導入されるインフラストラクチャの性質にも影響を与えます。

たとえば、Tirias Research は、現状では、生成 AI データセンターのサーバー インフラストラクチャと運用コストが 2028 年までに 7,600 万ドルを超え、Amazon AWS の現在の推定年間運用コストの 2 倍以上、世界のクラウド サービス市場の 3 分の 1 に達すると予測しています。

ハードウェア コンピューティング パフォーマンスが 400 パーセント増加するという予測は、処理ワークロードが 50 倍増加するという Tirias の推定と比べると見劣りします。

高密度

シュナイダーエレクトリックの新しいホワイトペーパーによると、大規模なトレーニング クラスターと小型のエッジ推論サーバーの急増は、ラック電力密度の上昇も意味します。

「AIの新興企業、企業、コロケーションプロバイダー、インターネット大手は、これらの密度がデータセンターの物理インフラストラクチャの設計と管理に与える影響を考慮する必要がある」とホワイトペーパーには記されている。

シュナイダーエネルギー管理研究センターは、AI がエネルギー需要に与える影響について独自の予測を立てています。 AIは現在4.3GWの電力需要を占めており、2028年までに年平均成長率26%~36%で成長すると推定されています。

これにより、総需要は 13.5GW ~ 20GW となり、データセンター全体の電力需要の 2 ~ 3 倍の増加となります。 2028 年までに、AI ワークロードはデータセンターの総エネルギーの 20% を消費することになります。

シュナイダー氏は、トレーニング クラスターよりも多くの電力を消費すると予想されるものの、推論ワークロードはさまざまなラック密度で実行できると指摘しました。

「一方、AIトレーニングのワークロードは非常に高密度で実行されており、ラックあたりの電力は20〜100kWの範囲以上になっています。」

「ネットワークの需要とコストにより、これらのトレーニング ラックが統合されます。これらの非常に高電力密度のクラスターは、データ センターの電力、冷却、ラック、およびソフトウェア管理の設計に根本的な課題をもたらします。」

パワートレインの課題

シュナイダー氏は、電力、冷却、ラック、ソフトウェア管理という 4 つの主要分野における影響の可能性を概説しました。

電力面では、AI ワークロードは配電システムやスイッチギアの電力システムに課題をもたらします。

現在使用されている電圧の中には導入が非現実的であるものもあり、また配電ブロックのサイズが小さいと IT スペースが無駄になる可能性があります。ラックの温度が高くなると、故障や危険の可能性も高まります。

冷却は極めて重要であり、データセンターが半世紀以上にわたってプロフェッショナル向け高性能コンピューティングで使用されてきた液体冷却に移行するにつれて、大幅な変更が必要となる領域の 1 つになります。

「空冷は当面の間は継続されるだろうが、AI クラスターを備えたデータセンターでは、空冷から液冷への移行が望ましい、あるいは必須のソリューションになると予測している」とシュナイダー氏は述べた。

「液体冷却は、プロセッサの信頼性とパフォーマンスの向上、スペースの節約とラック密度の向上、パイプ内の水の熱慣性の向上、水使用量の削減など、空冷に比べて多くの利点があります。」

AI クラスターの場合、サーバーの奥行きが深くなり、電力要件が大きくなり、冷却がより複雑になります。

したがって、ラックにはより高い密度と耐荷重能力が必要です。

デジタルツイン

最後に、DCIM、BMS、電気設計ツールなどのソフトウェア ツールが AI クラスターの管理に重要になります。

適切に構成および実装されたソフトウェアは、データセンターのデジタル ツインを提供して、電力制約と冷却リソースのパフォーマンスを特定し、より適切なレイアウト決定に役立ちます。

ますますダイナミックな環境では、エラーの余地が少なくなり、運用上のリスクが高まります。そのため、シュナイダーは、ラック内の機器や仮想マシンを含む IT スペース全体のデジタル ツインを作成することを推奨しています。

「IT 負荷をデジタルで追加または移動することで、サポートするのに十分な電力、冷却、床荷重容量があることを確認できます。これにより、リソースの無駄を回避し、ダウンタイムの原因となる人為的エラーを最小限に抑えるための意思決定が可能になります。」

<<:  34B パラメータが GPT-4 を上回ります! 「数学的普遍モデル」MAmmoTH オープンソース: 平均精度が最大 29% 向上

>>:  サプライチェーン管理においてAIがすでに優れた成果を上げている分野

ブログ    
ブログ    

推薦する

プログラマーの 90% が職を失いつつあり、Google AI によって書かれた機械学習コードはプログラマーよりも優れている!

ロボットはいくつの業界を置き換えることができるでしょうか? 初期の介護士から、後の編集者 (静かに悲...

...

たった今、アリババが重大な技術的爆弾を発表しました!

人類史上のスーパープロジェクトとは何でしょうか?ピラミッド、万里の長城、ドバイワールドアイランド、三...

ビッグモデルの「錯覚」、この記事を読んでください

ビッグモデルの「幻想」がついに体系的にレビューされました! 49 ページの記事では、幻覚の定義、分類...

...

...

人工知能とモノのインターネットの統合は、今後10年間で最大のイノベーションの機会となるかもしれない

先日終了した全国人民代表大会と中国人民政治協商会議では、「科学技術イノベーション」という言葉が頻繁に...

従来の AGV と比較した利点は何ですか? AMRロボット業界の状況は変化する

ロボット技術の知能化は、ロボット応用分野の継続的な拡大にプラスの影響を与えています。この傾向を受けて...

人工知能をうまく実装するにはどうすればよいでしょうか?

人工知能 (AI) と機械学習 (ML) は、ビジネスの流行語から、より広範な企業での導入へと移行し...

汎用人工知能 (AGI) までどれくらい遠いのでしょうか?

人工知能 (AI) は、今日のテクノロジーにおいて最も注目され、最も影響力のあるトピックの 1 つで...

Kingsoft ビデオクラウド AI + エッジコンピューティング デュアルアクセラレーションが 5G HD 時代をリード

5G時代の到来により、さまざまな業界のトラフィックが爆発的な増加を遂げており、特にビデオ業界はインタ...

...

3日でAppleの無料リストのトップに立った「ZAO」、このままでは死んでしまう

8月30日夜、「ZAO」と呼ばれるAI顔変更ソフトウェアがソーシャルメディアを席巻した。ユーザーは正...

...

...