人工知能によりデータセンターの設計が再考される

人工知能によりデータセンターの設計が再考される

AI が企業で大規模に導入されるにつれて、データセンターのワークロードのより大きな割合が AI によって消費されるようになります。

AI はデータセンターに対する需要を加速させ、投資に対する新たなインセンティブを生み出すだけでなく、データセンターの持続可能性戦略や導入されるインフラストラクチャの性質にも影響を与えます。

たとえば、Tirias Research は、現状では、生成 AI データセンターのサーバー インフラストラクチャと運用コストが 2028 年までに 7,600 万ドルを超え、Amazon AWS の現在の推定年間運用コストの 2 倍以上、世界のクラウド サービス市場の 3 分の 1 に達すると予測しています。

ハードウェア コンピューティング パフォーマンスが 400 パーセント増加するという予測は、処理ワークロードが 50 倍増加するという Tirias の推定と比べると見劣りします。

高密度

シュナイダーエレクトリックの新しいホワイトペーパーによると、大規模なトレーニング クラスターと小型のエッジ推論サーバーの急増は、ラック電力密度の上昇も意味します。

「AIの新興企業、企業、コロケーションプロバイダー、インターネット大手は、これらの密度がデータセンターの物理インフラストラクチャの設計と管理に与える影響を考慮する必要がある」とホワイトペーパーには記されている。

シュナイダーエネルギー管理研究センターは、AI がエネルギー需要に与える影響について独自の予測を立てています。 AIは現在4.3GWの電力需要を占めており、2028年までに年平均成長率26%~36%で成長すると推定されています。

これにより、総需要は 13.5GW ~ 20GW となり、データセンター全体の電力需要の 2 ~ 3 倍の増加となります。 2028 年までに、AI ワークロードはデータセンターの総エネルギーの 20% を消費することになります。

シュナイダー氏は、トレーニング クラスターよりも多くの電力を消費すると予想されるものの、推論ワークロードはさまざまなラック密度で実行できると指摘しました。

「一方、AIトレーニングのワークロードは非常に高密度で実行されており、ラックあたりの電力は20〜100kWの範囲以上になっています。」

「ネットワークの需要とコストにより、これらのトレーニング ラックが統合されます。これらの非常に高電力密度のクラスターは、データ センターの電力、冷却、ラック、およびソフトウェア管理の設計に根本的な課題をもたらします。」

パワートレインの課題

シュナイダー氏は、電力、冷却、ラック、ソフトウェア管理という 4 つの主要分野における影響の可能性を概説しました。

電力面では、AI ワークロードは配電システムやスイッチギアの電力システムに課題をもたらします。

現在使用されている電圧の中には導入が非現実的であるものもあり、また配電ブロックのサイズが小さいと IT スペースが無駄になる可能性があります。ラックの温度が高くなると、故障や危険の可能性も高まります。

冷却は極めて重要であり、データセンターが半世紀以上にわたってプロフェッショナル向け高性能コンピューティングで使用されてきた液体冷却に移行するにつれて、大幅な変更が必要となる領域の 1 つになります。

「空冷は当面の間は継続されるだろうが、AI クラスターを備えたデータセンターでは、空冷から液冷への移行が望ましい、あるいは必須のソリューションになると予測している」とシュナイダー氏は述べた。

「液体冷却は、プロセッサの信頼性とパフォーマンスの向上、スペースの節約とラック密度の向上、パイプ内の水の熱慣性の向上、水使用量の削減など、空冷に比べて多くの利点があります。」

AI クラスターの場合、サーバーの奥行きが深くなり、電力要件が大きくなり、冷却がより複雑になります。

したがって、ラックにはより高い密度と耐荷重能力が必要です。

デジタルツイン

最後に、DCIM、BMS、電気設計ツールなどのソフトウェア ツールが AI クラスターの管理に重要になります。

適切に構成および実装されたソフトウェアは、データセンターのデジタル ツインを提供して、電力制約と冷却リソースのパフォーマンスを特定し、より適切なレイアウト決定に役立ちます。

ますますダイナミックな環境では、エラーの余地が少なくなり、運用上のリスクが高まります。そのため、シュナイダーは、ラック内の機器や仮想マシンを含む IT スペース全体のデジタル ツインを作成することを推奨しています。

「IT 負荷をデジタルで追加または移動することで、サポートするのに十分な電力、冷却、床荷重容量があることを確認できます。これにより、リソースの無駄を回避し、ダウンタイムの原因となる人為的エラーを最小限に抑えるための意思決定が可能になります。」

<<:  34B パラメータが GPT-4 を上回ります! 「数学的普遍モデル」MAmmoTH オープンソース: 平均精度が最大 29% 向上

>>:  サプライチェーン管理においてAIがすでに優れた成果を上げている分野

推薦する

...

機械学習の経験を人生の指針に活用する: 学習効率を最大化する方法

[[185313]]原作者 | ライムンド・マンテローラ編集チーム | Aileen、Huang W...

ガートナー: 2024 年の主要な戦略的テクノロジー トレンド

2024 年までに、AI は企業で主流となり、クラウド サービス、セキュリティ、持続可能性も影響力を...

人工知能とモノのインターネットの動的統合の探究(I)

AI と IoT の統合により、私たちの日常生活に新たな効率、自動化、インテリジェンスがもたらされ...

...

PG&E、AIを活用して山火事のリスクを軽減

2018年、パシフィック・ガス・アンド・エレクトリック(PG&E)の送電線の故障により発生し...

スマート農業におけるモノのインターネットの応用

人口は飛躍的に増加しており、農業は人口を養う問題を解決する必要がある。農業をより効率的かつ持続可能な...

...

Googleの新しい研究により、ロボット犬が速歩することが可能になった

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

掃除機はいくらかかりますか?掃除ロボットの原理とハードウェア構成の詳細な説明

時代の発展とともに、掃除ロボットは多くの家庭にとって必需品となりました。掃除ロボットは、ベッドの下を...

顔認証でお金を引き出すのは安全ですか?

広州市のある商業銀行は最近、顔認証引き出し機能を備えたATMを導入し、利用者が銀行カードを持っていな...

ビジネスアナリストにとってAIが意味するもの

[[275322]]今日では、人工知能はもはや流行語ではなく、多くの環境ビジネスアナリストやその他の...

...

2つのセッションは「AI顔認識」と生体認証データの法制化と規制の緊急の必要性に焦点を当てています。

[[385416]]現在、両セッションは活発に行われており、全国のさまざまな分野の代表者が独自の提...