現在進行中のデータ センターの再設計の主な側面は、AI の大規模で複雑なワークロードと、グラフィックス プロセッシング ユニット (GPU)、テンソル プロセッシング ユニット (TPU)、またはアクセラレータをさらに追加する必要性です。 これらのセルに必要な電力と発生する熱により、設計者は、何が可能で、最適なレイアウト設計なのかを再考する必要に迫られました。さらに、再設計のコストも増加しています。 その結果、Tirias Researchによると、地主は2028年までに新しいAIデータセンターインフラに年間760億ドルを費やす可能性があるという。 データセンターが直面している現在の課題: 今日の高密度GPUベースのクラスターTom's Hardware の Anton Shilov 氏は最近、AI ワークロード向け GPU の需要が非常に大きいと評価しました。
その結果、Nvidia H100 グラフィックス プロセッシング ユニット (GPU) 1 個の重量は、軽量のボウリング ボールとほぼ同じ重量になります。上記の Omdia によって計算された重量には、関連するケーブルや液体冷却は含まれていません。 シュナイダーエレクトリックのデータセンターイノベーション担当副社長スティーブン・カルリーニ氏は、AIに使用されるラックは余分な重量と熱に対応するために再設計する必要があると述べた。これは、今日の AI サーバーの密集したクラスターと、現代の AI が本格的に開発され、整然とした列が密集したホット ラン クラスターに変わる前に一般的だった、通常のサーバー ラックの「整然と分散された」列を対比したものです。 カルリーニ氏は、これらの AI クラスターはラックあたり最大 100 キロワットを消費する可能性があるが、従来の非 AI データセンター ラックではラックあたり 20 キロワットしか消費しないと述べた。シュナイダーエレクトリックのエネルギー管理研究センターの上級研究アナリストで、カルリーニ氏の同僚であるビクター・アベラー氏は、Nvidia H100 の消費電力は 1 台あたり 700 ワットであるのに対し、依然として需要が高い旧型の A100 の消費電力は 400 ワットであると指摘した。どちらのタイプの GPU も液体冷却が必要です。 各 GPU 内の 800 億個のトランジスタが密集したシリコン領域が、ほとんどの熱を発生させます。 Amazon、Googleなどの企業は、このGPUを8個搭載したAIサーバーを導入している。適切に設計されていれば、AI サーバー クラスターは、非 AI アプリケーションのサーバー使用率がはるかに低いのに対し、継続的に 100% で実行できます。 データセンターのエネルギー管理に関する長期的な視点今日の AI ワークロードをホストする主要なデータセンターの所有者は、環境への影響を軽減することに長年取り組んでおり、エネルギー管理に関しては長期的な視点を持つ傾向があります。エネルギー消費量がかつてないほど増加しているのは事実ですが、現在、主要なデータセンターの多くで再生可能エネルギーが利用されているため、所有者は他のゼロ排出の代替手段を模索しています。例えば、マイクロソフトは5月に、2028年から核融合エネルギーの新興企業ヘリオン社から少なくとも50メガワットの電力を購入する契約を締結した。 Victor Avelar は、今日のデータセンターのライフサイクル全体にわたる二酸化炭素排出量を定量化し、将来のデータセンターのレイアウトと設計の最適化に取り組んでいます。 Avelar は、データセンターの建設に使用されるコンクリートの調達、製造、注入中に排出される炭素などの組み込まれた炭素と、データセンターの運用中に生成される炭素の両方を考慮する、無料のデータセンターライフサイクル CO2 等価計算機でこれを実証しました。 コスト計算ツールは、プランナーが代替案を検討し、最適な設計基準を選択するのに役立ちます。たとえば、シュナイダーエレクトリックは電源に関する研究を実施しました。アヴェラール氏はウェストバージニア州の石炭火力発電所とフランスの原子力発電所を比較した。 スコープ別の年間総 CO2 換算排出量を見ると、ウェストバージニア州のオプションのスコープ 2 (地元の電力会社から購入した電力) 排出量が、ミックスのかなり大きな部分を占めていることがわかります。対照的に、フランスの選択肢では、スコープ 3 (新しいデータ センターのコンクリートに含まれる炭素などの間接エネルギー) の割合が大きくなります。スコープ 1 および 2 の排出量は、計画者の制御範囲内にあります。 データセンターの所有権の移行カルリーニ氏は、歴史的にデータセンターはアンカーテナントとブティックストアを備えたショッピングモールのようなモデルに従う傾向があり、所有者は地元の需要を満たす建物の運営とスペースのリース管理のみに重点を置いていると指摘した。 しかし最近では、新しいデータセンター建設の割合において、大手クラウド、メディア、SaaS プロバイダーが優位に立っています。所有者/運営者にとって、標準的なデータセンター設計は存在しません。データ センターはそれぞれ異なり、現在の環境における主な課題は、発生しているすべての変化に対応することです。 |
<<: ビジネスリーダーがAIを導入する際に指針となる5つの基本原則
[51CTO.com からのオリジナル記事] 7 年間の努力と見事な変貌。 2012年以降、6年連続...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
k-means アルゴリズムは比較的単純です。 k-means アルゴリズムでは、クラスターはクラ...
[[207302]]現代の人工知能は企業に多くの利益をもたらすと同時に、機械の認知能力も大幅に向上さ...
どの国が終末的な災害映画を撮影したとしても、人工知能はさまざまな大量破壊兵器を操作して人類と戦い、最...
数日前、Intelは生成AI用のAIチップGaudi3を含む一連の新しいCPUを発売しました。計画に...
[[408123]]最近、Google Brain チームは Vision Transformer ...
オラクルが市場調査会社ウェイクフィールド・リサーチおよびニューヨークに拠点を置く小売コンサルティング...
最近、ソートアルゴリズムを勉強していて、多くのブログを読んでいます。インターネット上のいくつかの記事...
エネルギーの状況は劇的な変化を迎えようとしており、今は機械学習と電力網を組み合わせる絶好の機会です。...
[[315132]]中国科学技術院発展戦略研究員 李秀全氏へのインタビュー第1次、第2次、第3次産業...
米道路交通安全局(NHTSA)は木曜日、自動運転車メーカーに対し、衝突基準を満たすために完全自動運転...
最近、中国サイバースペース管理局は「インターネット情報サービスアルゴリズム推奨管理規則(草案)」(以...