AIがデータセンターの設計をどう変えるか

AIがデータセンターの設計をどう変えるか

AI システムへの世界的な支出は 2023 年から 2026 年の間に 2 倍になると予想されており、需要を満たすためにデータ センターの容量が急速に増加するのは明らかです。

しかし驚くべきことに、多くのデータセンター運営者が過去1年間に新規プロジェクトを中止し、投資を減速させており、ロンドンの空き容量は2022年から2023年の間に6.3%減少した。

この直感に反するトレンドの背後には何があるのでしょうか? それを説明するには、AI コンピューティングとそれをサポートするインフラストラクチャについていくつか理解する必要があります。

AIがデータセンターのインフラをどう変えるのか

データ センターはこれまで、従来のコンピューティング ワークロードを処理するために CPU 搭載ラックを中心に構築されてきました。 しかし、AI コンピューティングには GPU 搭載マシンのラックが必要であり、同等の CPU 容量よりも多くの電力を消費し、多くの熱を放散し、多くのスペースを占有します。

実際には、これは AI のコンピューティング能力には、より多くの電源接続や代替の冷却システムが必要になることが多いことを意味します。

これは組み込みインフラストラクチャであるため、データセンター コンプレックスの構造に組み込まれており、交換には非常に高額な費用がかかり、経済的に完全に不可能になることもあります。

実際には、オペレーターは、新しいデータセンターで AI と従来のコンピューティングにどれだけのスペースを割り当てるかを検討する必要があります。

この間違いを犯し、AI に過剰にコミットすると、データセンター運営者は、永久に活用されず収益性のない容量に直面することになる可能性があります。

この問題は、AI 市場がまだ初期段階にあるという事実によってさらに悪化しており、ガートナーは AI 市場が現在、誇大宣伝サイクルにおける過大な期待のピークにあると主張しています。 その結果、多くの事業者は、新しいデータセンター プロジェクトにおける AI コンピューティングの割合を早急に決定するのではなく、設計段階で躊躇することを選択します。

設計段階では総合的なアプローチを取る

しかし、事業者は、投資を遅らせたり、市場シェアや競争上の優位性を失ったりするリスクがあることを痛感しています。 しかし、データセンター インフラストラクチャの基礎の多くがリアルタイムで書き換えられていることを考えると、これは困難な作業です。

先駆者としての要求とリスクの相殺のバランスをとるために、事業者は AI コンピューティングの時代に最大限の効率性と回復力を発揮できるようにデータ センターを設計する必要があります。 これには、新しい総合的な設計アプローチが必要です。

1. より多くの関係者を巻き込む

オペレーターが AI と従来のコンピューティングをどのように区別するかに関係なく、AI コンピューティング機能を備えたデータ センター サイトは、従来の施設よりもはるかに複雑になります。 一般的に、複雑さが増すと障害点も増えます。特に AI コンピューティングには従来のコンピューティングよりも多くの要求があるためです。

したがって、サイトの存続期間中の稼働時間を保証し、コストのかかる問題のリスクを軽減するには、チームはデータ センターの計画段階でより徹底する必要があります。

特に、設計フェーズでは、プロジェクトの開始時に、より幅広いチームや専門知識からの意見を求める必要があります。 設計者は、電力と冷却に関する専門知識を求めるだけでなく、早い段階で運用、配線、セキュリティの各チームと連携して、潜在的なボトルネックや障害の原因を理解する必要があります。

2. データセンター運用にAIを統合する

オペレーターは現在、現場で AI コンピューティングを導入しているため、その能力を活用して AI を使用し、運用効率を向上させる必要があります。 人工知能はデータセンターで長い間使用されており、その技術によりワークフローを極めて高い精度と品質で実行することができます。 たとえば、AI は次のことに役立ちます。

  • 温度と湿度の監視
  • 安全システムの操作
  • 電力消費の監視と配分
  • ハードウェア障害検出と予測メンテナンス

データセンターのライフサイクルのあらゆる段階でテクノロジーを積極的に使用することで、オペレーターは運用効率と堅牢性を大幅に向上させることができます。 AI は、障害検出や予測メンテナンスなど、次世代データセンターの斬新で複雑なレイアウトを採用する際に発生する新たな課題に対処するのに最適です。

3. 誤った節約を避ける

AI は、トレーニングの実行中やエンタープライズ規模のモデルを本番環境で実行しているときなどのピーク時に、データセンターに大きな負荷をかけます。 この間、AI の計算は、電力消費、冷却要件、データ スループットに関して従来の予想を大幅に上回ることがよくあります。

最も基本的なレベルでは、これはデータセンターの基礎となる材料にかかるストレスが増大することを意味します。 これらの基礎となる材料やコンポーネントの品質が高くない場合、故障する可能性が高くなります。 AI コンピューティングは、サイト内のコンポーネントと接続の数の劇的な増加を意味するため、従来のサイトでは問題なく機能する安価で低品質の材料を使用すると、AI コンピューティングを実行するデータセンターが機能しなくなる可能性があります。

このため、事業者は、低品質のケーブルなどの劣悪な材料を購入してコストを節約することを避ける必要があります。 そうすると、これらの材料は故障する可能性が高くなり、より頻繁に交換する必要が生じるため、誤った経済性を生み出すリスクがあります。 しかし、最も問題なのは、基準を満たさない材料や部品による故障により、工場の停止や減速が頻繁に発生し、収益性に影響を及ぼすことです。

インフラの課題を解決する

AI コンピューティングのインフラストラクチャ要件が、事業者が投資を遅らせている主な理由である可能性はありますが、長期的にはそうはならないでしょう。

市場の不確実性が高まるにつれ、企業はデータセンターにおける従来のコンピューティングと AI コンピューティングの分割に関して「ゴルディロックス ゾーン」に近づくことになります。

こうした状況では、企業は学習と成熟を進めながら、Web サイトの運用において可能な限りの優位性を確保する必要があります。

つまり、最初から総合的に設計し、AI 自体を活用して現場で新たな効率性を発見し、AI コンピューティングのより大きな要求に対応できる高品質の素材に投資するということです。

<<:  IDC: 高速サーバー市場は2023年上半期に31億ドルに達し、GPUサーバーが依然として主流となる

>>:  AIによる顔の変形にはポジティブなエネルギーもある:研究によると、自分で顔を変える教育ビデオを観ると学習効率と楽しさが向上することがわかった

推薦する

ディープフェイクが流行中!誰かがこれを使ってロシアの野党の人物を真似し、ズームで欧州の国会議員を「からかう」

[[399266]]ビッグデータダイジェスト制作著者: 王 イエ最近、欧州の一部の上級議員は困惑し...

10万ドル+26日、低コスト1000億パラメータLLMが誕生

大規模言語モデル (LLM) には、デコーダーのみの構造 (GPT や LLAMA シリーズ モデル...

...

人工知能分野で最も有望な技術トップ10

2018年世界ロボット会議が北京で開催され、ロボット産業の最先端技術が披露されました。世界的なロボ...

Java プログラミング スキル - データ構造とアルゴリズム「非再帰的バイナリ検索」

[[396063]]基本的な紹介1. バイナリ検索は、順序付けられたシリーズ(数字や文字など)の検...

...

軍用ロボットは障害物を乗り越えるために車輪を使うか脚を使うかを決定できる

ロボットが環境内を移動するための最も効率的な方法の 1 つは、比較的滑らかな地形上で車輪を動かすこと...

メタバースを強化してインテリジェントなインタラクションの新たな未来を切り開く

4月23日、51CTO主催の「MetaConメタバーステクノロジーカンファレンス2022」がオンライ...

在庫 | 今年の世界の AI 事情

​​​ [[253255]]​​ 1. 2018 年の世界の AI 業界の発展は非常に爆発的でした。...

機械学習モデルの仕組み

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

ディープラーニングで知っておくべき活性化関数トップ10

みなさんこんにちは、ピーターです〜最近、reddit で非常に鮮明な mó xìng の写真を見まし...

自分のIQに挑戦してみませんか? 10 種類の機械学習アルゴリズムを理解してデータ サイエンティストになろう

データ サイエンティストになりたいですか? 十分な知識と新しいことに対する好奇心が必要です。このため...

「成熟した」大型モデルが登場したときだけでしょうか? MIT: GPT-4はコードを自己修正できるが、GPT-3.5はできない

大規模言語モデルがコード生成において並外れた能力を発揮していることは誰もが知っています。しかし、コン...

ナレッジグラフリテラシー

過去 2 年間で、Linking Open Data などのプロジェクトの本格的な開発により、セマン...

Sora のようなモデルをトレーニングしたいですか? You YangのチームOpenDiTが80%の加速を達成

2024年初頭のキング爆弾として、ソラの出現は追いつくための新たな目標を設定しました。ヴィンセントビ...