人工知能、液体冷却、そして未来のデータセンター

人工知能、液体冷却、そして未来のデータセンター

生成型人工知能 (AI) の急速な台頭は、企業が AI を導入する驚異的なスピードを浮き彫りにしています。最近のアクセンチュアのレポートによると、ビジネスリーダーの 98% が、今後 3 ~ 5 年間で AI が自社の戦略において重要な役割を果たすだろうと回答しています。マッキンゼーのアナリストは、企業の約65%が今後3年間でAIへの投資を増やす予定であることを発見しました。

この勢いはまだ始まったばかりです。 NVIDIA、AMD、Intel は、生成 AI と高性能コンピューティング (HPC) 向けに設計された新しいチップを発売します。パブリッククラウドプロバイダーや新興チップ企業も競争に加わっています。 IDCのアナリストは、AIソフトウェア、ハードウェア、サービスへの世界的な支出が今年の推定1540億ドルから3000億ドルに達すると予測している。

しかし、AI の拡張には課題が残っており、その課題の 1 つは、これらのワークロードをサポートするために必要なデータ センター インフラストラクチャです。

データセンターはますます熱くなる

AI および機械学習 (ML) で最も一般的なチップであるグラフィックス プロセッシング ユニット (GPU) は、AI アプリケーションのコンピューティング プロセスを大幅に高速化できます。 800億個のトランジスタを搭載したNVIDIAのH100 GPUなどのように、非常に強力なGPUは大量の熱を発生するため、効果的に冷却する必要があります。

従来、単一のデータセンター ラックで 10 kW に達する構成は高密度と見なされますが、空冷はこれらのサーバーを冷却するための効果的な方法であり続けます。 Uptime Institute は、30 kW を超えるラックを備えたデータ センターはほとんどないことを発見しましたが、極端な密度が出現しています。高性能コンピューティングのコモディティ化と生成型人工知能の台頭により、電力需要が増加し、従来の空冷方法に過度の負担がかかっています。

たとえば、NVIDIA の最新 GPU の最大電力消費量は、前世代のチップよりも 160% 高くなっています。ラック構成は簡単に 40 kW の範囲を超える可能性があり、従来の空冷方法では管理できません。今日のデータセンターは、これらの増加した熱負荷を効果的に管理できるように進化する必要があります。

冷却技術はますます重要になってきている

幸いなことに、ますます人気が高まっているリアドアヒートスワップやダイレクトチップ技術など、この課題に対応できるさまざまな液体冷却技術があります。また、液体冷却剤が入った容器に IT コンポーネントを沈めるという、さまざまな種類の浸漬冷却技術も登場しています。

浸漬冷却はまだ導入の初期段階にあるが、アナリストは、この技術が今後 4 年以内に主流となり、市場規模が 2021 年の 2 億 5,100 万ドルから 2027 年には 16 億ドル以上に成長すると予測している。これはデータセンターのインフラストラクチャ要件に大きな影響を与えるため、ビジネスリーダーは、データセンター運営者がこの移行をサポートするために短期的に必要な投資を行う意思があるかどうかを把握する必要があります。

液体冷却の利点と欠点

液体は熱伝導率が空気の 1,000 倍も高く、動作に必要なインフラストラクチャも少なくて済みます。空冷システムには、停電時にサーバーが冷却されない状態にならないようにするためのチラー、エアポンプ、ケーブル配線、湿度制御および濾過システム、冗長バックアップ システムなどを含む複雑な冷却インフラストラクチャが必要です。

液体冷却システムは比較的シンプルですが、現在のデータセンター インフラストラクチャに実装するための初期投資と複雑さにより、大きな課題が生じる可能性があります。セットアップは複雑になる可能性があり、専門的なメンテナンスが必要になる場合があります。さらに、サーバー設計の調整が必要になる場合があり、浸漬方法によって OEM 保証が無効になる場合があり、冷却システムの漏れによって損傷やダウンタイムが発生する可能性があります。データセンター運営者は、データセンターでの液体の使用に関する新しい規制や環境基準も考慮する必要があります。

とはいえ、液体冷却システムや浸漬冷却システムでは、バックアップや特別な床面または通路の封じ込め戦略をあまり必要としません。エネルギー消費とコストへの全体的な影響は甚大になる可能性があります。最近の調査の結果、液体冷却を導入すると施設の電力を約 20% 削減でき、データセンター全体の電力を 10% 以上削減できることがわかりました。総合使用効率 (TUE) は、高性能コンピューティング環境における液体冷却と空冷の効率を比較するために設計された新しい指標であり、液体冷却の方がエネルギー効率が 15% 以上高いことが示されています。

液体冷却への移行には、他の持続可能な利点もあります。液体冷却システムでは、空冷システムよりも必要な水が少なくなります。データ センターを変革することで、物理的フットプリントと二酸化炭素排出量を削減するための新しい考え方が可能になります。熱再利用戦略は、周辺の企業やコミュニティにエネルギーを提供することができます。その可能性は刺激的で、生成 AI 自体と同じくらい変革をもたらす可能性があります。

今知っておくべきこと

ほとんどの企業にとって、オンプレミスのデータセンターを変革するのは複雑すぎてコストもかかる可能性があります。一方、今日のパブリック クラウド インフラストラクチャの多くは、大規模な AI アプリケーションを実行するために構築されたものではなく、大量のワークロードに対するクラウド コストの上昇により、多くの組織が他の選択肢を模索するようになっています。

これらの課題と機会を考慮すると、さまざまな顧客のユースケースに対応するインフラストラクチャの経験を持つコロケーション データ センター プロバイダーが、多くの企業にとって最適なソリューションを提供できる可能性があります。この分野のリーダーは、組織の変革を導く専門知識とサポートを提供することができます。また、当社はデータセンターの進化を推進する多くのハードウェア OEM および液体冷却サプライヤーと重要な関係を確立し、お客様の独自のニーズを満たす多様なオプションを提供しています。

組織は、自社のデータ センター運営者がすでに計画を立てているかどうか、そしておそらくもっと重要な点として、次世代のデータ センターの進化を可能にするために必要なテクノロジをインストールするための物理的な容量や適切なテクノロジを備えているかどうかを今すぐ把握する必要があります。データ センターはすでに、要件に最適なサーバーにワークロードを移動するという複雑な課題に直面しています。 AI と高性能コンピューティングのワークロードの需要が高まり続けるにつれて、根本的に異なる冷却システムを追加するというさらなる課題が、これらの障害をさらに複雑にすることは間違いありません。

現在これらの戦略に投資しているデータセンター事業者は、顧客がこれらの課題に正面から取り組むのを支援するのに有利な立場に立つことになります。人工知能はデータセンターを含むあらゆるものを変えています。今こそこの会話を始める時です。

<<:  ToTを超えて、ETHチューリッヒは新世代のマインドマップGoTをリリース:推論品質は62%向上し、コストは31%削減

>>:  Li YunlongとSheldonはプロのチャット仲間です!ロールプレイングシステム「ChatHaruhi」は人気があり、32の中国語と外国語のキャラクターをサポートし、54,000の対話データをオープンソース化しています。

ブログ    
ブログ    

推薦する

Tencent IEG オープンソース AI SDK: PUBG および MOBA ゲームの自動テスト

SDK はゲームを自動的にプレイすることもできますか?この SDK はちょっと「クール」です。 [[...

Google UFOGen は、非常に高速なサンプリング速度で高品質の画像を生成できます。

過去1年間、Stable Diffusionに代表される一連の文化イメージ拡散モデルは、ビジュアル創...

Apple、たった1文で写真をレタッチできる新AIモデルMGIEを披露

2月8日、マイクロソフトの急速な発展と比較すると、AppleのAI分野における展開ははるかに控えめで...

2017年の人工知能の挫折

今年、AIプロジェクトのAlphGoとLibratusが、それぞれ囲碁とテキサスホールデムポーカーで...

...

5G+AI: 未来に影響を与える新たなトレンド

7月9日、2020年世界人工知能会議クラウドサミットが正式に開幕しました。 AI という SF 用語...

DDLは第一の生産力です。科学的な説明があります。ネットユーザー:ビッグモデルで試してみましょう

年末です。大学生は期末試験の週で、労働者は KPI の達成に急いでいます。期限のない年末(DDL)は...

2020年、全国の産業用ロボット出荷台数は前年比19.1%増加した。

工業情報化部が発表したデータによると、2020年1月から12月まで、全国の産業用ロボットの生産台数は...

PyGWalkerを使用して表形式のデータを視覚化および分析する

導入Jupyter Notebook に大量のデータがあり、それを分析して視覚化したいとします。 P...

企業における機械学習: 次の 1 兆ドル規模の成長はどこから来るのでしょうか?

ハリー・ポッターの世界では、組分け帽子は生徒の行動履歴、好み、性格に関するデータを取得し、そのデータ...

...

「人工知能」の発展を合理的に扱う

現在の人工知能の発展は、主にディープラーニングに代表される機械学習技術の恩恵を受けています。ディープ...

ユニバーサルで説明可能なAIコンピューティングハードウェア設計は、EDAにおける次の革命的な技術となるでしょう。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

業界丨2020年のインテリジェントウェーブを理解するには、BaiduとGoogleのAIの足跡から始める

2020年が過ぎました。順調で平和な生活を送ったか、非常に困難な生活を送ったかにかかわらず、私たちは...