シングルテナント AI ファクトリーは最新のデータセンタートレンドでしょうか?

シングルテナント AI ファクトリーは最新のデータセンタートレンドでしょうか?

コロケーション データ センターの標準的な構造は、数十または数百の顧客が同時に異なるアプリケーションを実行することです。しかし、Nvidia は、アプリケーションを実行し、それを使用する顧客が 1 社のみという新しいタイプのデータ センターについての洞察を提供しています。

「AI工場」の出現

これは新しいタイプのデータセンターであり、多くのアプリケーションが実行され、多くの異なるテナントが同じインフラストラクチャを使用していた過去のデータセンターとは異なります。」

これらの新しいデータ センターは、少数のアプリケーションをホストし、基本的に単一のテナントによって使用されます。テナントは、データを処理し、モデルをトレーニングし、トークンを生成して AI を生成します。私たちはこれらの新しいデータセンターを「AI ファクトリー」と呼んでいます。

AI 工場があらゆるところに出現しています。私の推測では、ほぼすべての主要地域に AI クラウドが存在し、すべての主要国に独自の AI クラウドが存在することは間違いありません。つまり、私たちは今、コンピューティングにおけるこの転換点、変革の始まりにいるのです。

この傾向は現在、インド、スウェーデン、日本、フランスで起こっています。 AI が真に効果的であるためには、言語および文化の標準に準拠する必要があります。日本のAIニーズはスウェーデンのそれとは異なります。 AI データセンターやシングルテナント AI ファクトリーが各国に限定されるのはそのためです。

AI導入規模の評価

Amazon や Google などの大手クラウド サービス プロバイダーや、Equinix などの大手コロケーション プロバイダーのデータ センターは、サッカー場ほどの大きさの巨大なものが多いです。 Nvidia の Hopper プロセッサの膨大な電力消費を考えると、これらの AI 工場はマクドナルドとほぼ同じ大きさになります。

一般的なデータ センターのラック電力予算は 6kW ~ 8kW の範囲ですが、LLM の実行に最適化されたサーバーを導入する場合、1 台のサーバーで約 11kW の電力が消費され、これは汎用サーバー約 14 台の平均電力消費量に相当します。

この場合、一般的なデータセンターでは、DGXH100 などの GPU サーバーを限られた数しか実行できません。1MW のデータセンターの場合は、約 50 台の DGXH100 サーバーを導入できます。多数の同時ユーザーに AI を大規模に展開するには、このようなサーバーの大規模なクラスターが必要になります。つまり、一般的なデータ センターでは、限られた数の顧客、おそらく 1 人の顧客のみに対応できます。

AIを活用した工場の未来

AI ファクトリーのような単一目的の GPU 環境の場合、最もコスト効率の高い設計は、高密度と液体冷却向けに設計された専用のデータセンターを、AI エンタープライズに最適な場所に設置することです。

AI クラスターの電力消費は、多数のサーバーを備えたデータセンターの制限要因となり、これらのデータセンターの一部は AI 専用となる可能性があります。 AI を取り巻く安全性と規制の枠組みもこの傾向を推進する可能性があります。生成 AI と汎用 AI の開発により、セキュリティとコンプライアンスの問題が発生するため、企業はそのようなワークロードを高度に安全な専用施設から実行することを決定する場合があります。

AI工場とデータセンター

AI の電力密度は従来のデータ センターの 5 ~ 10 倍であるため、AI ファクトリーは、100 万平方フィートを超える従来のデータ センターほど大きくはなりません。

従来のデータセンターと AI ファクトリーのもう 1 つの違いは、その場所です。巨大なデータセンターは再生可能エネルギー源に隣接する遠隔地に建設されることが多いですが、AI 工場は市内中心部や大都市圏、十分な電力が利用可能な既存の施設内に建設できます。

現在、十分に活用されていないオフィスや小売スペースが大量に存在しています。そこで非常に魅力的なのは、廃墟となった建物や十分に活用されていない都市空間、あるいは人里離れた場所にある古い倉庫の一部で、すでに電源が通っていて、AI 機器や液体冷却装置を設置して電源を入れるだけで使える場所になります。

データセンター業界の将来を予測することは不可能ですが、AI の急速な成長は、デジタル インフラストラクチャ オペレーターが増大する需要に応えようと躍起になるにつれて、AI ファクトリーがすぐに必要になる可能性があることを示唆しています。

<<:  GPT-4 の時代は終わったのでしょうか?世界中のネットユーザーがクロード3を試し衝撃を受けた

>>:  Claude3 が GPT4 に教訓を与えました!オープンAI最強の対戦相手の深夜爆弾、全貌解析付き!

ブログ    
ブログ    

推薦する

...

人工知能に関する3カ年国家戦略が発表されました。8つの主要分野が注目されます。

昨日、工業情報化部が突然、人工知能に関するもう一つの重要な赤字文書を発行しました!文書では、2018...

生体認証に関する最大の誤解は何ですか?

セキュリティ分野で広く使用されている技術の中で、生体認証技術のプライバシー問題が最も懸念されています...

人工知能は人類の終焉をもたらすのでしょうか? AIに対する5つの実存的脅威

私たちは現在、この地球上で最も知的な種であり、他のすべての生命は生き続けるために私たちの善意に依存し...

ByteDanceは、従来の4倍の速度を誇る高性能トレーニングおよび推論エンジンLightSeqを発表した。

Transformer モデルは、Google チームが 2017 年に発表した論文「Attent...

私の国の医薬品人工知能市場は急速な成長期に入っている

3月23日から26日まで、2021年重大健康産業(重慶)博覧会と第6回双品会が重慶で開催されました。...

MITテクノロジーレビューが2019年の世界トップ10の画期的テクノロジーを発表

MITテクノロジーレビューは2001年以来、毎年その年の「トップ10ブレークスルーテクノロジー」を選...

...

2020 年に役に立つ機械学習ツール

TL;DR — 優れた機械学習アプリケーションを構築することは、ミシュランの星を獲得した料理を作るよ...

Google が「シャンプー」という 2 次最適化アルゴリズムを提案、Transformer のトレーニング時間を 40% 削減

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

長いテキストの復号化畳み込みニューラルネットワークアーキテクチャ

導入まず正直に言うと、しばらくの間、私はディープラーニングをあまり理解できませんでした。関連する研究...

スタンフォード大学の研究:スマートフォンの録画で人が酔っているかどうかを98%の精度で識別できる

11月9日、スタンフォード大学の最近の研究で、スマートフォンは音声パターンから人が酔っているかどうか...

クラゲのように見える7cmのガジェットは、実際にはチーターに似た最速のソフトロボットです

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...