データセンターの未来: AIの力を活用して経済成長とイノベーションを推進

データセンターの未来: AIの力を活用して経済成長とイノベーションを推進

人気のSF小説で「機械知能の台頭」が描かれる場合、通常はレーザーや爆発が伴い、軽度な場合には軽い哲学的恐怖も伴います。 しかし、人工知能 (AI) と機械学習 (ML) の現実的な可能性に対する関心が高まっており、新しいアプリケーションが日々登場していることは間違いありません。

すでに世界中の何百万ものユーザーが ChatGPT、Bard、その他の AI インターフェースを使用して AI と対話しています。 インドでは、デスクワークの従業員の 75% が生産性向上のために AI ツールを使用しています。 しかし、こうしたユーザーのほとんどは、好奇心旺盛な AI アシスタントとの快適なデスクトップでのやり取りが、実は世界中の大規模なデータ センターによって実現されていることに気づいていません。

企業は、自社のビジネス戦略に合わせて AI モデルを構築、トレーニング、改良するために、データセンター内の AI クラスターに投資しています。 これらの AI コアは、AI モデルがアルゴリズムを徹底的にトレーニングするために必要な驚異的な並列処理能力を提供する GPU (グラフィックス プロセッシング ユニット) のラックで構成されています。

データセットがインポートされると、Inference AI がそのデータを分析して解釈します。 これは、犬には共通しないが猫には共通する特徴のトレーニングに基づいて、画像に猫が含まれているか子犬が含まれているかを判断するプロセスです。 生成 AI はそのデータを処理して、まったく新しい画像やテキストを作成できます。

世界中の人々、政府、企業の関心を集めているのは、このような「スマート」な処理ですが、有用な AI アルゴリズムを作成するには、トレーニング用の膨大なデータが必要であり、コストと電力を大量に消費するプロセスです。

効率的なトレーニングはここから始まります

データ センターでは通常、AI アルゴリズムのトレーニング用にデータを処理するために連携して動作する個別の AI およびコンピューティング クラスターが維持されます。 これらの電力を大量に消費する GPU によって発生する熱により、特定のラック スペースに収まる GPU の数が制限されるため、熱を減らしてリンク遅延を最小限に抑えるために物理レイアウトを最適化する必要があります。

AI クラスターには新しいデータ センター アーキテクチャが必要です。 GPU サーバーではサーバー間の接続が多く必要になりますが、電力と熱の制約によりラックあたりのサーバー数は少なくなります。 その結果、従来のデータセンターよりもラック間のケーブル配線が多くなり、銅線では 100G ~ 400G リンクに必要な距離をサポートできなくなります。

一般的に、大規模な人工知能をトレーニングする場合、必要な時間の約 30% がネットワーク遅延によって消費され、残りの 70% が計算時間に費やされると考えられています。 大規模なモデルのトレーニングには最大 1,000 万ドルのコストがかかる可能性があるため、このネットワーク時間は大きなコストとなります。 50 ナノ秒または 10 メートルのファイバーの遅延の節約でも大きな効果があり、AI クラスター内のほぼすべてのリンクは 100 メートルに制限されています。

メートル、ナノ秒、ワットの微調整

オペレーターは、コストと電力消費を最小限に抑えるために、AI クラスターで使用する光トランシーバーとケーブルを慎重に検討する必要があります。

考慮すべき重要なポイント:

• 波長分割多重化のための光マルチプレクサとデマルチプレクサの必要性を回避するために、パラレルファイバーを備えたトランシーバを使用する

• トランシーバのコスト削減は、デュプレックスファイバーケーブルの代わりにマルチファイバーケーブルを使用することで生じるわずかなコスト増加を相殺する以上の効果があります。

• シングルモードおよびマルチモード ファイバーは、最大 100 メートルのリンクをサポートできます。 マルチモード ファイバーはシングルモード ファイバーよりもわずかに高価ですが、ケーブル コストは主に MPO コネクタによって制御されるため、2 種類のマルチモード ケーブルの差は小さくなります。

• さらに、高速マルチモードトランシーバーは、シングルモードトランシーバーよりも 1 ~ 2 ワット少ない電力を消費します。 これは小さいことのように思えるかもしれませんが、AI クラスターの場合、電力を節約する機会があれば、トレーニング中や運用中に大幅な節約につながる可能性があります。

トランシーバーとアクティブ光ケーブル

多くの AI/ML クラスターは、GPU とスイッチを相互接続するために、両端に光送信機と受信機が統合された光ケーブルであるアクティブ光ケーブル (AOC) を使用します。 ただし、AOC の送信機と受信機は、同様のトランシーバーの送信機と受信機と同じである場合もありますが、通常はスクラップです。

AOC 送信機と受信機は、ほとんどの場合、ケーブルのもう一方の端に接続された特定のユニットでのみ動作する必要があります。 設置者は光ファイバーコネクタにアクセスできないため、光ファイバーコネクタの清掃や検査に必要なスキルは必要ありません。 さらに、AOC のインストールにはトランシーバーが接続されたケーブルを配線する必要があり、ブレークアウト ケーブルを使用して AOC を適切にインストールするのは特に難しいため、時間がかかり、繊細な作業になる可能性があります。

全体的に、AOC の故障率は同等のトランシーバーの 2 倍でした。 AOC に障害が発生した場合、またはネットワーク リンクをアップグレードする必要がある場合、新しい AOC をネットワーク経由でルーティングする必要があり、計算時間が消費されます。 トランシーバーの場合、光ファイバーケーブルはインフラストラクチャの一部であり、数世代にわたるデータレートを維持できます。

データセンターにおけるAIと機械学習の時代

AI/ML はすでに存在しており、人、企業、デバイスが相互にやり取りする方法において、より重要かつ統合された要素となるでしょう。 Salesforce のレポートによると、インドの IT リーダーの約 95% が、生成 AI モデルが近いうちに組織内で重要な役割を果たすようになると考えており、需要が高まっていることを示しています。

AI サービスとのインターフェイスは文字通り手のひらの上で実現できますが、それでも大規模なデータセンター インフラストラクチャとそれを駆動するすべてのパワーに依存しており、急速に変化するハイパーコネクテッドな世界では、AI を迅速かつ効率的にトレーニングできる企業が重要になります。 AI クラスターのケーブル配線を慎重に検討すると、コスト、電力、設置時間を節約できます。適切なファイバーケーブルを使用することで、組織は人工知能のメリットを最大限に活用できるようになります。 AI のトレーニングと運用を推進する高度なファイバー インフラストラクチャに今日投資すれば、明日は驚くべき成果が得られます。

<<:  ホワイトハウスのAIに関する大統領令がサイバーセキュリティリーダーに何を意味するか

>>: 

ブログ    
ブログ    

推薦する

リードし続けてください! Oracle Autonomous Databaseに会話型AI機能が追加

編集者 | Yifeng制作:51CTO テクノロジースタック(WeChat ID:blog) Or...

インテリジェント時代の到来により、インテリジェントロボットが私たちの仕事と収入を奪ってしまうのでしょうか?

インテリジェント社会の到来とともに、インテリジェントロボットは私たちの生活や仕事にますます多く登場す...

マルチエージェントコラボレーションフレームワーク:人工知能の次の方向性と課題

人間社会は複雑なマルチエージェントシステムであり、各個人は独自の目標、行動、信念、好みを持ち、共通の...

タオバオの顔面を平手打ちして電子商取引を破壊しよう!このファッション会社はアルゴリズムを使って新しい小売業をリードしている

[51CTO.com からのオリジナル記事] 私が共有したトピックは、データ駆動型の意思決定サポート...

21 世紀においてインテリジェント オートメーションは誇張されすぎているのでしょうか?

[[427549]] Analytics Insight では、21 世紀においてインテリジェント...

地球と宇宙の廃棄物問題を解決するためにAIを活用する4つの企業

人工知能は、世界中の組織において情報に基づいた意思決定を行うための重要なツールとなっています。人工知...

...

...

エンジニアの職が危機に:ボストン・ダイナミクスのロボット犬がフォードにエンジニアとして入社!

[[335339]]ボストン・ダイナミクスのロボット犬に新たなアイデンティティが誕生。フォードのエ...

「チューリップ」は、感染症予防・抑制期間中に政府情報へのアクセスを容易にするためのインテリジェントな質疑応答アシスタントを作成します。

突然の感染拡大に直面し、国民は情報の適時性、透明性、伝達効率にさらに注目するようになった。このような...

人工知能は静かに到来し、世界のテクノロジー大手はAIをめぐる戦いを始めている

人工知能は長い間、小売業から農業に至るまで、さまざまな業界で主要な技術的焦点となってきており、大手企...

農業用ドローンは熱を帯び続け、今後の開発に向けた3つの大きなトレンドが浮上

農業は国民の衣食住の問題を解決する鍵であり、国民経済の発展を促進する重要な基盤でもあります。我が国は...

百度のCTO王海鋒が百度ブレイン7.0をリリース: イノベーションを統合し障壁を下げる

火星の環境について知りたいですか?たった一文であなた自身のデジタル人物を生成したいですか?こうした最...

EleutherAIが200億パラメータのGPT風モデルを発表: GPT-3とは異なり、無料でオープン

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...