20年後、AIはデータセンターアーキテクチャを再び分裂に引きずり込むのでしょうか?

20年後、AIはデータセンターアーキテクチャを再び分裂に引きずり込むのでしょうか?

Alpha GO が人間の囲碁プレイヤーに勝利して以来、AI はビジネス界全体で最もホットな用語になりました。 AI の背後には、従来のビジネス モデルの大きな転覆と、社会の生産性の完全な解放があります。将来的には、AI によって高度な反復作業を必要とする仕事の一部がなくなる可能性は高いものの、解放された労働力によって人間の創造性は将来的に新たな高みへと押し上げられるでしょう。

しかし、AI の明るい未来は常套句となっているものの、実際の応用においては、AI 技術はまだ初期段階にあります。現段階では、人工知能はまだ非常に初期段階にあり、膨大なデータに基づいて構築されたモデルに基づいてアプリケーション内で推論と判断を完了することしかできません。限られた情報に基づいてモデルを独自に拡張して判断できる、真に自律的な人工知能や強力な人工知能との間には、まだ大きなギャップがあります。

[[258131]]

しかし、AI開発と応用の主なモデルが確認されたため、それに応じた研究方法も明らかになった。既存の技術方向性では、企業はニューラルネットワーク技術を活用し、機械学習とディープラーニングのアルゴリズムを使用してモデルを構築し、そのモデルに基づいて対応するソフトウェアとハ​​ードウェアのソリューションを開発する必要があります。 AI モデルをトレーニングする場合でも、AI モデルを使用して推論や判断を行う場合でも、強力なコンピューティング能力が不可欠です。

AIの両端の異なる画像

モデルのトレーニングに関しては、さまざまな入力データ タイプと使用される DL/ML フレームワークのため、ハードウェアには強力な並列コンピューティングと浮動小数点機能だけでなく、高い柔軟性も必要です。ただし、これら 2 つの要件はいずれも従来の x86 サーバーでは対応できないため、対応するモデル トレーニング タスクを完了するには、x86 と異種のコプロセッサが必要です。この分野で最大の勝者は間違いなくNVIDIAです。この市場における膨大な需要と大きな利益に直面して、NVIDIA はさまざまなパフォーマンスとアプリケーション環境向けのさまざまな GPU 製品を発売しただけでなく、対応するオールインワン マシンや、大規模な GPU 相互接続に高い帯域幅を提供する NVLink バスも発売しました。さらに、NVIDIA は、クラウド データ センターの仮想化環境や関連トレーニング プログラムの開発における並列コンピューティングの効率を向上させるための特殊な GRID 仮想化テクノロジと CUDA 言語も備えています。

[[258132]]

NVIDIA は製品の研究開発に多額の投資を行い、AI のモデルトレーニング市場をほぼ独占しています。しかし、NVIDIA は、完成したモデルを使用して実際の問題に関する推論や判断を行う分野ではまだ支配的な地位を獲得していません。

AI モデル (プログラム) を使用して実際の問題を推論および判断するには、対応するハードウェア システムに強力なコンピューティング機能が必要です。ただし、モデルトレーニングの複雑なシナリオとは異なり、実行する必要があるプログラムと処理されるデータの種類は比較的固定されているため、ハードウェア システムには高い柔軟性は必要ありません。対照的に、実際の AI アプリケーションのシナリオでは、ユーザーはハードウェアの調達コスト、エネルギー効率、展開効率に対してより高い要件を課すことがよくあります。

その結果、特定のアルゴリズムに特化した AI チップがますます多く製造されるようになっています。最近、資本界や市場で大きな注目を集めているHuawei HiSilicon、Cambrian、Horizo​​n Robotics、Bitmainなどの企業は、いずれもこの分野の新興企業です。製品形態の面では、ほとんどが ASIC を使用して AI アプリケーションをチップ内に固定し、コストの削減とパフォーマンスおよびエネルギー効率の向上を実現しています。もちろん、この分野に伝統的なテクノロジー企業が存在しないわけではありません。GoogleのTPU、IntelのArria 10シリーズ(FPGAチップ)、XilinxのVersalチップ(FPGA)もAI推論と判断の分野に参入しています。

AI モデルのトレーニング分野における NVIDIA の独占とは異なり、推論と判断の分野では百花繚乱の思想と激しい競争が繰り広げられています。

クラウドデータセンターにおけるAIの懸念

クラウドの概念と利点がますます多くの企業に認識されるにつれて、クラウド コンピューティング市場も急速な成長を遂げています。クラウド コンピューティングを通じて企業やユーザーに AI 機能を提供することは、AI テクノロジーの急速な発展と広範な応用の前提条件となっています。そのため、クラウドデータセンターでは、さまざまなコンピューティングカードとAIチップが容量拡張と構築の最優先事項となっています。

しかし、クラウド コンピューティング市場とアプリケーションの集中化の傾向がますます顕著になるにつれ、大規模なクラウド データ センターでは、GPU、ASIC、FPGA がますます多くなり、それぞれが異なるプログラムを実行し、異なる役割を果たし、異なる管理方法を持つデータ センターが埋め尽くされることになるでしょう。これはデータセンターにとって大きな課題です。

20 年前、CPU のパフォーマンスは今日ほど強力ではありませんでした。データの保存と管理の大きなプレッシャーに直面して、ほとんどの企業はより効率的な ASIC チップの開発を開始し、それをストレージ システムのコア機能実装ユニットにしました。当初、このアイデアは非常に良い結果を達成し、ユーザーのニーズを満たしました。しかし、時が経つにつれ、さまざまなブランド、さまざまな管理フレームワーク、さまざまな機能の ASIC が増え、ストレージ ネットワークの管理および運用コストが急騰し、最終的に苦しむのは依然として企業です。ソフトウェア定義ストレージ技術がようやくこの状況を徐々に逆転させ、企業をストレージ システム構造の深淵から救い出し始めています。

[[258133]]

データセンターは大規模に運用されているものの、CPU+GPU+FPGA+ASIC の複雑なコンピューティング アーキテクチャは依然として企業を AI インフラストラクチャの深淵に引きずり込み、データセンターが再び 20 年前のジレンマに直面することになるかもしれません。明らかに、これらすべてはまだ十分な注目を集めていません。

AI の台頭により、企業はデジタル時代の競争で大きな優位性を獲得できるようになり、人々の生活やビジネス運営の効率と方法が完全に変わると予想されるのは事実ですが、この広範な開発アイデアは、データセンター管理者の注目に値します。

現時点で、複雑かつ変化し続ける AI 市場において、統一的な管理・運用体制を構築することは非現実的であり、また、新興の AI チップ ユニコーンが、将来的なデータセンター全体の管理・運用の視点から製品を設計することを期待することも難しいでしょう。しかし、市場のルールから判断すると、新たな破壊的技術が登場する前に、この問題を解決できる人が将来の AI ハードウェア市場で真の勝者になる可能性を秘めているでしょう。

これに基づくと、最も勝者となる可能性が高いのは、依然としてインテルやグーグルのような大企業です。彼らは、データセンターのアーキテクチャを設計する能力と経験、そして業界の発展をリードする資本と力の両方を備えています。ファーウェイ傘下のハイシリコンも、ファーウェイの豊富な機器製造やシステム構築の実績を活かして、将来的に市場シェアを獲得できる可能性がある。しかし、Horizo​​n Robotics、Bitmain、Cambricon など近年登場したばかりの新興企業にとって、データセンターは依然として巨大かつ制御不能な存在であり、将来的には最終的な行き先は買収されることになるかもしれない。

もちろん、FPGA と GPU ソリューションは比較的高い柔軟性を備えているため、さまざまなデータセンター管理アーキテクチャと簡単に互換性を保つことができます。これは、最近株価が下がり続けている NVIDIA にとっては朗報かもしれません。

<<:  機械学習に関する7つの誤解

>>:  2019年の技術予測: クラウド、ビッグデータ、AI、IoT、ブロックチェーン

ブログ    

推薦する

AIとブロックチェーン:この2つの人気技術の衝突はどのような火花を散らすのでしょうか?

編集者注: ブロックチェーンと AI は、今日最もホットな 2 つの技術方向であると言えます。一般の...

...

生体認証技術丨「ブラックテクノロジー」で体のパスワードを解読

生体認証技術は、身体本来の生理学的特性や行動特性を利用して、コンピューターで個人を識別します。生理学...

テクノロジーリーダーはAIGCの長所と短所をどう評価しているか

AIGC は、現代の偉大な技術的進歩の 1 つとして広く認められています。 OpenAI の Cha...

AI時代における我が国の人工知能開発の長所と短所の分析

人工知能が人々の生活にますます大きな影響を与えるにつれて、人工知能技術は絶えず更新され、反復され、ま...

大規模モデルの観点から見た因果推論

1. 因果推論と大規模モデル近年、因果推論は研究のホットスポットとなり、多くのシナリオに適用されてき...

PyTorch から Mxnet まで、7 つの主要な Python ディープラーニング フレームワークを比較

[[184728]]最近、Data Science Stack Exchange の「ニューラル ネ...

ディープラーニングの一般化能力についての簡単な議論

1. DNNの一般化能力に関する問題この論文では主に、過剰パラメータ化されたニューラル ネットワー...

...

0.5秒、GPU不要、安定性AIと中国チームVASTオープンソース単一画像生成3DモデルTripoSR

最近、ヴィンセントのビデオモデル「Sora」が生成 AI モデルの新たな波を引き起こし、そのモデルの...

2020 年の機械学習の 5 つのトレンド

[[318500]] [51CTO.com クイック翻訳]機械学習は、多くの人にとって新しい用語かも...

K12教育におけるAIとIoT

デジタル化により市場のグローバル化のプロセスが加速しました。新しいテクノロジーは、従来のビジネスモデ...

...

...