今日、私たちはコンピューティングにおける大きなイノベーションの時代を目の当たりにしており、世界中で 5G が急速に導入され、データ集約型のワークロードと生成型人工知能の画期的な発展が絡み合っています。新しいタイプのアクセラレーション、斬新なシステム アーキテクチャ、そして増え続けるデータ消費の需要を満たす新しい方法を革新し、探求するために、コンピューティング エコシステム全体にわたる柔軟性の必要性がかつてないほど高まっています。半導体設計コストの上昇と世界的なエネルギー予算の引き締めというさらなる課題により、私たちは世界のコンピューティング インフラストラクチャの変革の真っ只中にいることになります。 5Gと人工知能の組み合わせは大きなチャンスを秘めています。 5G テクノロジーは、AI アプリケーションが大量のデータを収集、送信、処理するために必要な、高スループット、低レイテンシ、信頼性の高い接続を提供できます。その代わりに、AI は 5G ネットワークがリソースを動的に割り当て、トラフィックを管理し、異常を検出するのに役立ちます。人工知能は 5G を使用して、ユーザーやデバイスにパーソナライズされ、コンテキストに応じたインテリジェント サービスを提供することもできます。これら 2 つのテクノロジーを組み合わせることで、私たちのコミュニケーション、仕事、生活のあり方は真に変わります。 しかし、どんな話にも二つの側面がある。 5G と AI は、どちらも大量のデータを生成するため、柔軟かつタイムリーでコスト効率が高く、エネルギー効率の高い方法で保存、処理、分析する必要があるため、データ センターの運営者と顧客にとって大きな課題となります。この機会を最大限に活用するには、データ センター アーキテクトは、コンピューティングの設計、構築、展開方法に関する革新的なアプローチを見つける必要があります。 5G 仮想 RAN: エッジ データ センターを実現する重要な要因5G をサポートする重要なイノベーションの 1 つは、仮想化無線アクセス ネットワーク (vRAN) です。 vRAN は、人気が高まっている比較的新しい導入モデルです。セルラー ベースバンド処理機能をハードウェアから分離し、汎用サーバー上でソフトウェアとして実行します。 これにより、5G ネットワークの展開と管理の際の柔軟性、拡張性、効率性が向上します。仮想化された 5G インフラストラクチャにおける規模の経済は、さまざまな方法で実現できます。まず、同じコンピューティング インフラストラクチャを組み合わせて 5G 接続とエッジ アプリケーションに対応することで、接続とデータ処理がソースに近づきます。次に、ソフトウェア駆動型のクラウド ネイティブ インフラストラクチャにより、動的なリソース割り当て、負荷分散、構成の高速化、ネットワーク管理の自動化が可能になり、運用効率に大きな影響を与えます。 3 番目に、vRAN はファイバー接続を利用して複数の基地局を 1 つの集中型サーバー プールにまとめることができるため、5G インフラストラクチャのコストと複雑さが軽減されます。 vRAN は、コンピューティング能力をエンドユーザーとそのデバイスに近づけることで、エッジ コンピューティングを促進し、レイテンシを削減してパフォーマンスを向上させることができます。 しかし、vRAN の潜在能力を最大限に引き出すには、非常に高い計算効率を維持しながら、高スループット、低レイテンシ、確定的な無線信号処理をサポートできるコンピューティング プラットフォームが必要です。また、サーバー、無線、エンドデバイス間の大量のデータトラフィックを処理するには高速ネットワークインターフェースも必要となり、変革的なアプローチの必要性がさらに強調されます。 今日の 5G データセンター: CPU と DPU従来の汎用 CPU では、5G vRAN スタックの複雑で多様なワークロードを処理できません。オペレーティング システム、ネットワーク層、アプリケーション、プロトコルなど、すべてのネットワーク機能をソフトウェアに仮想化することで、データ センター内のトラフィック量が大幅に増加し、CPU 効率が低下しました。この課題を解決するには、CPU からネットワーク タスクをオフロードしてパフォーマンスと効率を向上できる補完的な専用アクセラレーション デバイスが必要です。今日の 5G データセンターで最も人気のある加速デバイスの 1 つは、データ処理ユニット (DPU) です。 AIとソフトウェアが5Gデータセンターの変革を推進する方法 5G インフラにおける人工知能 (出典: Arm) DPU は、パケット処理、暗号化/復号化、圧縮/解凍、負荷分散、ファイアウォール、ルーティング/スイッチング、サービス品質 (QoS) などのネットワーク機能を実行できる組み込みプロセッサまたはプログラマブル ロジックを備えたネットワーク カードです。 DPU は、ネットワーク関連のタスクの一部を引き継ぐことでサーバーの CPU 使用率と電力消費を削減し、さまざまなシナリオに応じてネットワーク機能を構成および最適化する際の柔軟性とプログラマビリティを実現します。 異機種コンピューティングにより、将来のワークロードに対する柔軟性が高まります今日の 5G データ センターではすでに CPU と DPU を活用して vRAN やその他の 5G アプリケーションをサポートしていますが、次世代の 5G データ センターでは、ハードウェア アーキテクチャ、ソフトウェア プラットフォーム、サービス モデルにおいてより高い柔軟性が求められます。たとえば、データ センターでは、複雑な数学、グラフィックス、ビデオ、またはその他の大規模なデータ セットを処理するために GPU を使用し、機械学習のワークロードには GPU または TPU を使用し、よりカスタムなワークロードを解決するためにプログラマブル ロジックに FPGA を使用する場合があります。 このタイプの異種コンピューティングは、RAN サービス、クラウド コンピューティング機能、および人工知能アプリケーション サービスをエンド ユーザーの近くで提供できる統合インテリジェント エッジ データ センターのパフォーマンス、効率、およびスケーラビリティの向上に役立ちます。最終的には、より専門的なコンピューティングをデバイスやエンドユーザーに近づけることで、レイテンシを改善し、5G が約束する次世代のユースケースの多くを実現できるようになります。 ソフトバンク、Nvidia、Armは最近、AIと高性能コンピューティング(HPC)向けの世界最先端のデータセンターを構築するための提携を発表した。これは、特殊な処理機能を備えた、現在行われているこのタイプのデータ センター変革の最も優れた例の 1 つです。この提携により、ソフトバンクが日本全国の新しい分散型AIデータセンターに展開する予定のNvidia GH200 Grace Hopperスーパーチップをベースにした、生成型AIと5G/6Gアプリケーション向けの画期的なプラットフォームが実現すると期待されています。新しいデータセンターは、これまで使用されていたものよりも均等に分散され、人工知能や 5G のワークロードを処理できます。これにより、低レイテンシでピーク容量をより適切に運用できるようになり、全体的なエネルギーコストが大幅に削減されます。 ソフトバンクは、NVIDIA と連携してデータセンターを構築し、世界中で生成 AI アプリケーションとサービスを迅速に展開するための道を開きます。このデータセンターは、マルチテナントの汎用サーバー プラットフォーム上で生成 AI とワイヤレス アプリケーションをホストできるため、エネルギー効率が向上し、コストが削減され、より多くのサービスが提供されます。 このようなイノベーションは、5G と AI にとって重要な転換点となります。データ センター全体は、特殊な処理によって実現される目標パフォーマンスを中心に構築されており、オペレーターは vRAN の可能性を実現するために必要な運用効率を得ることができます。さらに、特殊な処理により、オペレーターは人工知能や 3D ビデオ会議などの計算集約型サービスを、データやユーザーに近い同じ物理的な場所で共同ホストできるようになります。これは、柔軟性、低レイテンシ、パフォーマンス効率によってコンピューティング リソースとそれに必要な資本コストおよびエネルギー コストが最適に活用され、データ センター全体の TCO (総所有コスト) が変化するため、非常に重要です。 次世代の 5G データ センターを見据えると、柔軟で効率的なコンピューティング プラットフォームの必要性が極めて重要になります。 5G と人工知能によって推進されるデータセンター サービスの需要の高まりに対応するため、次世代のデータセンターは、新しいテクノロジーとワークロードに適応し、企業と消費者が求めるパフォーマンスと効率性を実現する能力によって定義されることになります。したがって、当社は今後も、効率的で特殊なチップをこの分野におけるイノベーションと変革の基盤として捉えていきます。 |
<<: IT の現状レポート: IT リーダーの 90% が、生成型 AI がまもなく主流になると考えています
>>: ICML 2023 優秀論文賞発表!北京大学の卒業生が作品で賞を受賞、3人の中国人作家が作品に参加、DeepMindとAppleも選出
建設業界は、革新、破壊、あるいは何と呼ぼうと、何らかの変化が起こりやすい時期にあります。以前にも書い...
脅威の攻撃者が戦術や手法を進化させ続けるにつれて(たとえば、暗号化されたトラフィック内に攻撃を隠すな...
[[270417]]ニール・ガーシェンフェルド(出典:MIT産業連携プログラム) 「世界中のすべて...
中国移動の公式ニュースによると、2月3日と2月4日、武漢協和病院と同済天佑病院はそれぞれ、中国移動と...
現在、カスタマーサービス業界は質的な変化を遂げており、AIインテリジェントテクノロジーがカスタマーサ...
ディープマインドの主任研究科学者であり、ロンドン大学ユニバーシティ・カレッジのコンピューターサイエン...
[[410176]]予測時間を可能な限り延長することが時系列予測の中心的な課題であり、エネルギー、輸...
[[432431]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
2019年のノーベル賞受賞者のリストは、今年10月7日から発表されます。発表日が近づくにつれ、学界...
人類文明の継続的な発展に伴い、社会の分業は大きな変化を遂げ、さまざまな産業の置き換えと反復において、...
CISO は、日常的なタスクを排除し、従業員がより価値の高い仕事に集中できるようにするために、ロボ...
[[270507]]画像: AMP Robotics の特注マシンは、1 分間に 80 個のアイテム...