Amazon AWSが新しいAIチップをリリース、Nvidia H200も提供

11月29日、米国時間火曜日に開催されたReinventカンファレンスにおいて、アマゾンのクラウドコンピューティング部門AWSは、顧客がAIアプリケーションを構築・実行するための新しい人工知能（AI）チップを発表し、Nvidiaの最新チップを提供する予定であると発表した。

AWS は、コスト効率の高いさまざまなオプションを備えたクラウドサービスプロバイダーとして際立とうとしています。しかし、安価なAmazonブランドの製品だけを販売するわけではない。アマゾンのオンライン小売マーケットプレイスと同様に、アマゾンのクラウドコンピューティングサービスでも、大手人工知能チップメーカーのNvidiaのGPUなど、他のベンダーのトップ製品が提供される予定だ。

人工知能のスタートアップ企業OpenAIが昨年ChatGPTチャットボットをリリースして以来、Nvidia GPUの需要は急増している。 ChatGPT チャットボットは、情報を要約し、実際の人物に似たテキストを書く機能で人々を驚かせます。各社が同様の生成AI技術を自社製品に組み込もうと競争する中、Nvidiaではチップ不足に陥っている。

アマゾンは、自社製チップの製造と、顧客にNVIDIAの最新チップの使用を認めるという二本柱の戦略を選択した。これは、クラウドコンピューティングの最大のライバルであるマイクロソフトに対抗するのに役立つ可能性がある。マイクロソフトも今月初めに同様のアプローチを取り、同社初のAIチップ「Maia 100」を発表し、同社のAzureクラウドはNvidia H200 GPUを搭載すると発表した。

具体的には、AWS は Nvidia の最新の H200 人工知能グラフィック処理ユニットを提供する予定だと述べた。同社はまた、新しいTrainium 2人工知能チップと汎用Graviton 4プロセッサも発表した。

新しい H200 GPU は、OpenAI が最先端の大規模言語モデル GPT-4 のトレーニングに使用した H100 のアップグレード版です。大企業、新興企業、政府機関はいずれも限られたチップ供給をめぐって競争しており、それはつまり、Amazon などのクラウドサービスプロバイダーからチップをリースする需要も高いことを意味します。 Nvidia によれば、H200 は H100 のほぼ 2 倍の速度になるとのこと。

Amazon 独自の Trainium 2 チップは、OpenAI ChatGPT やその競合製品などの AI チャットボットを動かす基礎モデルを含む AI モデルのトレーニング用に設計されています。アマゾンは、スタートアップ企業のデータブリックスと、アマゾンが支援するOpenAIの競合企業アンスロピックが、新しいTrainium 2チップを使用してモデルを構築する予定であると述べた。このチップは、元のモデルの4倍の性能を持つことになる。

Graviton4 プロセッサは Arm アーキテクチャをベースとしており、Intel や AMD のチップよりも消費電力が少なくなっています。 Graviton4 は、既存の Graviton3 チップに比べて 30% のパフォーマンス向上を約束しており、AWS によれば、より高価格の出力が可能になります。インフレ率が通常よりも一貫して高く、中央銀行が金利を引き上げている状況で、AWS を引き続き使用しながらも、経済の影響を受けにくくするためにクラウド料金を下げたいと考えている組織は、Graviton への移行を検討する必要があるかもしれません。

アマゾンは、5万人以上のAWS顧客がすでにGravitonチップを使用していると述べた。

最後に、AWS は、Nvidia とのパートナーシップ強化の一環として、Arm アーキテクチャに基づく Nvidia GPU と汎用プロセッサを搭載した 16,000 個以上の Nvidia GH200 Grace Hopper スーパーチップを運用すると発表した。 Nvidia 独自の研究開発チームと AWS の顧客は、このインフラストラクチャを活用できるようになります。

AWS は、2006 年にデータのコンピューティングと保存のための EC2 および S3 サービスを開始して以来、200 を超えるクラウド製品を立ち上げてきました。もちろん、すべてのサービスが大成功を収めたわけではなく、一部のバージョンは長い間更新されておらず、いくつかのサービスは廃止されているため、Amazon はリソースを解放して再割り当てすることができます。しかし、同社はグラビトンとトレイニウムのプロジェクトへの投資を続けており、アマゾンが需要を認識していることを示唆している。

AWS は、Nvidia の H200 チップを搭載した仮想マシンインスタンスのリリース日を発表しなかったほか、Trainium 2 チップを使用した仮想マシンインスタンスのリリース日も発表しなかった。ただし、顧客は現在でも Graviton4 仮想マシンインスタンスのテストを開始でき、数か月以内に商用利用が可能になります。（小さい）

<<: 低速自動運転のためのパノラマ/魚眼カメラによる近距離認識

>>: Java から MySQL に接続するためのベストプラクティスを解読: 自分に合った方法を選択する