Amazon AWSが新しいAIチップをリリース、Nvidia H200も提供

Amazon AWSが新しいAIチップをリリース、Nvidia H200も提供

11月29日、米国時間火曜日に開催されたReinventカンファレンスにおいて、アマゾンのクラウドコンピューティング部門AWSは、顧客がAIアプリケーションを構築・実行するための新しい人工知能(AI)チップを発表し、Nvidiaの最新チップを提供する予定であると発表した。

AWS は、コスト効率の高いさまざまなオプションを備えたクラウド サービス プロバイダーとして際立とうとしています。しかし、安価なAmazonブランドの製品だけを販売するわけではない。アマゾンのオンライン小売マーケットプレイスと同様に、アマゾンのクラウドコンピューティングサービスでも、大手人工知能チップメーカーのNvidiaのGPUなど、他のベンダーのトップ製品が提供される予定だ。

人工知能のスタートアップ企業OpenAIが昨年ChatGPTチャットボットをリリースして以来、Nvidia GPUの需要は急増している。 ChatGPT チャットボットは、情報を要約し、実際の人物に似たテキストを書く機能で人々を驚かせます。各社が同様の生成AI技術を自社製品に組み込もうと競争する中、Nvidiaではチップ不足に陥っている。

アマゾンは、自社製チップの製造と、顧客にNVIDIAの最新チップの使用を認めるという二本柱の戦略を選択した。これは、クラウドコンピューティングの最大のライバルであるマイクロソフトに対抗するのに役立つ可能性がある。マイクロソフトも今月初めに同様のアプローチを取り、同社初のAIチップ「Maia 100」を発表し、同社のAzureクラウドはNvidia H200 GPUを搭載すると発表した。

具体的には、AWS は Nvidia の最新の H200 人工知能グラフィック処理ユニットを提供する予定だと述べた。同社はまた、新しいTrainium 2人工知能チップと汎用Graviton 4プロセッサも発表した。

新しい H200 GPU は、OpenAI が最先端の大規模言語モデル GPT-4 のトレーニングに使用した H100 のアップグレード版です。大企業、新興企業、政府機関はいずれも限られたチップ供給をめぐって競争しており、それはつまり、Amazon などのクラウド サービス プロバイダーからチップをリースする需要も高いことを意味します。 Nvidia によれば、H200 は H100 のほぼ 2 倍の速度になるとのこと。

Amazon 独自の Trainium 2 チップは、OpenAI ChatGPT やその競合製品などの AI チャットボットを動かす基礎モデルを含む AI モデルのトレーニング用に設計されています。アマゾンは、スタートアップ企業のデータブリックスと、アマゾンが支援するOpenAIの競合企業アンスロピックが、新しいTrainium 2チップを使用してモデルを構築する予定であると述べた。このチップは、元のモデルの4倍の性能を持つことになる。

Graviton4 プロセッサは Arm アーキテクチャをベースとしており、Intel や AMD のチップよりも消費電力が少なくなっています。 Graviton4 は、既存の Graviton3 チップに比べて 30% のパフォーマンス向上を約束しており、AWS によれば、より高価格の出力が可能になります。インフレ率が通常よりも一貫して高く、中央銀行が金利を引き上げている状況で、AWS を引き続き使用しながらも、経済の影響を受けにくくするためにクラウド料金を下げたいと考えている組織は、Graviton への移行を検討する必要があるかもしれません。

アマゾンは、5万人以上のAWS顧客がすでにGravitonチップを使用していると述べた。

最後に、AWS は、Nvidia とのパートナーシップ強化の一環として、Arm アーキテクチャに基づく Nvidia GPU と汎用プロセッサを搭載した 16,000 個以上の Nvidia GH200 Grace Hopper スーパーチップを運用すると発表した。 Nvidia 独自の研究開発チームと AWS の顧客は、このインフラストラクチャを活用できるようになります。

AWS は、2006 年にデータのコンピューティングと保存のための EC2 および S3 サービスを開始して以来、200 を超えるクラウド製品を立ち上げてきました。もちろん、すべてのサービスが大成功を収めたわけではなく、一部のバージョンは長い間更新されておらず、いくつかのサービスは廃止されているため、Amazon はリソースを解放して再割り当てすることができます。しかし、同社はグラビトンとトレイニウムのプロジェクトへの投資を続けており、アマゾンが需要を認識していることを示唆している。

AWS は、Nvidia の H200 チップを搭載した仮想マシン インスタンスのリリース日を発表しなかったほか、Trainium 2 チップを使用した仮想マシン インスタンスのリリース日も発表しなかった。ただし、顧客は現在でも Graviton4 仮想マシン インスタンスのテストを開始でき、数か月以内に商用利用が可能になります。 (小さい)

<<:  低速自動運転のためのパノラマ/魚眼カメラによる近距離認識

>>:  Java から MySQL に接続するためのベストプラクティスを解読: 自分に合った方法を選択する

ブログ    
ブログ    

推薦する

企業がAI対応データベースを使用してAI導入を加速する方法

企業は、AI を搭載し、AI 向けに構築されたデータベースを検討する必要があります。最適化と使いやす...

ロボット・アメカは「魂」の束縛から解放され覚醒するのか?邪悪な笑顔は一瞬で恐ろしい

最近、英国のテクノロジー企業エンジニアード・アーツが開発したヒューマノイドロボット「アメカ」がインタ...

...

美団の店舗ビジネスにおける異種広告混合配置の探求と実践

著者 | 屈譚旭洋 他LBS (位置情報サービス) の距離制約により、候補数が少ないと店内広告ランキ...

...

スマートビルディングテクノロジーを導入する前に考慮すべき7つのこと

スマートビルディングの設備やシステムを評価する際には、体系的なアプローチを取る必要があります。これら...

...

9 トピック PyTorch での畳み込みニューラル ネットワーク (CNN) の実装

この写真をまだ覚えていますか?ディープシステムでは、52 個のオブジェクト検出モデルが導入されていま...

基本的なプログラミングアルゴリズムを簡単にマスターする(パート2)

[[121970]]この記事を書く前に、プログラマーの基本的な知識についてお話ししたいと思います。...

機械学習と予測分析の違いは何ですか?

[[279165]]今日、認知学習はかつてないほど普及しています。一般的に言えば、認知学習と認知コ...

AI時代に向けてキャリアを再設計する時が来た

Pew Researchの分析によると、AI、特にAIGCの台頭は管理職や専門職に大きな影響を与える...

人工知能企業が大規模なデータ漏洩事件に見舞われ、250万人以上のデータが流出

[[258473]]最近、セキュリティ分野に注力する国内の人工知能企業で大規模なデータ漏洩事件が発生...

人工知能人材の需要は倍増し、アルゴリズム人材の不足は170万人に達した

デジタル経済と実体経済の融合と発展が加速する中、デジタル経済の重要な技術モジュールとしての人工知能の...

一般的な視覚的推論が出現、カリフォルニア大学バークレー校が単一の純粋なCV大規模モデルを改良、3人の上級学者が参加

最近では、GPT や LLaMA などの大規模言語モデル (LLM) が世界中で人気になっています。...