11月29日、米国時間火曜日に開催されたReinventカンファレンスにおいて、アマゾンのクラウドコンピューティング部門AWSは、顧客がAIアプリケーションを構築・実行するための新しい人工知能(AI)チップを発表し、Nvidiaの最新チップを提供する予定であると発表した。 AWS は、コスト効率の高いさまざまなオプションを備えたクラウド サービス プロバイダーとして際立とうとしています。しかし、安価なAmazonブランドの製品だけを販売するわけではない。アマゾンのオンライン小売マーケットプレイスと同様に、アマゾンのクラウドコンピューティングサービスでも、大手人工知能チップメーカーのNvidiaのGPUなど、他のベンダーのトップ製品が提供される予定だ。 人工知能のスタートアップ企業OpenAIが昨年ChatGPTチャットボットをリリースして以来、Nvidia GPUの需要は急増している。 ChatGPT チャットボットは、情報を要約し、実際の人物に似たテキストを書く機能で人々を驚かせます。各社が同様の生成AI技術を自社製品に組み込もうと競争する中、Nvidiaではチップ不足に陥っている。 アマゾンは、自社製チップの製造と、顧客にNVIDIAの最新チップの使用を認めるという二本柱の戦略を選択した。これは、クラウドコンピューティングの最大のライバルであるマイクロソフトに対抗するのに役立つ可能性がある。マイクロソフトも今月初めに同様のアプローチを取り、同社初のAIチップ「Maia 100」を発表し、同社のAzureクラウドはNvidia H200 GPUを搭載すると発表した。 具体的には、AWS は Nvidia の最新の H200 人工知能グラフィック処理ユニットを提供する予定だと述べた。同社はまた、新しいTrainium 2人工知能チップと汎用Graviton 4プロセッサも発表した。 新しい H200 GPU は、OpenAI が最先端の大規模言語モデル GPT-4 のトレーニングに使用した H100 のアップグレード版です。大企業、新興企業、政府機関はいずれも限られたチップ供給をめぐって競争しており、それはつまり、Amazon などのクラウド サービス プロバイダーからチップをリースする需要も高いことを意味します。 Nvidia によれば、H200 は H100 のほぼ 2 倍の速度になるとのこと。 Amazon 独自の Trainium 2 チップは、OpenAI ChatGPT やその競合製品などの AI チャットボットを動かす基礎モデルを含む AI モデルのトレーニング用に設計されています。アマゾンは、スタートアップ企業のデータブリックスと、アマゾンが支援するOpenAIの競合企業アンスロピックが、新しいTrainium 2チップを使用してモデルを構築する予定であると述べた。このチップは、元のモデルの4倍の性能を持つことになる。 Graviton4 プロセッサは Arm アーキテクチャをベースとしており、Intel や AMD のチップよりも消費電力が少なくなっています。 Graviton4 は、既存の Graviton3 チップに比べて 30% のパフォーマンス向上を約束しており、AWS によれば、より高価格の出力が可能になります。インフレ率が通常よりも一貫して高く、中央銀行が金利を引き上げている状況で、AWS を引き続き使用しながらも、経済の影響を受けにくくするためにクラウド料金を下げたいと考えている組織は、Graviton への移行を検討する必要があるかもしれません。 アマゾンは、5万人以上のAWS顧客がすでにGravitonチップを使用していると述べた。 最後に、AWS は、Nvidia とのパートナーシップ強化の一環として、Arm アーキテクチャに基づく Nvidia GPU と汎用プロセッサを搭載した 16,000 個以上の Nvidia GH200 Grace Hopper スーパーチップを運用すると発表した。 Nvidia 独自の研究開発チームと AWS の顧客は、このインフラストラクチャを活用できるようになります。 AWS は、2006 年にデータのコンピューティングと保存のための EC2 および S3 サービスを開始して以来、200 を超えるクラウド製品を立ち上げてきました。もちろん、すべてのサービスが大成功を収めたわけではなく、一部のバージョンは長い間更新されておらず、いくつかのサービスは廃止されているため、Amazon はリソースを解放して再割り当てすることができます。しかし、同社はグラビトンとトレイニウムのプロジェクトへの投資を続けており、アマゾンが需要を認識していることを示唆している。 AWS は、Nvidia の H200 チップを搭載した仮想マシン インスタンスのリリース日を発表しなかったほか、Trainium 2 チップを使用した仮想マシン インスタンスのリリース日も発表しなかった。ただし、顧客は現在でも Graviton4 仮想マシン インスタンスのテストを開始でき、数か月以内に商用利用が可能になります。 (小さい) |
<<: 低速自動運転のためのパノラマ/魚眼カメラによる近距離認識
>>: Java から MySQL に接続するためのベストプラクティスを解読: 自分に合った方法を選択する
5GとAIは未解決の問題に解決策を見つけることができる5G はエッジの究極の未来です。 5G は、普...
10 年前、ほとんどの人は、今日では現金やカードを持ち歩かずに携帯電話だけを持って街を歩き回り、買...
近い将来、人間はロボットにやり方を一度見せるだけで、タスクの実行方法を教えることができるようになるか...
海外メディアの報道によると、人工知能によるニュースのパーソナライゼーションの時代では、従来の報道機関...
NLP は人工知能を刺激的な新時代へと導きます。現在、人工知能分野で最もホットな話題は、大規模モデ...
[[393944]]この記事はWeChatの公開アカウント「Beta Learns JAVA」から転...
[[430158]]コールセンターは1960年代から存在しており、NASAのミッションコントロールで...
コンピレーション | ブガッティ編集者 | 薛燕澤[51CTO.com クイック翻訳]多くの企業は、...
屈原・漁夫のアルゴリズムの追求を分析する前に、「漁夫」の原文を見てみましょう。屈原は流刑になった後、...
文/東方一洛顔認識技術は公共の場で自由に使用できなくなるのでしょうか?最近、欧州連合は377対248...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...