NVIDIA は 3 か月で 800 トンの H100 を販売しました。黄氏が1兆ドル規模のGPU覇者の「3つのノー」戦略を明かす

NVIDIA は 3 か月で 800 トンの H100 を販売しました。黄氏が1兆ドル規模のGPU覇者の「3つのノー」戦略を明かす

今年の第 2 四半期だけで、Nvidia は 816 トンの H100 を販売しました。

同じペースでいけば、今年のH100の販売量は3,266トンになると予想されている。そして、その後数年間で、Nvidia は 120 万台の H100 を販売する予定です。

現在、クラウド サービス プロバイダーの大規模 H100 クラスターの容量は枯渇しつつあり、世界中で GPU が不足しており、シリコン バレーの経営者たちは不安を募らせています。全体として、世界中の企業は約 432,000 台の H100 を必要としています。

また、最近非常に人気があるのは、Huang Renxun 氏による Nvidia の管理方法です。

「計画なし、報告なし、階層なし」、とてもカジュアル、とても仏教的、とてもクレイジーとさえ言える。

この経営手法により、Nvidia の時価総額は 1 兆を超え、世界最強の半導体企業となったのです。

半導体大手

Nvidiaは、2024年度第2四半期に103億ドル相当のデータセンターハードウェアを販売したと主張している。

103 億ドルの価値があるとはどういう意味ですか?

今日、市場調査会社 Omdia は、よりわかりやすい単位「816 トン H100」を提供してくれました。

Omdiaの推定によると、Nvidiaは第2四半期に816トン以上のH100 GPUを出荷した。

NVIDIA H100 GPU はラジエーターを含めて平均 3 キログラム以上の重さがあるため、第 2 四半期の H100 の出荷量は控えめに見積もっても 30 万台になります。

Omdia の見積りは正確ですか?

H100 には、重量が異なる 3 つの異なるフォーム ファクターがあることに注意してください。

H100 PCIe グラフィック カードの重量は 1.2 kg、H100 SXM モジュールの重量は不明、ヒートシンク付き OAM モジュールの重量は最大 2 kg です。H100 SXM とほぼ同じサイズと TDP です。

H100 出荷の 80% がモジュールで、20% がグラフィック カードであると仮定すると、1 台の H100 の平均重量は約 1.84 kg になります。

したがって、大見田の推定はほぼ正確であると考えられる。もちろん、実際の重量は 816 トン未満である可能性があります。

816トンの重さはどれくらいですか?

この重みを理解するために、次の例えを使うことができます。

4.5 ボーイング 747

11スペースシャトル

181,818 台のプレイステーション 5

ゴールデンレトリバー 32,727 匹

Nvidia が今後の四半期で同じ GPU 販売量を維持すれば、今年は 3,266 トンの H100 を販売すると予想されます。

このペースが一定であれば、Nvidia は年間 120 万台の H100 を販売することになります。

それだけではありません。

H800 のほか、前世代の A100、A800、A30 もあります。

この計算によると、Nvidia が四半期ごとに実際に販売する GPU の数は 30 万個をはるかに超え、総重量は 816 トンをはるかに超えることになります。

それでも、世界的なGPU不足には対応できない。業界関係者によると、Nvidiaの2023年向けH100の生産分はすでに完売しており、今注文してお金を払っても、少なくとも2024年半ばまでは商品を受け取れないという。

現在、H100 カードは入手困難です。

NVIDIAはH100の生産台数を今年の約50万台から2024年には150万~200万台に増やす計画だとの海外メディアの報道もある。

生成型 AI の流行の中で Nvidia チップの需要がますます高まっていることから、この予測が誇張でないことは明らかです。

ジェン・スン・ファン:第一原理

同時に、GPU の売上が急増したことで、Nvidia は世界のコンピューティング パワーのリーダーとなり、1 兆ドル クラブへの参入を果たしました。

これは、リーダーである黄仁訓氏の「クレイジー」な経営戦略と切り離せないものです。

黄氏は、会社を立ち上げるときには、第一原則から始めるのが自然だと語った。

「機械を組み立てて、それがどのように機能するか、入力は何か、出力は何か、どのような条件下では、業界標準は何かを調べるようなものです...」

黄氏の言葉によれば、NVIDIA の使命は、世界のほぼ不可能と思われるコンピューティング問題を解決することです。通常のコンピュータで解決できる問題であれば、Nvidia はそれを行いません。

この使命を達成するために、NVIDIA は多くの優れた才能を引きつけ、結集しています。

同時に、これらの人材を管理するための黄氏の最重要戦略も必要です。

40人の部下を直接管理し、1対1のミーティングは行わない

NVIDIA は「ピラミッド」管理を必要とせず、代わりに全員に権限を委譲します。

黄氏は、情報が素早く広まるためにはフラットな組織が最も強力だと考えています。

その中でも、組織の第一レベルであるトップマネジメントは、より慎重に物事を考えなければなりません。経営陣の誰も彼にキャリアに関するアドバイスを求めなかったため、彼はどの幹部に対してもキャリアに関するアドバイスをしたことはありませんでした。

「彼らは成功した。素晴らしい仕事をした。」

さらに、黄氏は決して一対一の会議を行わず、すべてをグループディスカッションで行います。

「戦略的な方向性があるのなら、なぜ1人だけに伝えるのですか?全員がそれを知っているべきです。」

誰もが常にあらゆる情報を得ている

社内で副社長会議や取締役会議が開催されることはありません。

老黄氏は、自分が出席した会議にはさまざまな組織の人々や最近大学を卒業した人々が参加しており、誰でも参加して意見を述べることができたと語った。

ステータスレポートの代わりに「トップ5」をメールで送る

NVIDIA では、ステータス レポートを作成する必要がありません。Huang 氏は、ステータス レポートは「メタ情報」のようなもので、洗練されすぎていて、基本的に役立つ情報がないと考えているからです。

代わりに、社内の誰もが彼に「トップ 5 のこと」を電子メールで送信できます。

あなたがこれまでに学んだこと、観察したこと、これからやろうとしていること、それが何であれ、彼は毎朝 100 通以上のメールを読んで、全員のトップ 5 の事柄を理解します。

たとえば、素敵なレストランに行った、かわいい赤ちゃんが生まれた、など、これらは本当に重要な情報です。

正式な定期スケジュールはありません

計画の立て方としては、会社の最も基本的なアイデアを出して、それを優秀なエンジニアに実行させるというものです。

老黄氏は、「私にとって、5年計画や1年計画はなく、常に変化する事業や市場の状況に基づいて再評価します」と述べました。

要約すると、NVIDIA は組織構造を次のように最適化しています。(1) 優秀な人材を引き付ける、(2) チームの規模をできるだけ小さくする、(3) 情報をできるだけ迅速に広める。

Nvidia のディープラーニング研究担当副社長、ブライアン・カタンザーロ氏も出席し、すべてが真実であることを証明しました。

では、このような組織で働くというのはどのようなことなのでしょうか?

ブライアン氏は、多くの点で非常に安定した環境だと語った。多くの上級従業員は数十年にわたってNvidiaで働いています。このスタイルはすべての人に適しているわけではありませんが、多くの人にとってうまく機能します。活気のある環境です。

マスク氏とは異なり、フアン氏は自分の会社をどのように経営しているかを他人に話すことはめったにない。

今年、国立台湾大学で行ったスピーチで、Huang 氏は今日の NVIDIA を定義する 3 つのストーリーを語りました。これは彼の意思決定、判断、思考と切り離せないものです。

当初、Nvidia は SEGA と契約を結び、SEGA 向けのゲーム コンソールを開発しました。 1 年間の開発を経て、使用された技術アーキテクチャが間違っていたことが判明しました。

しかし、黄仁訓氏は、自分が作成した製品がマイクロソフトの Windows システムと互換性がないため、たとえ修正しても無駄であることに気づきました。

そこで彼はセガのCEOに連絡し、NVIDIAでは課題を完了できないことを説明し、セガから援助を得た。幸いにも彼は倒産を免れた。

2つ目は、NVIDIAが2007年に発表したCUDA GPUアクセラレーションコンピューティングテクノロジーです。

CUDA 技術を世界に広めるために、GTC カンファレンスが特別に設立されました。長年の努力の結果、NVIDIA のテクノロジーは AI 革命の重要な原動力となりました。

3つ目は、携帯電話市場から撤退し、グラフィック カードに注力するという難しい決断を下すことです。

老黄はこう言いました。「戦略的な撤退、犠牲、そして何を諦めるかを決めることが成功の核心であり、まさに重要な核心である。」

X社のエンジニアは、この経営手法はマスク氏のX社の運営と非常に似ていると語った。

一部のネットユーザーは、黄氏の管理スタイルはマルチモーダルインテリジェントエージェント大規模モデルシステムにモデル化できると冗談を言った。

もし黄氏がマスク氏のような伝記を出版することができれば、誰もが喜んで読むだろうと私は信じている。

Nvidia の GPU がどのように成功を収め、大企業にとっての金採掘のシャベルとなったかを見てみましょう。

世界のGPU不足は40万台を超える

H100 の不足により、シリコンバレーの経営者たちはすでにパニックに陥っています。

Sam Altman 氏はかつて、GPU の燃料が不足しており、ChatGPT を使用するユーザーが減ることを望んでいると明かしました。 😂

「GPU は非常に不足しており、当社の製品を使用する人が少なければ少ないほど良いのです。」

アルトマン氏は、OpenAI は GPU の制限により、いくつかの短期計画 (微調整、専用容量、32K コンテキスト ウィンドウ、マルチモーダル性) を延期したと述べました。

OpenAIの共同設立者でパートタイムの科学者でもあるアンドレイ・カルパシー氏は、誰がいくつH100を獲得したかが今やシリコンバレーの最大の話題になっていることも明らかにした。

コミュニティ内で広く配布されたこのチャートでは、かつて次のような推定が行われました。

-GPT-4はおそらく約10,000〜25,000個のA100でトレーニングされた

-メタ約21000 A100

-テスラ約7000 A100

-安定性AI約5000A100

-ファルコン40Bは384機のA100で訓練された

– Inflectionは3500とH100を使用して、GPT-3.5に匹敵する機能を持つモデルをトレーニングしました。

現在、テクノロジー企業が H100 の購入に並んでいるだけでなく、サウジアラビアやアラブ首長国連邦も動き出し、一度に数千個の H100 GPU を購入しています。

マスク氏は、H100を購入するのは現在極めて困難であると率直に述べた。

マスク氏によると、GPT-5には3万〜5万個のH100が必要になる可能性がある。以前、モルガン・スタンレーは、GPT-5は25,000個のGPUを使用し、2月からトレーニングされていると述べていましたが、サム・アルトマンは後にGPT-5はまだトレーニングされていないことを明らかにしました。

「Nvidia H100 GPU: 供給と需要」と題された記事では、中小規模のクラウドプロバイダーの大規模H100クラスターの容量が枯渇しそうになっており、H100の需要傾向は少なくとも2024年末まで続くだろうと推測されています。

マイクロソフトの年次報告書では、GPU が同社のクラウド事業の急速な成長にとって「重要な原材料」であると投資家に強調した。必要なインフラストラクチャが利用できない場合は、データセンターの停止のリスク要因が発生する可能性があります。

OpenAI では 50,000 台の H100、Inflection では 22,000 台、Meta では 25,000 台、大手クラウド サービス プロバイダー (Azure、Google Cloud、AWS、Oracle など) では 30,000 台が必要になると推測されています。

Lambda、CoreWeave、その他のプライベート クラウドでは合計で 10 万が必要になる可能性があります。 Anthropic、Helsing、Mistral、Character にはそれぞれ 10k 必要になる可能性があります。

全体として、世界中の企業では約 432,000 台の H100 が必要です。 H100 1 台あたり約 35,000 ドルなので、GPU の総需要は 150 億ドルになります。

これには、H800 を必要とする多数の国内インターネット企業は含まれません。

さらに、H100 は需要が高いだけでなく、利益率も非常に高いです。

業界の専門家は、Nvidia H100 の利益率は 1,000% に近いと述べています。

<<:  RLHF が LLM トレーニングの鍵となるのはなぜですか? AI専門家が5つの代替案を検討し、Llama 2のフィードバックメカニズムのアップグレードを説明

>>: 

ブログ    

推薦する

人工知能の旅:プロトタイピングは始まりに過ぎない

国内外で人工知能や機械学習のチームが大きな成果のニュースを共有し続けているのをよく見かけますが、実用...

1.2兆パラメータ:Googleの汎用スパース言語モデルGLaM、小サンプル学習がGPT-3を上回る

[[439859]]近年、モデルの規模はどんどん大きくなっています。例えば、2018年に登場したGP...

UniVision: BEV 検出と Occ、デュアル SOTA の統合フレームワーク!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

機械学習研究開発プラットフォームの選択

機械学習は現在隆盛を極めていますが、機械学習を学習・研究し、実稼働環境で活用したい場合には、プラット...

汎用人工知能までどれくらい遠いのでしょうか?

汎用人工知能はどのくらい遠いのでしょうか? どのくらいの速さで進歩しているのでしょうか? 現在、人間...

馬懿、沈向陽、曹英の最新AIレビューが人気に!作成に3か月かかりました。ネットユーザー必読の論文です

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Nvidia が企業秘密を盗んだと非難される!ビデオ会議で証拠が明らかになり、関与した従業員は有罪を認めた

Nvidia はビデオ会議を開催しただけで訴えられたのですか? ? ?はい、きっかけはほんの数枚のコ...

糖尿病網膜症のスクリーニングの改善におけるAIの役割

糖尿病は網膜症を引き起こす可能性があり、これは失明につながる合併症です。しかし、良いニュースとしては...

ソフトウェア開発者ガイド: 独自のデータで ChatGPT をトレーニングする

翻訳者 | 李睿レビュー | Chonglou制作:51CTO テクノロジースタック(WeChat ...

Google は一連の大きな動きを発表しました: Gemini Pro は中国語をサポートし、Bard は描画を学習し、新しいモデルが利用可能になりました

この分野で GPT-4 を上回った Bard は「勢いをつかみ」、メジャーアップデートをリリースしま...

IoT、AI、ブロックチェーンがビジネス経済を変革する

ビジネスとテクノロジーの世界のつながりは非常に強いため、テクノロジーの発展が次の段階に進むたびに、ビ...

私たちの重要なインフラは人工知能に対応できるでしょうか?

ChatGPT を楽しみや機能のために使用する個人から、タスクの自動化に人工知能 (AI) を適用...

ロボットがあなたの仕事を奪おうとしているのでしょうか?データはあなたが考えすぎている可能性を示唆している

編集者注:人工知能技術が進歩し続けるにつれ、職を失うことを心配する人が増えています。彼らの理由は、根...