史上最速の大規模モデル推論を実現するには、1171万ドル(8410万元)の費用がかかりますか? ? ? 同じプロジェクトの場合、Nvidia GPU を使用するコストはわずか 30 万ドルです... 最も強力な AI チップが Groq に移るかどうかについては、待って見守る必要があるかもしれない。 過去 2 日間で、Groq は驚くべき登場を果たしました。 「Nvidia より 100 倍コスト効率が高い」と言われるチップを使用して、目立った遅延なく 1 秒あたり 500 トークンの速度で大規模なモデルを生成します。 Google TPU チームの優秀な人材である Buff と相まって、多くの人がこう言っていました。「Nvidia は打ち負かされるだろう...」 騒動の後、主にGroqの費用対効果に焦点を当てた合理的な議論がいくつか出始めました。 ネットユーザーは、現在のデモには568個のチップが必要で、コストは1171万ドルになると概算した。 その結果、業界内外のあらゆる分野の人々が自発的に計算を始めました。 テーブルを持って現れ、自分の経験を共有するアナリストもいました... そしてため息をつきました。 「よし、今週はみんな公開数学をやるんだ。」 しかし、Groq 氏もできるだけ早くソーシャル ネットワーク上で反応しました。 「みんな数学をやっている」Groq のコスト問題に関する議論には、コンピューターを学ぶ学生や推論サービスを提供するクラウドベンダー、さらには現従業員と対立する元 Groq 従業員など、さまざまな人が参加し、非常に活発な議論が展開されました。 代表的なものをいくつか取り上げて、みんながどう思うか見てみましょう。 まず、大まかな見積もりですが、カードの価格はおよそ 20,000 ドルで、メモリはわずか 0.23 GB です。 したがって、1 台の LLama 70B モデルをサービスするには、約 320 枚のカード (実際にはそれ以上) を購入する必要があり、サーバーを含めて約 1,000 万ドルの費用がかかります... Nvidia の H100 と比較するとどうでしょうか? レプトンの賈洋青氏も参加し、いくつかの計算を行った。基本価格に加え、エネルギー消費量、性能、運用コストの観点からも分析しました。 最後に、次の核心点をまとめます。
なお、Groq が実施したベンチマークテストには Lepton も含まれており、推論速度は Lepton の約 3 倍です。
ただし、これらの議論には他のアルゴリズムも存在します。 例えば、一部のネットユーザーは、単一のトークンの価格に基づいて計算するとどうなるのかと質問しています。 それは問題ではありません。行動を起こすプロのアナリストは他にもたくさんいます。 しかし、彼の計算によれば、100万トークンの支出ごとに、Groq の方が費用対効果が高くなります。 これに加えて、Transformer の高速化がサポートされているかどうかなど、他の議論もあります。 Groq オンライン Q&A皆があまりにも注目していたので、グロクは出てきて自ら質問に答えざるを得ませんでした。
主なポイントは次のとおりです。
オンラインでの質問への回答はまだ続いています... したがって、Groq が本当に Nvidia の地位を揺るがすことができるのかどうかは、待って見守る必要がある。 しかし、昨日のNvidiaの株価は異常な動きを見せました... |
>>: Karpathy の新しいビデオが再び人気に: GPT Tokenizer をゼロから構築
1. 要件の説明数字の文字列を入力し、その文字列を整数に変換して出力するプログラムを作成します。たと...
目は体表にある器官の中で画像データを取得しやすい器官であり、その健康状態は人々の生活や学習に与える影...
[[286342]]本論文では、バウンディング ボックス回帰に基づく効率的なポイント クラウド イ...
編集者注: この記事の著者は、USTC のジュニアクラスの卒業生で投資家の Wang Chuan で...
機械学習の分野では、コンセプトドリフトという問題が長い間研究者を悩ませてきました。つまり、データの分...
[[257487]] [51CTO.com クイック翻訳] 音声アシスタントの台頭により、マーケティ...
[[422568]]イーストロサンゼルスのアービーズ・ドライブスルーでローストビーフサンドイッチを注...
この記事は、WeChat OCR 技術紹介シリーズの一部であり、ディープ シーケンス ラーニング手法...
先週の発表に続き、OpenAI は本日、GPT ストアの立ち上げを正式に発表しました。写真昨年 11...
先ほど、Keras 3.0 が正式にリリースされました! 5 か月のパブリック ベータ テストを経て...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
自転車が「自力で歩ける」ようになるのはいつでしょうか? [[404743]]自転車は劣駆動システムで...
▲ 液体生検は費用対効果が高く、生検全体のプロセスを大幅に簡素化できます。 Wikipedia によ...
新型コロナウイルス感染症のパンデミックによってもたらされた変化の中で、組織の業務が在宅勤務からリモー...