NVIDIA が Tensor RT-LLM を発表、RTX 搭載 PC プラットフォームで大規模言語モデルを 4 倍高速化

NVIDIA が Tensor RT-LLM を発表、RTX 搭載 PC プラットフォームで大規模言語モデルを 4 倍高速化

10月18日、NVIDIAはハードウェア分野における生成型人工知能の王者となった。同社のGPUは、MicrosoftやOpenAIなどの企業のデータセンターに搭載され、Bing ChatやChatGPTなどの人工知能サービスを実行している。本日、Nvidia は、ローカル Windows PC 上の大規模言語モデル (LLM) のパフォーマンスを向上させるように設計された新しいソフトウェア ツールを発表しました。

Nvidia はブログ投稿で、以前はデータセンター向けにリリースされていた TensorRT-LLM オープンソース ライブラリが、Windows PC でも利用できるようになったことを発表しました。最も優れた機能は、Windows PC に NVIDIA GeForce RTX GPU が搭載されている場合、TensorRT-LLM により LLM を Windows PC 上で 4 倍高速に実行できることです。

NVIDIA は記事の中で、開発者とエンドユーザーにとっての TensorRT-LLM の利点を次のように紹介しています。

バッチ サイズが大きい場合、この高速化により、ライティング アシスタントやコーディング アシスタントなどのより複雑な LLM 使用エクスペリエンスが大幅に改善され、複数の固有のオートコンプリート結果を同時に出力できるため、パフォーマンスが高速化され、品質が向上し、ユーザーが最適なオプションを選択できるようになります。

IT Home は、ブログ投稿に TensorRT-LLM の例が示されていることに気付きました。 LLaMa 2 ベース モデルに「Alan Wake 2 にはどのような NVIDIA テクノロジが統合されていますか?」と質問したところ、「ゲームはまだ発表されていません」という役に立たない回答が返ってきました。代わりに、RAG を使用して GeForce News を Vector Library に追加し、同じ Llama2 モデルに接続すると、正しい答え (NVIDIA DLSS 3.5、NVIDIA Reflex、フルスクリーン レイ トレーシング) が得られるだけでなく、TensorRT-LLM アクセラレーションにより応答性も大幅に向上します。このスピードとパワーの組み合わせにより、ユーザーはよりスマートなソリューションを利用できるようになります。

TensorRT-LLM は、NVIDIA の開発者向け Web サイトでまもなく利用可能になります。

Nvidia は本日、新しい GeForce ドライバー アップデートに AI ベースの機能もいくつか追加しました。これには、オンライン ビデオを視聴するときに解像度のアップスケーリングが向上し、圧縮が少なくなる、RTX ビデオ スーパー解像度機能の新しいバージョン 1.5 が含まれます。 Nvidia は、Stable Diffusion Web UI に TensorRT AI アクセラレーションも追加し、GeForce RTX GPU を使用するユーザーが AI 画像ジェネレーターから通常よりも高速に画像を取得できるようにしました。

<<:  ベイジアンネットワークを使用して病院の患者数を予測する

>>:  情報フローシナリオにおけるAIGCの実践

ブログ    

推薦する

...

Dubbo 負荷分散戦略コンシステントハッシュ

この記事では、主にコンシステント ハッシュ アルゴリズムの原理とデータ スキューの問題について説明し...

ICML 優勝者 Lu Yucheng: 分散型機械学習の理論的な限界は何ですか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

UNITのハイライト - 対話システムの技術的原理を素早く習得

[[254684]]人工知能時代の対話的特徴は、「対話」という一言に集約されます。音声であれテキスト...

顔認識、マルチターゲット追跡…Suningのスマートストアのその他のブラックテクノロジーを公開!

[51CTO.comからのオリジナル記事] インターネット+の急速な発展に伴い、オフライン小売業界...

...

ロボットはすべてレンガを動かしているのでしょうか?人工知能は失業の波を引き起こすでしょうか?

今日、私は突然、食べたり飲んだり休んだりすることなく、1時間で200個のレンガを積むことができるレン...

...

ハッカーの天敵! AI はサイバー攻撃の防御にどのように役立つのでしょうか?

最近、ハッカーがサイバー攻撃を仕掛けてデータ漏洩を引き起こしているというニュースをよく耳にすると思い...

ビジネスアナリストにとってAIが意味するもの

[[275322]]今日では、人工知能はもはや流行語ではなく、多くの環境ビジネスアナリストやその他の...

人工知能産業は各地で花開いています。この7つのロボットがあなたに近づいてきます!

現在、中国の製造業、農業、飲食業、企業、機関はすべて、自動化からインテリジェンス化、デジタル化への変...

...

AIと情報サービスが出会うとき:百度脳産業イノベーションフォーラムが成都であなたを待っています

注目の人工知能がインターネットの「伝統的なプロジェクト」情報サービスと出会うと、業界にどのような A...

エッジコンピューティング時代の到来は AI にどのような影響を与えるのでしょうか?

[[270834]]近年、人工知能はテクノロジー界で注目されている分野です。中国では、Megvii...

Testin Cloud Testing: テクノロジーを活用して企業の飛躍を支援

急速に発展するデジタル時代において、ビジネスの成功にとって高品質で効率的なテスト サービスが重要であ...