NVIDIA が Tensor RT-LLM を発表、RTX 搭載 PC プラットフォームで大規模言語モデルを 4 倍高速化

NVIDIA が Tensor RT-LLM を発表、RTX 搭載 PC プラットフォームで大規模言語モデルを 4 倍高速化

10月18日、NVIDIAはハードウェア分野における生成型人工知能の王者となった。同社のGPUは、MicrosoftやOpenAIなどの企業のデータセンターに搭載され、Bing ChatやChatGPTなどの人工知能サービスを実行している。本日、Nvidia は、ローカル Windows PC 上の大規模言語モデル (LLM) のパフォーマンスを向上させるように設計された新しいソフトウェア ツールを発表しました。

Nvidia はブログ投稿で、以前はデータセンター向けにリリースされていた TensorRT-LLM オープンソース ライブラリが、Windows PC でも利用できるようになったことを発表しました。最も優れた機能は、Windows PC に NVIDIA GeForce RTX GPU が搭載されている場合、TensorRT-LLM により LLM を Windows PC 上で 4 倍高速に実行できることです。

NVIDIA は記事の中で、開発者とエンドユーザーにとっての TensorRT-LLM の利点を次のように紹介しています。

バッチ サイズが大きい場合、この高速化により、ライティング アシスタントやコーディング アシスタントなどのより複雑な LLM 使用エクスペリエンスが大幅に改善され、複数の固有のオートコンプリート結果を同時に出力できるため、パフォーマンスが高速化され、品質が向上し、ユーザーが最適なオプションを選択できるようになります。

IT Home は、ブログ投稿に TensorRT-LLM の例が示されていることに気付きました。 LLaMa 2 ベース モデルに「Alan Wake 2 にはどのような NVIDIA テクノロジが統合されていますか?」と質問したところ、「ゲームはまだ発表されていません」という役に立たない回答が返ってきました。代わりに、RAG を使用して GeForce News を Vector Library に追加し、同じ Llama2 モデルに接続すると、正しい答え (NVIDIA DLSS 3.5、NVIDIA Reflex、フルスクリーン レイ トレーシング) が得られるだけでなく、TensorRT-LLM アクセラレーションにより応答性も大幅に向上します。このスピードとパワーの組み合わせにより、ユーザーはよりスマートなソリューションを利用できるようになります。

TensorRT-LLM は、NVIDIA の開発者向け Web サイトでまもなく利用可能になります。

Nvidia は本日、新しい GeForce ドライバー アップデートに AI ベースの機能もいくつか追加しました。これには、オンライン ビデオを視聴するときに解像度のアップスケーリングが向上し、圧縮が少なくなる、RTX ビデオ スーパー解像度機能の新しいバージョン 1.5 が含まれます。 Nvidia は、Stable Diffusion Web UI に TensorRT AI アクセラレーションも追加し、GeForce RTX GPU を使用するユーザーが AI 画像ジェネレーターから通常よりも高速に画像を取得できるようにしました。

<<:  ベイジアンネットワークを使用して病院の患者数を予測する

>>:  情報フローシナリオにおけるAIGCの実践

ブログ    
ブログ    
ブログ    

推薦する

2023年までに、プライバシーコンプライアンス技術の40%以上がAIに依存するようになる

ガートナーによれば、2023年までにプライバシーコンプライアンス技術の40%以上が人工知能(AI)に...

...

成功するビジネス インテリジェンス戦略を開発する方法

ビジネス インテリジェンス戦略の策定は、企業が検討する必要がある重要なステップであり、ビジネス イン...

誇張か革命か?産業メタバースの4つの大きなトレンド

産業用仮想世界は、製造業者がすでに進めているデジタル変革を補完できるでしょうか? メタバースについて...

2021年10月のドローン業界の最新動向を3分で振り返る

現在、人工知能や5Gなどの技術の助けを借りて、我が国のドローン開発は急速な成長の軌道に乗っています。...

データマイニング: 機械学習手法に基づく POI カテゴリ推奨アルゴリズム

序文Meituan マーチャント データ センター (MDC) には、調整および監査済みの POI ...

追跡すべきマルチモーダル LLM が多すぎますか?まずは26のSOTAモデルを見てみましょう

現在、AI分野の焦点は大規模言語モデル(LLM)からマルチモーダルへと移行しており、その結果、LLM...

機械学習を使用して画像キャプションを生成する

最近のディープ ニューラル ネットワークの開発以前は、業界で最も優秀な人材でもこの問題を解決できませ...

第4世代ロボットが発売。Lingdong TechnologyのAMR分野における粘り強さと革新

AGV と比較すると、V-AMR ロボットの利点は、特にビジネス プロセス、倉庫の変革、展開サイクル...

再サンプリングからデータ合成まで: 機械学習における不均衡な分類問題にどのように対処するか?

機械学習とデータサイエンスを少しでも勉強したことがあるなら、クラス分布の不均衡に遭遇したことがあるは...

...

2020 年に台頭する AI と機械学習の 6 つのトレンド

人工知能ソリューションの市場は急速に成長を続けており、数百億ドルの収益をもたらしています。調査会社I...

大型模型のレイアウトは何度も変わります!

ChatGPT の Android バージョンが登場します。 OpenAI は今年 5 月に早くも...

人工知能がスマートファクトリーにもたらす力

現在、製造業における人工知能技術の応用が急成長しています。自社にとって適切な人工知能ツールをどのよう...