11月16日、Microsoft Ignite 2023カンファレンスが本日開幕しました。NVIDIAの幹部がカンファレンスに出席し、TensorRT-LLMのアップデートを発表し、 OpenAI Chat APIのサポートを追加しました。 IT Homeは今年10月に、NVIDIAがデータセンターとWindows PC向けのTensor RT-LLMオープンソースライブラリをリリースしたと報じた。最も優れた機能は、Windows PC に NVIDIA GeForce RTX GPU が搭載されている場合、TensorRT-LLM により LLM を Windows PC 上で 4 倍高速に実行できることです。 本日の Ignite 2023 カンファレンスで、NVIDIA は TensorRT-LLM のアップデートを発表し、OpenAI の Chat API のサポートを追加し、DirectML 機能を強化して Llama 2 や Stable Diffusion などの AI モデルのパフォーマンスを向上させました。 TensorRT-LLM は、NVIDIA の AI Workbench を通じてローカルで実行できます。AI Workbench は、開発者が PC またはワークステーション上で事前トレーニング済みの生成 AI モデルと LLM を迅速に作成、テスト、カスタマイズできる、統合された使いやすいツールキットです。 NVIDIA はこの目的のために早期アクセス登録ページも立ち上げました。 NVIDIA は、今月後半に TensorRT-LLM 0.6.0 バージョン アップデートをリリースする予定です。これにより、推論パフォーマンスが 5 倍向上し、Mistral 7B や Nemotron-3 8B などの他の主流の LLM もサポートされます。 ユーザーは、8GB 以上のビデオ メモリを搭載した GeForce RTX 30 シリーズおよび 40 シリーズ GPU で実行でき、一部のポータブル Windows デバイスでも高速で正確なネイティブ LLM 機能を利用することができます。 |
<<: マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース
>>: マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能
[[378336]]死者を生き返らせるというのは非常に神秘的に聞こえますが、技術の進歩により、科学者...
テキスト生成タスクは通常、教師強制法を使用してトレーニングされ、これにより、モデルはトレーニング中に...
過去2年間、テイクアウトの市場規模は驚異的なペースで成長を続けています。美団の最近のフードデリバリー...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
植物保護ドローンは、現在の農業分野において間違いなく新たな人気機器です。高効率、利便性、精度、環境保...
6月10日、江蘇省人工知能学会、ファーウェイ端末クラウドサービス、ファーウェイ南京研究所が共催する2...
AGI からどれくらい離れているのでしょうか? ChatGPTによって引き起こされた新たなAI爆発...
Bard と ChatGPT は、それぞれ Google AI と OpenAI によって開発された...
[[388887]]人工知能研究を専門とする外国の機関が、人工知能の実務家を対象に、2021年の人工...
多くのプログラマーの目には、データ構造やアルゴリズムなどは役に立たず、実際に使用されることもあまりな...
近年、ディープラーニング技術の急速な発展に伴い、AIベースの超解像技術は画像修復や画像強調の分野で幅...
[[440946]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
韓国のチームが達成した室温超伝導は、世界中の主要な研究室で再現の熱狂を引き起こした。先ほど、もう一つ...
昨日は第4回世界トップ科学者フォーラムの2日目でした。世界トップの科学者たちがオンラインとオフライン...