NVIDIA が TensorRT-LLM の新バージョンをプレビュー: 推論能力が 5 倍に向上、8GB 以上のグラフィックカードがローカルで実行可能、OpenAI の Chat API をサポート

11月16日、Microsoft Ignite 2023カンファレンスが本日開幕しました。NVIDIAの幹部がカンファレンスに出席し、TensorRT-LLMのアップデートを発表し、 OpenAI Chat APIのサポートを追加しました。

IT Homeは今年10月に、NVIDIAがデータセンターとWindows PC向けのTensor RT-LLMオープンソースライブラリをリリースしたと報じた。最も優れた機能は、Windows PC に NVIDIA GeForce RTX GPU が搭載されている場合、TensorRT-LLM により LLM を Windows PC 上で 4 倍高速に実行できることです。

本日の Ignite 2023 カンファレンスで、NVIDIA は TensorRT-LLM のアップデートを発表し、OpenAI の Chat API のサポートを追加し、DirectML 機能を強化して Llama 2 や Stable Diffusion などの AI モデルのパフォーマンスを向上させました。

TensorRT-LLM は、NVIDIA の AI Workbench を通じてローカルで実行できます。AI Workbench は、開発者が PC またはワークステーション上で事前トレーニング済みの生成 AI モデルと LLM を迅速に作成、テスト、カスタマイズできる、統合された使いやすいツールキットです。 NVIDIA はこの目的のために早期アクセス登録ページも立ち上げました。

NVIDIA は、今月後半に TensorRT-LLM 0.6.0 バージョンアップデートをリリースする予定です。これにより、推論パフォーマンスが 5 倍向上し、Mistral 7B や Nemotron-3 8B などの他の主流の LLM もサポートされます。

ユーザーは、8GB 以上のビデオメモリを搭載した GeForce RTX 30 シリーズおよび 40 シリーズ GPU で実行でき、一部のポータブル Windows デバイスでも高速で正確なネイティブ LLM 機能を利用することができます。

<<: マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース

>>: マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能

梅雨から台風シーズンまで、ドローンが再び活躍

ブログ

トランスフォーマーは新たな覇者となったのか？ FAIRらは純粋な畳み込みConvNetを再設計し、より良いパフォーマンスを達成した。

ブログ

NVIDIA が TensorRT-LLM の新バージョンをプレビュー: 推論能力が 5 倍に向上、8GB 以上のグラフィックカードがローカルで実行可能、OpenAI の Chat API をサポート

梅雨から台風シーズンまで、ドローンが再び活躍

トランスフォーマーは新たな覇者となったのか？ FAIRらは純粋な畳み込みConvNetを再設計し、より良いパフォーマンスを達成した。

深層強化学習における敵対的攻撃と防御

マスクがインセプションを実現させた？スタートアップ企業はトランスフォーマーを使って明晰夢を誘発し、ニューラリンクの技術は夢をコントロールする驚くべき効果を発揮する

AIと天気予報が出会うとどんな火花が散るのでしょうか？

推薦する

OpenAIの最初の投資家コスラ氏：AIスタートアップのほとんどは過大評価されている

オープンソース版「ChatGPT Plus」が登場。データ分析、プラグイン通話、自動インターネットアクセス、現実世界のインテリジェントエージェントの実装が可能

Nature: DeepMind の大規模モデルが 60 年前の数学的問題を突破、その解決法は人間の認識力を超える

音声認識にPythonを使用する方法を教えます

従来のグラフエンジンから GNN へ: 計算グラフと機械学習の進化

データサイエンティストに Kubernetes クラスターの管理を任せるのはやめましょう…

成長痛に遭遇: 2017 年の AI およびビッグデータ業界のレビュー

蘇州の路上には自動運転バスが走っている。これは試験運行ではない。市民は無料で乗車できる。

フォーブス：人工知能が解決できる15の社会的課題

強いAIと弱いAIの議論：人工知能の意識に関する興味深い理論

パスワード危機: ディープラーニングがパスワードクラッキングを加速!

CNN 推論エンジンを使用して IoT デバイスにディープラーニングを実装するにはどうすればよいですか?