11月16日、Microsoft Ignite 2023カンファレンスが本日開幕しました。NVIDIAの幹部がカンファレンスに出席し、TensorRT-LLMのアップデートを発表し、 OpenAI Chat APIのサポートを追加しました。 IT Homeは今年10月に、NVIDIAがデータセンターとWindows PC向けのTensor RT-LLMオープンソースライブラリをリリースしたと報じた。最も優れた機能は、Windows PC に NVIDIA GeForce RTX GPU が搭載されている場合、TensorRT-LLM により LLM を Windows PC 上で 4 倍高速に実行できることです。 本日の Ignite 2023 カンファレンスで、NVIDIA は TensorRT-LLM のアップデートを発表し、OpenAI の Chat API のサポートを追加し、DirectML 機能を強化して Llama 2 や Stable Diffusion などの AI モデルのパフォーマンスを向上させました。 TensorRT-LLM は、NVIDIA の AI Workbench を通じてローカルで実行できます。AI Workbench は、開発者が PC またはワークステーション上で事前トレーニング済みの生成 AI モデルと LLM を迅速に作成、テスト、カスタマイズできる、統合された使いやすいツールキットです。 NVIDIA はこの目的のために早期アクセス登録ページも立ち上げました。 NVIDIA は、今月後半に TensorRT-LLM 0.6.0 バージョン アップデートをリリースする予定です。これにより、推論パフォーマンスが 5 倍向上し、Mistral 7B や Nemotron-3 8B などの他の主流の LLM もサポートされます。 ユーザーは、8GB 以上のビデオ メモリを搭載した GeForce RTX 30 シリーズおよび 40 シリーズ GPU で実行でき、一部のポータブル Windows デバイスでも高速で正確なネイティブ LLM 機能を利用することができます。 |
<<: マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース
>>: マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能
[[406948]]人間が意思決定を行うプロセスは、複雑で恣意的であるように見えることもあります。そ...
研究者は最近、ターゲット検出のための Transformer の使用を熱心に研究していますが、この論...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
企業はどのように AI ソリューションを使用して効率性を向上させ、プロセスを合理化できるのでしょうか...
7月21日、鄭州市の西40キロにある米河鎮は停電、インターネット、道路が遮断され、完全な情報孤島とな...
数日前、アリババの研究チームは「Animate Anyone」と呼ばれる手法を構築しました。この手法...
「汎用人工知能」は、今や2020年代の「水から石油」の技術になりつつあります。ほぼ2週間ごとに、大規...
ケーキも食べて、ケーキも残したいです! BAIR は、正確性と解釈可能性のバランスをとったニューラル...
最近、中国科学技術大学の研究チームは中国地震局と協力し、世界初の人工知能地震監視システム「スマート地...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
[[323768]]トレンド1: 自律型デバイス自動車、ロボット、農業など、自律型デバイスは従来人間...
序文Matplotlib は、データの視覚化を簡単に作成できる人気の Python ライブラリです。...
AIインテリジェンスは近年急速に発展しており、技術の進歩をもたらす一方で、一部の業界にも影響を与え...
次々と資金調達を行っているAI医薬品製造は、どれほど人気があるのでしょうか?海外からの最高受注額...