11月16日、Microsoft Ignite 2023カンファレンスが本日開幕しました。NVIDIAの幹部がカンファレンスに出席し、TensorRT-LLMのアップデートを発表し、 OpenAI Chat APIのサポートを追加しました。 IT Homeは今年10月に、NVIDIAがデータセンターとWindows PC向けのTensor RT-LLMオープンソースライブラリをリリースしたと報じた。最も優れた機能は、Windows PC に NVIDIA GeForce RTX GPU が搭載されている場合、TensorRT-LLM により LLM を Windows PC 上で 4 倍高速に実行できることです。 本日の Ignite 2023 カンファレンスで、NVIDIA は TensorRT-LLM のアップデートを発表し、OpenAI の Chat API のサポートを追加し、DirectML 機能を強化して Llama 2 や Stable Diffusion などの AI モデルのパフォーマンスを向上させました。 TensorRT-LLM は、NVIDIA の AI Workbench を通じてローカルで実行できます。AI Workbench は、開発者が PC またはワークステーション上で事前トレーニング済みの生成 AI モデルと LLM を迅速に作成、テスト、カスタマイズできる、統合された使いやすいツールキットです。 NVIDIA はこの目的のために早期アクセス登録ページも立ち上げました。 NVIDIA は、今月後半に TensorRT-LLM 0.6.0 バージョン アップデートをリリースする予定です。これにより、推論パフォーマンスが 5 倍向上し、Mistral 7B や Nemotron-3 8B などの他の主流の LLM もサポートされます。 ユーザーは、8GB 以上のビデオ メモリを搭載した GeForce RTX 30 シリーズおよび 40 シリーズ GPU で実行でき、一部のポータブル Windows デバイスでも高速で正確なネイティブ LLM 機能を利用することができます。 |
<<: マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース
>>: マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能
2019年10月25日、人工知能の新興企業OpenAIが非営利団体から「営利企業」へと転換した際、シ...
OpenAI ChatGPT Plus サブスクリプション支払いには強力な機能があり、高度な「データ...
Google DeepMind の最新の成果が再び Nature に掲載され、大規模なモデルを使用し...
[[282998]]オンラインでいくつかの例を見つけましたが、音声をテキストに変換できる成熟したモデ...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
[[317899]]生産機械学習には組織的な問題があります。この問題は、生産機械学習の比較的新しい...
2017 年、人工知能とビッグデータの開発では次の 10 の成長痛が発生しました。 [[216307...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能の応用範囲は非常に広いです。製造業から保険業まで、さまざまな業界がビジネスの改善に人工知能の...
[[344692]]最近、私のお気に入りの新進思想家の一人と高性能 AI と低性能 AI について議...
情報セキュリティの専門家は、「生成的敵対ネットワーク」(GAN)がオンラインセキュリティをどのように...
[[212457]]ディープラーニング技術により、モノのインターネット (IoT) デバイスは非構...