11月16日、Microsoft Ignite 2023カンファレンスが本日開幕しました。NVIDIAの幹部がカンファレンスに出席し、TensorRT-LLMのアップデートを発表し、 OpenAI Chat APIのサポートを追加しました。 IT Homeは今年10月に、NVIDIAがデータセンターとWindows PC向けのTensor RT-LLMオープンソースライブラリをリリースしたと報じた。最も優れた機能は、Windows PC に NVIDIA GeForce RTX GPU が搭載されている場合、TensorRT-LLM により LLM を Windows PC 上で 4 倍高速に実行できることです。 本日の Ignite 2023 カンファレンスで、NVIDIA は TensorRT-LLM のアップデートを発表し、OpenAI の Chat API のサポートを追加し、DirectML 機能を強化して Llama 2 や Stable Diffusion などの AI モデルのパフォーマンスを向上させました。 TensorRT-LLM は、NVIDIA の AI Workbench を通じてローカルで実行できます。AI Workbench は、開発者が PC またはワークステーション上で事前トレーニング済みの生成 AI モデルと LLM を迅速に作成、テスト、カスタマイズできる、統合された使いやすいツールキットです。 NVIDIA はこの目的のために早期アクセス登録ページも立ち上げました。 NVIDIA は、今月後半に TensorRT-LLM 0.6.0 バージョン アップデートをリリースする予定です。これにより、推論パフォーマンスが 5 倍向上し、Mistral 7B や Nemotron-3 8B などの他の主流の LLM もサポートされます。 ユーザーは、8GB 以上のビデオ メモリを搭載した GeForce RTX 30 シリーズおよび 40 シリーズ GPU で実行でき、一部のポータブル Windows デバイスでも高速で正確なネイティブ LLM 機能を利用することができます。 |
<<: マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース
>>: マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能
AIによって仕事が奪われるのではないかと心配する人が多い中、ある企業が世界初のAIヒューマノイドロボ...
人類が宇宙に建設した最初の工場がここにあります。しかも無人工場です!先週、この衛星はマスク氏のスペー...
企業が社内でソリューションを構築する必要は必ずしもありませんが、これが失敗の一般的な原因となります。...
中国工程院の院士である倪光南氏は、第2回北京人工知能産業革新発展会議で人工知能の発展に関する見解と経...
オペレーティング システムには多くのスケジューリング アルゴリズムがあり、ジョブ スケジューリングに...
復旦大学データインテリジェンスおよびソーシャルコンピューティング研究所復旦大学のデータインテリジェン...
今日、機械学習の可能性に関心を持つプログラマーは、人工知能と AI ベースのソフトウェア開発ツールを...
適応型計算とは、環境の変化に応じて ML システムの動作を調整する能力を指します。従来のニューラル ...
顔認識技術の賛否は議論の余地がある。多くの利害関係者は利点を強調したが、批評家は欠点も指摘した。顔認...
機械学習と人工知能は、IT サービス分野に浸透し続け、ソフトウェア エンジニアが開発したアプリケーシ...