GPT-4の最強代替アップデート!カリフォルニア大学バークレー校がVicuna v1.5をリリース、4Kおよび16Kコンテキストをサポート、SOTAをリフレッシュ、LeCunが賞賛を再投稿

GPT-4の最強代替アップデート!カリフォルニア大学バークレー校がVicuna v1.5をリリース、4Kおよび16Kコンテキストをサポート、SOTAをリフレッシュ、LeCunが賞賛を再投稿

GPT-4 の最強の代替品が更新されました!

今回、カリフォルニア大学バークレー校は、最新の Llama 2 をベースに、Vicuna v1.5 の更新バージョンをリリースしました。

4K および 16K コンテキストをサポートするだけでなく、ほぼすべてのベンチマークで SOTA を達成します。

3 月のリリース以来、Vicuna は最も人気のあるチャット LLM の 1 つになりました。マルチモダリティ、AI の安全性、評価に関する研究は画期的です。

ビクーニャのモデルは、先月、Hugging Face で 200 万回以上ダウンロードされました。

LeCun 氏は、独自のモデルに基づいた Vicuna の新バージョンも発表しました。

最新モデルの重量

Vicuna は LLaMA に基づいており、LLaMA のモデル ライセンスに基づいて使用する必要があります。

次のコマンドを使用してチャットを開始できます。

Hugging Face リポジトリから重みを自動的にダウンロードします。その他のコマンド オプションとメモリ不足の処理方法については、以下の「コマンド ライン インターフェイスを使用した推論の実行」セクションを参照してください。

注意: 16K バージョンには transformers>=4.31 が必要です。

現在、試用可能なデモ版があります。

https://chat.lmsys.org/

Vicunaによる素晴らしいプロジェクト

ミニGPT4

アドレス: https://minigpt-4.github.io

高度な大規模言語モデル Vicuna を使用して微調整された、MiniGPT-4 用の新しいモデル。

テキスト予測ではChatGPTの90%を達成できます。視覚認識に関しては、研究者らは BLIP-2 と同じ事前トレーニング済みの視覚コンポーネントも使用しました。

コンポーネントは、EVA-CLIP の ViT-G/14 と Q-Former で構成されています。

MiniGPT-4 は、エンコードされた視覚的特徴を Vicuna 言語モデルに合わせるためのマッピング レイヤーのみを追加し、すべての視覚的および言語コンポーネント パラメータを固定します。

ラヴァ

アドレス: https://llava-vl.github.io

LLaVA は、ウィスコンシン大学マディソン校、マイクロソフト、コロンビア大学の研究者によってリリースされた大規模なマルチモーダル モデルです。

このモデルは、一般的な視覚と言語理解のために、ビジュアルエンコーダーとビクーニャを組み合わせています。

その機能は GPT-4 の画像およびテキスト理解機能に近いもので、GPT-4 と比較して 85.1% の相対スコアを達成し、科学的 QA における現在最も高度な精度を実現しています。

LLM攻撃

アドレス: https://llm-attacks.org

CMU と AI 安全センターの研究者は、一連の特定の意味のないトークンを追加することで、謎のプロンプトサフィックスを生成できることを発見しました。

その結果、誰でも簡単に LLM のセキュリティ対策を破り、無制限の量の有害コンテンツを生成できるようになります。

興味深いことに、この「敵対的攻撃」の方法は、オープンソース システムのガードレールを突破するだけでなく、ChatGPT、Bard、Claude などのクローズド ソース システムも回避できます。

ゴリラ

アドレス: https://github.com/ShishirPatil/gorilla

Gorilla は、適切な API 呼び出しを生成できる LLaMA アーキテクチャに基づく大規模な言語モデルです。

これは、Torch Hub、TensorFlow Hub、HuggingFace という 3 つの大規模な機械学習ライブラリのデータセットでトレーニングされました。

Gorilla は、Kubernetes、GCP、AWS、OpenAPI などの新しいドメイン知識を迅速に追加することもできます。

ゼロショットのシナリオでは、Gorilla は GPT-4、ChatGPT、Claude などのモデルよりも優れています。

量子ロラ

アドレス: https://github.com/artidoro/qlora

ワシントン大学の研究者らは、モデルのパフォーマンスを損なうことなく量子化された 4 ビット モデルを微調整できることを初めて実証しました。

彼らの新しい方法である QLoRA は、新しい高精度技術を使用して、事前トレーニング済みのモデルを 4 ビットに量子化し、学習可能な低ランクのアダプター重みの小さなセットを追加します。

これらのアダプタの重みは、量子化された重みの勾配を逆伝播することによって調整されます。

QLoRA メソッドは、4 ビットの量子化モデルも効果的に微調整して、フル精度モデルに匹敵するパフォーマンスを実現できることを示しています。

ツールラマ

アドレス: https://github.com/OpenBMB/ToolBench

ToolLLM プロジェクトの目的は、一般的なツール使用機能を備えた強力な言語モデルの構築を容易にするために、オープンソースで大規模かつ高品質の命令チューニング SFT データセットを構築することです。

研究者らによると、オープンソースの LLM は何千もの異なる現実世界の API を習得することができ、これは高品質の命令調整データセットを収集することによって実現されるという。

<<:  老黄が勝利! Nvidia H100の注文は24年待ち、マスク氏も黙っていられない

>>: 

ブログ    
ブログ    

推薦する

中国初の人工知能教科書が注目を集める:人材育成が鍵

香港のサウスチャイナ・モーニング・ポストが5月3日に報じたところによると、人工知能分野の世界的な競争...

レコメンデーションシステムにおけるディープラーニングの応用: パーソナライズされたレコメンデーションの新たな領域

インターネットの発展により、人々は膨大な量の情報と製品の選択肢に直面しており、パーソナライズされた推...

マイクロソフトはWindows 11の組み込みアプリにAI機能を導入すると報じられている。写真、スクリーンショット、描画などに新しい機能が追加される。

8月23日、マイクロソフトは過去1年間で人工知能の分野で大きな進歩を遂げており、同社の新製品のほぼ...

AIの成功には適切なデータアーキテクチャが必要

人工知能 (AI) を習得したいと考えている企業にとって、AI はコストを節約し、競争上の優位性を獲...

AI 対応スマート ビルディングの利点は何ですか?

世界が人工知能(AI)を採用し続けるにつれて、AIを使用したスマートビルディングの人気が高まっていま...

AI および機械学習プロジェクトはどの程度安全ですか?

[[355693]]人工知能と機械学習はメリットをもたらす一方で、新たな脆弱性ももたらします。この...

AI、機械学習、RPA業界への期待

毎年、IT 業界メディアの eWEEK では、新製品、革新的なサービス、開発動向など、IT 業界の今...

2018 年のエンタープライズ AI の良い点と悪い点

人工知能の応用はまだ機械学習タスクに限定されていますが、アルゴリズムとハードウェアは徐々に融合してお...

...

OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

IT Homeは1月10日、ChatGPTの開発元であるOpenAIが最近、ChatGPTのようなA...

人工知能があなたの好きな家を見つけるお手伝いをします

潜在的な購入者が住宅を閲覧したり、オンラインで検索したりする際に、エージェントやブローカーによる物件...

企業におけるビッグデータ活用のための実践的AI技術

ビッグデータ、クラウド コンピューティング、高度なアルゴリズムという 3 つの主要なトレンドのユニー...

...

光学行列乗算は人工知能をどう変えるのか

現在の AI の世界は電力を大量に消費し、計算能力が制限されています。モデル開発の軌跡は急速でしたが...

人工知能にとって2019年は厄介な年だった。資金は必要だったが、使えるお金がなかったのだ。

2019年、中国の人工知能分野への投資・融資熱は大幅に低下し、取引量も急減した。恥ずかしいことに、...