少し前に、Mistral AI がリリースした Mixtral 8x7B モデルがオープンソース コミュニティ全体で人気を博しました。そのアーキテクチャは GPT-4 と非常によく似ており、多くの人がこれを GPT-4 の「小型バージョン」と表現しています。 OpenAI チームが GPT-4 のパラメータ数とトレーニングの詳細については口を閉ざしていることは周知の事実です。 Mistral 8x7B のリリースにより、開発者は間違いなく「GPT-4 に非常に近い」オープンソース オプションを利用できるようになります。 ベンチマークでは、Mistral 8x7B は Llama 2 70B よりも優れており、ほとんどの標準ベンチマークで GPT-3.5 と同等かわずかに優れています。 画像出典: https://mistral.ai/news/mixtral-of-experts/ この研究が発表されると、多くの人が「クローズドソースのビッグモデルは終焉を迎えた」と言った。 わずか数週間で、機械学習愛好家の Vaibhav (VB) Srivastav 氏は次のように述べました。「AutoAWQ の最新バージョン (Mixtral、LLaVa などのモデルの量子化をサポート) のリリースにより、ユーザーは Mixtral 8x7B Instruct と Flash Attention 2 を組み合わせて高速推論を実現できるようになりました。この機能には、約 24GB の GPU VRAM と 10 行未満のコードしか必要ありません。」 画像出典: https://twitter.com/reach_vb/status/1741175347821883502 AutoAWQ アドレス: https://github.com/casper-hansen/AutoAWQ 操作手順は以下のとおりです。 まず、AutoAWQ とトランスフォーマーをインストールします。 2 番目のステップは、トークナイザーとモデルを初期化することです。 3 番目のステップは TextStreamer を初期化することです。 4 番目のステップは、入力をトークン化することです。 5 番目のステップでは、以下を生成します。 プロジェクトの設定が完了したら、Mixtral との会話を開始できます。たとえば、ユーザーが「最高のアメリカーノを作るにはどうすればいいですか? 簡単な手順でできますか?」と質問すると、Mixtral は手順 1、2、3 などで回答します。 プロジェクトで使用されるコード: Srivastav 氏は、上記の実装により、ユーザーは Mixtral のすべての微調整を AWQ で実行し、Flash Attention 2 を使用して改善できるとも述べています。 この研究を見たネットユーザーは思わずこう言った。「本当にすごい」 その他の関連リンクについては、以下を参照してください。 モデルアドレス: https://huggingface.co/models?search=mixtral%20awq Transformer の量子化テクノロジー: https://huggingface.co/docs/transformers/main/en/quantization |
<<: AI研究も印象派から学べるのでしょうか?これらの生きているような人物は3Dモデルであることが判明した
来月、大手自動車メーカーのグループが米国でブロックチェーンベースの車両識別ネットワークの初のフィール...
[[353503]]画像ソース: https://pixabay.com/images/id-575...
Deep Instinct の CIO である Carl Froggett 氏は、2024 年に予算...
[[389356]]今日、人工知能技術は急速に発展しており、イノベーションのペースは加速しています。...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
1. インテリジェントビル通信システムの構成インテリジェントビル通信システムは、主に以下の部分で構成...
デジタルパフォーマンス管理の変革デジタル目標設定パフォーマンス計画は、企業の繁栄戦略と業務を結び付け...
ディープラーニングとニューラル ネットワークの進歩により、自然言語処理とコンピューター ビジョンに大...
[[334032]]顔認識と 3D テクノロジーが融合したとき、最終的な勝者は誰になるでしょうか? ...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
さまざまなメーカーが続々と参入し、スマートカー市場はますます熱を帯びています。このような背景から、ス...
AdobeやCelsysなどのソフトウェア企業は近年、デジタルデザインソフトウェアに人工知能機能を追...