オープンソースモデルの新記録:Mixtral 8x7B Instructを超えるモデルが登場

オープンソースモデルの新記録:Mixtral 8x7B Instructを超えるモデルが登場

Llama、Llama 2 から Mixtral 8x7B まで、オープンソース モデルのパフォーマンス記録は継続的に更新されています。 Mistral 8x7B はほとんどのベンチマークで Llama 2 70B や GPT-3.5 よりも優れているため、「GPT-4 に非常に近い」オープンソース オプションとも考えられています。

少し前の論文で、このモデルの開発元である Mistral AI 社は、Mixtral 8x7B の技術的な詳細を発表し、Mixtral 8x7B – Instruct チャット モデルをリリースしました。このモデルのパフォーマンスは、人間による評価ベンチマークにおいて、GPT-3.5 Turbo、Claude-2.1、Gemini Pro、Llama 2 70B チャット モデルを大幅に上回ります。 Mixtral-Instruct は、BBQ や BOLD などのベンチマークでも偏りが少ないことが示されています。

しかし、最近ではMixtral Instructも追い抜かれてしまいました。 Nous Research という会社は、Mixtral 8x7B に基づいてトレーニングされた新しいモデル、Nous-Hermes-2 Mixtral 8x7B が、多くのベンチマークで Mixtral Instruct を上回り、SOTA パフォーマンスを達成したと発表しました。

「私の知る限り、これは Mixtral Instruct に勝る最初の Mixtral ベースのモデルであり、私の個人的なテストでは、最高のオープンソース LLM モデルかもしれません!」と、同社の共同設立者であり X プラットフォーム ユーザーでもある @Teknium (e/λ) は述べています。

モデル プロファイル カードには、モデルが 100 万を超えるエントリ (主に GPT-4 によって生成されたデータ) と、AI 分野全体のオープン データセットからのその他の高品質データでトレーニングされたことが示されています。モデルは、その後の微調整方法に応じて 2 つのバージョンに分割されます。

  • Nous Hermes 2 Mixtral 8x7B SFT は SFT メソッドのみを使用して微調整されています。リンク: https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-SFT
  • Nous Hermes 2 Mixtral 8x7B DPO は、SFT+DPO 方式を使用して微調整されています。リンク: https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO. Mixtral Nous-Hermes 2 DPO アダプター リンク: https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO-adapter

2 つのバージョンがリリースされた理由については、@Teknium (e/λ) が次のように説明しています。

モデルからの出力の例を次に示します。

1. データ可視化のためのコードを書く

2. サイバーパンクサイケデリック詩を書く

3. 入力テキストに基づいてプロンプトを作成する

パフォーマンス数値は次のとおりです。

1. GPT4オール

2. AGI評価

3. BigBench推論テスト

このモデルがリリースされてすぐに、生成 AI のスタートアップ企業 Together AI が、自社の API でこのモデルをサポートすることを発表しました。 Together AIは昨年11月に1億ドルを超えるラウンドA資金調達を完了したばかりだ。 Together AI は、Nous Research が Nous Hermes 2 Mixtral 8x7B モデルをトレーニングおよび微調整する間、コンピューティング能力のサポートを提供しました。

画像出典: https://twitter.com/togethercompute/status/1746994443482538141

Nous Researchはボランティアプロジェクトとして始まりました。同社は最近、Distributed GlobalとOSS Capitalが共同で主導し、Together AIの創設者兼CEOであるVipul Ved Reddy氏を含む数名の著名な投資家の参加を集めた520万ドルのシードラウンドを成功裏に完了しました。 Nousは2024年にNous-Forgeと呼ばれるAIオーケストレーションツールをリリースする予定です。

公式サイトの紹介から、同社の製品の位置付けは、プログラムを接続して実行し、顧客の文書を取得して分析し、生産に使用するための合成データを生成することができるということがわかります。これらの独自のシステムは、ビジネスの分野に関係なく、クライアントのニーズに合わせて微調整できます。これらの斬新なアルゴリズムを通じて、彼らはデジタルアテンションエコシステム内のこれまで構造化されていなかったテーマ別データを集約・分析し、隠れた市場動向情報を顧客に提供したいと考えています。

<<:  Microsoft TaskWeaver オープンソース フレームワーク: データ分析と業界のカスタマイズを組み合わせてトップ エージェント ソリューションを作成

>>:  ヤン・ルカンは、テンセントのポートレート写真生成が自由にできることを明かした。

ブログ    
ブログ    

推薦する

アンドリュー・ン氏のチームが2019年のAIトレンドを振り返る:自動運転は寒い冬を迎え、ディープフェイクはモンスターとなった

あと数日で2019年も終わりです。今年は AI が夢から現実へと移り変わる年です。NLP から自動運...

脳も学習を強化しています! 「価値判断」は脳によって効率的にコード化され、ニューロンに公開される

[[437266]]私たち一人ひとりは、人生において、「今夜何を食べるか」「明日はどこに遊びに行くか...

ビデオ生成における新たなブレークスルー:PixelDance、複雑な動きやクールな特殊効果を簡単に表現

最近では、画面を占め続ける大規模な言語モデルに加え、動画生成技術も大きく進歩し、多くの企業が新たなモ...

Stable Diffusion 3 技術レポート公開: Sora と同じアーキテクチャの詳細を公開

いよいよ、「ヴィンセント・ピクチャーズの新王者」Stable Diffusion 3 の技術レポート...

戦争におけるAI:ウクライナはロシア軍兵士を「調査」するために顔認識を使用しているが、これは単なる子供の遊びだ

現代人は時間の概念が曖昧です。よく考えなければ、プーチン大統領が2月24日にウクライナに宣戦布告して...

国家戦略科学者としてトップのAI研究者である朱松春氏は中国に戻り、北京総合AI研究所を設立した。

知乎のホットな投稿によると、中国のトップAI研究者でUCLA教授の朱松春氏が清華大学オートメーション...

新たな自動運転ランキングが発表

最近、米国の市場調査機関であるナビガントリサーチが、自動運転の競争力に関する新たなランキングを発表し...

「地表」から「宇宙」まで、探査ロボットが未知の領域の秘密を解き明かす

ロボットは現代社会で生み出された新しい種です。科学技術の進歩により、ロボットの開発はもはや人間の能力...

2021年第2四半期の人工知能へのベンチャーキャピタル投資は200億ドルを超え、新たな記録を樹立した。

CB Insightsが発表した2021年第2四半期のAI(人工知能)レポートによると、疫病の刺激...

コンピュータビジョンプロジェクト: 10 個の高品質オープンソースデータセットがリリースされました

コンピューター ビジョンは、ほぼすべての産業分野で進歩を加速させています。 コンピューター ビジョン...

人工知能の今後の発展はどうなるのでしょうか?

汎用人工知能の任務は、ユビキタスな視覚と聴覚を制御することです。「認識」を例にとると、汎用人工知能の...

マスク氏:大胆なアイデアがあるんです!信号機にAIビジョンプラグインを追加する

オフィスワーカーにとって、大都市では 2 種類の交通手段があります。 彼らは日中は仕事に行くことも、...

ロボットもこのように遊べるのでしょうか?自分の目で確認したら、これが私の欲しいロボットだ!

「タイムレイダース」を覚えていますか? 1つは1999年、もう1つは2018年のもので、わずか19年...

AIの「心の目」が透けて見える!ニューラルネットワークに大きな変化、モデル生成の背後にあるロジックが初めて明らかに

エイリアンの小さな頭の中で何が起こっているのか、そしてエイリアンは世界をどのように認識しているのか疑...

銀行における機械学習の応用シナリオは何ですか?

1. 機械学習プラットフォームとビッグデータプラットフォームの関係の明確化[[346643]]機械...