ミストラル・ミディアムが誤って漏洩した?以前は API 経由でのみ利用可能でしたが、そのパフォーマンスは GPT-4 に近いです。 CEO の最新の声明: これは真実であり、初期のクライアントの従業員によって漏洩されたものです。しかし、引き続き注目してください。 写真 つまり、このバージョンはまだ古く、実際のバージョンの方がパフォーマンスが優れています。 この2日間、「Miqu」という謎のモデルが大手モデルコミュニティで話題を呼んでおり、多くの人がこれがLIamaの微調整版ではないかと疑っています。 写真 また、Mistral CEOは、早期の顧客にできるだけ早くGPT-4のパフォーマンスに近いAPIを提供する必要があったため、Mistral MediumをLlama 2をベースに再トレーニングしたと説明。事前トレーニングはMistral 7Bがリリースされた日に完了したとのこと。 真実が明らかになった今、CEOは依然として秘密にしており、多くのネットユーザーが期待を込めて期待している。 写真 写真 ミストラル・ミディアムが誤って漏洩もう一度事件全体を振り返ってみましょう。 1月28日、Miqu Devという謎のユーザーがHuggingFaceに「miqu-1-70b」というファイルセットを投稿した。 写真 ドキュメントには、新しい LLM の「プロンプト形式」とユーザー対話方法は Mistral と同じであると記載されています。 同日、4chan の匿名ユーザーが miqu-1-70b ファイルへのリンクを投稿しました。 そこで、一部のネットユーザーがこの不思議なモデルに気づき、ベンチマークテストを始めました。 結果は驚くべきもので、EQ-Bench(ローカル評価)で83.5ポイントを獲得し、 GPT-4を除く世界中の他のすべての大規模モデルを上回りました。 ネットユーザーたちは一時期、この大物モデルをランキングに加え、その背後にいる本当のモデルを見つけ出すよう強く求めていた。 疑わしい点は主に 3 つあります。
一部のネットユーザーは比較結果を投稿した。標準的な答えを知っているのは合理的だが、ロシア語の文言でさえミストラル・ミディアムとまったく同じであるということはあり得ない。 写真
しかし、他のネットユーザーは、それがMoEモデルではなく、LIama 2と同じアーキテクチャ、パラメータ、レイヤー数を持っていることを発見しました。 写真 しかし、他のネットユーザーからは、ミストラル7bもラマ7Bと同じパラメータとレイヤー数を持っているのではないかとすぐに疑問視されました。 むしろ、これはミストラルの初期の非 MoE バージョン モデルに似ています。 写真 しかし、多くの議論を経て、多くの人々の心の中でこれがすでに GPT-4 に最も近いモデルであることは否定できません。 写真 現在、ミストラルの共同創設者兼CEOのアーサー・メンシュ氏は、この漏洩は同社の初期の顧客の熱心すぎる従業員が、彼らがトレーニングして公開した古いモデルの量子化バージョンを漏洩したことによって引き起こされたと認めている。 Perplexity に関しては、CEO は Mistral Medium の重量を入手したことがないことも明らかにしました。 写真 ネットユーザーたちはこのバージョンが削除されるのではないかと心配している。 写真 興味深いことに、メンシュ氏はHuggingFaceの投稿を削除するよう求めなかった。 写真 代わりに、私は「帰属の問題を検討するかもしれない」というコメントを残しました。 参考リンク: |
<<: ChatGPTへのチップは本当に効果があります! 10元や10万元は大きな効果がありますが、1セントでは増えるどころか減るだけです。
チューリッヒ大学の研究者らは、複雑で未知の環境でもドローンが高速で自律飛行できるようにする新たな人工...
「シナプストランジスタ」は、脳の可塑性を模倣して、データの処理と保存を同時に行うことができます。 ...
半世紀以上前に誕生して以来、人工知能(AI)革命は全世界に大きな影響を与えてきました。特に過去10年...
犯罪現場の足跡が貴重な証拠となるのと同様に、野生動物の足跡も野生生物保護活動家にとって同様に貴重なも...
人工知能における画像処理人工知能には画像処理のためのさまざまなタスクがあります。この記事では、物体検...
序文近年、ディープラーニングは音声、画像、自然言語処理などの分野で優れた成果を上げており、最も注目さ...
1. 情報フローシナリオの課題と並べ替えモデルの独自の利点多くの学生は再ランキングに馴染みがないかも...
私を含め、ほとんどの人は人間の感情の変化を正確に把握することはできませんが、コンピューターはそれがで...
近年、セキュリティビデオ監視はソフトウェアとハードウェアの両方で大きな技術的進歩を遂げており、さ...
[[251301]]ロボットがあなたの仕事を奪う可能性はありますか? あなたはロボットの仕事を手伝う...
Nature Communications に最近発表された新しい研究によると、高度な視覚認知機能は...
[[384489]]広告システムに取り組んでいたとき、接続されたプラットフォーム上のほとんどの広告シ...
2016 年が過ぎ、BEEVA Labs のデータ アナリスト Ricardo Guerrero G...