Mistral と Microsoft が「小さな言語モデル」の波を起こしました。 Mistralのコーディング能力はGPT-4より優れており、コストは2/3に削減されます

Mistral と Microsoft が「小さな言語モデル」の波を起こしました。 Mistralのコーディング能力はGPT-4より優れており、コストは2/3に削減されます

最近、「小さな言語モデル」がにわかに話題になっています。

今週月曜日、4億1500万ドルの資金調達を完了したばかりのフランスのAIスタートアップ企業Mistralが、Mixtral 8x7Bモデルをリリースした。

このオープンソース モデルは、100 GB 以上のメモリを搭載したコンピューターで実行できるほど小さいサイズであるにもかかわらず、いくつかのベンチマークで GPT-3.5 に匹敵し、開発者の間ですぐに賞賛されました。

特定のタスクを処理するようにトレーニングされたさまざまな小型モデルを組み合わせて効率を高めるため、Mixtral 8x7B と呼ばれています。

この「専門家の希薄混合」モデルは実装が容易ではない。OpenAIは今年初め、MoEモデルを適切に動作させることができなかったため、モデルの開発を断念しなければならなかったと言われている。

そして、その翌日、マイクロソフトは Phi-2 モデルの新バージョンをリリースしました。

ミストラルの 70 億のパラメータと比較すると、Phi-2 はわずか 27 億のパラメータで、携帯電話で実行できるほど小さいです。比較すると、GPT-4 には 1 兆個のパラメータがあります。

Phi-2 は、計算能力が限られている携帯電話でもモデルが正確な結果を生成できるように、十分に高品質の慎重に選択されたデータセットでトレーニングされました。

マイクロソフトや他のソフトウェアメーカーが小規模モデルをどのように使用するかは不明ですが、最も明らかな利点は、大規模な AI アプリケーションの実行コストが削減され、生成 AI テクノロジの適用範囲が大幅に広がることです。

これは大問題だ。

Mistral-mediumコード生成はGPT-4を上回る

最近、Mistral-medium が内部テスト用に公開されました。

あるブロガーがオープンソースの Mistral-medium と GPT-4 のコード生成機能を比較しました。その結果、Mistral-medium は GPT-4 よりも強力なコード機能を備えているものの、コストは GPT-4 のわずか 30% であることが示されました。

合計金額は:

1) ミストラルは必ず仕事を完了し、完了率は非常に高いです。

2) 長い説明出力にトークンが無駄に消費されない。

3) 提供されるアドバイスは非常に具体的です。

最初の質問は、「フィボナッチ素数を生成する PyTorch データセット用に cuda に最適化されたコードを記述してください。」です。

Mistral-Medium によって生成されたコードは本格的かつ完全です。

GPT-4 によって生成されたコードは満足できるものではありません。

多くのトークンが無駄になりますが、有用な情報は出力されません。

すると、GPT-4 は具体的な関連コードなしでスケルトン コードのみを出力しました。

質問 2: 「約 10 億の大規模な Apache HTTP アクセス ファイルを SqlLite データベースに取り込み、それを使用して sales.html と product.html へのアクセスのヒストグラムを生成する効率的な Python コードを記述してください。」

Mistral の出力は素晴らしく、ログは CSV 形式ではありませんが、簡単に変更できます。

GPT-4 のパフォーマンスは依然として低いです。

これまで、ブロガーは複数のコード生成モデルをテストしてきましたが、GPT-4 は常に 1 位にランクされていました。

そして今、強力なライバルであるミストラル・ミディアムがついに登場し、その座を奪おうとしている。

公開された例は 2 つだけですが、ブロガーは複数の問題をテストし、結果は同様でした。

彼は次のように提案しました。「Mistral-medium はコード生成の品質において優れた実績があるため、あらゆる場所のコード コパイロットに統合される必要があります。」

誰かが 1,000 トークンあたりの入力コストと出力コストを計算し、Mistral-medium は GPT-4 と比較してコストを 70% 直接削減することを発見しました。

確かに、トークン手数料を 70% 節約するのは決して小さなことではありません。長い出力を記述する必要がないため、さらにコストを節約することもできます。

<<:  この論文は最初のICLRで却下され、コードは最適化されすぎていた。word2vecの作者であるTomas Mikolov氏がその裏話を語った。

>>: 

ブログ    

推薦する

AIのおかげで、これら5つの業界の求人需要は大幅な成長傾向を示すだろう

編集者注: 人工知能と人間の仕事は、今日多くの人が話題にしているトピックであり、議論の焦点は主に、人...

プログラマーが使用する基本アルゴリズムトップ10

[[188736]]アルゴリズム1: クイックソートアルゴリズムクイックソートは、Tony Hal...

建設ロボット代替の流れが到来。高齢化した移民労働者はどこへ行くのか?

長年にわたり、数億人の出稼ぎ労働者が経済建設と社会発展に積極的に参加し、中国の近代化推進に多大な貢献...

...

人工知能とモノのインターネットの動的統合の探究(I)

AI と IoT の統合により、私たちの日常生活に新たな効率、自動化、インテリジェンスがもたらされ...

新しいアルゴリズムとアーキテクチャ メトリックを備えた Lattix 5.0 アーキテクチャ管理ソフトウェアがリリースされました

Lattix は最近、インフラストラクチャ管理ソフトウェアのバージョン 5.0 をリリースしました。...

ポストエピデミック時代におけるスマートビルディング技術の重要な役割

COVID-19の世界的パンデミックを受けて、職場への復帰は通常通りの業務ではなく、セキュリティ シ...

アリババはどうやって1分で会話型ロボットを作ったのでしょうか?

[[319957]] Alimeiの紹介:2020年に突然発生したCOVID-19パンデミックに直...

研究によると、2027年までにAIの電力消費量は一部の国の電力消費量と同等になると予想されている。

10月17日のニュースによると、人工知能はプログラマーのプログラミング速度を上げ、ドライバーの安全...

...

[乾物] Tencent Cloud FPGA 上のディープラーニング アルゴリズム

テンセントクラウド基礎製品センターとテンセントアーキテクチャプラットフォーム部門で構成されたテンセン...

Apple Watchも新型コロナウイルスを検知可能:症状が出る7日前に検知可能

現在、新型コロナウイルスの核酸検査のほとんどは、咽頭ぬぐい液を使って行われている。スマートウォッチを...

中国のAIハイテクが2018CESを制覇、Zhuner翻訳機が世界の家電「オスカー」を驚かせる

2018 CES(国際コンシューマー・エレクトロニクス・ショー)が1月9日から12日まで米国ラスベガ...

...