Microsoft が OpenAI のライバルと提携!ミストラルの最新のトップレベルモデルはオープンソースではなくなった

ノア著

制作：51CTO テクノロジースタック（WeChat ID：blog）

最近、マイクロソフトは、評価額約20億ドルのフランスのAIユニコーン企業であるミストラルとの提携を発表しました。

ご存知のとおり、昨年 5 月に設立された Mistral は、最初のモデルである Mistral 7B で世界中の AI コミュニティの注目を集めています。「パフォーマンスが優れ、ハードウェア要件が少なく、オープンソースプロトコルがより緩和されている」Mistral 7B はすぐに人気を呼び、外部の世界では Mistral がヨーロッパ版 OpenAI とみなされるようになりました。

この契約に基づき、Mistral のオープンソースおよび商用言語モデルは Microsoft の Azure AI プラットフォームで利用可能となり、同社は OpenAI に次いで Azure 上で商用言語モデルを提供する 2 番目の企業となります。 OpenAI とのコラボレーションと同様に、Microsoft と Mistral とのコラボレーションも、次世代の大規模言語モデルの開発と展開に重点を置いています。

通常、Mistral のモデルはオープンソースですが、Microsoft との提携により、このスタートアップはより多くの商業的機会を模索できるようになりました。マイクロソフトもミストラルも投資の具体的な詳細は明らかにしていない。

しかし、海外メディアのフィナンシャル・タイムズによると、マイクロソフトはミストラルのAIモデルの立ち上げを支援し、このスタートアップに少額（非公開）の株式を保有する予定だという。これは、マイクロソフトが OpenAI に 100 億ドルを投資してからわずか 1 年余り後のことである。

1. ミストラル・ラージの野望：オープンソースをやめ、GPT-4をベンチマークする

同時に、ミストラルは「ミストラルラージ」と呼ばれる新しい AI モデルの発売を発表しました。このモデルは、OpenAI の GPT-4 モデルと競合するように設計されています。

Mistral の以前のモデルの一部とは異なり、この新しいモデルはオープンソースではありません。 Mistral AI チームは、「Mistral Large は、一般的に使用されるベンチマークで優れた結果を達成しており、世界中で API を通じて一般に利用できる 2 番目に大きいモデルとなっています (GPT-4 に次ぐ)」と述べています。

写真

さらに、Mistral Large の主な利点は次のとおりです。

1. 優れた多言語スキル。このモデルは、英語、フランス語、スペイン語、ドイツ語、イタリア語のネイティブスピーカー並みの流暢さを備えており、各言語の文法構造や文化的背景の詳細を深く理解することができます。

2. 32K トークンのコンテキストウィンドウにより、モデルは大規模なドキュメントから情報を正確に取得して記憶することができ、複雑な状況でのテキストの理解と分析に特に強力です。したがって、大規模なデータセットや複数の言語が関係する複雑なシナリオを処理するために使用できます。

3. 正確な命令実行機能により、開発者は必要に応じてコンテンツレビュー戦略をカスタマイズできます。たとえば、これは「le Chat」と呼ばれるチャットシステムレベルのコンテンツモデレーション設定に適用されます。

4. 組み込み関数呼び出し機能と、la Plateforme に実装された制約付き出力モードを組み合わせることで、大規模なアプリケーション開発とテクノロジースタックの近代化を強力にサポートします。開発者はこの機能を使用して、アプリケーションを効率的に構築および更新し、生成したコンテンツが事前に設定された仕様と要件を満たしていることを確認できます。

Mistral Large は、HellaSwag、Arc Challenge、MMLU (Massive Multitask Language Understanding) などのベンチマークで LLaMA 2 70B を大幅に上回る性能を発揮すると報告されています。

写真

Mistral AI は、Mistral Large に加えて、低レイテンシのワークロード向けに設計された最適化モデルである Mistral Small もリリースしました。 Mistral の 8x7B モデルと比較すると、Mistral Small は、低レイテンシを維持しながら優れたパフォーマンスを実現し、Mistral のオープンソース加重バージョンとフラッグシップモデルの間の効率的なソリューションをユーザーに提供します。

開発者により良いサービスを提供するために、Mistral AI はクラウドサービスエンドポイントを統合および最適化しました。魅力的なオープンソースウェイトエンドポイントを提供するだけでなく、Mistral Small および Mistral Large 向けに最適化されたモデルエンドポイント「mistral-small-2402」および「mistral-large-2402」も新たにリリースし、ユーザーがさまざまなモデルのパフォーマンスとコストのトレードオフを完全に理解できるようにすることを目指しています。

さらに、Mistral AI は JSON 形式モードを導入し、開発者がモデル出力の構造化された有効な JSON データ形式を取得できるようにし、データ処理の利便性と互換性をさらに向上させました。現在、関数呼び出し機能と JSON 出力形式は、Mistral Small および Mistral Large モデルでのみ使用できます。これにより、開発者は内部コード、API、またはデータベースと直接対話するなど、より複雑なアプリケーションシナリオの対話を実装できます。

2. マイクロソフトのレイアウト: ミストラルと提携して3つの分野に注力

さらに、ミストラルは、さまざまなミストラル AI モデルに基づいて構築された新しい会話型チャットボット「Le Chat (フランス語の意味: 猫)」もリリースします。このチャットボットは、会話型インターフェースを通じて同社の AI モデルと対話できるようになります。現在、「Le Chat」は初期顧客向けのテスト段階に入っており、近々法人ユーザー向けにも公開される予定です。

ミストラルの開発の歴史を振り返ると、それは活発なものであったと言えます。同社は昨年6月、欧州史上最大のシードラウンドで1億500万ユーロを調達した。昨年12月には評価額が20億ユーロに達し、4億5000万ユーロの投資を受けた。 Mistral は、ドイツの Aleph Alpha やヘルシンキの Silo AI と並んで、OpenAI の ChatGPT に代わるソリューションを提供するヨーロッパの主要企業の 1 つです。

Mistral は、Microsoft とのこの戦略的コラボレーションを通じて、パートナーの強力な市場チャネルと技術サポートを活用し、AI ソリューションの商用化を加速できるようになります。

Microsoft と OpenAI は常に密接な関係を築いてきたことは特筆に値します。 Microsoft の投資は、OpenAI にとっての激動の時期に続くものである。昨年11月17日、OpenAIの取締役会は共同創設者兼CEOのサム・アルトマン氏の解任を突然発表した。しかし、わずか数日後、アルトマン氏はOpenAIのCEOに復帰した。この混乱の時期に、マイクロソフトはOpenAIを管理する非営利団体の理事会で投票権のないオブザーバーの席を確保することに成功し、このソフトウェア大手はOpenAIの内部事情についてより深い洞察を得たが、依然として主要な決定に対する投票権はない。

Microsoft は、「すべての卵を 1 つのバスケットに入れない」という投資哲学も理解しています。今回、マイクロソフトはミストラル AI との長期的パートナーシップを発表し、協力の焦点は主にスーパーコンピューティングインフラストラクチャ、市場拡大、人工知能の研究開発という 3 つの中核領域に及びます。

「Mistral AI との複数年にわたるコラボレーションを発表できることを嬉しく思います。これにより、Azure 上でオープンモデルと基礎モデルの最良の選択肢をお客様に提供するという当社の取り組みがさらに強化されます」と、Microsoft の CEO である Satya Nadella 氏は述べています。

コラボレーションの一環として、Microsoft は Mistral AI に Azure AI スーパーコンピューティングインフラストラクチャへのアクセスを提供し、AI トレーニングと推論ワークロードの優れたパフォーマンスとスケーラビリティを確保します。

このコラボレーションの目的は、Azure AI Studio のモデルアズアサービス (MaaS) と Azure Machine Learning モデルカタログを通じて、顧客が Mistral AI の高度なモデルに簡単にアクセスできるようにすることです。ユーザーは、Microsoft Azure Consumption Commitments (MACC) を活用して Mistral AI のモデルを購入し、世界中で利用可能性を高めることができます。

さらに、Microsoft と Mistral AI は、特定の顧客ニーズ、特に欧州の公共部門のワークロードに関する綿密な協力に合わせてカスタマイズされたモデルをトレーニングする可能性を共同で検討する予定です。