Microsoft が OpenAI のライバルと提携!ミストラルの最新のトップレベルモデルはオープンソースではなくなった

Microsoft が OpenAI のライバルと提携!ミストラルの最新のトップレベルモデルはオープンソースではなくなった

ノア著

制作:51CTO テクノロジースタック(WeChat ID:blog)

最近、マイクロソフトは、評価額約20億ドルのフランスのAIユニコーン企業であるミストラルとの提携を発表しました。

ご存知のとおり、昨年 5 月に設立された Mistral は、最初のモデルである Mistral 7B で世界中の AI コミュニティの注目を集めています。 「パフォーマンスが優れ、ハードウェア要件が少なく、オープンソース プロトコルがより緩和されている」Mistral 7B はすぐに人気を呼び、外部の世界では Mistral がヨーロッパ版 OpenAI とみなされるようになりました。

この契約に基づき、Mistral のオープンソースおよび商用言語モデルは Microsoft の Azure AI プラットフォームで利用可能となり、同社は OpenAI に次いで Azure 上で商用言語モデルを提供する 2 番目の企業となります。 OpenAI とのコラボレーションと同様に、Microsoft と Mistral とのコラボレーションも、次世代の大規模言語モデルの開発と展開に重点を置いています。

通常、Mistral のモデルはオープンソースですが、Microsoft との提携により、このスタートアップはより多くの商業的機会を模索できるようになりました。マイクロソフトもミストラルも投資の具体的な詳細は明らかにしていない。

しかし、海外メディアのフィナンシャル・タイムズによると、マイクロソフトはミストラルのAIモデルの立ち上げを支援し、このスタートアップに少額(非公開)の株式を保有する予定だという。これは、マイクロソフトが OpenAI に 100 億ドルを投資してからわずか 1 年余り後のことである。

1. ミストラル・ラージの野望:オープンソースをやめ、GPT-4をベンチマークする

同時に、ミストラルは「ミストラル ラージ」と呼ばれる新しい AI モデルの発売を発表しました。このモデルは、OpenAI の GPT-4 モデルと競合するように設計されています。

Mistral の以前のモデルの一部とは異なり、この新しいモデルはオープン ソースではありません。 Mistral AI チームは、「Mistral Large は、一般的に使用されるベンチマークで優れた結果を達成しており、世界中で API を通じて一般に利用できる 2 番目に大きいモデルとなっています (GPT-4 に次ぐ)」と述べています。

写真

さらに、Mistral Large の主な利点は次のとおりです。

1. 優れた多言語スキル。このモデルは、英語、フランス語、スペイン語、ドイツ語、イタリア語のネイティブスピーカー並みの流暢さを備えており、各言語の文法構造や文化的背景の詳細​​を深く理解することができます。

2. 32K トークンのコンテキスト ウィンドウにより、モデルは大規模なドキュメントから情報を正確に取得して記憶することができ、複雑な状況でのテキストの理解と分析に特に強力です。したがって、大規模なデータセットや複数の言語が関係する複雑なシナリオを処理するために使用できます。

3. 正確な命令実行機能により、開発者は必要に応じてコンテンツ レビュー戦略をカスタマイズできます。たとえば、これは「le Chat」と呼ばれるチャット システム レベルのコンテンツ モデレーション設定に適用されます。

4. 組み込み関数呼び出し機能と、la Plateforme に実装された制約付き出力モードを組み合わせることで、大規模なアプリケーション開発とテクノロジー スタックの近代化を強力にサポートします。開発者はこの機能を使用して、アプリケーションを効率的に構築および更新し、生成したコンテンツが事前に設定された仕様と要件を満たしていることを確認できます。

Mistral Large は、HellaSwag、Arc Challenge、MMLU (Massive Multitask Language Understanding) などのベンチマークで LLaMA 2 70B を大幅に上回る性能を発揮すると報告されています。

写真

Mistral AI は、Mistral Large に加えて、低レイテンシのワークロード向けに設計された最適化モデルである Mistral Small もリリースしました。 Mistral の 8x7B モデルと比較すると、Mistral Small は、低レイテンシを維持しながら優れたパフォーマンスを実現し、Mistral のオープン ソース加重バージョンとフラッグシップ モデルの間の効率的なソリューションをユーザーに提供します。

開発者により良いサービスを提供するために、Mistral AI はクラウド サービス エンドポイントを統合および最適化しました。魅力的なオープン ソース ウェイト エンドポイントを提供するだけでなく、Mistral Small および Mistral Large 向けに最適化されたモデル エンドポイント「mistral-small-2402」および「mistral-large-2402」も新たにリリースし、ユーザーがさまざまなモデルのパフォーマンスとコストのトレードオフを完全に理解できるようにすることを目指しています。

さらに、Mistral AI は JSON 形式モードを導入し、開発者がモデル出力の構造化された有効な JSON データ形式を取得できるようにし、データ処理の利便性と互換性をさらに向上させました。現在、関数呼び出し機能と JSON 出力形式は、Mistral Small および Mistral Large モデルでのみ使用できます。これにより、開発者は内部コード、API、またはデータベースと直接対話するなど、より複雑なアプリケーション シナリオの対話を実装できます。

2. マイクロソフトのレイアウト: ミストラルと提携して3つの分野に注力

さらに、ミストラルは、さまざまなミストラル AI モデルに基づいて構築された新しい会話型チャットボット「Le Chat (フランス語の意味: 猫)」もリリースします。このチャットボットは、会話型インターフェースを通じて同社の AI モデルと対話できるようになります。現在、「Le Chat」は初期顧客向けのテスト段階に入っており、近々法人ユーザー向けにも公開される予定です。

ミストラルの開発の歴史を振り返ると、それは活発なものであったと言えます。同社は昨年6月、欧州史上最大のシードラウンドで1億500万ユーロを調達した。昨年12月には評価額が20億ユーロに達し、4億5000万ユーロの投資を受けた。 Mistral は、ドイツの Aleph Alpha やヘルシンキの Silo AI と並んで、OpenAI の ChatGPT に代わるソリューションを提供するヨーロッパの主要企業の 1 つです。

Mistral は、Microsoft とのこの戦略的コラボレーションを通じて、パートナーの強力な市場チャネルと技術サポートを活用し、AI ソリューションの商用化を加速できるようになります。

Microsoft と OpenAI は常に密接な関係を築いてきたことは特筆に値します。 Microsoft の投資は、OpenAI にとっての激動の時期に続くものである。昨年11月17日、OpenAIの取締役会は共同創設者兼CEOのサム・アルトマン氏の解任を突然発表した。しかし、わずか数日後、アルトマン氏はOpenAIのCEOに復帰した。この混乱の時期に、マイクロソフトはOpenAIを管理する非営利団体の理事会で投票権のないオブザーバーの席を確保することに成功し、このソフトウェア大手はOpenAIの内部事情についてより深い洞察を得たが、依然として主要な決定に対する投票権はない。

Microsoft は、「すべての卵を 1 つのバスケットに入れない」という投資哲学も理解しています。今回、マイクロソフトはミストラル AI との長期的パートナーシップを発表し、協力の焦点は主にスーパーコンピューティング インフラストラクチャ、市場拡大、人工知能の研究開発という 3 つの中核領域に及びます。

「Mistral AI との複数年にわたるコラボレーションを発表できることを嬉しく思います。これにより、Azure 上でオープン モデルと基礎モデルの最良の選択肢をお客様に提供するという当社の取り組みがさらに強化されます」と、Microsoft の CEO である Satya Nadella 氏は述べています。

コラボレーションの一環として、Microsoft は Mistral AI に Azure AI スーパーコンピューティング インフラストラクチャへのアクセスを提供し、AI トレーニングと推論ワークロードの優れたパフォーマンスとスケーラビリティを確保します。

このコラボレーションの目的は、Azure AI Studio のモデル アズ ア サービス (MaaS) と Azure Machine Learning モデル カタログを通じて、顧客が Mistral AI の高度なモデルに簡単にアクセスできるようにすることです。ユーザーは、Microsoft Azure Consumption Commitments (MACC) を活用して Mistral AI のモデルを購入し、世界中で利用可能性を高めることができます。

さらに、Microsoft と Mistral AI は、特定の顧客ニーズ、特に欧州の公共部門のワークロードに関する綿密な協力に合わせてカスタマイズされたモデルをトレーニングする可能性を共同で検討する予定です。

参考リンク:

https://thenextweb.com/news/mistral-releases-new-ai-model-partners-microsoft

https://www.theverge.com/2024/2/26/24083510/microsoft-mistral-partnership-deal-azure-ai

https://analyticsindiamag.com/mistrals-le-big-model-beats-googles-gemini-pro-signs-multi-year-deal-with-microsoft/

<<:  NTU Yu Yangによる徹底分析:「世界モデル」とは何か?

>>: 

ブログ    
ブログ    
ブログ    

推薦する

...

...

機械学習におけるラベル漏洩とそれがモデルのパフォーマンスに与える影響について紹介します

優れた、またはほぼ優れたモデルのパフォーマンスに圧倒されていますか? あなたの幸せは裏切られています...

ギャップを埋める:AI時代のデータセンターの変革

ハイパースケールかエンタープライズかを問わず、現代のあらゆるデータセンターは、より広範なイノベーショ...

...

...

AIは依然として人気、テクノロジー企業の人材育成の道筋を見てみよう

人工知能ブームが始まって以来、人材不足が業界の「主要テーマ」となっている。これを踏まえ、大手テクノロ...

ロボットチャットGPTが登場: ビッグモデルが現実世界に登場、DeepMindの画期的な進歩

インターネット上の言語と画像を習得した後、大きなモデルが最終的に現実世界に入り、「具現化された知能」...

Anthropic が「GPT-4 のライバル」言語モデル Claude 2 をリリース: パフォーマンスが向上し、長いテキストもサポート

7 月 12 日のニュース、Anthropic は最近、新しい Claude 2 言語モデルをリリー...

MITの新しい研究により、物体間の潜在的な関係性を理解し、AIが人間のように世界を「見る」ことが可能になった。

[[441262]]人々がシーンを観察するとき、通常はシーン内のオブジェクトとそれらの間の関係を観...

ニューラル放射線フィールドは「神経」を取り除き、3D効果の品質を低下させることなくトレーニング速度を100倍以上向上させます。

2020年、カリフォルニア大学バークレー校、Google、カリフォルニア大学サンディエゴ校の研究者...

...

シアトル港が機械学習を活用して航空貨物業務を効率化する方法

シアトル港は100年以上の歴史がありますが、非常に新しい技術を導入しています。シアトル港とシアトル・...

...