1300億のパラメータを持つ中国初の大規模数学モデルMathGPTがリリースされました!複数のベンチマークがGPT-4を上回る

1300億のパラメータを持つ中国初の大規模数学モデルMathGPTがリリースされました!複数のベンチマークがGPT-4を上回る

数学的 AI ビッグモデルはこの分野の将来を変える可能性があります。

本日、中国初の兆スケール数学モデルであるMathGPTが正式にリリースされ、パブリックベータ版が開始されました。

本日より公式サイトからアカウント登録を申請し、無料トライアルを体験いただけます。

内部テスト申請アドレス: www.mathgpt.com

その背後には、20年間数学の分野に深く関わってきた「TAL」チームが開発した数学の垂直分野の大きなモデルがあります。世界中の数学愛好家や研究機関を対象としており、問題解決とプレゼンテーションのアルゴリズムに重点を置いています。

MathGPT は、数学専用に構築された中国初の大規模モデルです。

テキストまたは画像で数学の問題をアップロードするだけで、答えに関する会話形式のフィードバックが得られます。

さらに、「ランダム質問」オプションを使用して、数学の問題をランダムに生成し、システムに答えを出させることもできます。

現在、MathGPT は PC とモバイル向けに中国語版と英語版をサポートしています。

数学的問題解決能力をリードする

実際、Future Education は今年 5 月にはすでに、MathGPT という独自の数学ビッグモデルを開発中であると発表していました。

CTOのTian Mi氏によると、MathGPTはFuture Educationが長年にわたって蓄積してきた教育および研究データを統合し、数学の分野に重点を置いています。

その中で、兆レベルの大規模モデルのトレーニング、推論、展開フレームワークは、モデルに強力な機能を与えます。高品質な教育データにより、質問の計算、説明、質問への回答など、複数のタスクの継続的なトレーニングと監督下での微調整が可能になり、優れたパフォーマンスを発揮します。さらに、人間によるフィードバック調整の助けにより、モデルの全体的な品質がさらに向上します。

評価結果から判断すると、MathGPT は問題解決の精度、安定性、ユーザー エクスペリエンスにおいて明らかな利点があります。

MathGPTの公式サイトによると、MathGPTの数学計算能力は小学校、中学校、高校の数学の問題をカバーしているとのこと。問題の種類は計算問題、応用問題、代数問題など。問題に対してフォローアップの質問もできますが、数学以外の質疑応答のやり取りはまだ公開されていません。

MathGPT 技術レポート

MathGPT技術レポートによると、CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、大学入試数学、Math401を含む6つの公開数学評価セットのテスト結果の中で、New OrientalのMathGPTが多くのテストで最高得点を達成しました。

同時に、MathGPT は C-Eval の中学・高校向け総合テストコレクションでも優れた成績を収めています。

中学校・高校の教科のC評価リストにおけるMathGPTスコア

問題解決の安定性と説明のわかりやすさの点では、MathGPT は多数の有名な教師の問題解決プロセスのデータに基づいてモデルをトレーニングしており、モデルの問題解決手順は専門的で明確です。

級数問題を例にとると、MathGPT が与える解答には「分析」、「詳細説明」、「要点」の 3 つの部分が含まれており、一般的な大まかなモデルの大まかな説明方法よりも詳細になっています。

このうち、「分析」では、問題解決のアイデアや考え方を提供し、ユーザーが問題をよりよく理解できるようにします。「詳細説明」では、具体的な計算方法と回答を示します。最後に、「要点」セクションでは、テストのポイント、難点、問題の要点に関するプロンプトを提供し、ユーザーが問題の意図を見直して振り返り、1つの例から推論を導き出すのに役立ちます。

ユーザーにとって、数学の問題を勉強するということは、答えそのものを得ることだけではなく、答えの背後にある問題解決の原則と論理的思考を得ることも意味します。

他の一般的な大規模モデルと比較して、MathGPT はより高い精度で問題を解決し、回答をより明確に分析し、より明確に説明できるため、AI 製品を使用して数学の問題を解決するユーザーのコアニーズをよりよく満たすことができます。

さらに、TALはMathGPTのリリースと同時に、世界中の人工知能の専門家や数学愛好家が体験・評価できるように、公式ウェブサイトで代表的かつ挑戦的な数学タスク評価セットも更新しました。

田實氏は、MathGPTが数学教育の分野でより大きな役割を果たすことを期待していると紹介した。Future Educationは、大規模で高品質なコンテンツに基づく数千億規模の大規模モデルの開発における経験と手法を業界と共有し、業界とともに進歩していきたいと考えている。

TAL AIの力強い成長

AIの波に後押しされ、今年、多くのテクノロジー企業が汎用的な大規模言語モデル製品の発売を発表しました。しかし、Future Educationは別の方向を選択しました。既存の大規模言語モデルを微調整してインターフェース呼び出しを行うことも、汎用的な大規模言語モデルを作成することもありません。代わりに、数学の垂直分野に深く入り込んで大規模モデルを開発し、独立した安定した持続可能な高品質の数学ソリューションを作成することに取り組んでいます。

一般的な大規模モデルは「科学よりも教養を重視し」ており、数学の問題を解くこと、説明すること、質問に答えること、そして推奨することにおいて明らかな欠陥があります。また、汎用人工知能への道のりでは数学的推論能力が非常に重要であり、世界中の多くの大企業がこの分野の研究を行っています。

「TALは数学データとビジネスで20年にわたる蓄積を持っています。私たちは大量の教育データを蓄積し、教育データを継続的に生産する能力を持っているので、この困難だが正しいことを選択しました。」田實氏は、TALは数学とAIにおける長年の蓄積を生かして、大規模AIモデルの時代に数学の基礎研究で良い仕事をしたいと考えていると語った。

Future Educationは2017年に早くもAIラボを設立しました。スマート教育人工知能オープンイノベーションプラットフォームのサポートにより、TAL AI Labは、さまざまなトップクラスの学術会議やコンテストで16回の優勝と6回の準優勝を果たし、国際的なジャーナルや会議で約100件の高レベルの学術論文を発表しました。

2019年、科学技術部は未来教育に依頼して、スマート教育のための国家新世代人工知能オープンイノベーションプラットフォームを構築すると発表しました。未来教育は、教育業界における人工知能「国家チーム」の最初で唯一のメンバーとなり、長年にわたり人工知能の分野で徹底的な研究を行ってきました。長年にわたり、教育業界の主要な需要に支えられ、TAL は人工知能アルゴリズム機能、アプリケーション ソリューション、基本的なソフトウェアおよびハードウェア システム、教育用のオープン ソース サービスを含む国家教育技術イノベーション プラットフォームを構築してきました。

TALはビッグモデル標準システムの構築推進にも積極的に参加しており、国家人工知能標準化総括グループが編成したビッグモデルシリーズの国家標準、中国情報通信研究院が編纂した「ビッグモデル事前訓練モデル技術と応用評価方法」シリーズのグループ標準、教育部教育情報化技術標準委員会と国家情報技術標準化技術委員会が編纂した「教育総合ビッグモデル」シリーズの標準に中核ユニットとして参加しています。

最近、TALは中国情報通信研究院、復旦大学、iFLYTEK、百度など、業界をリードする研究機関、大学、企業と共同で、教育用ビッグモデルのグループ標準の策定を主導しています。教育用ビッグモデルの機能を、カバレッジシナリオ、アプリケーションの有効性、サービスの信頼性などの側面から総合的に評価し、教育用ビッグモデルの実装に参考とガイダンスを提供しています。

AI を活用して大規模にパーソナライズされた教育を実現する

大規模言語モデルの台頭により、AI技術をあらゆる分野にどのように活用するかが社会の注目を集めるようになりました。教育業界は、AI分野の導入を最も早く開始した業界の1つであり、AIが教育エコシステムにもたらす変化は常に大きな注目を集めています。

「AIは教育業界を再定義する機会をもたらし、ビッグモデル技術は学生の適性に応じた大規模な教育を真に可能にした」と田彪氏は紹介し、未来教育は20年にわたり、小規模なオフラインクラスから大規模なオンラインクラス、そしてAIクラスへと、個別学習を模索してきた。形式は常に進化しているが、教える内容は常に固定されており、学生と教師のやり取りは少なく、粒度は質問レベルにしかならない。

Tian Mi 氏は、ビッグモデルの本質は、データから知識を学習し、それを適用するためのより効率的な方法であると考えています。

AI機能のサポートにより、「生徒の自習+AIによる質疑応答」という新しい学習方法が広く可能になりました。学習者が質の高い教育コンテンツを入手するための敷居やコストが下がり、また、学習者が受け取る教育コンテンツのパーソナライズ化や洗練化が進み、一人ひとりに合わせたAI教育や質疑応答による個別指導が可能となり、学習者一人ひとりが自分に最適な学習コンテンツを入手できるようになりました。

TALはMathGPTをベースに、世界中の学習者や数学愛好家により良いサービスを提供するために、AI環境での学習方法を探求し続けます。また、業界とタイムリーに経験を共有し、AIテクノロジーを通じて教育テクノロジーの積極的な変化を促進します。

Tian Mi氏によると、パブリックベータの順調な進捗により、MathGPTの問題解決能力は向上し続け、MathGPTをベースにした製品レベルのアプリケーションも加速しており、近い将来にリリースされる予定だという。

<<: 

>>:  エンタープライズ ソフトウェア ベンダーのジェネレーティブ AI への取り組み

ブログ    
ブログ    

推薦する

...

製造業に人工知能を適用するにはどうすればよいでしょうか?

現在、製造企業で使用されている人工知能技術は、主にインテリジェント音声対話製品、顔認識、画像認識、画...

...

あなたの工場ではエッジ AI を導入する必要がありますか?

より多くの製造企業が人工知能 (AI) ツールを活用してデータにアクセスし、リアルタイムで対応するこ...

50枚の写真が「毒された」安定した拡散、車と牛の区別がつかない

AI侵害に対するアーティストの反撃がここに——絵画に「毒」を入れると、AIが「毒化」されて使用時に誤...

...

LLM-Blender: 大規模な言語モデルも学習に統合可能

最近、arxiv を見ていたときに、Ensemble メソッドを使用して大規模な言語モデルを統合でき...

...

ビッグデータと人工知能の違いすら分からないのに、あなたはまだトップへの道を歩んでいる

ビッグデータと AI は公平に比較​​できるでしょうか? ある程度は公平ですが、まずはその違いを明確...

ファーウェイ、データインフラを再定義するAIネイティブデータベースを世界規模で展開

[中国、北京、2019年5月15日] ファーウェイは、2018年にAI戦略とフルスタックの全シナリオ...

誇大宣伝サイクルを経ても、チャットボットがまだ普及していないのはなぜでしょうか?

2016 年に私たちは、ボット パラダイムの変化は、過去 10 年間の Web からモバイル アプリ...

人工知能は人間の精神的健康を評価できる

学際的な共同プロジェクトによる研究によると、人工知能は専門家の評価を必要とせずに、アンケートや脳スキ...

OpenAIは低コストで開発者を引き付けるために大規模なアップデートを計画している

10月12日、外国メディアは関係者の話として、人工知能(AI)研究企業OpenAIが来月、開発者向け...

景勝地ロープウェイのスペアパーツに基づくドローン検査市場の簡単な分析

最近、中秋節と国慶節の連休が近づき、わが国の多くの観光地では、今年、省をまたぐ団体旅行が再開され、観...