1300億のパラメータを持つ中国初の大規模数学モデルMathGPTがリリースされました!複数のベンチマークがGPT-4を上回る

1300億のパラメータを持つ中国初の大規模数学モデルMathGPTがリリースされました!複数のベンチマークがGPT-4を上回る

数学的 AI ビッグモデルはこの分野の将来を変える可能性があります。

本日、中国初の兆スケール数学モデルであるMathGPTが正式にリリースされ、パブリックベータ版が開始されました。

本日より公式サイトからアカウント登録を申請し、無料トライアルを体験いただけます。

内部テスト申請アドレス: www.mathgpt.com

その背後には、20年間数学の分野に深く関わってきた「TAL」チームが開発した数学の垂直分野の大きなモデルがあります。世界中の数学愛好家や研究機関を対象としており、問題解決とプレゼンテーションのアルゴリズムに重点を置いています。

MathGPT は、数学専用に構築された中国初の大規模モデルです。

テキストまたは画像で数学の問題をアップロードするだけで、答えに関する会話形式のフィードバックが得られます。

さらに、「ランダム質問」オプションを使用して、数学の問題をランダムに生成し、システムに答えを出させることもできます。

現在、MathGPT は PC とモバイル向けに中国語版と英語版をサポートしています。

数学的問題解決能力をリードする

実際、Future Education は今年 5 月にはすでに、MathGPT という独自の数学ビッグモデルを開発中であると発表していました。

CTOのTian Mi氏によると、MathGPTはFuture Educationが長年にわたって蓄積してきた教育および研究データを統合し、数学の分野に重点を置いています。

その中で、兆レベルの大規模モデルのトレーニング、推論、展開フレームワークは、モデルに強力な機能を与えます。高品質な教育データにより、質問の計算、説明、質問への回答など、複数のタスクの継続的なトレーニングと監督下での微調整が可能になり、優れたパフォーマンスを発揮します。さらに、人間によるフィードバック調整の助けにより、モデルの全体的な品質がさらに向上します。

評価結果から判断すると、MathGPT は問題解決の精度、安定性、ユーザー エクスペリエンスにおいて明らかな利点があります。

MathGPTの公式サイトによると、MathGPTの数学計算能力は小学校、中学校、高校の数学の問題をカバーしているとのこと。問題の種類は計算問題、応用問題、代数問題など。問題に対してフォローアップの質問もできますが、数学以外の質疑応答のやり取りはまだ公開されていません。

MathGPT 技術レポート

MathGPT技術レポートによると、CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、大学入試数学、Math401を含む6つの公開数学評価セットのテスト結果の中で、New OrientalのMathGPTが多くのテストで最高得点を達成しました。

同時に、MathGPT は C-Eval の中学・高校向け総合テストコレクションでも優れた成績を収めています。

中学校・高校の教科のC評価リストにおけるMathGPTスコア

問題解決の安定性と説明のわかりやすさの点では、MathGPT は多数の有名な教師の問題解決プロセスのデータに基づいてモデルをトレーニングしており、モデルの問題解決手順は専門的で明確です。

級数問題を例にとると、MathGPT が与える解答には「分析」、「詳細説明」、「要点」の 3 つの部分が含まれており、一般的な大まかなモデルの大まかな説明方法よりも詳細になっています。

このうち、「分析」では、問題解決のアイデアや考え方を提供し、ユーザーが問題をよりよく理解できるようにします。「詳細説明」では、具体的な計算方法と回答を示します。最後に、「要点」セクションでは、テストのポイント、難点、問題の要点に関するプロンプトを提供し、ユーザーが問題の意図を見直して振り返り、1つの例から推論を導き出すのに役立ちます。

ユーザーにとって、数学の問題を勉強するということは、答えそのものを得ることだけではなく、答えの背後にある問題解決の原則と論理的思考を得ることも意味します。

他の一般的な大規模モデルと比較して、MathGPT はより高い精度で問題を解決し、回答をより明確に分析し、より明確に説明できるため、AI 製品を使用して数学の問題を解決するユーザーのコアニーズをよりよく満たすことができます。

さらに、TALはMathGPTのリリースと同時に、世界中の人工知能の専門家や数学愛好家が体験・評価できるように、公式ウェブサイトで代表的かつ挑戦的な数学タスク評価セットも更新しました。

田實氏は、MathGPTが数学教育の分野でより大きな役割を果たすことを期待していると紹介した。Future Educationは、大規模で高品質なコンテンツに基づく数千億規模の大規模モデルの開発における経験と手法を業界と共有し、業界とともに進歩していきたいと考えている。

TAL AIの力強い成長

AIの波に後押しされ、今年、多くのテクノロジー企業が汎用的な大規模言語モデル製品の発売を発表しました。しかし、Future Educationは別の方向を選択しました。既存の大規模言語モデルを微調整してインターフェース呼び出しを行うことも、汎用的な大規模言語モデルを作成することもありません。代わりに、数学の垂直分野に深く入り込んで大規模モデルを開発し、独立した安定した持続可能な高品質の数学ソリューションを作成することに取り組んでいます。

一般的な大規模モデルは「科学よりも教養を重視し」ており、数学の問題を解くこと、説明すること、質問に答えること、そして推奨することにおいて明らかな欠陥があります。また、汎用人工知能への道のりでは数学的推論能力が非常に重要であり、世界中の多くの大企業がこの分野の研究を行っています。

「TALは数学データとビジネスで20年にわたる蓄積を持っています。私たちは大量の教育データを蓄積し、教育データを継続的に生産する能力を持っているので、この困難だが正しいことを選択しました。」田實氏は、TALは数学とAIにおける長年の蓄積を生かして、大規模AIモデルの時代に数学の基礎研究で良い仕事をしたいと考えていると語った。

Future Educationは2017年に早くもAIラボを設立しました。スマート教育人工知能オープンイノベーションプラットフォームのサポートにより、TAL AI Labは、さまざまなトップクラスの学術会議やコンテストで16回の優勝と6回の準優勝を果たし、国際的なジャーナルや会議で約100件の高レベルの学術論文を発表しました。

2019年、科学技術部は未来教育に依頼して、スマート教育のための国家新世代人工知能オープンイノベーションプラットフォームを構築すると発表しました。未来教育は、教育業界における人工知能「国家チーム」の最初で唯一のメンバーとなり、長年にわたり人工知能の分野で徹底的な研究を行ってきました。長年にわたり、教育業界の主要な需要に支えられ、TAL は人工知能アルゴリズム機能、アプリケーション ソリューション、基本的なソフトウェアおよびハードウェア システム、教育用のオープン ソース サービスを含む国家教育技術イノベーション プラットフォームを構築してきました。

TALはビッグモデル標準システムの構築推進にも積極的に参加しており、国家人工知能標準化総括グループが編成したビッグモデルシリーズの国家標準、中国情報通信研究院が編纂した「ビッグモデル事前訓練モデル技術と応用評価方法」シリーズのグループ標準、教育部教育情報化技術標準委員会と国家情報技術標準化技術委員会が編纂した「教育総合ビッグモデル」シリーズの標準に中核ユニットとして参加しています。

最近、TALは中国情報通信研究院、復旦大学、iFLYTEK、百度など、業界をリードする研究機関、大学、企業と共同で、教育用ビッグモデルのグループ標準の策定を主導しています。教育用ビッグモデルの機能を、カバレッジシナリオ、アプリケーションの有効性、サービスの信頼性などの側面から総合的に評価し、教育用ビッグモデルの実装に参考とガイダンスを提供しています。

AI を活用して大規模にパーソナライズされた教育を実現する

大規模言語モデルの台頭により、AI技術をあらゆる分野にどのように活用するかが社会の注目を集めるようになりました。教育業界は、AI分野の導入を最も早く開始した業界の1つであり、AIが教育エコシステムにもたらす変化は常に大きな注目を集めています。

「AIは教育業界を再定義する機会をもたらし、ビッグモデル技術は学生の適性に応じた大規模な教育を真に可能にした」と田彪氏は紹介し、未来教育は20年にわたり、小規模なオフラインクラスから大規模なオンラインクラス、そしてAIクラスへと、個別学習を模索してきた。形式は常に進化しているが、教える内容は常に固定されており、学生と教師のやり取りは少なく、粒度は質問レベルにしかならない。

Tian Mi 氏は、ビッグモデルの本質は、データから知識を学習し、それを適用するためのより効率的な方法であると考えています。

AI機能のサポートにより、「生徒の自習+AIによる質疑応答」という新しい学習方法が広く可能になりました。学習者が質の高い教育コンテンツを入手するための敷居やコストが下がり、また、学習者が受け取る教育コンテンツのパーソナライズ化や洗練化が進み、一人ひとりに合わせたAI教育や質疑応答による個別指導が可能となり、学習者一人ひとりが自分に最適な学習コンテンツを入手できるようになりました。

TALはMathGPTをベースに、世界中の学習者や数学愛好家により良いサービスを提供するために、AI環境での学習方法を探求し続けます。また、業界とタイムリーに経験を共有し、AIテクノロジーを通じて教育テクノロジーの積極的な変化を促進します。

Tian Mi氏によると、パブリックベータの順調な進捗により、MathGPTの問題解決能力は向上し続け、MathGPTをベースにした製品レベルのアプリケーションも加速しており、近い将来にリリースされる予定だという。

<<: 

>>:  エンタープライズ ソフトウェア ベンダーのジェネレーティブ AI への取り組み

ブログ    
ブログ    

推薦する

アンドリュー・ン氏のチームが2019年のAIトレンドを振り返る:自動運転は寒い冬を迎え、ディープフェイクはモンスターとなった

あと数日で2019年も終わりです。今年は AI が夢から現実へと移り変わる年です。NLP から自動運...

Googleの華博士がICCV2021で新モデルを発表、卵を泡立てるだけでパンケーキを作りたいかどうかがわかる

機械学習モデルが現実世界でますます使用され、導入されるようになると、AI の意思決定は人々の日常生活...

なぜ人工知能には欠陥があるのでしょうか?

人工知能は、すべての人の生活に欠かせないものとなっています。 YouTube のおすすめなどの単純な...

...

AIはローカルアプリケーションから大規模な「AI主導」企業へと進化しました

最近、デロイト人工知能研究所は、「企業向け人工知能アプリケーションの現状レポート」と「厳選された A...

AIを安全で信頼できるものにするためには、まずアルゴリズムの一般化能力を理解することから始める

ディープラーニング システムは、新しいデータに対してどの程度のパフォーマンス (一般化) を発揮しま...

...

ガベージ コレクション アルゴリズムと JVM ガベージ コレクターの概要

[[199042]]ガベージ コレクション アルゴリズムと JVM ガベージ コレクターの概要は、著...

韓国が世界初の常温超伝導体を開発? 127度での超伝導、再現できればノーベル賞確実

常温・常圧超伝導が再び突破された?今回は韓国の科学者たちです。彼らは、世界初の常温常圧超伝導体、すな...

OpenAIの創設者サム・アルトマンが解雇されてから24時間後

ChatGPTを開発するOpenAIは金曜日、CEO兼創設者のサム・アルトマン氏を解雇したが、彼の突...

ディープラーニングニューラルネットワークによる予測区間

[[390133]]予測区間は、回帰問題の予測における不確実性の尺度を提供します。たとえば、95% ...

...

大学卒業後、彼はGoogleに入社し、先駆的な作品「Thinking Chain」を執筆した。このOpenAIの新人は、学部生の質問に答えている。

「思考の連鎖(CoT)」の概念を注意深く研究したことがあるなら、おそらく Jason Wei とい...

2020年に人工知能がIT業界を変える

21 世紀は人類史上刺激的な時代であり、人々の日常生活に技術の進歩が起こっています。今では、患者の健...

誰もが知っておくべきAIのパイオニア14人

[51CTO.com クイック翻訳] 世界経済フォーラムは毎年、世界中のテクノロジーの先駆者について...