前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >MathGPT来了!专攻数学大模型,解题讲题两手抓

MathGPT来了!专攻数学大模型,解题讲题两手抓

作者头像
量子位
发布于 2023-05-12 13:12:20
发布于 2023-05-12 13:12:20
3130
举报
文章被收录于专栏:量子位量子位
允中 发自 凹非寺 量子位 | 公众号 QbitAI

大模型领域又来新玩家。

据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT

面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。

目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。

据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责。

今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。

此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。

MathGPT与大语言模型(LLM)的差异

OpenAI在今年三月份发布了大语言模型GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:

解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配

“这种不足是由LLM模型的自身特点决定的。”

学而思AI团队负责人介绍,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。

行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。

因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题

  • 第一,题目要解对,现在GPT结果经常出现错误;
  • 第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;
  • 第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。

为了实现这些目标,MathGPT将结合大语言模型计算引擎两者的能力,大语言模型负责理解题目、分步解析,并在合适的步骤自行调用计算引擎,这样能提高题目解答正确率。

基于海量名师解题过程的数据进行模型训练,模型的解题步骤可以更加清晰。

再引入优秀老师的教学理念和方法,模型在解题趣味性上也能进一步提高。

据透露,MathGPT将先从中小学数学做起,逐步覆盖全年龄学段和解题种类。

做MathGPT,学而思凭什么

学而思作为获国家科技部批准的“智慧教育国家新一代人工智能开放创新平台”建设单位,也是教育行业首批唯一一家人工智能“国家队”成员,在人工智能领域有着多年的深入研究。

早在2017年,学而思便成立了AI lab 人工智能实验室

据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;

发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;

申请专利220余项,授权专利150余项,软件著作权60余项。

学而思AI lab在各类顶级学术会议比赛获奖情况

“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。

另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

所以,学而思选择在MathGPT方向发力也顺理成章。

今年2月,学而思学习机上线AI讲题机器人小π。

据了解,小π研发已有数年积累,研发方向主要为数学等领域的AI智能讲题能力,核心优势在于数理逻辑和运算。

在实测中,当学而思学习机用户配套的AR镜识别到一道手写或者印刷的数学计算题时,小π机器人会对题目进行智能AI拆解分析,同时生成逻辑流畅、表达清晰的语言,将题目的解题方法讲解出来。

该功能已覆盖的题目包括分数、小数等复杂计算,甚至一些“凑数、组合”的巧妙算法,已十分接近真人老师的解题效果。

同一道数学题目在ChatGPT(上)和小π(下)的解答对比

小π相关技术于2020年启动研发,以学而思超3亿的专业题库数据作为基础,经过了3年的数据训练和打磨迭代。

另据了解,学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。

MathGPT的挑战和技术难题

如何利用大语言模型服务各行各业是当下社会的焦点问题。

大模型的出现是对生产力和生产关系的改变,各行各业都会受到影响,并会在大模型的助力下完成转型升级。

教育行业和大模型有着天然的契合点。教育也是通过交流,把知识和信息传递给学生,大模型会让教育行业的数字化、智能化速度更快。

比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。

但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。

以数学领域为例,目前市场上有几个主要流派。

比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。

走AGI路线的公司则尝试让通用LLM“更懂数学”,比如GPT4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。

学而思选择了另一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM,而是自研基于专业领域的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。

学而思表示,乔布斯对电脑的定义是“思维的自行车”,MathGPT面向全球的数学爱好者,希望能成为学习数学、思考数学的“自行车”,帮助人们更好的解决学习数学、思考数学的问题。

长远看来,数学思维代表着理性逻辑,是“思维的体操”,是一种基础能力,能够与很多行业产生关联。 未来,也许每个人都是程序员,用自然语言就可以编程,创新想法,与人协作,创造新事物,但是用自然语言编程的好坏很大程度取决于是否经过数学思维的训练。我们希望通过MathGPT,帮助每个人更好地建立理性逻辑,从而终身成长,推动社会进步。

在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。

学而思自研独立的MathGPT大模型是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。

随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。

*本文系量子位获授权刊载,观点仅为作者所有。

—  —

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-05-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI教育大模型及其应用
人工智能在教育领域的应用日益深入,涌现出许多AI教育大模型,它们致力于提升教学效率、优化学习体验、推动教育公平。这些大模型通常以通用大模型为基础,通过针对教育场景的持续训练和优化,不断提高解决教育专业任务的能力。
数字孪生开发者
2025/06/19
290
AI教育大模型及其应用
学而思研发面向全球数学爱好者大模型MathGPT
---- 新智元报道   编辑:好困 【新智元导读】近日,学而思官宣称,正在自研的数学大模型「MathGPT」,目前已取得阶段性成果。 近日,在各家大厂打得如火如荼的「ChatGPT大战」中,学而思也加入其中。 不过,学而思另辟蹊径选择的是自研数学大模型「MathGPT」,以数学领域的解题和讲题算法为核心,并且已经取得了阶段性成果。 对此学而思表示,基于该自研大模型的产品级应用预计会在年内推出,将面向全球数学爱好者和科研机构。 作为公司的核心项目,学而思早在今年春节之前就启动了相应的团队建设、数据、
新智元
2023/05/09
2670
学而思研发面向全球数学爱好者大模型MathGPT
千亿级、数学专用,MathGPT大模型开始公测了
8 月 24 日,机器之心获悉,在好未来 20 周年直播活动中,CTO 田密宣布好未来自研的数学领域千亿级大模型 MathGPT 开启内测。即日起,用户可通过官网(www.mathgpt.com)申请注册账号免费试用体验。
机器之心
2023/09/08
5310
千亿级、数学专用,MathGPT大模型开始公测了
解决通用LLM「偏科」问题,数学大模型MathGPT要来了!
机器之心原创 作者:蛋酱 数学大模型 MathGPT,专治大语言模型的「偏科」问题。 不做通用 LLM,不基于现有 LLM 做微调和接口调用,学而思自研的数学大模型 MathGPT 要来了。 这对于全世界的数学爱好者来说,都是个值得关注的好消息。 MathGPT 是面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心的大模型。据了解,学而思已将 MathGPT 定位为公司核心项目,由 CTO 田密负责,今年春节前,研发正在进行中,该项目已经启动相应的团队建设、数据、算力准备和技术研发。 进度方面
机器之心
2023/05/09
6970
解决通用LLM「偏科」问题,数学大模型MathGPT要来了!
实测学而思MathGPT大模型:中小学数学解题正确率有望在全球范围内创造新 SOTA
这着实是数理爱好者福音了!要知道市面上GPT-4在内的通用大模型,都无法实现这一点。
量子位
2023/09/08
6710
实测学而思MathGPT大模型:中小学数学解题正确率有望在全球范围内创造新 SOTA
学习机火拼大模型:科大讯飞、学而思、网易有道赌上半条身家性命
过去几年,“双减”落地教培落幕,学习机因其资源整合和效率提升的优势,成为越来越多家长减轻教育焦虑的不二选择。
刘旷
2024/06/11
1800
prompt概念提出者之一刘鹏飞发布Abel,仅仅使用SFT即可达数学开源SoTA,超越十亿多美元模型MathGPT和GPT4
今天突然看到prompt概念提出者刘鹏飞(现上交大副教授)在twitter上的消息:
zenRRan
2023/09/25
6010
prompt概念提出者之一刘鹏飞发布Abel,仅仅使用SFT即可达数学开源SoTA,超越十亿多美元模型MathGPT和GPT4
万“模”霜天竞自由!开源大模型的春天来了?
在当代人工智能领域中,如果将算力比作是AI的燃料,那么大模型则相当于AI的发动机。算力充当着AI体系运作的根基,使得复杂的算法和模型得以运行,大模型则将这些算力转换为具体的智能输出。而开源大模型则是人人都能用得上的发动机。
数据猿
2024/04/30
2390
万“模”霜天竞自由!开源大模型的春天来了?
清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定
让清北毕业的爸爸都崩溃的这个难题,恐怕没有这么简单。毕竟,自己会做一道题和能把孩子教会,是完全不同的两件事。
新智元
2024/06/17
1550
清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定
垂直大模型竞争,能突破数据“卡点”吗?
随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。
科技云报道
2023/08/03
4900
垂直大模型竞争,能突破数据“卡点”吗?
李航:关于大模型的思考及研究热点
ChatGPT 和 GPT4,相比传统的深度学习技术,如 BERT,主要是在智能性和通用性上取得了巨大突破。具备语言、知识、简单推理能力,能够很好地近似人的智能行为。不需要标注数据就可以在不同领域完成不同任务,也就是进行零样本或小样本学习。
算法进阶
2023/10/23
3970
李航:关于大模型的思考及研究热点
大模型帮陶哲轩解题、证明数学定理:数学真要成为首个借助AI实现突破的学科了?
去年 2 月份,DeepMind 发布了编程辅助利器 AlphaCode。它使用人工智能技术来帮助程序员更快地编写代码,可以自动完成代码、提供代码建议并检查错误,从而提高编程效率。AlphaCode 的问世意味着 AI 在解决现实世界问题的道路上又迈出了一大步。
机器之心
2023/08/07
4410
大模型帮陶哲轩解题、证明数学定理:数学真要成为首个借助AI实现突破的学科了?
MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。
机器之心
2024/04/19
1810
MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜
白话科普:如何训练ChatGPT,能用它来挣钱吗?【P.S. 今晚19:30,说透ChatGPT】
本文作者 | 张杰   责编 | Carol 出品 | AI科技大本营(ID:rgznai100) 对话机器人不是个新技术,以往的机器人产品很多,为什么这次OpenAI公司推出的ChatGPT能这么火?因为以前的机器人只能做简单且有限的事,问天气、放音乐还行,问个复杂一些的事就有点“人工智障”了。ChatGPT可以说技术上的量变引起了效果上的质变,在三个方面让我感觉很惊艳: 有上下文记忆能力,多轮对话衔接得很好,很难看出是机器生成的; 有学习纠错能力,在它回答错误之后,如果你纠正了它,第二次就不会再答错;
AI科技大本营
2023/04/06
4890
白话科普:如何训练ChatGPT,能用它来挣钱吗?【P.S. 今晚19:30,说透ChatGPT】
谷歌研究员炮轰GPT初创公司瞎炒作,连发18条推文怒怼!
---- 新智元报道   编辑:昕朋 【新智元导读】面对GPT公司疯狂营销的乱象,谷歌研究员发长文怒怼其商业化模式:炒作救不了GPT!但投资人表示:无所谓,好玩就行 在AI领域,去年的流量王者,非生成式AI莫属。 从DALL-E 2到ChatGPT,从Stable Diffusion到Midjourney,AIGC行业呈现爆炸式的增长。 基于人工智能的生成式工具纷至沓来,让投资公司和广大公众眼花缭乱。 顶级投资公司红杉资本在一篇博文中写道:「生成式人工智能不仅变得更快、更便宜,而且在某些情况下比人类创
新智元
2023/02/24
3100
谷歌研究员炮轰GPT初创公司瞎炒作,连发18条推文怒怼!
人美声甜GPT,数学题哪里不会讲哪里
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 大模型的颠覆和变革,还只是开始。 ChatGPT一炮而红,重塑搜索、办公协同等多个场景和行业后,在线教育,被视为最重要的垂直场景——毕竟大语言模型展示出的能力,正是之前在线教育、AI老师所亟需的。 而且这种趋势已经开始,背靠大模型相关的在线教育应用,已经率先在海外火爆。 看过来!让GPT化身二次元美少女AI家教来讲数学题的方案,每步都有解法,再不用担心看见参考答案的“略”字: 基础到某个三角函数的定义,复杂到不同的解题方法与技巧,都能得到答案: 这就
量子位
2023/05/06
5170
人美声甜GPT,数学题哪里不会讲哪里
从逆境转型重生的科大讯飞半年报:AI大模型的无限机遇
8月12日,A股上市公司科大讯飞披露2023年上半年财报,由于收入下降和成本增长,公司净利润出现大幅下滑,盈利状况不尽如人意。
数据猿
2023/09/15
3480
从逆境转型重生的科大讯飞半年报:AI大模型的无限机遇
LLM评估综述论文问世,分三方面全面总结,还带资料库
大型语言模型(LLM)已经得到了学术界和产业界的广泛关注,而为了开发出好用的 LLM,适当的评估方法必不可少。现在,一篇有关 LLM 评估的综述论文终于来了!其中分三方面对 LLM 评估的相关研究工作进行了全面的总结,可帮助相关研究者索引和参考。
机器之心
2023/08/08
4390
LLM评估综述论文问世,分三方面全面总结,还带资料库
图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
图灵三巨头中的著名「e人」LeCun,提前就在X上大方公布出自己的行程,满怀期待地等着和粉丝们相见了。
新智元
2024/05/14
1340
图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
4个月狂揽两千万,国内首个披露营收的大模型来了!
8月31日,10余家大模型陆续通过《生成式人工智能服务管理暂行办法》备案,最终获批向公众开放。360智脑也已首批完成备案提交,预计将在未来1周左右陆续由各地方管理部门对外披露。
新智元
2023/09/09
3280
4个月狂揽两千万,国内首个披露营收的大模型来了!
推荐阅读
AI教育大模型及其应用
290
学而思研发面向全球数学爱好者大模型MathGPT
2670
千亿级、数学专用,MathGPT大模型开始公测了
5310
解决通用LLM「偏科」问题,数学大模型MathGPT要来了!
6970
实测学而思MathGPT大模型:中小学数学解题正确率有望在全球范围内创造新 SOTA
6710
学习机火拼大模型:科大讯飞、学而思、网易有道赌上半条身家性命
1800
prompt概念提出者之一刘鹏飞发布Abel,仅仅使用SFT即可达数学开源SoTA,超越十亿多美元模型MathGPT和GPT4
6010
万“模”霜天竞自由!开源大模型的春天来了?
2390
清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定
1550
垂直大模型竞争,能突破数据“卡点”吗?
4900
李航:关于大模型的思考及研究热点
3970
大模型帮陶哲轩解题、证明数学定理:数学真要成为首个借助AI实现突破的学科了?
4410
MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜
1810
白话科普:如何训练ChatGPT,能用它来挣钱吗?【P.S. 今晚19:30,说透ChatGPT】
4890
谷歌研究员炮轰GPT初创公司瞎炒作,连发18条推文怒怼!
3100
人美声甜GPT,数学题哪里不会讲哪里
5170
从逆境转型重生的科大讯飞半年报:AI大模型的无限机遇
3480
LLM评估综述论文问世,分三方面全面总结,还带资料库
4390
图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
1340
4个月狂揽两千万,国内首个披露营收的大模型来了!
3280
相关推荐
AI教育大模型及其应用
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档