当前位置: 首页>资讯 >

学而思自研数学大模型MathGPT,计划于年内推出-每日聚焦

来源: 凤凰网 | 时间: 2023-05-05 17:39:40 |

编辑 | ZeR0


(相关资料图)

智东西5月5日消息,据悉,学而思正在进行自研数学大模型MathGPT的研发,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。

据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。

此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。

一、大型语言模型数学功底差,MathGPT重点攻克三类难点

美国OpenAI公司在今年3月份发布了GPT-4大型语言模型(LLM),国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。

“这种不足是由大型语言模型的自身特点决定的。”学而思AI团队负责人介绍,大型语言模型来自对海量语言文本的训练,因此最擅长语言处理。

行业内偏向基于大型语言模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。

因此,学而思决心组建团队专研MathGPT——数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题:

第一,题目要解对,现在GPT结果经常出现错误;

第二,解题步骤要稳定、清晰,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;

第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的学习体验很不友好。

二、自研数学大模型背后,学而思的AI技术根基

学而思作为获国家科技部批准的“智慧教育国家新一代人工智能开放创新平台”建设单位,也是教育行业唯一一家人工智能“国家队”成员,在人工智能领域有着多年的深入研究。早在2017年,学而思便成立了AI lab人工智能实验室。

公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;申请专利220余项,授权专利150余项,软件著作权60余项。

“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。

另外,学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

从这些积累来看,学而思选择在MathGPT方向发力也属顺理成章。

另据了解,学而思学习机近期将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。

结语:数学领域容错率低,技术路线选择仍待讨论验证

如何利用大型语言模型服务各行各业是当下社会的焦点问题。

比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产品体验。

但也有一些领域如数学、医学等,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用大型语言模型目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。

以数学领域为例,目前市场上有几个主要流派。比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产品,主要利用非LLM的传统AI技术加上数据库的方式解决数学问题。

走AGI路线的公司则尝试让通用大型语言模型“更懂数学”,比如GPT-4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学问题进行调优。

学而思选择了另一条少有人走的路,不基于现有大型语言模型做微调和接口调用、不做通用大型语言模型,而是自研基于专业领域的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。

在大型语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思自研独立的MathGPT大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。

随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。

关键词:

 

热文推荐

学而思自研数学大模型MathGPT,计划于年内推出-每日聚焦

编辑|ZeR0智东西5月5日消息,据悉,学而思正在进行自研数学大模型MathGPT的研发,面向全球数学爱好者和科研机

2023-05-05

新日电动车72v价格表 新日电动车72v价格

今天来聊聊关于新日电动车72v价格表,新日电动车72v价格的文章,现在就为大家来简单介绍下新日电动车72v价

2023-05-05

俄罗斯卢布兑美元涨幅扩大至约2%,报76.50,为自3月28日以来最高点。

俄罗斯卢布兑美元涨幅扩大至约2%,报76 50,为自3月28日以来最高点

2023-05-05

祥和实业:与中原利达近期签订合计3.97亿元合同 环球报道

【祥和实业:与中原利达近期签订合计3 97亿元合同】祥和实业5月5日公告,公司与中原利达铁路轨道技术发展有

2023-05-05

贵州省铝深加工产业专利导航成果推介及技术交流培训会召开 世界观天下

近日,由贵州省科学技术情报研究所、贵阳市铝产业技术创新中心主办的贵州省铝深加工产业专利导航成果推介及

2023-05-05

阿里健康携手国家心血管中心共建“肺动脉高压就诊地图”

电商报快讯:5月5日消息,阿里健康联合国家心血管中心肺动脉高压专科联盟基于阿里健康罕见病就诊地图展开专

2023-05-05

环球观热点:欧洲央行管委维勒鲁瓦:可能还会有几次加息。

欧洲央行管委维勒鲁瓦:可能还会有几次加息

2023-05-05

5G“智”造:为矿山行业数智化转型注智赋能-全球看热讯

题:5G“智”造:为矿山行业数智化转型注智赋能  作者范丽芳赵琳  生活中随处可见的煤炭,背后隐藏着巨

2023-05-05

泰安9项科技创新成果亮相第37届山东省青少年科技创新大赛决赛 世界消息

泰安日报社·中华泰山网讯近日,第37届山东省青少年科技创新大赛决赛在日照举行。我市9项科技创新成果在决

2023-05-05

或将命名为LM 法拉利SF90高性能版实车谍照曝光-天天热推荐

日前,我们发现有海外媒体曝光了法拉利SF90高性能版的实车谍照,并表示该车的正式名称或为“SF90LM”(其中

2023-05-05

中国城投颐康山水与大华西海岸温泉丽舍买房投资分析!海南屯昌县哪里买房便宜能升值?

中国城投颐康山水与大华西海岸温泉丽舍买房投资分析!海南屯昌县哪里买房便宜能升值?海南房价要涨,屯昌购

2023-05-05

留学回暖 教育企业激战海外游学暑期档|当前要闻

先行的暑期研学游学  虽然留学申请周期较长,市场恢复仍需时间,但作为留学背景提升前置项目的境外游学开

2023-05-05

全球通讯!信达生物现涨逾5% 一季度总产品收入约11亿元实现季度环比增长

信达生物(01801)早盘上涨4 99%,现报41 00港元,成交额2 547亿港元。  4月27日,信达生物发布公告,202

2023-05-05

葛拉斯米尔湖_关于葛拉斯米尔湖的简介 环球观速讯

1、葛拉斯米尔湖位于温德米尔湖北边,小巧优美,除了宜人的风景外,这里也以华兹华斯的故居“鸽舍”和他散

2023-05-05

广东2023年高等教育自学考试毕业办理工作即将启动

文 羊城晚报全媒体记者孙唯图 新华社资料图(图文无关)5月4日,广东省教育考试院发布了《2023年高等教育自

2023-05-05

ATM机行业现状分析 中国ATM(自动柜员机)行业深度分析2023

一、ATM机的概念自动取款机又称ATM,是AutomaticTellerMachine的缩写,意思是自动柜员机,因大部分用于取款

2023-05-05

每日简讯:国际锐评 | “五一”假期的人气见证中国经济的底气

在一季度经济实现超预期增长之后,“五一”假期多个消费数据超出预期,充分证明中国消费市场的内生动力正在

2023-05-05

2022年净利润实现高增长,新建项目投产在即-全球播资讯

第一时间提供各大券商研究所报告,最大程度减少个人投资者与机构之间信息上的差异,使个人投资者更早的了解

2023-05-05

全球微动态丨电脑所有程序都打不开了怎么办_电脑所有程序都打不开

1、电脑可以帮助人们解决各种工作难题,我们可以应用电脑完成各种各样的任务,当然也可以应用电脑来娱乐。2

2023-05-05

银行理财产品4月月报:规模企稳回升 净值稳定波动

银行理财产品4月月报:规模企稳回升净值稳定波动

2023-05-05