返回列表 发新帖

大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o

[复制链接]

2万

主题

2

回帖

7万

积分

管理员

积分
73624
发表于 6 小时前 |显示全部楼层 | 阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
又是一年高考时,除文作文题目,其他的题你还能看懂嘛?

你也许不懂,但大模型可以!

随着人工智能技术的飞速发展,人工智能AI在各个领域的应用越来越广泛,“大模型做高考题”也成了一大看点。

虽然大模型“重文轻理”是普遍情况,但也有大模型主攻数学能力。今天的测试,让专攻数学的国产九章大模型(MathGPT)和GPT-4o一起做今年的数学题,以2024全国甲卷数学高考真题为例,看看结果会怎样?

一、先说结论

【九章大模型(MathGPT)】

选择题12题,做对7题。

填空题4题,做对2题。

九章大模型总分 = 7 * 5分 + 2 * 5分 = 45分 (满分90分)

【GPT-4o】

选择题12题, 正确7题。

填空题4题, 正确1题。

GPT-4o总分 = 7 * 5分 + 1 * 5分 = 40分 (满分90分)

九章大模型作为以数学领域的解题和讲题算法为核心的大模型,在高考数学题目上更胜一筹,比GPT-4o得分更高。同时“点睛”分析也是九章大模型的特色,在解题的同时还拆解了题目的考点,更适合给学习者参考。

但从绝对值的分数来看,两个大模型的整体答题分数都不算太高。大模型做数学题仍是一个难度较大的挑战,短期的模型表现还达不到完美,但在逐步攻克数学问题的路上,AI的每一步尝试进展,都是对未来教育的想象空间的开拓,值得更多耐心与期待。

二、测试方法说明

1、测试题目:2024年高考全国甲卷数学真题

2、数学解答题的评分考核步骤过程,答题准确与否不易评判,所以只针对有明确答案的选择题和填空题来测试。

3、在测试中我们发现,文本输入格式的不同,会对测试结果造成比较明显的干扰。于是此次测试采用了上传图片文本识别的方式,让大模型识别题目并做题,更能保证结果的公平客观。同时,这种识图的方式也更类似“人类视觉读题”的情况,是对大模型能力的全面考验。

三、选择题,九章大模型、GPT-4o互有胜负

2024年高考全国甲卷数学题共12道选择题,九章大模型和GPT-4o都是有7道正确,但做对的题目不完全相同,互有胜负。

具体来看几道题:

第2题,九章大模型做对,GPT-4o做错:

原题:



九章大模型解答:



GPT-4o解答:



第9题,九章大模型做对,GPT-4o认为没有正确答案:

原题:



九章大模型解答:



GPT-4o解答:



第10题,九章大模型做错,GPT-4o做对:

原题:



九章大模型解答:



GPT-4o解答,答案选择正确,但其中解题对命题①的分析存在错误:



四、填空题,GPT-4o做对一道,九章做对两道

具体来看两道题:

第14题,九章大模型和GPT-4o都做对:

原题:

九章大模型解答:



GPT-4o解答:



第16题,九章大模型做对,GPT-4o做错:

原题:



九章大模型解答:



GPT-4o解答:



关于GPT-4o

2024年5月14日,OpenAI宣布推出GPT-4o,GPT-4o在处理速度上提升了高达200%,GPT-4o所有功能包括视觉、联网、记忆、执行代码以及GPT Store等,可以实时对音频、视觉和文本进行推理。

关于九章大模型

学而思九章大模型(MathGPT)是学而思自主研发的,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的大模型。2023 年 11 月,九章大模型成为首批通过备案的教育大模型。
学习交流
小学交流
初中交流
高中交流
大学交流
小学学习
小学语文
小学数学
小学英语
初中学习
初中语文
初中数学
初中英语
初中物理
初中化学
初中学习
初中生物
初中地理
初中历史
初中政治
高中学习
高中语文
高中数学
高中英语
高中物理
高中化学
高中学习
高中生物
高中地理
高中历史
高中政治
大学考试
考研总复习
四六级英语考试
公务员考试
事业单位考试
专升本考试
大学考试
自学考试
成年人高考
各类就业考试
快速回复 返回顶部 返回列表