首个AI高考全卷评测结果出分，大模型“考生”表现如何？

admin · 发表于 2024-9-6 16:02:12

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

·大部分大模型“考生”语文、英语科目表现良好，但在数学方面还有待加强。阅卷老师点评，在语文科目上，对于语言中的一些“潜台词”，大模型尚无法完全理解。在数学科目上，大模型的主观题回答相对凌乱，且过程具有迷惑性。

6月19日，首个大模型高考全卷评测结果公布。2024年全国高考结束后，大模型开源开放评测体系——司南评测体系（OpenCompass）选取了6个开源模型包括GPT-4o，针对高考全国新课标I卷“语数外”三门课程展开全卷能力测试。

评测结果显示，阿里巴巴开源的Qwen2系列MoE对话模型（Qwen2-72B）、GPT-4o及书生·浦语2.0文曲星（InternLM2-20B-WQX）成为本次大模型高考的前三甲，在语、数、英三门课程中得分均超过70分。大部分模

游客，您当前的用户组是：“游客”，以下内容需要正式会员可见，请升级到正式会员（点击进入）后继续查看。

首个AI高考全卷评测结果出分，大模型“考生”表现如何？

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

相关帖子