送交者: 2024年06月13日04:33:29 于 [世界军事论坛] 发送悄悄话

国内AI大模型高考数学成绩超GPT-4o，你如何看待这一结果？

观察者网时政
观察者网时政编辑部

昨天 18:15

据复旦大学自然语言处理实验室微信公众号“FudanNLP”消息，近日，复旦NLP实验室的LLMEVAL团队推出对2024高考数学真题的评测。测评选取了网络上流出的2024高考新I卷和新II卷数学试卷客观题。大模型“考生”有13个。该团队认为，全新出炉的高考试题具备高度的独创性和保密性，是用来评测大模型的绝好评测集合。

根据两次评测的结果，大部分测试模型在简单题（如选择题前三道）上有比较好的准确率，而在中档题中表现一般。

GPT-4o与阿里云开源模型Qwen2-72b在两次测试中排名都比较靠前，相对比较稳定，而且两次排名Qwen2-72b均超过GPT-4o。

500

百川智能基座大模型Baichuan 4在新I卷测试中获得第一，字节豆包在新II卷测试中位列第一。

500

观网小伙伴，你如何看待这一结果？

0%(0)

	实用资讯

北美最大最全的折扣机票网站
美国名厂保健品一级代理,花旗参,维他命,鱼油,卵磷脂,30天退货保证.买百免邮.

一周点击热帖

更多>>

一周回复热帖

历史上的今天：回复热帖

2023:	同为儒家文化，日本为何如此仇视中国？
2023:	美媒：美新冠援助金被骗4000亿美元，大
2022:	魏凤和在“香会”提及美国南北战争，妙
2022:	12艘航母，6000多枚核弹头，这就是美军
2021:	大功告成，中國超視距雷達再獲突破，可
2021:	蝙蝠在中国的蝙蝠体内发现新型冠状病毒
2020:	MATLAB严重试应手，说明中国已经帮美国
2020:	潮水：北京把一手好牌打得稀烂，一张大
2019:	热烈庆祝平息＂六四天安门动乱＂30周年
2019:	“反送中”不仅是一国两制的失败，更是

国内AI大模型高考数学成绩超GPT-4o，你如何看待这一结果？

观察者网时政观察者网时政编辑部

观察者网时政
观察者网时政编辑部