| 国内AI大模型高考数学成绩超GPT-4o,你如何看待这一结果? zt |
| 送交者: 2024年06月13日04:33:29 于 [世界军事论坛] 发送悄悄话 |
|
|
国内AI大模型高考数学成绩超GPT-4o,你如何看待这一结果?据复旦大学自然语言处理实验室微信公众号“FudanNLP”消息,近日,复旦NLP实验室的LLMEVAL团队推出对2024高考数学真题的评测。测评选取了网络上流出的2024高考新I卷和新II卷数学试卷客观题。大模型“考生”有13个。该团队认为,全新出炉的高考试题具备高度的独创性和保密性,是用来评测大模型的绝好评测集合。 根据两次评测的结果,大部分测试模型在简单题(如选择题前三道)上有比较好的准确率,而在中档题中表现一般。 GPT-4o与阿里云开源模型Qwen2-72b在两次测试中排名都比较靠前,相对比较稳定,而且两次排名Qwen2-72b均超过GPT-4o。
百川智能基座大模型Baichuan 4在新I卷测试中获得第一,字节豆包在新II卷测试中位列第一。
观网小伙伴,你如何看待这一结果? |
|
|
![]() |
![]() |
| 实用资讯 | |
|
|
| 一周点击热帖 | 更多>> |
| 一周回复热帖 |
| 历史上的今天:回复热帖 |
| 2023: | 同为儒家文化,日本为何如此仇视中国? | |
| 2023: | 美媒:美新冠援助金被骗4000亿美元,大 | |
| 2022: | 魏凤和在“香会”提及美国南北战争,妙 | |
| 2022: | 12艘航母,6000多枚核弹头,这就是美军 | |
| 2021: | 大功告成,中國超視距雷達再獲突破,可 | |
| 2021: | 蝙蝠 在中国的蝙蝠体内发现新型冠状病毒 | |
| 2020: | MATLAB严重试应手,说明中国已经帮美国 | |
| 2020: | 潮水:北京把一手好牌打得稀烂,一张大 | |
| 2019: | 热烈庆祝平息"六四天安门动乱"30周年 | |
| 2019: | “反送中”不仅是一国两制的失败,更是 | |


观察者网时政编辑部


