| 我的题都做不出,更何况奥数 |
| 送交者: 2025年07月25日06:12:28 于 [世界时事论坛] 发送悄悄话 |
|
|
|
0+1 今天看到新闻,中国队取得第66届国际数学奥林匹克竞赛(IMO)团体冠军,六名选手全部获得金牌。这是过去七年中,中国对第六次夺冠。这已经不是新闻,比较有趣的是好几名AI“选手”也参加了比赛。计有OpenAI的O3 和O4,谷歌的 Gemini 2.5, 马斯克的Grok-4,中国的 DeepSeek-R1 等目前的世界一流AI。 AI选手在这次比赛全军覆没,连“几乎”都没有。得分最高的是Gemini 2.5,得到13分,在42分的满分中,的31%,连铜牌都不到。 然而,文章后面来了这一段,我怎么都看不懂。 “就在大家感叹AI太菜的时候,OpenAI团队用最新开发的通用推理模型,在两场4.5小时的考试时间中,和人类完全相同的考试条件下作答。 最终解出5道题,共获得35分IMO金牌分数线,成功拿到了金牌。” 这里至少有两个问题。OpenAI有没有参赛,好像没有,否则不会说“全军覆没”。因为考题没有外泄,所以是在比赛后做的,你怎么知道训练团队是否在这时间差来了点额外训练?相同条件从何谈起。 两个月前,我给ChatGPT和DeepSeek出了一道当年非常著名,但不算很难的立体几何题目。两“人”都错了,DeepSeek还错的非常离谱。 这道题当年非常著名,当今世界,知道的人已经极少。我曾经请一位搜索高手教我他会怎么找,他也用了四五步才间接找到。很显然,两位AI大概率没受过这方面训练。由此,再加上上面时间差的疑问,我对OpenAI的杰出表现相当怀疑。 上面那道题如下。 有一金字塔,塔底正方形边长为1。四个三角形是正三角形,边长也是一。 有一正四面体,即四个面都是正三角形,边长也是一。 把金字塔的一个三角形和正四面体的一个三角形合在一起,问新的多面体有几个面。 考试委员会的“标准答案”是7,正确答案是5,ChatGPT答7,DeepSeek答8。我不知道OpenAI是何方神圣,有该软体的读者不妨测试一下。 有了这个经验,我对众多AI的全军覆没就毫不惊讶了。再考虑到文中语焉不详的“相同条件”,我对OpenAI的金牌的怀疑也就顺理成章了。 |
|
|
![]() |
![]() |
| 实用资讯 | |
|
|
| 一周点击热帖 | 更多>> |
| 一周回复热帖 |
| 历史上的今天:回复热帖 |
| 2024: | 七絕 題照(2343)十億神州盡舜堯 | |
| 2024: | 代表56789的资产阶级应该力争地方自治权 | |
| 2023: | 多伦多教育局举办的培训是在亵渎与攻击 | |
| 2023: | 回国探亲访友点滴谈之九:酷吏治国?关 | |
| 2022: | 七絕 題照(1594)可怜一伙锦衣卫 | |
| 2022: | 台湾这个火药桶,什么时候爆炸? | |
| 2021: | 走资派正在走 | |
| 2021: | 河南暴雨和德国洪水的反思! | |
| 2020: | 抗美援朝 | |
| 2020: | 西藏 | |


