我的题都做不出，更何况奥数-世界时事论坛-军事论坛-世界论坛网（电脑版）

送交者: 2025年07月25日06:12:28 于 [世界时事论坛] 发送悄悄话

0+1

今天看到新闻，中国队取得第66届国际数学奥林匹克竞赛（IMO）团体冠军，六名选手全部获得金牌。这是过去七年中，中国对第六次夺冠。这已经不是新闻，比较有趣的是好几名AI“选手”也参加了比赛。计有OpenAI的O3 和O4，谷歌的 Gemini 2.5，马斯克的Grok-4，中国的 DeepSeek-R1 等目前的世界一流AI。

AI选手在这次比赛全军覆没，连“几乎”都没有。得分最高的是Gemini 2.5，得到13分，在42分的满分中，的31%，连铜牌都不到。

然而，文章后面来了这一段，我怎么都看不懂。

“就在大家感叹AI太菜的时候，OpenAI团队用最新开发的通用推理模型，在两场4.5小时的考试时间中，和人类完全相同的考试条件下作答。

最终解出5道题，共获得35分IMO金牌分数线，成功拿到了金牌。”

这里至少有两个问题。OpenAI有没有参赛，好像没有，否则不会说“全军覆没”。因为考题没有外泄，所以是在比赛后做的，你怎么知道训练团队是否在这时间差来了点额外训练？相同条件从何谈起。

两个月前，我给ChatGPT和DeepSeek出了一道当年非常著名，但不算很难的立体几何题目。两“人”都错了，DeepSeek还错的非常离谱。

这道题当年非常著名，当今世界，知道的人已经极少。我曾经请一位搜索高手教我他会怎么找，他也用了四五步才间接找到。很显然，两位AI大概率没受过这方面训练。由此，再加上上面时间差的疑问，我对OpenAI的杰出表现相当怀疑。

上面那道题如下。

有一金字塔，塔底正方形边长为1。四个三角形是正三角形，边长也是一。

有一正四面体，即四个面都是正三角形，边长也是一。

把金字塔的一个三角形和正四面体的一个三角形合在一起，问新的多面体有几个面。

考试委员会的“标准答案”是7，正确答案是5，ChatGPT答7，DeepSeek答8。我不知道OpenAI是何方神圣，有该软体的读者不妨测试一下。

有了这个经验，我对众多AI的全军覆没就毫不惊讶了。再考虑到文中语焉不详的“相同条件”，我对OpenAI的金牌的怀疑也就顺理成章了。

0%(0)

	实用资讯

北美最大最全的折扣机票网站
美国名厂保健品一级代理,花旗参,维他命,鱼油,卵磷脂,30天退货保证.买百免邮.

一周点击热帖

更多>>

一周回复热帖

历史上的今天：回复热帖

2024:	七絕題照（2343）十億神州盡舜堯
2024:	代表56789的资产阶级应该力争地方自治权
2023:	多伦多教育局举办的培训是在亵渎与攻击
2023:	回国探亲访友点滴谈之九：酷吏治国？关
2022:	七絕題照（1594）可怜一伙锦衣卫
2022:	台湾这个火药桶，什么时候爆炸？
2021:	走资派正在走
2021:	河南暴雨和德国洪水的反思！
2020:	抗美援朝
2020:	西藏