如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

2025-06-18 03:30:10

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
广告位810*200
相关阅读
为什么不能做出1T的内存条?

为什么不能做出1T的内存条?

很久以前,我爸单位合并,把一台报废的大脑袋电脑搬回家。 我...

2025-06-27
如何评价何恺明 (Kaiming He)仅用一年便取得了MIT终身教职?

如何评价何恺明 (Kaiming He)仅用一年便取得了MIT终身教职?

据悉,Kaiming 有95%的科研时间在沮丧。 然后...

2025-06-27
你见过哪些离谱的运维事故?

你见过哪些离谱的运维事故?

什么清理磁盘造成重要数据误删啦,用生产环境测试引起事故啦,一...

2025-06-27
如何看待贾玲、沙溢、贾冰、杨天真、范湉湉均瘦身成功?为什么明星想瘦就瘦普通人却很难?

如何看待贾玲、沙溢、贾冰、杨天真、范湉湉均瘦身成功?为什么明星想瘦就瘦普通人却很难?

梁宏达曾经评论过贾玲减肥,他非常确定一定是用了科技。 还有杨...

2025-06-27
女170 100斤胖吗?

女170 100斤胖吗?

啊?我158 116我都觉得我身材刚刚好,只需要塑塑型就好了...

2025-06-27