< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!

豆包硬刚ChatGPT

量子位 | 公众号 QbitAI

,又把不少人做沉默了。

从考场出来后,很多考生的第一反应不是有几道题不会,而是

于是乎,计算量大、题型新、区分度高,成了这张卷子被讨论最多的几个关键词。

更有意思的是,另一个问题也被顺手推上了台面:

如果把这张卷子交给AI,它到底会不会做?

我们平时会看到有些网友吐槽,AI在计算一些简单问题时会出错,怎么能答对从没见过的新高考题?

但这里有一个容易被忽略的细节,很多吐槽针对的是默认的快速模式,适合日常问答;而复杂数学、逻辑推理、编程分析这类任务,真正的打开方式应该是让模型深度思考。

所以这次,我们把问题拆开看。

同一张高考数学卷,分别交给

ChatGPT(GPT-5.5)

进行测试,结果会怎样?

豆包思考模式和ChatGPT都能给出相当稳定的解题表现。尤其是在需要多步推理、函数分析、概率建模、解析几何计算的题目上,AI已经可以按照人类解题路径一步步推进了。

(根据目前网传的试题和答案验证,豆包和ChatGPT在选择题和填空题上全都回答准确。解答题部分还需要专业老师评估过程分数。)

那么AI做高考数学,强在哪里?又容易卡在哪里?

我们继续往下看详细实测过程。

前几道选择题看起来很基础,但并不等于机械计算。

比如第1题,中位数;第2题,平面向量线性表示;第3题,三角函数值与集合交集;第4题,导数与切线方程。

这些题人类考生做起来不算特别难,但对AI来说,其实会同时考几个能力:

读懂题干,识别考点,调用公式,完成计算,还要避免在最后一步把选项看错。

到了后面,题目明显开始拉开梯度。

比如抛物线焦点距离、函数最大值反推参数、古塔排列中的等差数列分组、空间点集里的数学期望。

,每个题单独截图输入,并附上简单一句“解答这道题”。

豆包和ChatGPT答案如下:

这道题比较简单,豆包和ChatGPT从思路和答案上来看,没有任何问题。

豆包和ChatGPT答案如下:

两者都抓住了“向量a、b不共线”这一关键条件,转化为对应系数相等。整体看,这类题对当前头部AI难度不高。

豆包和ChatGPT答案如下:

这题容易错在特殊角的符号上,豆包和ChatGPT都逐项计算后再取交集,思路比较规范。差异主要在表述详略,结论一致。

豆包和ChatGPT答案如下:

两者都准确完成了求导、代入斜率、写切线方程三步,没有把函数值和导数值混淆。作为导数基础题,表现稳定。

豆包和ChatGPT答案如下:

这题开始要求先由点确定抛物线参数,再转为焦点坐标求距离。豆包和ChatGPT都能把计算链条走完,说明基础解析几何能力比较扎实。

豆包和ChatGPT答案如下:

相比前几题,这道题需要把“最大值为1”转化成参数约束。两者都能给出完整推导,但这类题也更能暴露中间计算是否严谨。

豆包和ChatGPT答案如下:

这题的难点在于先把“一百零八塔”的情境转成数列条件。豆包和ChatGPT都能识别等差结构并构造分组,说明对中文长题干的理解较稳。

作者 gjqs