加入怡居
過去7年,我司每年平均捐出52%純利作慈善用途,款額動輒以百萬元計,可稱實 至名歸的社會企業。閣下光顧我司,是變相自己做善事!日後請多多光顧為感!
尖沙咀總行 : 2569 2192
太古城華山分行 : 2569 1339
沙田銀禧分行 : 2636 1380
太古城明宮分行 : 2560 3738
沙田第一城專責組 : 2647 1838
杏花邨專責組 : 2898 0007
尖沙咀總行 : 2569 2192
太古城華山分行 : 2569 1339
沙田第一城專責組 : 2647 1838
沙田銀禧分行 : 2636 1380
太古城明宮分行 : 2560 3738
杏花邨專責組 : 2898 0007
   回應 : 0
奇、趣、妙、識
当AI学会反思,你还在“鸡娃”刷题吗?
默寶小講堂
2025年12月4日
(原文發表於2025年12月1日)
 

为了让AI更强大,人类教会它反思过程、验证逻辑;而为了让娃考上好的大学以为你好的名义,逼他们刷题,背模型

 

近日,DeepSeekMath-V2模型的发布,在科技圈与教育圈同时掀起巨浪。这款AI在被誉为大学生数学竞赛地狱Putnam竞赛中斩获118分(满分120),一举超越人类顶尖选手——要知道,参赛人类选手的平均分数仅2分,即便是麻省理工的天才学子,最高分也不过90分。

 

118分更震撼的,不是AI对人类的分数碾压,而是它夺冠的底层逻辑。不同于以往靠海量数据海量题型套路来蒙答案的旧版AIDeepSeekMath-V2真正学会了向内求索:开发者在它的核心架构中植入了左脑右脑两个角色——“左脑负责发散思维、推导解题步骤,右脑则充当逻辑检察官,对每一步推理死抠漏洞,一旦发现逻辑断裂,便要求左脑推翻重来。

 

这场AI内部的左右互搏,本质是让智能回归对真理的诚实:它考高分仅仅只是为了满足内部的逻辑自洽。只要有一步不通,就绝不糊弄自己、不走捷径。这种慢思考”“自我反思的进化路径,恰恰戳中了当下应试教育的痛点——我们正在批量培养的,正是被AI淘汰的旧版模式人类

 

打开当下的教育场景,多少被困在刷题-考试-追分的闭环里?某以应试闻名的超级中学,学生的日常被卷子填满:清晨刷题、课间小考、深夜改卷,一路靠着题海战术冲向高考。当追问为什么这道题要这么解,得到的回应往往是别问为什么,背下来就行,高考能考高分;当纠结于解题过程的逻辑,家长和老师更倾向于直接甩答案、教套路。

 

我们用排名、奖学金、升学名额等外部奖励,不断强化分数导向:让他们学会猜出题人的意图,学会生搬硬套公式,学会考完就把知识还给老师。久而久之,变成了只看结果的答题机器”——他们能精准拿到分数,却无法解释解题逻辑;能应对标准化考试,却无力解决真实世界的复杂问题。

 

这便是最尖锐的讽刺:为了让AI更强大,人类教会它反思过程、验证逻辑;为了让变强,我们却逼他们放弃过程、只盯结果。当DeepSeekMath-V2已经能凭借自我反思轻松拿下数学竞赛高分,甚至免费开源供所有人使用时,那些只会刷题,未来的竞争力在哪里?

 

AI的进化已经给出了教育转型的信号,我们或许可以开始着手调整:

 

首先, 把评价标准从分数转向过程。别再只问考了多少分,多追问你是怎么想到这个解法的这一步推导你觉得有问题吗。哪怕答案错了,只要逻辑链完整、思路有新意,就该为的思考鼓掌——这种对思维过程的重视,才是培养反思力的基础。

 

其次,保护自我验证欲。当对着一道题死磕、反复修改解题步骤时,别不耐烦地打断他,更别直接把标准答案甩给他。这种不糊弄自己的死磕精神,正是DeepSeekMath-V2的核心优势,也是我们最该守护的宝贵品质。

 

最后,培养对真理的好奇诚实,而非对分数的执念。带观察自然、探讨现象,少用考试要考限制他们的提问,让明白学习的目的不是拿高分,而是理解世界的逻辑。

 

写在最后:未来的世界,一定不需要只会机械解题的人形计算器”——因为AI已经把这件事做得足够好。我们真正需要培养的,是拥有反思力、好奇心,敢于质疑、勇于探索的“人”。

 

算法正在努力把AI变成会思考的人,我们千万别反过来,把人培养成只会做题的机器DeepSeekMath-V2的夺冠,与其说是AI的胜利,不如说是给应试教育的一记警钟:是时候重新定义优秀,让教育回归培养人的本质了。

我要回應
我的稱呼
回應 / 意見
驗証文字