仅4B大小可端侧部署！卡帕西预言的「认知模型」被国产做出来了

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

效果比肩GPT-5.4

量子位 | 公众号 QbitAI

好家伙，卡帕西又说对了！

几个月前，这位OpenAI创始成员在访谈中抛出了一个判断：

“推理模型要变天了！”

仅需10亿参数，就能构建起非常优秀的

——一个剥离了海量事实记忆、只保留思考算法的智能单元。

结果万万没想到，如今有这样一支中国团队已经率先实践。

小冰之父李笛集结微软小冰原班人马，带着仅成立半年的AI初创公司

（明日新程），刚刚推出了行业首个认知模型

何为首个？事实上，明日新程对认知模型的押注和卡帕西几乎是同一时期给出。

在去年12月的奇绩创坛Demo Day上，明日新程首度公开亮相就明确提出：

AI进化终点不是更大的单体大模型，

才是下一周期行业趋势。

凭借敏锐的行业嗅觉，他们愣是提前卡位、极限抢跑，于是有了今天的新程Alpha。

特别的是，这个模型只有区区

，在动辄千亿万亿、模型参数卷到飞起的大模型里，可谓一股清流。

但就是这么个轻量级选手，却把很多推理大模型做不到的事情做成了：以下克上，不仅搞定了模型算力的痛，最终效果还能比肩第一梯队的GPT-5.4。

这下再也不用月底为Token账单发愁了。（doge）

算力成本立省100%，从烧显卡变成了交电费，而且直接

那么问题来了，为啥这个认知模型可以以小搏大？和主流的知识型推理模型又有什么本质不同？量子位深入挖了挖。

卡帕西的这场访谈，核心其实就一句话：

现有的推理模型正集体陷入

「Scaling困境」

，行业默认参数越大、知识越多，模型就越聪明。

结果呢？那些拥有庞大知识库的模型，看似能解决复杂的数学和编程问题，却总是在细节处频频被网友捉虫，比如“200元取钱”这类逻辑陷阱，甚至说strawberry中有几个“r”这样的简单问题。

单靠死记硬背，模型是学不会深度思考的，尤其是在长程任务中，稍有不慎还会导致错误滚雪球似的指数级放大。模型认知负担越来越重，Token账单也越来越离谱。

比如最近亚马逊员工疯狂用AI，用到公司都不得不紧急关停内部AI排行榜。倒不是因为效果不够好，是算力用得太吓人了，预算再高也架不住这种烧法。

养龙虾更是如此，每个月我的会员额度都在和钱包打架，扛不住啊扛不住……

而这，几乎是今年大厂的普遍真实写照。

看着手里的账单，于是行业内开始复盘，或许问题的核心压根不在知识多少上，而是

模型到底会不会组织知识

前者是拥有知识，后者是运用知识。知识本身已经不再是最稀缺的资源，如何建立知识之间的关系才是关键。

传统的知识型推理模型还是在已有知识中找答案，但认知模型不一样，它具备自主思考和规划能力，能够把单一场景下的思维策略泛化到另一个不相关领域。

这就好比某九段围棋选手，如果只会死记硬背棋谱，那他最多只能算是棋痴，但好巧不巧，他是真的懂棋，能够掌握棋局背后的博弈本质，哪怕让他换赛道去打扑克，也能拿到世界冠军。

所以更进一步说，真正的认知核心应该能被剥离出来——

轻量、可泛化、低成本。

这不仅是一家之言，OpenAI、谷歌DeepMind近来都在明显加强对多智能体协作、长期规划、世界模型和群体智能等方向的投入。

仅4B大小可端侧部署！卡帕西预言的「认知模型」被国产做出来了

作者gjqs

作者 gjqs

相关文章

OpenAI重返机器人赛道！四大核心岗位开招

机器人原生世界动作模型问世！首创时空一体架构，复旦系团队出品

字节开源统一框架Bernini：给DiT配个“大模型军师”，AI视频编辑先理解再动手

You missed

具身智能Skill时刻！英伟达开源机器人技能库，Jim Fan：范式变了2026-07-01

Claude Mythos让梁文锋决定融资2026-06-29

τ0-WM：最大规模预训练的开源具身世界模型来了

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑