< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

全球首个英伟达含量为0的万亿模型,成了海外开发者的抢手货

量子位 | 公众号 QbitAI

国产算力能不能撑起万亿参数大模型?

美团LongCat-2.0

模型采用自研MoE混合专家架构,总参数达1.6万亿,每token激活约48B参数,原生支持1M超长上下文。

从训练到推理,英伟达含量为0——

首个在国产算力上实现全链路训推闭环的万亿参数模型

从多项专业评测数据来看,LongCat-2.0在代码、工具调用和多步逻辑推理等任务上具备较强综合性能。

不过,这位倒也不算开发者的“新朋友”,因为人家早就披着马甲“不小心”成为了全球Agent开发者的最爱~

没错,最近在OpenRouter上挺火热的

,正是LongCat-2.0(面具版)。

月调用量在Hermes、Claude Code和OpenClaw分列全球第一、第二和第三位,成为开发者首选的开源模型。

所以说,这位不仅第一个在国产卡上跑通了万亿级训推,还提前通过了市场的真实流量验证??

有意思有意思,等不及了,咱也来上手测一波!

体验方式: https://longcat.chat/platform/product

新用户认证送1000万token

技术报告: https://longcat.ai/blog/longcat-2.0/

把LongCat-2.0扔进三个坑里

榜单它稳坐第一,那咱也就接入Hermes看看实力~

为了验证它是不是真的把信息读进去了,我特意没用公开的论文或者技术白皮书。

自己手动拼了一份语料,把几份不同行业的研报、不同领域的几篇论文拼到一起,中英混杂凑了好几万字,be like:

我先问了一个藏在文档中前段的信息,是一份跨境电商进出口报告。

对比一下回答,信息完全正确!

还有被我特意拆分的完整统计报告,LongCat-2.0也能准确找到,而且感觉速度挺快,就1秒……

它做分析推理也挺清晰,扛住了几万字攻击!

好,胆子大一点,让它干一件程序员最烦的事情:接盘。

我找了一个开源代码仓库,GitHub上13k star的原版2048,纯HTML+CSS+JavaScript架构的项目。

把它丢给LongCat-2.0,然后提了两个具体需求:

视觉类修改:把整个游戏的配色方案改成赛博朋克风格,要深色背景、霓虹色的方块、发光效果的数字。

功能类修改:把4×4的棋盘改成5×5,同时增加一个计步器显示在棋盘下方,记录玩家一共滑了多少步。

拿到任务后它先把关键文件挨个过了一遍,自己拆出了一个7步的修改计划。

剩下的完全不用我管,LongCat-2.0自己跑了12分钟,交付了一个完整的结果。

从效果上看,我要的计步器和5×5方格都有,而且改完配色ok。

视频地址:https://mp.weixin.qq.com/s/OWCyjK_CVOJn8ITX_1Da4Q

改个颜色加个计步器当然不算难活儿,我又加了一道题。

让它把整个项目从原生JavaScript迁移到React。

跑出来的游戏看着一样,功能全部保留,但底层代码已经完全重写了。

LongCat-2.0官宣后的这两天,看到不少朋友说它和

Claude Code

好好好,那咱接入Claude Code再试一局。

这次我给了一个研究主题让它帮忙调研。虽然Claude Code自带deep-research,但咱先不用,看看LongCat-2.0的实力如何。

视频地址:https://mp.weixin.qq.com/s/OWCyjK_CVOJn8ITX_1Da4Q

自主连网搜索,LongCat-2.0独立完成了整篇结构化报告。

当然了,代码能力也不能落下,那就来个「只有一道门」魔性小游戏吧。

拿到任务后,LongCat-2.0开启了统筹能力,先把项目架构一列,然后就开始哐哐写代码。

中间的架构设计、模块拆分、技术选型,全是它自己定的。关卡逻辑、交互细节、通关动画一个没落,并主动加了个Web Audio音效。

视频地址:https://mp.weixin.qq.com/s/OWCyjK_CVOJn8ITX_1Da4Q

接入LongCat-2.0的API做了个代码分析师

,输入任意GitHub仓库,就能定制一份专属分析报告。

作者 gjqs