从LLM到JEPA，中国团队正在把“世界模型”搬进细胞内部

从LLM到JEPA，中国团队正在把“世界

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

从LLM到JEPA，中国团队正在把“世界模型”搬进细胞内部

四年前LeCun提出JEPA时，大概不会想到，这套架构有一天会被用来理解：一颗细胞。

量子位 | 公众号 QbitAI

最近，AI虚拟细胞（AIVC）赛道，迎来关键突破！

作为全球最早布局该领域的企业之一，

正式发布全球首个基于LLM-JEPA架构的AI虚拟细胞世界模型——AURA CellOS。

该模型是目前公开报道中

的单细胞基础模型，基于3.905亿个人类单细胞转录组训练，覆盖了几乎所有重要的人类细胞：40余种人体组织、260余种细胞类型。

其最受关注的突破在于，它首次将JEPA（联合嵌入预测架构）与世界模型理念系统性引入单细胞研究。

当前，世界模型已经是自动驾驶、机器人和生成式AI的重要技术方向。

CellOS的出现让外界好奇，

在高度复杂的生命科学领域，世界模型能否真正落地，并产生实质价值？

从目前公开的评测结果看，CellOS在预测精度、扰动建模等多个核心指标上与多款主流模型拉开倍数差距，达到当前国际领先（SOTA）水平。

但想要看清它的技术逻辑与商业价值，一切还要从

理解细胞变化，是生命科学最核心的问题之一。

疾病发生、药物作用、细胞治疗，本质上都是细胞状态发生变化的过程。

过去，科学家只能通过细胞培养、动物实验乃至人体验证来探究细胞在药物、基因扰动等刺激下的变化。

高昂的研发成本和漫长的试验周期，让大量潜在新药和细胞疗法陷入漫长试错，“十年研发周期、十亿美元投入，临床成功率却不足10%”的“双十定律”亟待被终结。

“虚拟细胞”的出现，为新药发现开辟了全新的路径。

在计算机里“复刻”细胞的想法，早在20世纪90年代就有学者探索，并开发了最早的细胞建模软件之一VCell。之后斯坦福大学研究团队发布了全球首个全细胞计算模型。

但此前的虚拟细胞，不是一个学习型的模拟器，不能模拟细胞在不同条件和变化环境下的运作。

无法预测细胞功能、行为和动力学，无法揭示其背后的机制，也就无法在药物开发应用中发挥最大价值。

直到近些年AI技术的突飞猛进，叠加组学技术的迅猛发展，才让虚拟细胞更接近生命科学的“模拟沙盘”：

单细胞测序技术的指数级进步及成本降低，显著提升了数据采集能力，过去几年中，

这些数据每6个月翻一番

，为建模提供了底层基础；

AI技术的进步则显著增强了细胞数据的处理、学习和推理的能力。

2024年12月，美国斯坦福大学、基因泰克制药公司与陈—扎克伯格基金会组成的联合科研团队在顶级期刊《Cell》发表的重磅论文，点燃了全球的研发热潮：

AI虚拟细胞（AIVC）的时代，正式宣告到来。

其实在此之前，Geneformer、scGPT、scFoundation、GeneCompass等一批模型就已相继问世，只是业内还没有统一AIVC的叫法。

这些AIVC模型解决了细胞类型识别等基础需求，但在预测细胞动态变化上存在明显局限。

在敲除基因、给药或诱导分化后，细胞会如何演化？

第一代AIVC模型在这类动态预测任务上仍存在明显局限。

核心在于，它们的训练目标主要是学习基因表达模式本身，而非细胞状态变化的内在机制，因此

难以区分哪些表达变化只是背景噪声

，哪些才是真正驱动细胞状态演化的关键信号。

进一步地，由于模型主要基于单一表达视角学习静态基因表达模式，难以刻画基因调控关系及细胞状态演化的动态规律。

许多只有在特定扰动条件下才显现的关键生物学信号，也容易被大量稳定表达的背景信号所淹没。

仅靠不断扩大数据规模和模型参数，并不能显著提升模型对细胞状态演化轨迹的预测能力，也难以学习细胞变化背后的内在生物学规律。

2026年6月，《Nature Methods》刊发的一项研究非常扎心：

研究人员基于2220万个细胞的scTab语料库，预训练了400个模型，完成6400次评估。结果显示，在多项任务中，模型性能往往在使用约1%的预训练数据后便进入平台期。

换句话说，仅用约22万细胞训练模型性能就基本拉满，再多

喂海量同质细胞样本，模型效果也不会明显提升。

这让行业开始重新思考：

现有技术路线是否还能持续受益于Scaling Law（缩放规律）？

或者说，问题究竟出在数据规模不足，还是第一代AIVC的建模范式已经触及瓶颈？

CellOS给出的答案是后者：

真正限制模型持续提升的，并非Scaling Law本身，而是

传统语言模型架构与细胞数据特性的系统性错配

从LLM到JEPA，中国团队正在把“世界模型”搬进细胞内部

作者gjqs

作者 gjqs

相关文章

OpenAI重返机器人赛道！四大核心岗位开招

机器人原生世界动作模型问世！首创时空一体架构，复旦系团队出品

字节开源统一框架Bernini：给DiT配个“大模型军师”，AI视频编辑先理解再动手

You missed

具身智能Skill时刻！英伟达开源机器人技能库，Jim Fan：范式变了2026-07-01

Claude Mythos让梁文锋决定融资2026-06-29

τ0-WM：最大规模预训练的开源具身世界模型来了

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑