困住医疗AI的死循环，终于有国产玩家跑通了

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

在多项关键医疗测评上打败了GPT-5.5

「智能是平等的，但是context是不平等的。」

Sam Altman不久前说了一句话，大意是：智能终将像水电一样成为基础设施，人人都能调用。但他也指出，AI当前最大的瓶颈不在智能，在

context gap

——系统没法持续理解用户的真实场景。

a16z在今年3月的一篇分析里说得更直接：没有正确context的AI Agent，基本无用。

这两个判断叠在一起，恰好解答了一个困扰我很久的疑惑：

为什么有些很火的垂直赛道，迟迟未能形成马太效应？比如医疗

AI发展到现在，通用大模型的格局已经很清楚了。头部三五家吃下绝大多数市场，后来者连牌桌都很难上。

强者恒强，几乎是常识。

但医疗偏偏是个例外。这条赛道热了好几年，上百家公司涌进来，论文一茬接一茬，评测榜单你追我赶。

可奇怪的是，似乎没有人真正拉开明显差距。为什么？

如果从context的角度进行思考，答案很可能是：

不是大家实力接近，恰恰相反，是因为整个行业卡在了同一个结构性死结里——

数据、模型、场景，三者的闭环断了

数据在医疗行业的角色有点像「萧何」，成也它，败也它。

看起来数据足够丰富，病历、影像、检验结果几乎无处不在，所以早期大家一窝蜂涌进来。

但真正进来之后才发现：数据确实不缺了，但没法直接用啊。

很多厂商手里的确有大量原始医疗数据，

但由于缺乏专业的标准化治理能力

，所以难以转化为有效训练素材。

说白了，专业的事交给专业的人。医疗数据的标准化处理，需要懂医学的人来干。

像DeepMind这样的顶级实验室还能自搭内部医学团队，但对大多数公司来说，他们往往只能依赖外部医学标注团队或医院合作方，通过「外包」来补齐能力缺口。

走外包当然没问题，问题是高质量的医学治理资源本身就是稀缺品，而且很难规模化复制。

通俗点，能接这种活的团队就那么多，排队都排不过来。

原始数据看起来很多，但真正经过专业治理、能稳定喂进训练流程的，其实非常有限

说到底，原始数据不等于context。没经过治理的数据，是噪音，不是信号。

很多人的想法是，虽然高质量数据少了点，但只要把模型扔进真实环境跑起来，不就能持续获取新数据、形成数据飞轮了吗？

思路没错，但飞轮恰恰卡在了这一步。

绝大多数医疗AI产品仍停留在「问答助手」阶段，能回答问题，却无法深度嵌入医生的工作流。

一个问答机器人哪怕每天被问一万次，沉淀下来的也只是「用户问了什么、AI怎么答的」，而真正有价值的数据，来自诊疗过程本身——

医生如何诊断、如何开药、如何调整治疗方案，以及患者最终恢复得怎么样。

进不去这些核心环节，就拿不到有效增量数据。

拿不到有效增量数据，模型当然还能靠公开文献和语料继续「刷分」，但这种提升更多停留在知识层面，而非临床决策与工作流层面。

结果就是一个很矛盾的现象：

评测很强，但医院里的实际使用频率并不高

产品进不了临床→拿不到真实诊疗数据→模型迭代没有燃料→产品更进不去

而现实的发展轨迹，几乎就是这个循环的真实写照。

困住医疗AI的死循环，终于有国产玩家跑通了

作者gjqs

作者 gjqs

相关文章

创意设计版WorkBuddy来了！腾讯发布智能体创意工作室Miora

5分钟AI长视频不翻车！国产开源框架杀到全球第一梯队

下限零基础，上限肝大作！腾讯这个AI游戏创作平台，太野了

You missed

具身智能Skill时刻！英伟达开源机器人技能库，Jim Fan：范式变了2026-07-01

Claude Mythos让梁文锋决定融资2026-06-29

τ0-WM：最大规模预训练的开源具身世界模型来了

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑