你的细胞，你的药：单细胞大模型正在把精准医疗从口号变成处方

单细胞大模型正在把精准医疗从对症下药升级为对细胞下药——不是根据你得了什么病来治，而是根据每一个细胞在说什么来治。

Overview

你的细胞，你的药：单细胞大模型正在把"精准医疗"从口号变成处方

期数: 第46期
日期: 2026-06-19
话题: 精准医疗、单细胞大模型、个性化治疗

2015年，时任美国总统奥巴马在国情咨文中宣布启动"精准医疗计划"（Precision Medicine Initiative），一时间全球沸腾。他描绘的愿景令人心驰神往：未来，医生不再根据"肺癌患者"这个笼统标签开药，而是根据你的肿瘤里每一颗细胞的分子特征，定制一套只属于你的治疗方案。十年过去了，我们离这个愿景还有多远？说实话，比想象中远——但单细胞大模型的出现，正在以一种几乎粗暴的方式，把这段距离急剧压缩。

一个残酷的事实：你的癌症和我的癌症，可能是两种完全不同的病

传统的癌症诊疗遵循一个简单逻辑：先看肿瘤长在哪儿（肺、肝、乳腺），再看显微镜下长什么样（腺癌、鳞癌），最后测几个标志性基因突变（EGFR、ALK、KRAS……）。然后，匹配一种"针对这类突变"的靶向药。这个流程救了很多人的命，但有一个致命的盲区——它假定同一类肿瘤里的细胞都差不多。

单细胞测序彻底戳破了这个假设。2014年，张鹍团队的先驱性工作首次在单细胞层面揭示了胶质母细胞瘤内部的惊人异质性：同一块肿瘤里，有些细胞在疯狂增殖，有些在逃避凋亡，有些在改建血管为转移铺路——它们共享同一套DNA蓝图，却呈现出截然不同的"分子面孔"。这就像一个管弦乐团，明明拿着同一份乐谱，每个演奏者却各吹各的调。你用一种药去靶向KRAS突变，可能只打中了乐团里的三把小提琴，剩下的低音提琴和定音鼓仍然在自顾自地演奏——肿瘤还是复发了。

这就是精准医疗的根本困境：不是我们不想精准，而是我们过去根本没有能力在单细胞分辨率上"看清"疾病。

从"用眼睛看"到"用AI看"：单细胞大模型的临床逻辑

过去十年，单细胞测序技术本身已经成熟到可以进入临床。问题在于，你拿到一百万颗细胞的基因表达数据之后怎么办？传统生物信息学流程需要一支训练有素的分析团队花几周时间：质控、降维、聚类、注释、差异表达、通路富集……每一步都需要专家级的人工决策。这就像一个侦探拿到了一个城市全部一千万市民的通话记录，但只能用放大镜一个一个看——理论上能破案，现实中累死了。

单细胞大模型改变了这个游戏。它的核心逻辑不是"分析"，而是"理解"。scGPT、Geneformer、scFoundation 这类模型在数十亿个细胞的表达数据上进行预训练，学习的是基因与基因之间的"语法关系"——就像一个大语言模型通过阅读整个互联网学会了英语的句法、语义和上下文，单细胞大模型通过"阅读"人类全部公开的单细胞数据，学会了"细胞的语言"。

当这样的模型面对一个患者的肿瘤单细胞数据时，它不需要从头做起。给它一个 zero-shot prompt——"指出哪些细胞亚群可能具有耐药性"——模型可以在几秒钟内完成传统流程需要数周的分析。更关键的是，它能做出传统方法做不到的推理：比如，识别出一种跨越组织的保守细胞状态特征——"这个转移灶里有一小群细胞，它们的表达模式与原发性耐药相关的胰腺癌细胞惊人地相似，虽然它们此刻仍在结肠里。"

类比：从"按图索骥"到"识人术"

用一个俗气的比喻来理解这个变化。

传统病理诊断像警察拿着一本《犯罪分子图鉴》：翻开书，对号入座——这个长得像A类通缉犯，按A类处置。如果你的肿瘤细胞"长得"足够标准，这套方法没问题。但问题是，肿瘤在进化——很多细胞并不"像"图鉴上的任何一张照片。

单细胞大模型则像一个阅人无数的老刑警。它见过的细胞比任何病理学家多几个数量级——来自不同患者、不同组织、不同疾病阶段、不同治疗前后。当它审视你肿瘤里的一小群细胞时，它不是在和图鉴比对，而是在调用它全部的"阅细胞经验"做出综合推断："我见过这个模式——在200个患者的肝转移灶里，这群细胞出现后，三个月内几乎所有患者都对常规化疗产生了耐药。"

这种能力在医学上有一个专门的术语：预后预测与治疗分层。说白了，就是在治疗开始前，告诉你：用这个方案，你有多大机会活过五年？要不要从一开始就升级方案？而这正是精准医疗的圣杯——不是"生病了再换药"，而是"在耐药还没发生时就预测到它会耐药"。

从群体统计到个体预测：一个真实的方向

这里有一个概念上的跃迁值得深究。

当前的临床指南基于群体统计：在一万个和你情况相似的患者中，A方案的有效率是65%，B方案的有效率是40%，所以推荐A方案。但"65%"意味着群体中有65%的人有效，35%的人无效——而你到底是哪一边，在治疗开始前没人知道。

单细胞大模型提供了一种可能性：基于你的细胞在模型潜空间中的位置，给出一个个体化的预测。这不是统计学外推，而是真正的模式匹配——你肿瘤中细胞的分子状态，与其他已知结局的患者的细胞状态，在模型的高维表示空间里有多接近。

2024年，一组来自斯坦福大学的研究者利用Geneformer对心脏衰竭患者的心肌细胞数据进行了分析。他们发现，模型可以在看不到临床结局的情况下，仅凭基因表达的细微差异，精准区分出对标准治疗方案响应良好和即将进展为终末期心衰的患者——这些差异，传统差异表达分析根本检测不出来。

换句话说，模型不是在数基因表达量的高低，而是在"读懂"细胞所处的功能状态——它是在衰竭的边缘挣扎，还是仍然在硬撑着维持收缩功能。这是传统统计学永远无法企及的维度。

现实障碍：从实验室论文到诊室处方

如果说上面的一切听起来过于乐观，那我们来谈谈不那么令人兴奋的部分。

单细胞测序要进临床，首先要过"成本关"。目前一个样本的单细胞测序费用大约在几千到上万元人民币不等，这对临床常规检测来说还是太贵。但随着微流控技术的发展，这个成本正在以每年30%-40%的速度下降。乐观估计，在未来三到五年内，单细胞测序将成为大型三甲医院肿瘤中心的标准配置。

第二个障碍是时效性。从取样到拿到可用于模型分析的表达矩阵，传统流程需要一到两周。对于等待治疗决策的癌症患者来说，这个窗口太长了。好消息是，单细胞大模型本身可以帮助加速这个流程——比如，在数据质控和注释环节，AI驱动的自动化已经可以将"从原始数据到可解读报告"的时间压缩到48小时以内。

第三个、也是最棘手的障碍，是监管。一个AI模型给出的"这个患者应该用B方案而非A方案"的建议，如果没有前瞻性临床试验验证，监管部门（无论中国NMPA还是美国FDA）是不会批准的。这意味着，单细胞大模型驱动的临床决策支持，需要经过和药物一样严格的临床试验——这是一条漫长的路。

展望：当你的"细胞病历"成为常规

尽管有这些障碍，方向是明确的。如果我们把临床医学的历史拉长来看，诊断精度的跃迁几乎都发生在"看清"的层面发生革命之时：显微镜让我们看清了细胞形态，PCR让我们看清了基因序列，新一代测序让我们看清了基因组全貌，而单细胞测序加AI，让我们第一次有能力看清疾病的功能状态。

未来的某一天，你的年度体检可能不再只是抽几管血测生化指标。医生会用微创方式取一小块组织，过一遍单细胞测序，然后把数据丢给一个单细胞大模型。几小时内，AI就会生成一份报告：你的肝细胞目前整体处于年轻态，但有一小群已经开始呈现早期纤维化的分子特征；你的免疫系统中，记忆T细胞的多样性开始下降——建议在未来六个月内接种一剂疫苗加强针来唤醒它们；你的胰腺β细胞功能完好，但胰岛素信号通路相关基因的表达模式提示：如果继续保持目前的生活方式，五年内有较高风险发展为2型糖尿病。

这不是科幻。这需要的所有技术组件，今天都已经存在——单细胞测序、大模型预训练、zero-shot推理。我们缺的只是把它们以合理的成本、可靠的精度、合规的流程整合到一起。

从奥巴马宣布精准医疗计划到今天，十年过去了。如果说这十年教会了我们什么，那就是：精准医疗真正的瓶颈不在测序，不在算法，甚至不在成本——而在于我们是否能够用AI真正"理解"每一个细胞的"诉说"。单细胞大模型迈出了这一步。下一步，是把它送到每一个需要的患者面前。

一句话总结：单细胞大模型正在把精准医疗从"对症下药"升级为"对细胞下药"——不是根据你得了什么病来治，而是根据你身体里的每一个细胞在说什么来治。