← Back to scModels Other

告别"死记硬背":Cell-JEPA 如何教会AI理解细胞的本质

告别"死记硬背":Cell-JEPA 如何教会AI理解细胞的本质
2026-05-28 ·

Cell-JEPA、联合嵌入预测架构(JEPA)、潜空间学习、dropout鲁棒性

Overview

WeChat科普推文 第23期 · 2026-05-28
话题: Cell-JEPA、联合嵌入预测架构(JEPA)、潜空间学习、dropout鲁棒性

想象你在一个嘈杂的房间里,试图通过偷听几个模糊的词语来理解一场对话。你听到了"心脏""血液""动脉"——你的大脑立刻推断出这是一场关于心血管系统的讨论,尽管大部分词语被噪音淹没。你不会傻到一个字一个字地去"重建"那些没听清的词;你抓住的是语义的骨架。

这正是 Cell-JEPA 想教会 AI 做的事。

90% 的假象

在单细胞转录组学中,每个细胞都被测序机读出一个"基因表达谱"——一份列出数万个基因各自表达了多少的清单。问题是,这份清单中超过 90% 的数值是零——不是因为基因真的不表达,而是因为技术限制:液滴捕获效率低、扩增偏差、采样随机性。

这种现象叫 dropout。它不是生物学沉默,而是测量假象。然而,目前几乎所有单细胞大模型——scGPT、Geneformer、UCE——都在做同一件事:训练 AI 去"重建"那些被故意遮住的基因表达值。换句话说,它们在要求 AI 学会从噪声中复原噪声。

这就像让一个学生背诵一本其中有 90% 的字被墨水涂掉的教科书——他记住的将是墨渍的图案,而不是书的内容。

LeCun 的赌注,细胞的答案

2018 年,图灵奖得主 Yann LeCun 提出了一个大胆的想法:AI 不应该学习重建像素,而应该学习在抽象语义空间中做预测。与其让 AI 逐像素猜下一帧视频(这需要模拟草怎么摇、水怎么流——全部多余的细节),不如让它在概念层面预测"下一时刻的场景概要"。

这个想法被命名为 JEPA(Joint Embedding Predictive Architecture,联合嵌入预测架构)。

2026 年 2 月,由西北大学、MIT、Chan Zuckerberg Biohub 等机构组成的联合团队,把这个想法搬到了单细胞领域,推出了 Cell-JEPA

学生与老师的默契

Cell-JEPA 的架构设计非常优雅。它同时维护两份模型副本:一个"学生"网络,一个"老师"网络。

学生只看到残缺的基因表达数据(随机遮盖掉一部分基因)。老师则看到完整的数据。学生被要求去预测老师对完整细胞所形成的"理解"——不是猜具体的基因数值,而是猜老师在抽象空间中对这个细胞身份的判断。

用比喻来说:老师看了一张完整的照片,说"这是一只猫"。学生只看到照片的一角(一只耳朵、半条尾巴),被要求推断出老师看到的整体印象。学生学会的不是"耳朵应该长什么样",而是"耳朵+尾巴→猫"这种高层次的关联。

关键设计是:老师网络不通过梯度下降更新,而是通过指数移动平均(EMA)缓慢跟上学生的步伐。这就像一个老练的教练,不会被学生一时的进步带偏,始终维持着稳定的判断标准。

800,000 个肾脏细胞的启示

团队用 80 万个人类肾脏单细胞数据训练了 Cell-JEPA。肾脏是一个细胞类型极其多样化的器官(足细胞、近端小管、远端小管、集合管……),非常适合作为"认识细胞身份"的试金石。

结果很惊人:在零样本细胞类型聚类的测试中,Cell-JEPA 的 AvgBIO 得分达到 0.72,而原始 scGPT 只有 0.53——相对提升 36%

AvgBIO 是一个衡量聚类结果与真实细胞标签吻合程度的指标。0.72 vs 0.53 意味着,Cell-JEPA 在从未见过目标数据集的情况下,自动分出的"细胞群"与生物学家的专家标注更为一致。

更重要的是,Cell-JEPA 并未增加参数或数据量——它只是在 scGPT 的基础上换了一种学习目标。从"还原基因数值"变成了"理解细胞身份"。

什么没变,什么变了

有意思的是,Cell-JEPA 在基因扰动预测任务上并未全面超越 scGPT:它更好地重建了扰动后的细胞绝对状态,但在预测效应量(即扰动带来的变化幅度)上没有显著优势。

这说明了两件事。第一,表征学习和扰动建模是互补的——理解细胞"是谁"和"被扰动后会变怎样"需要不同的能力。第二,JEPA 确实在做它擅长的事:抓住稳定不变的身份特征,而不是捕捉微小的变化。

一个新的方向

Cell-JEPA 的意义不在于它"打败了 scGPT"——毕竟它本身就是基于 scGPT 架构的改进版。真正的意义在于,它揭示了一个被忽视的真相:单细胞大模型的核心瓶颈可能不是模型不够大,而是学习目标不够聪明。

当你的数据 90% 是噪声时,最糟糕的策略就是要求模型精确地记住每一个噪声点。Cell-JEPA 的选择是"抓大放小"——预测高层次的概念一致性,而不是低层次的数值吻合。

这也许是单细胞 AI 需要的一场哲学转向:从"重建一切"到"理解本质"。


一句话总结:Cell-JEPA 将 LeCun 的 JEPA 范式引入单细胞领域,用"预测潜空间表征"替代"重建基因数值",在零样本细胞聚类上较 scGPT 提升 36%,揭示了一个核心洞见——90% dropout 的数据中,学会"理解"比学会"背诵"更重要。


论文: Cell-JEPA: Latent Representation Learning for Single-Cell Transcriptomics
作者: Ali ElSheikh, Rui-Xi Wang, Weimin Wu 等(Northwestern, MIT, Biohub, UChicago, Toronto, NTU)
链接: https://arxiv.org/abs/2602.02093
预印本: 2026年2月

Links

Tags