告别"死记硬背"：Cell-JEPA 如何教会AI理解细胞的本质

2026-05-28 ·

Cell-JEPA、联合嵌入预测架构(JEPA)、潜空间学习、dropout鲁棒性

Overview

WeChat科普推文第23期 · 2026-05-28
话题: Cell-JEPA、联合嵌入预测架构(JEPA)、潜空间学习、dropout鲁棒性

想象你在一个嘈杂的房间里，试图通过偷听几个模糊的词语来理解一场对话。你听到了"心脏""血液""动脉"——你的大脑立刻推断出这是一场关于心血管系统的讨论，尽管大部分词语被噪音淹没。你不会傻到一个字一个字地去"重建"那些没听清的词；你抓住的是语义的骨架。

这正是 Cell-JEPA 想教会 AI 做的事。

90% 的假象

在单细胞转录组学中，每个细胞都被测序机读出一个"基因表达谱"——一份列出数万个基因各自表达了多少的清单。问题是，这份清单中超过 90% 的数值是零——不是因为基因真的不表达，而是因为技术限制：液滴捕获效率低、扩增偏差、采样随机性。

这种现象叫 dropout。它不是生物学沉默，而是测量假象。然而，目前几乎所有单细胞大模型——scGPT、Geneformer、UCE——都在做同一件事：训练 AI 去"重建"那些被故意遮住的基因表达值。换句话说，它们在要求 AI 学会从噪声中复原噪声。

这就像让一个学生背诵一本其中有 90% 的字被墨水涂掉的教科书——他记住的将是墨渍的图案，而不是书的内容。

LeCun 的赌注，细胞的答案

2018 年，图灵奖得主 Yann LeCun 提出了一个大胆的想法：AI 不应该学习重建像素，而应该学习在抽象语义空间中做预测。与其让 AI 逐像素猜下一帧视频（这需要模拟草怎么摇、水怎么流——全部多余的细节），不如让它在概念层面预测"下一时刻的场景概要"。

这个想法被命名为 JEPA（Joint Embedding Predictive Architecture，联合嵌入预测架构）。

2026 年 2 月，由西北大学、MIT、Chan Zuckerberg Biohub 等机构组成的联合团队，把这个想法搬到了单细胞领域，推出了 Cell-JEPA。

学生与老师的默契

Cell-JEPA 的架构设计非常优雅。它同时维护两份模型副本：一个"学生"网络，一个"老师"网络。

学生只看到残缺的基因表达数据（随机遮盖掉一部分基因）。老师则看到完整的数据。学生被要求去预测老师对完整细胞所形成的"理解"——不是猜具体的基因数值，而是猜老师在抽象空间中对这个细胞身份的判断。

用比喻来说：老师看了一张完整的照片，说"这是一只猫"。学生只看到照片的一角（一只耳朵、半条尾巴），被要求推断出老师看到的整体印象。学生学会的不是"耳朵应该长什么样"，而是"耳朵+尾巴→猫"这种高层次的关联。

关键设计是：老师网络不通过梯度下降更新，而是通过指数移动平均（EMA）缓慢跟上学生的步伐。这就像一个老练的教练，不会被学生一时的进步带偏，始终维持着稳定的判断标准。

800,000 个肾脏细胞的启示

团队用 80 万个人类肾脏单细胞数据训练了 Cell-JEPA。肾脏是一个细胞类型极其多样化的器官（足细胞、近端小管、远端小管、集合管……），非常适合作为"认识细胞身份"的试金石。

结果很惊人：在零样本细胞类型聚类的测试中，Cell-JEPA 的 AvgBIO 得分达到 0.72，而原始 scGPT 只有 0.53——相对提升 36%。

AvgBIO 是一个衡量聚类结果与真实细胞标签吻合程度的指标。0.72 vs 0.53 意味着，Cell-JEPA 在从未见过目标数据集的情况下，自动分出的"细胞群"与生物学家的专家标注更为一致。

更重要的是，Cell-JEPA 并未增加参数或数据量——它只是在 scGPT 的基础上换了一种学习目标。从"还原基因数值"变成了"理解细胞身份"。

什么没变，什么变了

有意思的是，Cell-JEPA 在基因扰动预测任务上并未全面超越 scGPT：它更好地重建了扰动后的细胞绝对状态，但在预测效应量（即扰动带来的变化幅度）上没有显著优势。

这说明了两件事。第一，表征学习和扰动建模是互补的——理解细胞"是谁"和"被扰动后会变怎样"需要不同的能力。第二，JEPA 确实在做它擅长的事：抓住稳定不变的身份特征，而不是捕捉微小的变化。

一个新的方向

Cell-JEPA 的意义不在于它"打败了 scGPT"——毕竟它本身就是基于 scGPT 架构的改进版。真正的意义在于，它揭示了一个被忽视的真相：单细胞大模型的核心瓶颈可能不是模型不够大，而是学习目标不够聪明。

当你的数据 90% 是噪声时，最糟糕的策略就是要求模型精确地记住每一个噪声点。Cell-JEPA 的选择是"抓大放小"——预测高层次的概念一致性，而不是低层次的数值吻合。

这也许是单细胞 AI 需要的一场哲学转向：从"重建一切"到"理解本质"。

一句话总结：Cell-JEPA 将 LeCun 的 JEPA 范式引入单细胞领域，用"预测潜空间表征"替代"重建基因数值"，在零样本细胞聚类上较 scGPT 提升 36%，揭示了一个核心洞见——90% dropout 的数据中，学会"理解"比学会"背诵"更重要。

论文: Cell-JEPA: Latent Representation Learning for Single-Cell Transcriptomics
作者: Ali ElSheikh, Rui-Xi Wang, Weimin Wu 等（Northwestern, MIT, Biohub, UChicago, Toronto, NTU）
链接: https://arxiv.org/abs/2602.02093
预印本: 2026年2月