
近年来,各种新兴的空间转录组技术发展得如火如荼,对研究单细胞在复杂组织内的空间组成有着革命性的意义。这些空间转录组技术能够在复杂组织中揭示单细胞内众多基因的原位信息表达。但是,开发能够结合空间转录组数据的独特性质的计算方法,以揭示细胞身份和空间可变特征,仍是一个巨大的研究挑战。为了利用空间转录组数据识别组织中的细胞空间域和细胞类型,包括隐马尔可夫随机场(HMRF)在内的现有方法往往忽略了细胞内在本质和空间因素的复杂相互作用从而表现出并不准确的空间模式识别。最近出现的基于图卷积神经网络的方法非常有效,但是容易过度拟合,且其结果解释性不强。所以,现有方法对空间转录组数据的建模仍然有极大的提升空间。2023 年 1 月 9 日,美国卡内基梅隆大学计算机学院计算生物系的马坚实验室(共同第一作者为博士后 Benjamin Chidester 和博士研究生周天茗)在 Nature Genetics 发表了题为 SPICEMIX enables integrative single-cell spatial modeling of cell identity 的长文。文章详细介绍了一种全新的机器学习模型 SPICEMIX 来进行空间转录组数据建模。SPICEMIX 是一个无监督的机器学习方法,使用潜空间变量(latent variable)建模来阐明细胞的空间和内在因素的相互作用。SPICEMIX 在方法层面的主要创新点在于通过有效结合细胞空间组织的图模型(基于 HMRF)来极大增强非负矩阵分解(NMF)基因表达模型,从而对每个细胞得到更有意义的潜空间低维表征(latent representation)。SPICEMIX 模型直接输出空间元基因(spatial metagene)作为结果的重要部分,它可以建模转录组的空间和内在因素之间的相互作用。更重要的是,模型考虑了这些空间可变元基因对连续细胞状态的作用,这也是与其他方法相比有重大区别的创新概念。SPICEMIX 名字的选择受到了用于烹饪的香料组合的启发。譬如,人们可以用同一套各种香料(spice)做出各种不同的口味。细胞可能也是类似这样工作的 – 它们可能使用同一套常见的生物学过程,包括空间变化,但是这些生物学过程的特定组合使细胞具有各种独特的身份和功能。对人和小鼠的脑部的各种空间转录组数据,例如来自 seqFISH+,STARmap 和 Visium 等不同的技术,无论在基于成像和基于测序的数据上的应用都体现了 SPICEMIX 的有效性。在通过 seqFISH+ 和 STARmap技术得到的小鼠初级视觉皮层(primary visual cortex)的单细胞空间转录组数据上,SPICEMIX 能有效生成空间可变元基因和细胞表征。在用 Visium 技术获取的人类背外侧前额叶皮质(dorsolateral prefrontal cortex)数据上,SPICEMIX 改进了已知组织层次的标注并揭示了更细致的解剖结构。综上所述,通过有效的建模复杂组织中异质细胞的潜空间表征和空间元基因,SPICEMIX 提供了一个新的机器学习解决方案,以促进各类空间组学数据的分析,并对研究细胞在复杂组织中的空间演变有着重要的潜在意义。原文链接:
https://www.nature.com/articles/s41588-022-01256-z
制版人:十一
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
