在脑肿瘤诊断领域,传统的组织病理学评估正面临着分子标记技术带来的深刻变革。随着研究的不断深入,像 DNA 甲基化和下一代测序(NGS)等分子技术逐渐成为中枢神经系统(CNS)肿瘤分类的关键依据。然而,这些技术对 DNA 质量和数量的严格要求,在实际应用中常常受到限制,尤其是在处理样本量较小或肿瘤细胞含量较低的情况时。本文将详细解读《Spatially resolved transcriptomics and graph-based deep learning improve accuracy of routine CNS tumor diagnostics》一文,为您揭示一种全新的脑肿瘤诊断方法 ——NePSTA,它如何整合空间转录组学与基于图的深度学习技术,突破现有困境,提升诊断准确性。
研究背景与目的
脑肿瘤的准确诊断对于患者的治疗和预后至关重要。传统的诊断方法主要依赖于形态学特征和单一蛋白质表达,但近年来,分子标记物如 DNA 甲基化和 NGS 分析在脑肿瘤分类中发挥着越来越重要的作用。然而,这些分子诊断方法需要高质量和充足的 DNA,这在实际临床样本中往往难以满足,特别是对于一些活检样本较小或肿瘤细胞含量较低的情况。因此,开发一种能够克服这些限制的诊断方法具有重要的临床意义。
本文的研究目的是开发和验证一种基于空间转录组学的诊断应用——NePSTA,它利用经典机器学习算法和基于图的人工智能技术,实现对脑肿瘤的综合形态学和分子病理学诊断,提高诊断的准确性和可靠性。
研究方法
样本收集与处理
研究共纳入了来自四个德国医疗中心的 130 个样本,包括不同类型的神经上皮肿瘤患者和健康供体。样本分为两个队列,队列 1(n = 66)来自三个中心,进行了全面的空间转录组学分析和传统诊断检测;队列 2(n = 41)来自弗莱堡的一个单中心队列,也进行了类似的分析。同时,还包括了 12 个健康皮质样本作为对照。
对于福尔马林固定石蜡包埋(FFPE)样本和新鲜冷冻样本,分别按照 10X Genomics 的标准流程进行空间转录组学的制备。具体包括组织切片、染色、杂交、探针洗脱、文库构建和测序等步骤,确保获得高质量的 mRNA 表达数据。
技术流程
图1
研究结果
空间转录组学数据质量评估
通过比较不同样本类型和制备方法的平均独特分子标识符(UMI)数量,发现虽然总体质量指标在队列和样本类型之间没有显著差异,但细胞密度与 UMI 数量密切相关。例如,IDH - 野生型胶质母细胞瘤(GB)样本由于细胞密度高和 RNA 丰富,其 UMI 数量较高;而在非恶性组织和低级别胶质瘤中,由于细胞组成和 RNA 含量的差异,UMI 数量相对较低。这表明在分析空间转录组学数据时,需要考虑细胞密度和组织类型等因素对数据质量的影响。
推断免疫组化(IHC)结果
图2
研究团队开发了一种名为“推断 IHC” 的计算模块,利用贝叶斯推理从空间转录组学数据中预测蛋白质丰度。通过与连续的组织切片 IHC 结果进行比较,发现推断 IHC 结果与 IHC 衍生结果具有良好的一致性。例如,对于常用的诊断标记物 Ki67、GFAP 和 NeuN,其基因表达与蛋白质丰度之间存在显著的相关性(图 2)。尽管由于分辨率的差异,直接比较 IHC 和基因表达数据存在挑战,但推断 IHC 模块为传统 IHC 提供了一种有价值的补充工具,能够在全切片尺度上提供蛋白质表达的信息,有助于更全面地了解肿瘤的生物学特性。
CNV 预测与验证
图3
利用优化的空间转录组学算法计算所有样本的 CNV 图谱,并与 850K 甲基化分析(EPIC)的 CNV 图谱进行验证。结果显示,空间转录组学能够可靠地检测到 CNAs,与基于甲基化的 CNV 分析在 81.2% 的病例中具有一致性。通过多类 ROC 分析,验证了 CNV 检测的准确性,总体曲线下面积(AUC)达到 80.37%。此外,空间转录组学还能够识别出传统甲基化 - 基于 CNV 分析无法检测到的亚克隆组织架构,为深入了解肿瘤的遗传异质性提供了重要信息。
细胞类型分布分析
借助 Cell2location 算法和 GBMap 参考数据集,对不同甲基化类别的肿瘤样本进行细胞类型和状态分布的预测。研究发现,不同肿瘤亚型之间的细胞类型分布存在显著差异,例如在胶质母细胞瘤(GB)的不同亚型中,免疫细胞、基质细胞和髓样细胞的比例各不相同。同时,通过计算细胞间的邻近度,还揭示了不同亚型内细胞 - 细胞相互作用的差异,这些发现对于理解肿瘤微环境和潜在的治疗靶点具有重要意义。
组织学外观和甲基化亚类预测
图4
采用图神经网络(GNN)框架,利用空间转录组学数据预测组织学表型和甲基化亚类。通过比较不同模型结构和训练方法,发现整合近端信号能够显著提高模型的准确性。例如,使用三跳子图的 GIN 模型在预测肿瘤亚类时表现出极高的性能,准确率达到 0.893。在对 GB 和 IDH - 突变胶质瘤的进一步验证中,也显示出了良好的稳健性和准确性,为脑肿瘤的精准分类提供了有力支持。
MGMT 启动子甲基化和 CDKN2A/B 缺失预测
图5
针对
CNV 分析中无法确定单基因扩增和缺失的问题,研究团队扩展了 GNN 框架,加入了专门用于预测 MGMT 启动子甲基化和 CDKN2A/B 缺失的多层感知器(MLP)。结果表明,深度学习框架能够准确预测 MGMT 的状态,准确率接近 99%;对于 CDKN2A/B 缺失的预测,也能够在一定程度上区分不同的基因型,并绘制出其在组织中的空间分布图谱,为临床治疗决策提供了重要的分子信息。
研究意义与展望
本研究成功开发并验证了 NePSTA 这一创新的诊断框架,它整合了空间转录组学和基于图的深度学习技术,在脑肿瘤诊断中取得了显著的成果。通过克服传统分子诊断方法对 DNA 质量和数量的依赖,NePSTA 能够从少量组织中提取丰富的分子信息,实现对肿瘤的多维度分析,包括组织学特征、基因表达、CNV 和甲基化状态等。这不仅提高了脑肿瘤诊断的准确性和可靠性,还为深入了解肿瘤的生物学特性和微环境提供了新的视角。
未来,随着空间转录组学技术的不断发展和成本的降低,以及人工智能算法的进一步优化,NePSTA 有望在临床实践中得到更广泛的应用,为脑肿瘤患者的个性化治疗和精准医疗提供有力支持。同时,该研究也为其他肿瘤类型的诊断和研究提供了借鉴和启示,有望推动整个肿瘤诊断领域的发展。
参考文献
Ritter, M., Blume, C., Tang, Y. et al. Spatially resolved transcriptomics and graph-based deep learning improve accuracy of routine CNS tumor diagnostics. Nat Cancer (2025). https://doi.org/10.1038/s43018-024-00904-z