Py学习  »  机器学习算法

Cancer Cell | 基于多模态深度学习的泛癌组织学-基因组学整合分析

BioArtMED • 1 年前 • 276 次点击  

撰文 | Nan球是生命


肿瘤微环境中组织病理学、基因组和转录组的异质性共同决定了癌症患者对治疗的反应及疗效。目前临床上对于许多癌症主要通过手动评估其组织病理学特征,以肿瘤侵袭、坏死、分裂的程度作为评级标准将病人划分到不同的风险组,为后续的治疗提供参考。

近年来新兴的计算机病理学可通过组织学图像建立预后模型,并逐步成为一种可靠且客观的方法。然而,大多数预后模型局限于组织学或基因组学中的一种,无法将它们整合在一起成为基于图像-组学的预后模型。

近日,来自哈佛医学院布莱根妇女医院的Faisal Mahmood团队在Cancer Cell发表了文章Pan-cancer integrative histology-genomic analysis via multimodal deep learning利用多模态深度学习整合分析了14种癌症的全切片图像和基因图谱数据,该算法通过不同形式来预测好和差的预后效果,基于形态学和分子水平在疾病和患者层面对患者预后效果进行预测,结合肿瘤,基质和免疫细胞在肿瘤微环境中的空间分布来综合考量对患者风险进行分级,并建立了开放的数据库以供进一步的探索,以及生物标志物的发现和特征评估。


为了解决将图像和组学数据整合在一起分析癌症预后的问题,作者开发了多模态融合的深度学习算法MMF,利用全切片H&E图像和分子数据图谱(包括突变状态,拷贝数变异,RNA-seq数据表达)来评价和预估癌症死亡风险。文章中作者使用TCGA数据库中来源于5720位患者的6592张十亿像素的全切片图像对模型进行训练和评估,并建立了基于病理-组学整合分析的研究平台PORPOISE,来驱动新的预后标记物的发现。

首先作者利用配对的14种癌症的分子数据对多模态深度学习模型(MMF)进行了5倍交叉验证,并和AMIL(仅使用组织学数据)及SNN(仅使用基因组学测序数据)这两种单模态深度学习模型进行了比较,用交叉验证的一致性指数(c-Index)和动态曲线下面积 (survival AUC)来评估不同模型的可靠性,并用Kaplan-Meier生存曲线去可视化高低风险患者人群的分级质量。作者发现,在这14种癌症中,MMF的一致性指数最高(0.645),生存曲线下面积也优于AMIL和SNN,改进了至少7种癌症的患者分级显著性。

作者对全切片图像WSIs为癌症预后分析所贡献的比重进行了定量,发现其平均占比16.8%,表明基因组学数据在MMF的风险预测中占据主要地位。但他们也发现在UCEC(子宫内膜癌)中WSIs占比高达55.1%,在HNSC(头颈癌),STAD(胃腺癌)和LIHC(肝癌)等其他癌种中也观察到较高的贡献比例,证明MMF相比于AMIL能提取出更多的基因组学数据,相比于SNN能提取出更多的组织学数据,集两家之所长而更优。


为了进一步验证他们的模型,作者将基于关注度和梯度的注释方法附加到这三种模型上。对于WSIs,作者给H&E诊断切片添加了可视化工具并叠加关注度比重,并以一个高分辨率关注度的热图呈现出来,不同区域的图像热度代表不同的预后风险。对于分子组学数据,他们使用SHAP形式的归因图来可视化不同分子特征的比重和方向。这些注释和可视化的技术被用来建立了一个新的平台(PORPOISE)。作者分别以透明细胞肾细胞癌(KIRC)和乳头状肾细胞癌(KIRP)为例,对它们分别进行了局部和全域的数据解读,发现KIRC高风险患者的高关注度区域有更多的肿瘤内部坏死,而KIRP高风险患者的高关注度区域则有更多的肿瘤细胞侵袭肾小囊。对于不同类型的癌症,MMF算法可同时兼顾肿瘤和基质两个区域。另一方面,MMF也能够识别很多文献已报道的致癌和免疫相关基因,例如在LGG(神经胶质瘤)队列,IDH1突变被认为是贡献最大的基因,别的癌症类型如乳腺癌中PIK3CA,结直肠癌中SOX9和SOX11突变的贡献比重最大。

最后作者通过肿瘤浸润的淋巴细胞(TIL)对癌症风险的预测来进一步证实PORPOISE平台的可靠性,他们发现9种癌症预测低风险患者的TIL显著多于高风险患者,说明这个模型的关注度聚焦在高免疫区域,它也证明了免疫反应的形态学特征证明TIL在许多癌症中是可靠的预后指标,可作为对高低风险患者分级的重要参考。作者最后指出,该算法的局限性在于,虽然对数据的解读可以指出“是什么”和“在哪里”,但它通常不能解释“为什么”。总的来说,这篇研究展示了多模态预后模型利用弱监督的深度学习模式来全面地预测和展示了癌症患者的风险程度和预后,为描绘肿瘤内异质性,免疫细胞呈递和其他形态学决定因素提供了更强大的工具。


原文链接:
https://doi.org/10.1016/j.ccell.2022.07.004

制版人:十一



参考文献


1. Marusyk, A., Almendro, V., and Polyak, K. (2012). Intra-tumour heterogeneity: a looking glass for cancer? Nat. Rev. Cancer 12, 323–334. https://doi.org/10. 1038/nrc3261.

2. Amin, M.B., Greene, F.L., Edge, S.B., Compton, C.C., Gershenwald, J.E., Brookland, R.K., Meyer, L., Gress, D.M., Byrd, D.R., and Winchester, D.P. (2017). The eighth edition AJCC cancer staging manual: continuing to build a bridge from a population-based to a more ‘‘personalized’’ approach to cancer staging. CA. Cancer J. Clin. 67, 93–99. https://doi.org/10.3322/caac.21388.

3. Tarantino, P., Mazzarella, L., Marra, A., Trapani, D., and Curigliano, G. (2021). The evolving paradigm of biomarker actionability: histology-agnosticism as a spectrum, rather than a binary quality. Cancer Treat Rev. 94, 102169. https://doi.org/10.1016/j.ctrv.2021.102169.

转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/146331
 
276 次点击