Py学习  »  机器学习算法

Cancer Res | 中南大学梁青春等通过整合肿瘤微环境特征的深度学习框架准确预测肺癌病理图像中的多个驱动基因突变

iNature • 6 天前 • 27 次点击  
图片

iNature


深度学习(DL)具备直接从肺癌常规组织病理切片预测基因突变的潜力。然而,现有方法大多局限于突变层面的预测,未能实现驱动突变亚型或外显子变异的精准识别,从而限制了深度学习在靶向治疗中的应用转化
2025年11月25中南大学梁青春及湖南大学彭绍亮共同通讯在Cancer Research(IF=12.5)在线发表题为“A Deep Learning Framework Integrating Tumor Microenvironmental Features Accurately Predicts Multiple Driver Gene Mutations in Lung Cancer Pathology Images”的研究论文。该研究收集了来自中国四家医院2573例肺癌患者的配对病理图像与二代测序数据,构建了一个大型多中心数据集。基于此,作者开发了NAVF-Bio——一种基于多示例学习的自适应多视角特征融合框架,能够整合全切片图像(WSI)中的肿瘤微环境(TME)特征,以预测驱动突变及肿瘤突变负荷(TMB)。
通过对11种前沿深度学习方法的基准测试,NAVF-Bio在预测驱动突变(TP53、EGFR、KRAS、ALK)和TMB状态方面均持续优于现有模型,并在外部多中心验证中达到临床相关性能。值得注意的是,NAVF-Bio能够跨中心准确预测突变驱动基因的外显子区域,同时基于WSI可视化与TME定量分析的可解释性研究进一步证实了该框架解析病理相关肿瘤特征的能力。最后,作者构建了面向肺癌的多基因突变预测平台,以促进驱动基因突变的筛查。 总体而言,NAVF-Bio通过观察WSI的多尺度特征与TME特性来预测肺癌驱动基因突变,模拟了病理学家阅片的工作流程,有望为患者靶向治疗的选择提供指导
肺癌是全球致死率最高的恶性肿瘤之一,其发病率和死亡率均位居首位。准确预测肺癌中的基因突变,包括突变亚型及其外显子位点,对于肺癌患者的个体化精准靶向治疗和预后至关重要。识别基因突变的传统方法主要依赖聚合酶链式反应(PCR)、桑格测序(Sanger sequencing)、荧光原位杂交(FISH)以及下一代测序(NGS)进行测量和评估。TP53、EGFR、KRAS和ALK等基因突变以及肿瘤突变负荷(TMB)与肿瘤的发展、治疗反应和预后密切相关。本研究侧重于驱动突变而非乘客突变。
在癌症基因组学文献中,驱动突变被定义为那些通过激活致癌通路或使肿瘤抑制基因失活(例如,EGFR、KRAS、ALK激活或TP53缺失)从而赋予肿瘤细胞选择性生长优势的突变;而乘客突变大多是中性的,不参与致癌过程。作者选择EGFR、ALK、KRAS和TP53是基于它们在肺腺癌中作为驱动基因的明确作用:EGFR和KRAS是肺腺癌中最常见且通常互斥的致癌驱动因子,ALK融合(如EML4-ALK)在4-9%的非小细胞肺癌中被认为是促肿瘤事件。然而,肺癌基因检测存在两个主要局限性。首先,目前最常用的方法NGS涉及复杂流程,需要昂贵的设备和试剂。完成复杂的基因检测过程和分析结果通常需要数天至数周,使得NGS既昂贵又耗时。其次,初级医院或医疗资源有限的地区往往无法满足患者对个体化靶向治疗的需求。
全切片成像(WSI)通过提供细胞和组织层面的全面视觉数据,彻底改变了传统病理学。WSI提供的丰富信息,涵盖了从微观到宏观的多尺度特征,为探索肿瘤内部的复杂关系创造了独特机会。大量研究表明,可以从WSI数据中预测个体遗传改变、微卫星不稳定性、单基因表达或群体基因表达模式。特别是,那些持续激活参与细胞增殖、抗凋亡、侵袭和转移信号通路的驱动基因突变,从而赋予肿瘤细胞生长优势的突变,对于癌症早期诊断、预后评估以及制定靶向治疗策略至关重要。然而,目前对肺癌驱动基因预测的准确性和泛化性仍然较低,无法满足临床精准医学的需求。
值得注意的是,现有的大多数研究主要侧重于使用分类和回归方法预测各种癌症类型的基因突变,并未涉及基因突变亚型和外显子。例如,TP53的错义和无义突变亚型;EGFR外显子19缺失(EX19del)、EX21 L858R点突变和EX20 T790M获得性耐药突变等;KRAS在EX2(Gly12, Gly13)、EX3(Gln61)和EX4(K117, Ala146)等的突变;以及ALK基因与EML4基因的融合等。此外,目前发表的研究的精确度尚未达到足以有效指导临床靶向治疗的水平。另外,现有模型的可解释性无法精确定位哪些组织学模式与驱动基因改变相关,并且仅凭视觉分析无法直观推断这些遗传变化,导致主观性高、易出错且工作量大
模式流程图(图片源自Cancer Research 
最早的研究发现,基于深度学习(DL)使用WSIs预测肺癌相关基因(TP53, EGFR, KRAS)在群体水平测量中获得的AUC值在0.733到0.856之间。此后,越来越多的算法被广泛应用于生物标志物预测,包括ABMIL、CLAM、DSMIL、TransMIL、DTFT-MIL、IBMIL、HIPT、MHIM、R2T_MIL和Patch-GCN。这些方法主要由特征提取器和聚合模块组成。特征提取器利用预训练模型从WSI内的所有补丁中提取特征,然后这些补丁级别的特征表示被聚合起来以对个体患者进行预测。在2019年至2021年间,大多数研究依赖简单的启发式方法,例如最大池化或平均池化,作为聚合模块。随后,多实例学习(MIL)的变体已成为处理WSIs的新标准,尤其是在从组织病理学切片预测遗传改变方面。然而,当前的MIL方法在聚合过程中没有考虑补丁之间的上下文信息,尽管局部和全局上下文对于医学诊断都至关重要。基于图的数据结构在表示组织和细胞之间的空间关系方面具有天然优势。因此,基于图的WSI表示捕捉了组织的空间层次结构和复杂的细胞间关系,这在预测特定基因突变、突变亚型和其他生物标志物方面非常有效。
目前,现有方法主要关注单尺度特征,常常忽略了WSIs的多尺度特性。这一限制阻碍了它们全面捕捉肿瘤异质性的能力。多尺度特征指的是从不同分辨率级别提取信息,捕捉组织内的细粒度细节以及更广泛的情境模式。这些特征对于准确表征肿瘤的复杂性至关重要,因为肿瘤通常在多个空间尺度上表现出显著的变异性。尽管一些方法已经纳入了多尺度病理特征,但大多数方法未能充分处理肿瘤微环境(TME)特征,而这些特征是肿瘤发生、进展和治疗反应的关键因素。诸如微血管密度(MVD)、肿瘤浸润淋巴细胞(TILs)和细胞死亡率(CDR)等TME特征为肿瘤的生物学行为提供了重要的见解。TME特征整合不足可能导致模型忽略肿瘤细胞与周围微环境之间的相互作用,从而导致预测性能欠佳。此外,传统方法通常依赖于手工制作的特征或有限的DL架构,无法充分利用WSIs中固有的复杂空间关系。最后,这些模型的可解释性通常仅限于补丁级别的视觉分析,忽略了生物标志物预测过程中TME特征的定量可解释性。这些局限性凸显了对更先进模型的需求,这些模型需要能够有效利用多尺度组织病理学和TME特征来改进基因突变及其外显子(EXs)的预测。
本研究旨在模拟病理医生检查切片的工作流程,通过观察WSIs的多尺度特征和TME特征来预测肺癌驱动基因突变,包括突变亚型和EXs。该研究收集了来自中国四家医院的2573例肺癌患者的肿瘤组织病理学WSIs和肺癌相关基因检测报告结果,从而构建了一个大规模病理组学数据集。本研究首次提出了一种自适应多视角特征融合MIL方法,命名为NAVF-Bio。通过采用多尺度特征融合和自适应跨视角知识互补策略,该方法从WSIs中提取TME等多视角信息,以预测驱动基因突变和TMB状态。多尺度特征融合过程充分模拟了病理医生检查切片进行特征提取和整合的方式。自适应跨视角知识互补(ACKC)策略利用注意力机制和自适应权重模块,灵活地整合来自多个视角的特征,从而提升模型的预测性能。
NAVF-Bio解决了以下挑战:首先,在预测驱动基因突变和TMB状态方面,NAVF-Bio在中南大学湘雅二医院(SXYCSU)数据集上优于11种最先进的(SOTA)方法,并在中南大学湘雅医院(XYCSU)、湖南省康复医院(HRH)和浏阳市人民医院(LPH)的外部数据集上达到了临床级诊断性能。其次,NAVF-Bio首次在多中心数据集中预测了TP53突变亚型以及突变基因(TP53, EGFR, KRAS, ALK)的外显子,取得了良好的诊断性能,并为因各种原因未能进行驱动基因突变检测的肺癌患者的精准靶向治疗提供了参考。广泛的消融实验证明,TME在提高NAVF-Bio性能方面起着关键作用。通过可视化WSIs和量化TME,该研究解释和分析了NAVF-Bio预测驱动基因突变的过程,这可能弥合组织病理学模式与潜在分子机制之间的差距,最终增强作者对癌症生物学的理解并促进精准医学的发展。最后,为临床医生构建了一个肺癌驱动基因突变预测平台,使肺癌患者能够进行早期基因筛查,并协助临床医生快速制定个体化精准靶向治疗方案

原文链接:
https://doi.org/10.1158/0008-5472.CAN-25-0582
图片

END

内容为【iNature】公众号原创,

转载请写明来源于【iNature】


微信加群


iNature汇集了4万名生命科学的研究人员及医生。我们组建了80个综合群(16个PI群及64个博士群),同时更具专业专门组建了相关专业群(植物,免疫,细胞,微生物,基因编辑,神经,化学,物理,心血管,肿瘤等群)。温馨提示:进群请备注一下(格式如学校+专业+姓名,如果是PI/教授,请注明是PI/教授,否则就直接默认为在读博士,谢谢)。可以先加小编微信号(love_iNature),或者是长按二维码,添加小编,之后再进相关的群,非诚勿扰。


图片


图片

投稿、合作、转载授权事宜

请联系微信ID:Love_iNatures


觉得本文好看,请点这里!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/189928