Py学习  »  机器学习算法

从苏木精和伊红染色的全玻片图像预测子宫内膜癌分子分类的可解释深度学习模型:PORTEC随机试验和临床队列的联合分析

深度学习辣汤小组 • 1 年前 • 290 次点击  

深度学习辣汤小组文献阅读学习之七十五

从苏木精和伊红染色的全玻片图像预测子宫内膜癌分子分类的可解释深度学习模型:PORTEC随机试验和临床队列的联合分析

DeepLearning 深度学习辣汤小组

 2023/1/9 


2022年,来自荷兰莱顿大学医学中心病理学系的Sarah Fremond和其同事开发了一个可解释的、基于深度学习的模型im4MEC,旨在利用患者的苏木精和伊红染色玻片预测子宫内膜癌的四类分子分类,鉴定形态分子相关性,改善子宫内膜癌患者预后,并在期刊Lancet Digit Health(IF=25.98,医学1区Top)上发表题为“Interpretable deep learning model to predict the molecular classification of endometrial cancer from haematoxylin and eosin-stained whole-slide images: a combined analysis of the PORTEC randomised trials and clinical cohorts”的文章。

DOI:

https://doi.org/10.1016/S2589-7500(22)00210-2


一、研究背景

子宫内膜癌可分为POLEmut、错配修复缺陷(MMRd,mismatch repair deficient)、p53异常(p53abn,p53 abnormal)和无特定分子谱(NSMP,no specific molecular profile)亚组。现有的治疗指南认为:分子分型的提出对子宫内膜癌的诊断和临床管理具有重要意义。目前,临床上对于子宫内膜癌的分类系统主要有基于分子分型的和基于组织学特征的,两类系统是分开报告的。有必要建立一套完整的子宫内膜癌形态分子相关性,统一两种分类系统,并发现与临床有关的相关性,加深目前对子宫内膜癌分子分类的理解,并为改善预后提供机会

深度学习能够将组织的复杂视觉特征与分子疾病特征联系起来,受到了很多学者的关注。实践发现,自监督学习在训练特征提取器模型方面具有巨大的潜力,具有注意力机制的深度学习模型在处理病理图像分类问题表现良好。

基于此,该研究团队开发了一种基于图像的深度学习管道(im4MEC),利用自我监督学习来提取子宫内膜癌特异性形态学特征,利用可解释的基于注意力的分类模型从从苏木精和伊红染色的全玻片图像(WSI, whole-slide images)预测子宫内膜癌的分子分类。

二、数据集

该联合分析纳入了三项随机试验和四个临床队列的完整分子和临床病理数据。PORTEC-1(n=466)、PORTEC-2(n=375)和PORTEC-3(n=393)随机试验和TransPORTEC试点研究(n=110)、Medisch Spectrum Twente(MST)队列研究(n=242)的2028名中高风险子宫内膜癌患者的苏木精和伊红染色诊断玻片和分子和临床病理数据,Leiden子宫内膜癌资料库中的POLEmut子宫内膜癌患者的病例系列(n=47)和癌症基因组图谱TCGA­UCEC子宫体子宫内膜癌队列(n=395)。妇科病理学家筛选所有患者子宫切除标本中一个最具代表性的苏木精和伊红染色玻片,在3DHISTECH P250数字扫描仪和3DHISTECH P1000上以40 ×放大倍数对切片进行数字化。

来自PORTEC­1、PORTEC­2、TransPORTEC试点、MST、POLEmut Leiden子宫内膜癌知识库和TCGA­UCEC队列的所有患者被用于使用自我监督学习来训练特征提取器模型。进行了k倍交叉验证分割,按分子类别、队列和扫描仪类型进行分层,以确定最佳模型配置。PORTEC-3作为一个独立的测试集进行了测试,并计算了宏观平均值和分类AUROC、精度、召回率、F1得分、准确性、特异性、负预测值和混淆矩阵。

三、方法

im4MEC深度学习模型,主要包括以下几步:(1)将WSI预处理切割成360µm的非重叠方形瓦片,并调整大小为224×224像素。(2)通过自监督学习模型MoCo-v2学习瓦片级别的形态学特征。(3)使用自监督学习编码器ResNet-50从整个幻灯片图像的所有区块中提取特征,得到大小为2048的特征。(4)使用基于注意力机制的分类模型从所有瓦片级特征向量对整个WSI进行分子分类,并为每个瓦片和分子类分配注意力分数。(5)提取了每个预测分子类别中注意力得分最高的前20个瓦片,根据HoVer-Net预测计算出五个形态学特征:三种细胞类型(炎性细胞、基质细胞和肿瘤细胞)的计数以及肿瘤细胞的核大小和形状,确定形态分子相关性。实验流程图如图1所示。核分类深度学习模型的预测用于导出可解释的形态学特征。最后分析了5年无复发生存率,并使用Kaplan-Meier方法探讨了分子分类对预后的改善。

四、结果与结论

在四倍交叉验证中,im4MEC的发现达到了0.874的宏观平均AUROC,在独立测试集上达到了0.876。POLEmut(n=51)的分类AUROC为0.849,MMRd(n=134)为0.844,NSMP(n=120)为0.883,p53abn(n=88)为0.928。如图2所示。

im4MEC预测提供了预测形态特征,并突出了每个分子类别中的某种程度的异质性,如图3所示。POLEmut和MMRd瓦片具有高密度的淋巴细胞,p53abn瓦片具有强的核异型性,并且POLEmut与MMRd子宫内膜癌的形态学重叠。im4MEC强调低肿瘤与间质比率是NSMP类潜在的新特征

在PORTEC-3中,如图4,im4MEC预测的分子类别之间的5年无复发生存率显著不同。被预测为MMRd的10例侵袭性p53abn子宫内膜癌患者表现出炎症形态,并且似乎比预测正确的p53abb子宫内膜癌的患者预后更好。四名预测为p53abn的NSMP子宫内膜癌患者表现出更高的核异型性,并且似乎比预测正确的NSMP患者预后更差。预测为POLEmut的MMRd子宫内膜癌患者预后良好,与真正的POLEmut子宫内膜癌一样。总而言之,im4MEC有力地鉴定了形态分子相关性,可以进一步改善子宫内膜癌患者的预后。

图1:实验流程图

图2:PORTEC-3独立测试集上的模型性能

图3:PORTEC-3中基于支持向量机的一致病例形态学特征重要性

图4:PORTEC-3中基于预后和形态学的不一致图像预测


Pepper soup transformed by: Yang Na




  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科大学附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!


扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173274