欢迎来看雪球讲套路、讲文献!最近讲了不少孟德尔随机化的文献,但要说到生存预测,还是得回“生信老家”看看。
比如这篇文献纳入组织病理学、基因组学和转录组学的数据,通过可解释的多模态融合模型进行整合,预测泛癌(该研究包含12种癌种)患者的生存预后。
比喻成整合多种机器学习算法的生信套路
是不是好理解一点了
看雪球拆解吧
仅用公共数据也能搭乘深度学习快车?
可添加雪球 回复“个性化”咨询定制
Voxel-level radiomics and deep learning for predicting pathologic complete response in esophageal squamous cell carcinoma after neoadjuvant immunotherapy and chemotherapy
体素级影像组学和深度学习用于预测食管鳞状细胞癌新辅助免疫治疗和化疗后的病理完全缓解情况
期刊:Journal for ImmunoTherapy of Cancer
IF:10.3
发布时间:2025/03/15
pipeline:
从术前CT扫描中提取放射组学特征图,并将它们与CT图像相结合,使用Vision-Mamba模型预测病理完全缓解(pCR与非pCR);还探索了该模型对预后进行分层的能力。
图像经处理、分割、特征提取、特征选择和模型构建,然后使用独立的验证集验证模型的性能。
Vision-Mamba模型架构包括用于CT图像的单独卷积层和用于所有影像组学特征图的共享卷积层。使用这些卷积层和激活函数进行初始处理后,数据将通过状态空间模型层传递,然后将输出串联并馈送到全连接层中以预测pCR或非pCR。
患者纳入与数据集划分:
共纳入741名患者,分为训练集(469名患者)、内部验证集(118名患者)和两个外部验证集(分别为120名和34名患者)。
治疗方案与病理评估:
患者接受至少一个周期的新辅助免疫治疗,并与化疗联合使用。根据美国病理学家学会食管癌协议,将肿瘤退行分级(TRG)分为四类,其中TRG 0定义为pCR。
图像和影像组学特征处理:
通过3D Slicer软件手动分割肿瘤区域,并使用PyRadiomics Python包从每个感兴趣区域(ROI)提取90个放射组学特征图,通过特征选择保留了6个具有潜在区分能力的特征。
Vision-Mamba架构适应性改造:
构建了一个能够处理四维数组(包含选定的体素级放射组学特征图和裁剪后的CT图像)的模型,通过3D卷积、批量归一化和ReLU激活等操作提取特征,并利用双向状态空间模型(SSM)处理数据依赖的全局视觉上下文。
Vision-Mamba模型构建与训练:
使用Adam优化器进行训练,通过五折交叉验证调整超参数。模型在训练集上表现出良好的性能,并在内部和外部验证集上保持了较高的准确率、AUC、敏感性和特异性。
与其他模型比较:
Vision-Mamba模型在所有验证集上的性能均优于3D-ResNet、Vision Transformer和传统放射组学方法,显示出更好的预测能力和泛化能力。
模型预后价值评估:
根据模型预测的pCR状态和风险评分对患者进行分层,发现模型能够显著区分患者的预后,尤其是在使用训练集的中位风险评分作为固定截断值时,分层效果最为明显。
模型解释:
通过SHAP值分析,确定了CT图像和两个放射组学特征(glszm_SmallAreaLowGrayLevelEmphasis和gldm_LargeDependenceHighGrayLevelEmphasis)对模型预测的贡献最大,并通过可视化SHAP值图展示了对模型预测有重要影响的区域,包括肿瘤坏死区、肿瘤边缘区和一些显著增强的区域。
Fig 2 预后分层性能
A 总生存期 (OS) 的 Kaplan-Meier (KM) 曲线按训练集和三个独立验证集(测试集-1、测试集-2 和测试集-3)中的实际病理完全缓解 (pCR) 状态分层
B 按模型的预测 pCR 状态分层的 OS 的 KM 曲线
C OS 的 KM 曲线按模型输出的风险评分分层,使用训练集中的 −1.2 的中位截止值并将其应用于测试集
Fig 3 模型解释以及特征重要性
A 不同输入特征对模型预测的贡献
B-D 从左到右,每个面板分别显示了原始 CT 图像、裁剪的肿瘤区域、SHAP 值图和叠加图像。SHAP 值图叠加在 CT 图像上,较深的红色区域表示对模型预测贡献更大的区域。(B) 较深的红色区域,特别是在肿瘤坏死区域(由箭头指示),突出显示对预测病理完全反应有重大影响的区域
C 肿瘤边缘区域中较深的红色区域表示有助于模型预测的重要 SHAP 值。(D) 进一步的可视化强调了增强区域在模型预测中的重要性。SHAP, SHapley 加法解释.
本研究中“影像-组学-深度学习”三位一体的技术路线,提供了一种从影像原始数据到临床决策的解决方案,且能在单个时间点完成以往需要多步骤、多时间点完成的疗效评估预测。
时间、人力,更节省:
一般的影像组学研究需要与经验丰富的影像科医生手动勾画兴趣区域(ROI),该研究采用体素级分析取代ROI标注,极大节省了时间精力。
数据资源,更充分利用:
目前缺少新辅助免疫治疗联合化疗(nICT)病理反应中,具有成本效益、预测价值高的临床预测生物标志物。同时影像组学作为一种在nICT预测中处于初步应用阶段的数据,具备应用潜力。
既往应用中,影像组学有已知的优缺点。可以“扬长避短”,解决传统影像组学过拟合、过于简化复杂肿瘤特征等局限性。
SHAP解释,更清晰:
算法的黑箱性质为研究的可解释性蒙上了一层轻纱,而以SHAP解释为代表的机器学习解释方法能够指出模型中贡献更高的特征、特征在模型中属于保护因素还是危险因素等,可与生物学机制等多种证据互相验证,在应用可行性上更进一步。
可解释机器学习/人工智能/多模态
在Nature及其子刊中尤其火热哦~
“4+4”疑云未明,唯有自己学习什么、得到什么,是可以把握的。一个通过自己的真成果,扎扎实实拿到的学位;一篇篇不靠背景靠实力,发表的SCI,握在手里的感觉,方叫心安。
也许完成学校、导师、医院的各种要求,对你来说有点吃力;也许你没有时间,从0开始硬啃各种代码分析;也许你没有人脉,听不到投稿、申请课题珍贵经验与方法论。试试硕博陪跑吧👇丰富课程,教授体系化方法论;专人1v1辅导,答疑解难;强针对性,内容围绕顺利毕业,定制设计。别担心错过,它是随时加入都可以开始学习的!(报名无期限,毕业有期限,请斟酌喔)
预告:五一期间不停学!如果孟德尔的复合套路,还是不能撼动你的心弦,有真材实料的人工智能/深度学习如何呢?不需要攀关系也能拿下的那种。
都可以投到哪里呢?总不能是“10+大水刊”Nature Communications(NC)吧——恰巧,雪球搜集了5篇发表在Nature高分子刊上的AI相关文献,期刊简写都以NC开头。小长假想弯道超车的小伙伴推荐关注!
需要加速科研,将自己的课题做大做强?需要优化方法,突破分数瓶颈,达成科研要求?现在添加雪球老师回复“个性化”咨询吧~
✅立足科研 守正创新
✅上下限跨度广
✅适合优化分析/进阶分数段/丰富前期背景等需求
✅涵盖众多实用创新套路
✅量身定制,绝无量产,绝不敷衍