总设计
数据集划分:
使用75%/25%的比例将患者数据分为训练集(n=63)和测试集(n=22)。
模型训练:
使用从静态/动态参数PET图像中提取的影像组学特征训练集成机器学习模型,以分类病变的恶性程度。
可解释方法:
采用三种可解释机器学习方法——局部可解释模型无关解释(LIME)、Anchor和SHapley加性解释(SHAP)生成患者特定的解释。
医生评估:
18名来自8个机构的医生在两个阶段评估测试样本。第一阶段仅通过磁共振和静态/动态PET图像分析22个病例;第二阶段重新评估相同病例,但包含影像组学模型预测和解释。
影响获取与预处理
PET影像获取:
患者接受动态18F-FDOPA PET采集,使用两种不同的PET/CT系统,并进行空间重采样以实现各向同性体素。
感兴趣体积划分:
由经验丰富的核医学医生在静态图像上划分健康大脑、纹状体和肿瘤的感兴趣体积。
特征提取:
从静态肿瘤-背景比(TBR)和动态时间至峰值(TTP)参数图像中提取208个特征,包括一级统计、形态学和纹理特征。
模型训练与评估
特征选择:
去除零方差变量,使用层次聚类去除高度相关特征,并通过Wilcoxon评分选择最信息丰富的特征。
模型优化:
使用集成分类器,包括逻辑回归、线性支持向量机(SVM)、核化SVM、随机森林和梯度提升决策树。通过贝叶斯搜索优化超参数。
模型评估:
使用AUC、准确率、敏感性和特异性评估医生在有无影像组学模型支持下的诊断能力。
模型解释
可解释方法应用:
使用LIME、Anchor和SHAP为测试集中的每个患者提供视觉支持,帮助医生分析医学图像和常规临床信息。
医生反馈:
在第二阶段,医生在评估时还需判断每种XML方法是否有效地影响了他们的决策过程。
统计分析
主要目标分析:
使用混合效应逻辑回归模型评估医生在有无可解释影像组学模型帮助下的表现。
诊断指标:
计算AUC、准确率、敏感性和特异性,并使用500次自助采样计算95%置信区间。
次要目标分析:
通过Fleiss’s kappa评分评估医生间的一致性,并使用混合效应序数回归模型分析影像组学模型对医生置信度水平的影响。
结果
诊断准确性提升:
在第二阶段,医生的诊断准确性显著提高(0.775 vs. 0.717,p=0.007)。
医生信心增强:
影像组学模型显著增强了医生的置信度(p<0.001)。
可解释方法的有效性:
Anchor和SHAP在75%和72%的病例中有效,优于LIME(p≤0.001)。
结论
研究结论:
可解释的影像组学模型在使用氨基酸PET扫描作为诊断支持以帮助医生识别胶质瘤恶性程度方面具有潜力。
未来方向:
需要进一步研究以评估可解释影像组学模型在其他更广泛分布的神经肿瘤学指征中的有效性,例如胶质瘤复发的检测。