利用动态双delta混合机器学习模型改善原发性肺癌经气腔播散（STAS）的预测：一项多中心队列研究

2023年11月，上海交通大学医学院附属上海市胸科医院及复旦大学附属中山医院在 Biomarker Research 杂志发表了题为 Improving the prediction of Spreading Through Air Spaces (STAS) in primary lung cancer with a dynamic dual-delta hybrid machine learning model: a multicenter cohort study 的研究。

文章摘要

背景：在原发性肺癌中，对经气腔播散（STAS）进行可靠的术前预测对于精准治疗和手术决策至关重要。本研究旨在开发和验证一种基于治疗前计算机断层扫描（CT）图像序列的双Δ深度学习（deep learning，DL）与影像组学模型，以预测肺癌患者的STAS情况。

方法：从三家中国医院回顾性招募了674名接受术前CT随访扫描（至少间隔两周）并经手术确诊为原发性肺癌的患者。训练队列和内部验证队列分别从上海胸科医院选取，包含509名和76名患者；外部验证队列则分别来自其他两家中心，包含36名和53名患者。通过包括手动勾画、3D提取、图像配准和相减在内的方法，从治疗前CT图像中构建了反映STAS状态的四种成像特征（经典影像组学特征和DL特征、Δ影像组学特征和ΔDL特征）。采用逐步优化的三步程序进行特征构建和方法优化，包括特征提取（通过DL和时间影像组学斜率）、特征选择（通过可重复性检查和45种选择算法）和分类（考虑了32种分类器）。使用Grad-CAM对DL特征的可解释性进行评估，并对影像组学特征进行特征排序。

结果：双Δ模型在STAS和非STAS之间表现出良好的区分能力，在内部验证队列和两个外部验证队列中，受试者工作特征曲线下面积（AUC）分别为0.94（95% CI，0.92–0.96）、0.84（95% CI，0.82–0.86）和0.84（95% CI，0.83–0.85），并具有可解释的核心特征集和特征图。

结论：ΔDL模型与Δ影像组学特征的结合了肿瘤生长的非对称性和放射学随访期间肿瘤内的异质性变化等信息，可为原发性肺癌中STAS的预测提供有价值的信息。

主要结果

图2 CHEST 队列的构建及其基线信息。 A CHEST 队列的注册资格以及实验和验证设置中的数据分配。B 研究队列的基线信息（性别、年龄、吸烟史、AJCC 分期、侵袭状态、LUAD 亚型的分子和石蜡病理学，以及基线扫描中的 CT 体征）。

图3 本研究中的特征提取过程和提取特征的特征。A 提取 dual-delta 特征。B 深度学习提取特征和影像组学特征的特征（优缺点）从可解释性和可重复性、稳定性、脆弱性和数据需求三个方面进行比较。

基于时间斜率的delta影像组学特征定义为：

图4 配准结果。A SSIM 对各种配准方法进行评分。B 三种不同类型配准方法的 SSIM 分数和示例。

图5 在现实世界中进行五重交叉验证和中心验证的结果。 A提取 delta-DL 特征的 AlexNet 模型的训练曲线（训练过程中 ICV 准确性与 ICV 损失）。B 双 delta 机器学习模型的接近平均分类结果的代表性混淆矩阵。C T-SNE 无监督特征聚类，随着 delta 信息的引入，模型对 STAS（+）和 STAS（-）的聚类结果更接近完全分离状态，这使得两个点集更加可分。D 五重交叉验证 ROC 曲线及其 AUC 值。E 中心验证 ROC 曲线及其 AUC 值。F AUC 值和特征选择算法及其最佳分类模型组合的特征编号，其中变量的 LASSO 交叉验证图和 LASSO 轨迹图（绿色竖线表示对应于 MSE 的特征数分钟），并给出了按 ReliefF 排序的特征权重（饼图显示了 LASSO 和 ReliefF 选择的基本特征集的组成）。

图6 不同随访间隔对模型性能和模型跨中心性能的影响。收集了 131 例患者的 CT 扫描，这些患者由于中心随访间隔超过一年但少于两年而被排除在上述入组程序中。将这 131 例新入组的患者和既往 CHEST 队列中的 585 例患者合并在一起，根据随访间隔的长短分为三组。A、B 和 C 组患者的随访间隔分别为 3 周至 3 个月（n = 329）、3 个月至 1 年（n = 256）和 1 至 2 年（n = 131）。

A 不同随访时间组的频率分布。B 不同模型对不同随访时间组的表现。C 显示不同模型中特征有效性和随访时间间隔之间的可能关系。D 显示中山队列和第九医院队列的 ROC 曲线和混淆矩阵的外部验证结果。

图7 模型可解释性。A CNN 分类的 GRAD-CAM 可视化结果的代表性示例，其中经典 DL 模型和 delta-DL 模型的注意力分布显示在注释图像中，对于经典的 DL 模型，CNN 模型的注意力更加分散。虽然大部分注意力集中在肿瘤和瘤周区域，但对背景的关注分散，而对于 delta-DL 模型，CNN 注意力明显比前者更集中，对分类做出重要贡献的区域集中在反映肿瘤生长的区域。B LASSO 和 ReliefF 选择的基本特征集及其构图。

该文章系统研究将深度网络（CNNs）从配准后的相减图像中提取的特征与delta影像组学相结合的价值。文中将这种方法定义为双delta模型，基于经典影像组学参数在一段时间内的斜率得到的delta影像组学，以及描述基线扫描和随访扫描之间肺部肿瘤差异的配准CNN深度特征。该模型不仅适用于各种随访间隔，而且比目前用于STAS预测的经典深度学习模型更具可解释性和直观性。