基于放射组学的机器学习术前预测临床 IA 期纯实性非小细胞肺癌的生存结局

背景

非小细胞肺癌（NSCLC）是全球常见恶性肿瘤之一。随着胸部计算机断层扫描（CT）筛查的广泛应用，更多NSCLC在早期被诊断出来，其中临床IA期且直径小于3cm的肿瘤备受关注。肺部结节根据实性成分比例分为亚实性（实性肿瘤比[CTR]<1）和纯实性（CTR = 1）结节。此前研究表明，CT上含磨玻璃影成分的IA期NSCLC预后较好，而纯实性病变患者的生存结局明显更差。尽管T分期对纯实性NSCLC有预后评估价值，但同T分期患者存在肿瘤异质性，表现为淋巴结转移和复发率较高，因此临床急需更有效的预后评估工具。

胸部CT是评估NSCLC侵袭性和预后的重要手段，但目前CT扫描的形态学特征用于预后评估的较少，仅有肿瘤直径和CTR在临床广泛应用，肿瘤的许多放射组学特征未得到充分评估。放射组学可从CT图像中提取和分析高维定量放射学特征，已有研究显示其与早期NSCLC患者的预后相关。然而，由于放射组学特征维度高，传统统计方法难以处理，而机器学习能够学习高维数据的潜在关系并进行分类或预测。将机器学习与基于CT的放射组学相结合，为术前预测临床IA期NSCLC患者的生存情况带来了希望。本研究旨在开发并验证可解释的机器学习模型，利用术前临床和放射组学特征预测临床IA期纯实性NSCLC患者的总生存期（OS）。

结果

本研究共纳入642例CT显示为纯实性的NSCLC患者，平均年龄71岁，男性占70.2%。多数患者处于临床IA2（49.3%）和IA3（41.4%）期，肺叶切除术是最常见的手术方式（73.2%）。大部分患者处于病理IA期（59.8%），18.5%的患者处于I期以上。平均随访时间为56个月。

从CT图像的瘤内和瘤周区域共提取3748个放射组学特征，经预处理和筛选，最终确定1002个与OS显著相关的特征。基于这些特征进行聚类分析，识别出瘤内和瘤周特征的表达模式，且这些模式与血管侵犯、病理分期和OS显著相关。随后，通过LASSO回归从1024个特征中筛选出42个用于建模，包括9个临床特征、2个表达模式特征和31个放射组学特征。

XGBoost模型在预测OS方面表现最佳，6至60个月的集成时间依赖性曲线下面积（iAUC）为0.832（95%置信区间[CI]，0.779 - 0.880）。XGBoost和随机生存森林（RSF）模型均优于Cox回归模型（iAUC分别为0.795和0.753）。在1年、3年和5年的OS预测中，XGBoost模型的时间依赖性曲线下面积也最高。校准曲线显示，XGBoost和RSF模型与观察到的生存曲线较为一致，其中XGBoost模型的预测与实际情况最为接近。此外，单独基于临床特征和放射组学特征构建的XGBoost模型的iAUC分别为0.778和0.721，表明结合两者特征可提升模型性能。

XGBoost模型为每位患者生成反映死亡风险的预测值。根据预测值计算阈值，将患者分为不同风险组。分为3个风险组时，低、中、高风险组的5年OS分别为92.9%、78.9%和41.7%（P < 0.0001）；分为4个风险组时，低、中低、中高和高风险组的5年OS分别为100.0%、88.5%、75.6%和41.7%（P < 0.0001）。不同风险组在年龄、性别、吸烟史等多个特征上存在显著差异。

在整个队列中，接受亚肺叶切除术和肺叶切除术的患者OS相似（P = 0.65）。亚组分析显示，中低风险组中两种手术方式的OS无差异（P = 0.98）；中高风险组中，亚肺叶切除术患者的OS较肺叶切除术患者差，但无统计学意义（P = 0.18）；高风险组中，亚肺叶切除术患者的OS较好，但也无统计学意义（P = 0.097）。进一步分析发现，中高风险组和高风险组在部分患者一般状况和肿瘤特征上存在显著差异。

通过SHAP解释评估XGBoost模型中各特征的重要性，癌胚抗原（CEA）被确定为最重要的特征，其平均绝对SHAP值为0.46。CEA值增加时，SHAP值稳步上升，尤其是CEA大于5时。Charlson合并症指数为2或更高时，SHAP值急剧增加。前2个放射组学特征与OS呈非线性关系。通过两个实例展示了SHAP值对XGBoost模型预测的解释。

讨论

本研究有三个关键发现。首先，CT放射组学特征与肿瘤异质性和预后密切相关，1002个放射组学特征与OS显著相关，瘤内和瘤周放射组学特征的表达模式揭示了具有更具侵袭性病理特征和更差OS的亚型。其次，基于放射组学和临床特征的可解释机器学习模型可在术前准确进行个性化生存预测，XGBoost模型在预测OS方面表现优异，优于传统的Cox回归模型。最后，模型预测结果可能有助于改善手术决策，尽管在不同风险组中手术方式与OS的差异无统计学意义，但高风险组患者可能从亚肺叶切除术中获益。

胸部CT在NSCLC临床实践中应用广泛，但目前对NSCLC的CT定量分析不足。放射组学在NSCLC领域潜力巨大，本研究聚焦临床IA期纯实性NSCLC患者，发现其放射组学特征可有效反映肿瘤异质性，有助于术前识别肿瘤的不同亚型。然而，此前针对该亚型的放射组学单独分析较少，本研究填补了这一空白。此外，临床特征对OS的预测也至关重要，本研究中临床XGBoost模型的性能优于放射组学XGBoost模型，且添加放射组学特征后模型性能进一步提升，证实了多层面数据对OS预测的重要性。

由于放射组学特征的高维性，将有效特征组合成特征签名或模型可提升性能。此前基于放射组学特征签名的研究在预测早期NSCLC生存结局方面有一定成效，但多基于LASSO - Cox回归模型，其只能捕捉线性关系，难以准确预测复杂的生存情况。本研究采用机器学习算法与放射组学相结合的方式，结果显示机器学习模型优于传统Cox回归模型，表明OS与各特征之间可能存在非线性关系，其中XGBoost模型在辨别能力和校准方面表现最佳。与深度学习相比，机器学习模型更具可解释性，本研究通过SHAP解释揭示了各特征对XGBoost模型的贡献，增强了预测结果的可靠性。

在基于风险组的亚组分析中，中高风险和高风险患者接受亚肺叶切除术的生存趋势存在矛盾。虽然因样本量不足未达到统计学意义，但高风险组患者可能因一般状况较差无法耐受肺叶切除术，而从亚肺叶切除术中获益。目前，对于纯实性NSCLC的最佳手术方式仍存在争议，本研究提出的基于准确预后机器学习模型的手术决策指导方法具有潜在应用价值，未来纳入更多有用特征可能进一步提升手术决策的准确性。

结论

基于CT的放射组学能够反映临床IA期纯实性NSCLC的肿瘤异质性。可解释的放射组学机器学习模型可在术前准确预测该类患者的OS，实现个性化生存预测并改善生存分层，这可能为手术决策提供帮助。未来需进行大样本验证研究，特别是针对手术决策的研究，以评估该模型在临床应用中的潜力。