研究通过比较多种机器学习算法,为LAGC个体化管理提供了重要工具参考。
过去二十年里,新辅助化疗(NAC)已被广泛用于治疗局部进展期胃癌(LAGC),对这类患者进行有效的预后分层已成为研究热点。近年来随着人工智能(AI)的快速发展,各种机器学习(ML)算法逐渐应用于预测疾病预后,显著提高了预测准确性,为癌症诊断和治疗提供了新的可能。针对以上背景,近期发表在Surgical Endoscopy杂志的一项研究旨在利用Cox回归并评估多种ML算法,以识别和优先排序影响LAGC患者总生存期(OS)的关键因素,从而建立一个高效的预后预测模型[1]。本文特此整理关键信息,以飨读者。
研究回顾性分析了2016年1月至2020年12月间在福建医科大学附属协和医院(FMUUH)接受NAC后行根治性胃切除术的340例LAGC患者资料。纳入标准为:确诊LAGC(临床分期cT2-4N0-3M0);年龄18-80岁;接受过NAC;化疗前后影像学资料完整。排除标准为:有恶性肿瘤病史或合并其他恶性肿瘤;术前或术中发现转移;既往接受过胃切除术或内镜黏膜下剥离术;残胃癌;R1切除(镜下切缘阳性)。
最终279例患者符合纳入标准,作为内部队列(FMUUH队列),并按6:4比例随机分为训练集(n=167)和验证集(n=112)。纳入2016年1月至2020年12月期间确诊的106例患者作为外部验证队列,其中41例来自福建医科大学附属漳州医院(FMUAZZH),65例来自青海大学附属医院(QUAN)。筛选流程见图1。
图1 患者入组流程图
首先对内部训练集进行单因素Cox比例风险回归分析,仅将具有显著相关性(P<0.05)的变量用于后续建模,最终将筛选出的特征变量整合到6种ML算法中构建预测模型,包括SVM、逻辑回归、RF、L1正则化线性回归(Lasso)、极端梯度提升(XGBoost)和K近邻算法,并采用迭代方法动态调整模型参数,观察不同结果并确定最优参数。
模型性能通过曲线下面积(AUC)、特异性、阳性预测值(PPV)、阴性预测值(NPV)、召回率、F1分数、Youden指数及多轮交叉验证的平均结果评估,最终选取最佳模型进行预测分析,评估其区分度、校准度和临床实用性。
内部训练集、内部验证集和外部验证集分别包含167例、112例和106例患者。表1展示了三个队列的临床病理特征,基线特征相对平衡。
表1 患者基线特征
Cox回归分析显示,估计出血量、肿瘤位于上部、肿瘤大小、神经侵犯、脉管侵犯、肿瘤退缩分级(TRG)、ypTNM分期、幽门螺杆菌(H.pylori)感染状态、术前淋巴细胞计数、术前血小板计数、血小板/淋巴细胞比值(PLR)及CA19-9是OS的显著独立预后因素(表2)。
表2 OS预后因素的单变量Cox分析
将上述12个变量纳入6种ML模型。受试者工作特征(ROC)曲线显示,在预测接受NAC后行根治性胃切除术的LAGC患者死亡率方面,支持向量机(SVM)模型优于其他5种模型。6种模型的详细参数比较显示,SVM模型的预测性能更优(表3)。
表3 不同模型性能评估结果
此外,采用决策曲线分析(DCA)直观评估和比较6种模型的临床适用性(图3),结果显示在不同概率阈值下,SVM模型的净获益均大于其他模型。
图3 内部验证集中不同模型的DCA曲线
此外,SVM模型的Brier评分更小(0.200),表明其校准性能更优(图4)。在外部验证集中,SVM模型预测患者死亡率的AUC为0.74,提示其对接受NAC联合根治性胃切除术的LAGC患者具有较高的预测准确性。因此,研究者选择SVM算法构建预测模型。
图4 内部验证集中不同模型的校准曲线分析
为进一步识别SVM模型中影响患者预后的因素,基于SVM算法对内部训练集进行了特征重要性分析,结果显示ypTNM分期、H.pylori感染状态、估计出血量和肿瘤位置是贡献预后权重的关键因素(图5)。
图5 SVM模型中影响患者预后的因素重要性排序
研究还采用SHAP依赖图分析了影响预后的关键因素(图6A-L):SHAP值>0的特征增加患者死亡风险,SHAP值<0的特征降低死亡风险。结果发现,肿瘤分期对预后预测影响显著,晚期患者(ypTNM III期)的SHAP值为正,表明死亡风险高。H.pylori阴性、估计出血量>55mL及肿瘤位于胃中部的SHAP值为正,是预测死亡风险较高的指标。相反,肿瘤大小、术前CA199、神经侵犯、TRG等特征的SHAP值变化较小。
图6 胃切除术后预后预测的SHAP依赖图
研究针对SVM模型与传统ypTNM分期系统的性能进行了比较(表4)。ROC曲线分析显示,SVM模型在所有数据集中的表现均优于ypTNM分期系统(图7)。此外,DCA分析显示SVM模型的净获益大于ypTNM分期系统(图8)。
表4 SVM模型与ypTNM分期系统的性能评价
图7 模型性能比较的ROC曲线
图8 模型性能比较的DCA分析
为评估SVM模型的长期生存预测性能,研究通过内部训练集的生存数据进行了Youden指数分析,确定最佳OS差异阈值为0.39,据此将患者分为高危组(HRG,≥0.39)和低危组(LRG,<0.39)。内部队列的中位OS随访时间为46个月,中位DFS随访时间为45个月;外部验证集的中位OS随访时间为67个月,中位无病生存期(DFS)随访时间为68个月。
内部队列中,HRG的OS显著短于LRG,平均OS为47.33个月(95%CI,41.04-53.63),LRG为64.97个月(95%CI,59.70-70.25);HRG的平均DFS为45.06个月(95%CI,38.33-51.78),LRG为62.49个月(95%CI,56.99-67.99)。
图9 内部队列中HRG和LRG的生存分析
外部验证队列中,两组OS差异与内部队列相似:HRG的平均OS为53.60个月(95%CI,43.70-63.50),显著短于LRG的79.47个月(95%CI,70.30-88.64);HRG的平均DFS为47.41个月(95%CI,37.24-57.59),LRG为70.70个月(95%CI,59.91-81.47)。
图10 外部验证队列中HRG和LRG的生存分析
关于静态和动态复发模式,进一步分析了纳入内部队列的
279例LAGC患者。静态复发模式方面,279例患者中112例发生术后复发,复发率为40.1%。HRG的总复发率(48.0% vs 35.6%,P=0.041)和腹膜复发率(14.7% vs 6.2%,P=0.019)均高于LRG(表5)。
表5 内部集合中LRG和HRG患者的术后复发模式
动态复发模式方面,复发风险峰值出现在术后12.0个月(峰值风险率0.0170),随后曲线逐渐下降(图11A)。HRG的总复发峰值风险率显著高于LRG(0.0230 vs 0.0140)(图11B);腹膜复发方面,术后38.0个月内HRG的风险高于LRG(0.0078 vs 0.0028)(图11C)。
图11 内部队列中的动态复发风险曲线图
本研究首次应用多种ML算法预测接受NAC后行根治性胃切除术的LAGC患者预后,发现SVM模型预测性能最优,其纳入术中出血量、肿瘤部位等12个特征,经SHAP分析确定ypTNM分期、幽门螺杆菌感染状态等为关键影响因素,能有效区分高低危人群,预测效能优于AJCC第8版ypTNM分期系统,可指导个体化随访策略。尽管本研究可能存在数据来源偏倚、外部验证复发数据不足等局限,但该模型仍为LAGC患者预后评估提供了重要临床工具参考,有望为更深入的探索提供新的启示。
参考文献:
[1]Huang, ZN, et al. Predicting the prognosis of radical gastrectomy for patients with locally advanced gastric cancer after neoadjuvant chemotherapy using machine learning technology: a multicenter study in China. Surg Endosc 39, 5152–5170 (2025).
审批编号:CN-167851 有效期至:2026-09-10
本材料由阿斯利康提供,仅供医疗卫生专业人士参考
*此文仅用于向医疗卫生专业人士提供科学信息,不代表平台立场。
更多医疗资讯,点击“阅读原文”查看