社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

中国多中心研究:验证局部进展期胃癌患者NAC后基于机器学习的高效生存预测模型

医学界肿瘤频道 • 3 天前 • 22 次点击  
*仅供医学专业人士阅读参考
图片

研究通过比较多种机器学习算法,为LAGC个体化管理提供了重要工具参考。


过去二十年里,新辅助化疗(NAC)已被广泛用于治疗局部进展期胃癌(LAGC),对这类患者进行有效的预后分层已成为研究热点。近年来随着人工智能(AI)的快速发展,各种机器学习(ML)算法逐渐应用于预测疾病预后,显著提高了预测准确性,为癌症诊断和治疗提供了新的可能。针对以上背景,近期发表在Surgical Endoscopy杂志的一项研究旨在利用Cox回归并评估多种ML算法,以识别和优先排序影响LAGC患者总生存期(OS)的关键因素,从而建立一个高效的预后预测模型[1]。本文特此整理关键信息,以飨读者。



研究方法


数据来源与研究设计


研究回顾性分析了2016年1月至2020年12月间在福建医科大学附属协和医院(FMUUH)接受NAC后行根治性胃切除术的340例LAGC患者资料。纳入标准为:确诊LAGC(临床分期cT2-4N0-3M0);年龄18-80岁;接受过NAC;化疗前后影像学资料完整。排除标准为:有恶性肿瘤病史或合并其他恶性肿瘤;术前或术中发现转移;既往接受过胃切除术或内镜黏膜下剥离术;残胃癌;R1切除(镜下切缘阳性)。


最终279例患者符合纳入标准,作为内部队列(FMUUH队列),并按6:4比例随机分为训练集(n=167)和验证集(n=112)。纳入2016年1月至2020年12月期间确诊的106例患者作为外部验证队列,其中41例来自福建医科大学附属漳州医院(FMUAZZH),65例来自青海大学附属医院(QUAN)。筛选流程见图1。


1 患者入组流程图


机器学习算法与模型构建


首先对内部训练集进行单因素Cox比例风险回归分析,仅将具有显著相关性(P<0.05)的变量用于后续建模,最终将筛选出的特征变量整合到6种ML算法中构建预测模型,包括SVM、逻辑回归、RF、L1正则化线性回归(Lasso)、极端梯度提升(XGBoost)和K近邻算法,并采用迭代方法动态调整模型参数,观察不同结果并确定最优参数。


模型性能通过曲线下面积(AUC)、特异性、阳性预测值(PPV)、阴性预测值(NPV)、召回率、F1分数、Youden指数及多轮交叉验证的平均结果评估,最终选取最佳模型进行预测分析,评估其区分度、校准度和临床实用性。



研究关键结果


患者临床病理特征


内部训练集、内部验证集和外部验证集分别包含167例、112例和106例患者。表1展示了三个队列的临床病理特征,基线特征相对平衡。


1 患者基线特征


患者风险因素分析


Cox回归分析显示,估计出血量、肿瘤位于上部、肿瘤大小、神经侵犯、脉管侵犯、肿瘤退缩分级(TRG)、ypTNM分期、幽门螺杆菌(H.pylori)感染状态、术前淋巴细胞计数、术前血小板计数、血小板/淋巴细胞比值(PLR)及CA19-9是OS的显著独立预后因素(表2)。


2 OS预后因素的单变量Cox分析


ML模型的建立与验证


将上述12个变量纳入6种ML模型。受试者工作特征(ROC)曲线显示,在预测接受NAC后行根治性胃切除术的LAGC患者死亡率方面,支持向量机(SVM)模型优于其他5种模型。6种模型的详细参数比较显示,SVM模型的预测性能更优(表3)。


3 不同模型性能评估结果


此外,采用决策曲线分析(DCA)直观评估和比较6种模型的临床适用性(图3),结果显示在不同概率阈值下,SVM模型的净获益均大于其他模型。


3 内部验证集中不同模型的DCA曲线


此外,SVM模型的Brier评分更小(0.200),表明其校准性能更优(图4)。在外部验证集中,SVM模型预测患者死亡率的AUC为0.74,提示其对接受NAC联合根治性胃切除术的LAGC患者具有较高的预测准确性。因此,研究者选择SVM算法构建预测模型。


4 内部验证集中不同模型的校准曲线分析


为进一步识别SVM模型中影响患者预后的因素,基于SVM算法对内部训练集进行了特征重要性分析,结果显示ypTNM分期、H.pylori感染状态、估计出血量和肿瘤位置是贡献预后权重的关键因素(图5)。


5 SVM模型中影响患者预后的因素重要性排序


研究还采用SHAP依赖图分析了影响预后的关键因素(图6A-L):SHAP值>0的特征增加患者死亡风险,SHAP值<0的特征降低死亡风险。结果发现,肿瘤分期对预后预测影响显著,晚期患者(ypTNM III期)的SHAP值为正,表明死亡风险高。H.pylori阴性、估计出血量>55mL及肿瘤位于胃中部的SHAP值为正,是预测死亡风险较高的指标。相反,肿瘤大小、术前CA199、神经侵犯、TRG等特征的SHAP值变化较小。


6 胃切除术后预后预测的SHAP依赖图


SVM模型与ypTNM分期系统的比较


研究针对SVM模型与传统ypTNM分期系统的性能进行了比较(表4)。ROC曲线分析显示,SVM模型在所有数据集中的表现均优于ypTNM分期系统(图7)。此外,DCA分析显示SVM模型的净获益大于ypTNM分期系统(图8)。


4 SVM模型与ypTNM分期系统的性能评价


7 模型性能比较的ROC曲线


8 模型性能比较的DCA分析


SVM模型对OS获益的影响


为评估SVM模型的长期生存预测性能,研究通过内部训练集的生存数据进行了Youden指数分析,确定最佳OS差异阈值为0.39,据此将患者分为高危组(HRG,≥0.39)和低危组(LRG,<0.39)。内部队列的中位OS随访时间为46个月,中位DFS随访时间为45个月;外部验证集的中位OS随访时间为67个月,中位无病生存期(DFS)随访时间为68个月。


内部队列中,HRG的OS显著短于LRG,平均OS为47.33个月(95%CI,41.04-53.63),LRG为64.97个月(95%CI,59.70-70.25);HRG的平均DFS为45.06个月(95%CI,38.33-51.78),LRG为62.49个月(95%CI,56.99-67.99)。


9 内部队列中HRG和LRG的生存分析


外部验证队列中,两组OS差异与内部队列相似:HRG的平均OS为53.60个月(95%CI,43.70-63.50),显著短于LRG的79.47个月(95%CI,70.30-88.64);HRG的平均DFS为47.41个月(95%CI,37.24-57.59),LRG为70.70个月(95%CI,59.91-81.47)。


10 外部验证队列中HRG和LRG的生存分析


复发模式


关于静态和动态复发模式,进一步分析了纳入内部队列的 279例LAGC患者。静态复发模式方面,279例患者中112例发生术后复发,复发率为40.1%。HRG的总复发率(48.0% vs 35.6%,P=0.041)和腹膜复发率(14.7% vs 6.2%,P=0.019)均高于LRG(表5)。


5 内部集合中LRG和HRG患者的术后复发模式


动态复发模式方面,复发风险峰值出现在术后12.0个月(峰值风险率0.0170),随后曲线逐渐下降(图11A)。HRG的总复发峰值风险率显著高于LRG(0.0230 vs 0.0140)(图11B);腹膜复发方面,术后38.0个月内HRG的风险高于LRG(0.0078 vs 0.0028)(图11C)。


11 内部队列中的动态复发风险曲线图



文章小结


本研究首次应用多种ML算法预测接受NAC后行根治性胃切除术的LAGC患者预后,发现SVM模型预测性能最优,其纳入术中出血量、肿瘤部位等12个特征,经SHAP分析确定ypTNM分期、幽门螺杆菌感染状态等为关键影响因素,能有效区分高低危人群,预测效能优于AJCC第8版ypTNM分期系统,可指导个体化随访策略。尽管本研究可能存在数据来源偏倚、外部验证复发数据不足等局限,但该模型仍为LAGC患者预后评估提供了重要临床工具参考,有望为更深入的探索提供新的启示。


参考文献:

[1]Huang, ZN, et al. Predicting the prognosis of radical gastrectomy for patients with locally advanced gastric cancer after neoadjuvant chemotherapy using machine learning technology: a multicenter study in China. Surg Endosc 39, 5152–5170 (2025). 

审批编号:CN-167851 有效期至:2026-09-10

本材料由阿斯利康提供,仅供医疗卫生专业人士参考


*此文仅用于向医疗卫生专业人士提供科学信息,不代表平台立场。
图片图片更多医疗资讯,点击“阅读原文”查看

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/187293
 
22 次点击