社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【Nature子刊】西湖大学郭天南团队:利用蛋白质组学与机器学习技术预测II期和III期结肠癌患者的总生存期

转化医学网 • 8 月前 • 225 次点击  

【导读】结肠癌作为全球范围内发病率和死亡率较高的恶性肿瘤,其早期诊断和预后预测,对于提高患者生存率至关重要。近年来,蛋白质组学和机器学习技术的结合,为癌症预后评估提供了新的途径。蛋白质组学可以探索癌症患者体内蛋白质表达的变化,而机器学习则能够处理复杂的数据模式,预测疾病进展。本文将深入探讨如何利用蛋白质组学数据和机器学习算法来预测II期和III期结肠癌患者的总生存期,以及其在临床应用中的潜力和挑战。

2024年8月13日,西湖大学医学院郭天南团队在期刊《Cell Discovery》上发表了题为“Prediction of overall survival in stage II and III colon cancer through machine learning of rapidly-acquired proteomics”的研究论文。本研究的目的是开发一个可理解的分类模型,以基于蛋白质组学的数据,预测II-III CC患者的长期生存期,并在外部验证数据集中验证其普遍性。

https://www.nature.com/articles/s41421-024-00707-7#ethics

研究介绍

 01 

被诊断为肿瘤淋巴结转移(TNM)II期和III期结肠癌 (CC)的患者,占所有CC病例的2/3以上。pT4病变(病理上肿瘤已生长到内脏腹膜表面或附着在其他器官或结构上)和12个淋巴结,以及生物标志物CDX2、SMAD4、BRAF和KRAS的状态,是影响医生选择辅助治疗的重要因素。对于具有II期高危临床特征的患者和III期CC患者,通常建议接受辅助化疗。然而,辅助治疗对所有III期患者的普遍适用性,以及其他II期患者的复发风险,仍存在争议。此外,现有危险因素不能准确预测总生存期(OS)和其他预后结果,这需要可靠的预后标志物或模型,来预测个体II-III CC 患者的预后。这些工具可以为高危患者提供更有针对性的治疗方法,并防止对预后较好的患者进行过度治疗。


在本研究中,团队招募了CC患者(II 期-III 期),他们都接受了根治性手术并接受了随访。在进行任何辅助治疗之前,团队使用压力循环技术(PCT)和数据非依赖性采集(DIA)质谱(MS)对福尔马林固定石蜡包埋组织(FFPE)手术标本,进行了蛋白质组学分析。利用机器学习算法,团队建立了一个新颖实用的分类模型,用于预测结合蛋白质组学和临床特征的CC患者预后,并在独立验证队列中,得到了进一步验证。

研究进展

 02 

从浙江大学第二附属医院(SAHZU)招募患者230例作为培训队列,从西京医院(XJH)招募58例患者进行外部验证。所有患者均随访超过5年。团队收集了患者的年龄、性别、病变位置、病理类型、分期、微卫星不稳定性(MSI)状态的信息,并采用逐步特征选择方法结合临床特征,构建了临床预后模型。使用PCT-DIA MS在蛋白质组学分析中,鉴定和定量了8,187个蛋白质组和6,256个蛋白质,具有高再生产率。在使用重采样训练集进行1,000次LASSO回归复制后,这些蛋白(筛选出9种蛋白,包括PDP1、ALR、ENOG、NPC2、FYCO1、STXB1、ARH40、RIMC1、MTMR5)的选择时间超过50%。


团队评估了该蛋白质组学模型的性能,以及将9种蛋白质与临床特征(病变位置、病理类型、分期、MSI 状态)相结合的模型,以预测II-III CC期患者的5年生存率。在训练队列中,团队将受试者工作特征曲线下面积(AUC)值从0.707(临床模型)和0.872(蛋白质组学模型)提高到0.926(蛋白质组学 + 临床模型)。在验证队列中,在包含临床和蛋白质组学数据的模型中,AUC值分别从临床模型的0.786和蛋白质组学模型的0.789提高到0.872。此外,模型结合临床和蛋白质组学数据的敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)、总体准确性和F1评分均升高。团队整合临床和蛋白质组学数据的模型,显示出有希望的预后潜力。训练集的5年OS率为95%和39%(P < 0.0001),验证集的5年OS率为93%和53%(P = 0.0013)。关于辅助化疗的使用,风险分层是平衡的(P > 0.05),这不能有效预测5年随访中的OS。


模型研究和性能的示意图。


在9种蛋白中,存活超过5年的患者中,有8个蛋白下调,在CC中生存不利,而只有MTMR5上调,在CC中有利于生存。癌症基因组图谱(TCGA)中ENOG的mRNA表达,表现出相似的结果,进一步发现NPC2在MSI高CC患者中处于不利地位。PDP1、ALR、ENOG 和 NPC2与CC进展有关。由于线粒体功能障碍,PDP1激活可能在直肠癌中诱导放射抵抗。ALR作为一种抗凋亡和抗转移因子,促进细胞存活,参与肠道癌前病变。ENOG通过上皮-间充质转化,促进CC转移,并被认为在BRAFV600E突变CC的进展中,起关键作用。NPC2作为细胞内胆固醇转运蛋白发挥作用,被发现有助于CC的预后和转移。FYCO1、STXB1和ARH40参与其他肿瘤,但尚未在CC中报告。以往的研究没有将MTMR5和RIMC1与肿瘤联系起来,这表明团队的蛋白质组学方法,在挖掘与肿瘤相关的隐藏必需蛋白质方面具有潜力。

研究结论

 03 

一些研究已经开发出新的方法来改善TNM分期系统的预后,例如基于6-microRNA的分类器,用于预测II期CC患者的CC复发,以及I-III期CC的共识免疫评分分类。将MSI状态、BRAFV600E和KRAS突变状态与TNM分期相结合,提高了II期和III期CC个体患者准确预测预后的能力。此外,据报道,与苏木精和伊红染色切片的数字扫描相关的深度学习,可用于II-III期CC的预后分组。然而,这些方法的结果仍然不够令人满意,无法在临床实践中广泛采用。


总之,团队开发了一种新型临床和基于9种蛋白质的模型,来预测II期和III期CC患者的预后,并在外部队列中进行了验证。模型将通过对II期和III期CC患者进行分层,来帮助临床决策。高风险患者可以接受更积极的治疗和随访,而低风险患者可以接受相对低水平的辅助治疗。考虑到本研究的局限性,例如验证队列的样本量小,该模型需要在其他独立队列中进行更多的验证和校准。团队正在进行一项临床试验,以前瞻性地测试该模型,旨在改善预后并帮助合理随访、制定时间表和风险适应性个体化治疗。


参考资料:


1.Puccini, A., Berger, M. D., Zhang, W. & Lenz, H. J. Target. Oncol. 12, 265–275 (2017).


2.Kannarkatt, J., Joseph, J., Kurniali, P. C., Al-Janadi, A. & Hrinczenko, B. J. Oncol. Pract. 13, 233–241 (2017).


【关于投稿】

转化医学网(360zhyx.com)是转化医学核心门户,旨在推动基础研究、临床诊疗和产业的发展,核心内容涵盖组学、检验、免疫、肿瘤、心血管、糖尿病等。如您有最新的研究内容发表,欢迎联系我们进行免费报道(公众号菜单栏-在线客服联系),我们的理念:内容创造价值,转化铸就未来!

转化医学网(360zhyx.com)发布的文章旨在介绍前沿医学研究进展,不能作为治疗方案使用;如需获得健康指导,请至正规医院就诊。

热门·直播/活动

🕓 线上|08月15日 19:00-20:30

▶  “脑类器官前沿:揭秘遗传机制,重塑神经退行性疾病研究未来”线上研讨会欢迎您的参与!

🕓 北京|09月20日-21日

▶  第五届单细胞技术应用研讨会暨空间组学前沿研讨会欢迎您的参与!

🕓 上海|11月15日-16日

▶  2024第一届中国类器官转化医学大会欢迎您的参与!

点击对应文字 查看详情

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173216
 
225 次点击