Py学习  »  机器学习算法

IF=9.6,柳叶刀子刊级,深度学习+SHAP解释,临床预测模型抄作业!公共数据也能做!

挑圈联靠 • 4 月前 • 87 次点击  

欢迎来看雪球讲套路、讲文献!连续讲了两篇AI处理医学成像的文献,今天稍微换个方向,看看电子健康记录(EHR)与深度学习+SHAP解释碰撞,会有怎样的惊喜。


算法能取代临床经验吗?

当作临床医生的助手,在统计学结果上挺合格的。


这篇文献2天前刚刚在柳叶刀子刊 eClinicalMedicine 上发布,来自广东、四川、北京多所医院肝胆外科的研究者合作完成。收集5年(2018.11-2023.12)期间的多家独立医院患者病例,使用MIMIC-IV数据集进行外部验证。MIMIC本身数据量较为丰富,纯挖掘也可发文,推荐科研新手多了解一下~

临床SCI加速发表 就选纯公共数据挖掘

添加雪球 回复“个性化”定制


Learning-based early detection of post-hepatectomy liver failure using temporal perioperative data: a nationwide multicenter retrospective study in China

基于学习的围手术期时间数据肝切除术后肝衰竭早期检测:中国全国性多中心回顾性研究


期刊:eClinicalMedicine

IF:9.6

发布时间:2025/05/06


 定义 


电子健康记录(EHR)项目是指从电子病历系统中收集的综合临床数据,包括患者年龄、性别、体重指数 (BMI)、高血压和糖尿病等合并症、脂肪肝、肝硬化、门静脉高压、腹水、15 分钟吲哚菁绿保留率 (ICGR15) 和围手术期实验室检查。回顾术前影像学检查的肿瘤特征,包括影像学诊断的肝癌、最大直径和肿瘤数量。手术变量包括手术类型、手术时间、术中失血量、输血量、门静脉闭塞时间、切除节段数量和肝大切除术。收集了有关指数入院、住院时间、术后住院时间和 90 天死亡率的并发症数据。将收集的围手术期资料分为基本特征、术前、术中和术后因素。

结构化查询语言用于从 MIMIC-IV 数据库中提取患者的围手术期数据。缺失数据是随机发生的,没有系统性模式或偏倚。MIMIC-IV 数据集主要包括来自急诊科和重症监护病房的数据,本质上包含很高的缺失率数据,尤其是对于术中记录。MIMIC-IV 数据集专门用于评估我们的模型在西方人群中的泛化潜力


根据国际肝外科研究组 (ISGLS) 概述的标准, PHLF 定义为血清总胆红素 (TBIL) 升高 (>1.2 mg/dl) 和伴随凝血酶原时间国际标准化比值 (PT-INR) 升高 (>1.2) 术后第 5 天或更晚。A 级 PHLF 表示这些实验室标志物受损且无治疗后果,B 级 PHLF 转称为 PHLF 需要无创治疗,C 级 PHLF 转诊为 PHLF 需要重症监护监测和有创治疗。发病率定义为最初 90 天内与正常术后病程的任何偏差,根据 Clavien-Dindo 分类 (CDC) 分为轻度 (CDC I-II) 和重度 (CDC IIIa-V) 并发症。肝脏大切除术定义为切除 3 个或更多 Couinaud 节段,胆漏根据 ISGLS 标准定义,死亡率定义为术后 90 天内死亡。


 技术路线 


本研究旨在利用深度学习技术,结合术前、术中和术后24小时内的数据,实现对术后肝衰竭的早期检测。


数据收集与处理:

收集来自中国六个不同地区医院的1832名患者的围手术期电子健康记录(EHR)数据,包括患者的基本特征、术前、术中和术后24小时内的各项指标。

从MIMIC-IV数据库中提取242名患者的数据,以评估模型在西方人群中的泛化能力。

对缺失和不一致的数据进行处理,确保数据的完整性和一致性。


模型构建:

使用Bio-Clinical BERT (BC-BERT)作为基础模型,将EHR数据编码成高维特征嵌入,并考虑时间相关性。

利用上下文感知Transformer模块进行特征提取,分析围手术期数据中的时间事件和特征之间的关系。

采用两层MLP模型作为主分类器,用于PHLF检测;采用层次化门控MLP模型作为分级分类器,用于对PHLF进行分级。


模型训练与验证:

将中国队列分为训练集(681名患者)和内部验证集(171名患者)。

使用训练集训练模型,并使用内部验证集评估模型的性能。

将模型应用于外部验证集(包括五个中国外部验证队列和一个西方队列)进行评估,以验证模型的泛化能力。


模型解释:

使用t-SNE分析评估模型将围手术期临床因素编码成高维特征嵌入的能力,并考虑时间属性。

使用SHAP方法解释模型的预测结果,分析每个特征对预测结果的影响,并解释特征之间的相互作用和时间关系。


模型临床应用评估:

评估模型在不同围手术期阶段数据上的预测性能,包括术前、术中和术后24小时内的数据。

评估模型在预测临床相关PHLF(Grade B/C)和Grade A PHLF方面的性能。

根据是否存在已知的PHLF风险因素进行亚组分析,评估模型在不同风险水平人群中的预测性能。

评估模型对PHLF进行风险分层的能力,将患者分为高风险和低风险组,并比较两组之间的临床特征和结局。

将模型与临床医生进行比较,评估模型在早期检测PHLF方面的性能。

评估模型在处理不完整变量输入方面的能力,包括随机缺失变量输入和缺失不 influential 变量输入。



 研究结果 


Fig 2  使用不同模型进行 PHLF 预测的验证队列的受试者工作特征 (ROC) 曲线


Fig 3 模型中特征对 PHLF 预测的贡献的 SHAP 分析


Fig 4 不同围手术期因素对 PHLF 预测的贡献


Fig 5 模型在不同围手术期的表现


Fig 6 模型在临床意义中的性能多功能性


Fig 7 模型作为临床医生的 AI 助手的性能


Fig 7d和e说明了模型与临床医生之间的早期PHLF检测表现比较。邀请了 5 名专门从事肝脏手术和肝切除术后管理的高级临床医生参与早期检测PHLF挑战,平均准确率为 AUC = 0.637 ,而模型的准确率实现了AUC = 0.921(Fig 7d);在研究模型的帮助下,临床医生预测结果的 ACC、F1、Sensitivity、Kappa 和 MCC 都得到了显著改善(Fig 7e),反映了预测准确性的提高和漏报和错误预测风险的最小化,表明人工智能辅助决策具有显着增强 PHLF 预测和早期识别的潜力, 改进风险分层,以确保对 PHLF 高危患者进行及时干预。







目前国自然的初审结果已经公布,在5月15日16时前,“不予受理”的项目,申请人都可以向相关管理部门提出复审申请。


对于想要在评奖、职称更进一步的临床医生,还有想要争取教职的研究者来说,冲击国自然基金申请都是重要一步,而其中,申请人代表作、以及合适的前期工作、撰写得当的标书,又是增加中标几率的重要内容。


缺少资源进行学科交叉合作,又想凭借代表作,争一争基金申请、职称评定晋升,推荐带着需求,添加雪球,回复“个性化,定制框架、优化课题、升级分析。2025新版可做方法,总共涵盖80+种!雪球朋友圈还会不定期更新投稿返修小知识、报喜喜讯等内容,来占一个雪球的好友位吧~


✅立足科研 守正创新

✅上下限跨度广

✅适合优化分析/进阶分数段/丰富前期背景等需求

✅涵盖众多实用创新套路

✅量身定制,绝无量产,绝不敷衍


 雪球的生信套路 每周周中讲解 

注意没有星标⭐的话

容易错过更新哦

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181923
 
87 次点击