Py学习  »  机器学习算法

8.5/1区,青岛大学挖掘MIMIC:机器学习结合SHAP建模重症血糖变异性死亡风险

统计之光科研时间 • 2 月前 • 199 次点击  

引言

在ASCVD患者预后研究中,MIMIC数据库凭借其大规模真实世界数据优势,为探索糖代谢指标与死亡率关联提供支撑。那么,我们应该如何利用MIMIC数据库的真实世界数据优势,结合机器学习进行观察性研究呢?

2025年5月9日,青岛大学附属医院团队在Cardiovascular diabetology上发表论文,研究使用MIMIC数据库探讨了应激高血糖率(SHR)和GV在不同血糖代谢状态下的ASCVD患者中的预后价值,并利用机器学习方法来识别影响死亡率的关键因素。

文献简介



文献标题:

应激高血糖率与血糖变异性综合评估预测动脉粥样硬化性心血管疾病危重患者在不同葡萄糖代谢状态下的全因死亡率:一项机器学习的观察性队列研究


期刊名称:

Cardiovascular diabetology


影响因子:8.5,中科院1区


发表时间:2025年5月9日

💡  PMID:40346649

文献原文,关注本公众号并

回复【PDF】即可领取原文PDF!


研究思路  Research approach


这篇文章通过挖掘MIMIC数据库,纳入2807例动脉粥样硬化性心血管疾病(ASCVD)患者,按正常血糖调节(NGR)、糖尿病前期(Pre-DM)、糖尿病(DM)进行糖代谢状态分层。研究运用Kaplan-Meier生存分析、Cox比例风险模型、限制性立方样条(RCS)、ROC曲线等传统统计方法,结合机器学习算法(逻辑回归、随机森林等)及SHAP解释技术,评估了应激高血糖率(SHR)、血糖变异性(GV)及其联合指标对28天和90天全因死亡率的预测效能。研究发现,SHR与GV联合评估在NGR和Pre-DM患者中显著提升预测准确性,而DM患者中仅90天死亡率预测有一定优势,机器学习模型进一步验证了SHR的核心预测价值及糖代谢状态的影响。


研究步骤 Research Steps


1

研究人群筛选

分析方式:

基于MIMIC数据库,通过ICD-9/10代码筛选ASCVD患者,并应用排除标准(年龄<18 岁、ICU停留<24 小时、血糖测量<3次或HbA1c缺失)。

结论:

  • 最终纳入2807例患者,分为NGR(941 例)、Pre-DM(680 例)、DM(1186 例)。


  • 基线特征显示:非幸存者年龄更大(77 vs. 70 岁,P<0.01),合并急性肾损伤(AKI)、心力衰竭(HF)比例更高,SHR和GV水平显著升高。

2

SHR与GV的计算及分层

分析方式:

  • 计算SHR:公式为ABG(mg/dL)/(28.7×HbA1c%-46.7),反映急性血糖相对于慢性控制的偏离程度。


  • 计算GV:采用CV(标准差 / 均值 ×100%),量化血糖波动。


  • 按tertiles将SHR和GV分为高低组(SHR:<0.90,0.91-1.15,>1.15;GV:<14.92,14.93-24.46,>24.46)。

结论:

非幸存者的SHR和GV显著高于幸存者(SHR:1.18vs.1.04,P<0.01;GV:22.52% vs.18.91%,P<0.01),提示SHR和GV可能与死亡风险相关。

3

生存分析与风险建模

分析方式:

  • Kaplan-Meier(KM)曲线:比较不同SHR、GV分层的生存差异。


  • Cox比例风险模型:评估SHR、GV与死亡率的独立关联,调整年龄、性别、APACHEII评分等混杂因素。


  • 限制性立方样条(RCS):分析SHR、GV与死亡率的剂量-反应关系。

结论:

  • SHR的独立作用:在NGR和Pre-DM组,SHR升高与28天死亡率显著相关(HR=1.24, 95% CI 1.10-1.41),但DM组无显著关联(HR=1.14, 95% CI 0.80-1.62)。


  • GV的独立作用:各组中GV与死亡率均无显著关联(P>0.05)。


  • 剂量-反应关系:Pre-DM组SHR与死亡率呈线性相关(P非线性=0.36),NGR组呈非线性相关(P非线性=0.023),DM组无显著关联。

4

联合评估(SHR+GV)的预测效能

分析方式:

  • 构建SHR+GV联合模型,通过ROC曲线比较其与单一指标的预测效能(AUC值)。


  • 亚组分析:按糖代谢状态分层,评估联合模型的增量价值。

结论:

  • NGR和Pre-DM组:联合模型的AUC显著高于SHR或GV单独使用(如NGR组28天死亡率:AUC=0.688vs.SHR=0.623,P=0.028)。


  • DM组:仅90天死亡率中联合模型AUC高于SHR(0.578vs.0.560,P=0.027),其余无显著差异。

5

机器学习建模与特征解析

分析方式:

  • 使用Boruta算法筛选重要特征,构建5种ML模型(LR、DT、RF、XGBoost、LightGBM)。


  • 通过SHAP值解析模型,评估SHR和GV的贡献权重。

结论:

  • 模型性能:RF模型在NGR组表现最佳(AUC=0.804),LR模型在Pre-DM和DM组最佳(AUC 分别为 0.757和0.794)。


  • 特征贡献:SHR在NGR和Pre-DM组贡献权重较高,GV贡献较低;DM组中SHR和GV的贡献均低于传统临床指标。


研究亮点Research Highlights


🟣首次联合评估SHR和GV:揭示联合指标在非糖尿病患者(NGR、Pre-DM)中的显著预测优势,DM患者中效果有限。

🟣机器学习增强预测:RF和LR模型在亚组中表现优异,SHAP提供直观解释。

🟣分层分析:首次在不同糖代谢状态中评估SHR+GV的联合预测价值,发现其在NGR和Pre-DM患者中优势显著,而DM患者因慢性代谢适应或治疗干预,联合评估价值有限。

🟣临床转化:提出基于糖代谢表型的个性化血糖管理策略,强调非糖尿病患者需同时关注急性血糖升高和波动。

学习小Tips

在该研究中,作者依托MIMIC-IV数据库,纳入ASCVD患者并按糖代谢状态分层,综合运用Kaplan-Meier、Cox模型等传统统计方法与机器学习算法(如随机森林、逻辑回归),结合SHAP技术解析特征重要性。研究技巧上,通过ICD编码精准筛选人群,利用CV量化血糖变异性、SHR整合急慢性血糖指标,借助ROC曲线对比预测效能,且通过亚组分析和敏感性分析验证结果稳健性。


学习时可借鉴其多方法联合挖掘数据间的关联,按糖代谢表型分层探索异质性,以及运用机器学习提升预测精度并增强结果可解释性的策略,同时,做观察性研究的同学,务必记得关注基线特征的全面性与混杂因素的控制。

文献原文,关注本公众号并

回复【PDF】即可领取原文PDF!

报名【统计之光临床研究一对一全流程教学服务】,我们将为您安排一位临床专业老师👨‍🎓,全程手把手指导您将一个创新性的选题落地,结课即可投稿!

01


从0到1,全程定制


基于学员的选题而定制化安排授课内容。全程从0到1,真正做到独一无二专属定制,不用担心选题再踩坑!

02


在线指导,随时答疑


1V1腾讯会议定制授课,在直播中,学员可以通过发送弹幕和老师实时互动,老师在讲课时可以根据学员的弹幕反馈来及时调整自己的讲课节奏。

1V1专属项目群答疑,课上学、课下练,争取让你每一次的疑问都能得到解答。

03


永久回放,保障学习


教学过程讲师会全程录屏,课后一小时内就会上传到学员专属后台,学员可根据需求随时随地进行回放学习,超清视频回放长期有效!

04


专属服务,贴心陪伴


除了项目内各环节授课以外,我们提供的语言服务、选刊投稿指导、返修指导等服务环节也都是学员专属一对一服务。由团队内专业的老师一对一和学员对接,共同推进项目落地,环环相扣,全程高效。

05


自建数据库,支付级安全系统


自建项目管理系统,所有交付文件均存放于自建数据库,保障信息安全。报名签订保密协议,开具公司发票,安心可靠!

一对一全流程培训服务特色 


🌟 服务内容:从选题→教学→成稿后专家评估→根据专家建议返修→翻译润色→选刊投稿全程指导,结课之时,掌握技能+拥有成果。

🌟 教学模式:一对一直播教学,不受时空限制,学员可灵活约课,提供永久超清视频回放。

🌟 安全保障:签订保密协议,公司自建数据管理系统(基于NAS),内容均无法外流。

🌟 团队力量:除讲师外,还配备资深助教、教务、专业编辑,“多对一”模式全方位协助解决学习问题。

🌟  赠送权益:赠送统计之光VIP一年,可免费学习数十门科研筑基训练营


立即扫码,免费咨询

👇👇👇





 END 

统计之光专注于提供医学SCI教学指导:

Meta分析一对一

经典Meta、网状Meta、预测模型Meta、放射组学Meta、伞状Meta等全种类Meta、医学全科可学!

临床研究一对一

CHARLS数据库挖掘、MIMIC数据库挖掘、NHANES数据库、GBD数据库挖掘、SEER数据库挖掘、基于现有数据设计课题及指导分析、指导收集数据进行临床研究、多中心临床试验等各类临床研究!

生信分析一对一

各类生信分析1-3分、3-6分、6+的课题设计及教学指导,孟德尔随机化教学指导、单细胞测序研究等各类生信服务!

高品质视频课:

1️⃣ GBD数据库零基础挖掘实战

2️⃣ MIMIC数据库挖掘从0产出一篇论文

3️⃣ 孟德尔随机化实战课题落地

4️⃣ 单细胞生信分析全流程

5️⃣ Meta分析小白消除计划

6️⃣ 生信全能实战班

7️⃣ Meta分析选题秘籍

8️⃣ AI浪潮下,如何优雅完成SCI写作

9️⃣ GBD 2023新数据直播课


一对一单项高品质科研服务:

01

生物医学领域论文翻译、母语润色服务

02

专家评审服务,让研究设计更具科学性

03

选刊投稿服务,精准投稿,提高文章接受率

04

统计分析服务,从方案到成果保障可靠

往期精彩

GBD 2023马上来了!公开数据预计5月发布!

学员喜报合集,热烈祝贺新鲜出炉的部分统计之光学员成功发表SCI!

你已选中了添加链接的内容

统计之光年中总结丨2025进度■■■□□□,活力■■■■■■

助力全球学者科研成长

统计之光STATRAY

统计之光是沿长控股旗下的技能培训品牌。依托资深技术大牛团队+互联网平台,致力于打造以“浓缩、易懂、专业、实用、定制”为服务特色的互联网知识工具,为全球学者提供靠谱的统计技能学习解决方案。

我们相信:好的产品自己能说话

——统计之光创始人Borra

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182728
 
199 次点击