社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

IF=8.5!SHAP+Shiny+eICU 三大亮点花样上分,不卷难度!0实验公共数据库挖掘,可解释机器学习势不可挡!

挑圈联靠 • 1 周前 • 19 次点击  

欢迎来看雪球讲套路、讲文献!同样的时间内,自己通读一遍文献,和阅读别人整理的精华,得到的收获、启发也是显然不同的。雪球每周为大家带来直播拆解、文字拆解,适合时间紧迫的你,速成沉淀一下!比如,看看我们今天所拆文献的一页速通:


2025,是时候更新各大公共数据库挖掘方法!

添加雪球回复“1”进群获取完整课件

什么程度算“数据量不足”?

带着自己的疾病和疑问 添加雪球详询

这种套路不行 我们还有下一种!



Exploring the prognostic impact of triglyceride - glucose index in critically ill patients with first - ever stroke: insights from traditional methods and machine learning - based mortality prediction

探索甘油三酯-葡萄糖指数对首次中风危重症患者预后的影响:来自传统方法及基于机器学习的死亡风险预测的见解


期刊:Cardiovascular Diabetology

IF:8.5

发布时间:2024/12/18


 技术路线 


数据收集与预处理

从eICU数据库中收集了2014-2015年的数据,作为主要分析队列,并从当地医院的ICU收集了外部验证队列。

使用Python的“miceforest”进行多重插补处理缺失值。


定义TyG指数和协变量

TyG指数通过公式ln[glucose (mg/dL) × triglycerides (mg/dL)/2]计算,并提取了包括人口统计学变量、严重程度评分、合并症、实验室结果、药物和干预措施等协变量。


统计分析与模型构建

使用限制性立方样条分析(RCS)和Kaplan-Meier曲线评估TyG指数与ICU全因死亡率的关系,结果显示高TyG组(TyG ≥ 9.265)与更高的ICU和医院全因死亡率相关。

调整潜在混杂因素后,发现TyG指数与ICU全因死亡率独立相关。

使用随机森林等七种机器学习算法构建预测模型,并通过内部验证和外部验证评估模型性能。随机森林模型在内部验证中表现最佳,AUC为0.900,在外部验证中AUC为0.776。


敏感性分析

在调整了红细胞分布宽度(RDW)、降脂治疗(他汀类和贝特类药物)和降糖治疗后,TyG指数与死亡率的关系仍然显著。


特征重要性评估

通过SHapley Additive exPlanations(SHAP)值评估特征重要性,发现机械通气(MV)、TyG指数和呼吸衰竭(RFA)是预测ICU全因死亡率的最重要特征。


网络平台开发

将随机森林模型嵌入到一个网络平台中,用户可以通过输入患者的特征信息,获得患者ICU全因死亡率的预测概率。


结果:

TyG指数被确定为ICU和医院全因死亡率的独立风险因素,机器学习模型展示了强大的预测性能,强调了胰岛素抵抗(以TyG指数作为替代指标)在首次中风患者预后评估和早期风险分层中的重要性。



 研究结果 


Fig 1 ICU全因死亡率和住院全因死亡率的限制性立方样条(RCS)分析和KM曲线


Fig 2 使用ROC和DCA在内部验证队列中评估所有机器学习模型的表现


Fig 3 评估所有机器学习模型的性能与其他指标,以及TyG对RF在内部验证队列(a&c)和外部验证队列(b&d)中的效果的依赖图


Fig 4 内部验证队列 (A) 和外部验证队列 (B) 中随机森林模型每个特征的 SHAP 值和重要性




这篇文献用的是eICU数据库呢,我记得另一篇使用生物标志物预测重症患者全因死亡率的文献用的是——MIMIC数据库,所以我也可以做联合?

学会触类旁通了,恭喜~今天这篇文献明显的不同就是引入了SHAP解释,以及交互网页的搭建。“交互网页”听着很高大上,其实是一种丰俭由人的加分套路。风险计算器,点选患者的一些基本指标就能得出风险概率,也是交互网页;在线分析平台,具备大量公开数据,用户可以在线作图、出报告,也是交互网页。不过,都对提高文章曝光和引用可能性有帮助就是了。想要再多了解一些,就添加雪球私聊吧~


研究团队搭建的预测平台
http://162.62.58.247:3030/







距离第十期卓越计划正式开营,已仅剩十天倒计时!要说推荐理由,大概就是在不到一学期的时间跨度内,能把实用发文套路、图表的零代码和R语言复现、公共数据库挖掘等丰富内容,一网打尽吧。具备线下实战演练课程、提供大量工具清单、自动工作流提效作业批改、精英讲师教练团队陪伴答疑......等等优点,错过还得等半年!


✅️三个月大体量直播课,通关实用生信套路

✅️两天线下实地纠错,生信分析实操跟练

✅️高品质生信分析临床科研成长,添加雪球回复“卓越计划”了解


2025已到3月份,各位小伙伴的年度计划怎么样了?如果觉得自己离目标,还差一篇关键的文献,想要在质量、层次、创新点......等方面下功夫,又心有余力不足,就来找雪球老师回复“个性化”咨询定制吧~


✅立足科研 守正创新

✅上下限跨度广

✅适合优化分析/进阶分数段/丰富前期背景等需求

✅涵盖众多实用创新套路

✅量身定制,绝无量产,绝不敷衍


雪球的生信套路 每周周中更新

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/179984
 
19 次点击