Py学习  »  机器学习算法

MIMIC-IV+可解释机器学习+SHAP,SCI 发文!肺炎住进 ICU 后再评估血流感染风险,模型可解释关键因素

MIMIC超市 • 2 天前 • 30 次点击  

MIMIC-IV+可解释机器学习+SHAP,SCI 发文!肺炎住进 ICU 后再评估血流感染风险,模型可解释关键因素

医学在线-MIMIC超市|零代码玩转主流医疗公共数据库(MIMIC-IV、eICU、INSPIRE、nwICU、SICdb、HiRID、PIC、CHARLS、NHANES、HRS、SHARE、MHAS、CDC WONDER、ELSA),从研究人群构建到 AI 写论文初稿一站搞定。

文章信息

  • 目的
    :肺炎病人住进 ICU 后,再发血流感染(BSI)会显著拉高死亡率、住院时长和治疗费用,但血培养要等 1–5 天才出结果、阳性率只有 10%–20%,临床很难及时判断该不该升级抗生素。本研究想做的,是开发并外部验证一个可解释的机器学习模型,用 ICU 早期就能拿到的信息,对肺炎病人的血流感染风险做一次"入院后的再评估"。
  • 设计
    :数据来自 MIMIC-IV 数据库与中国一所三甲医院(达州市中心医院)。MIMIC-IV 人群随机拆成训练集与内部测试集,达州人群作为外部验证集。候选变量涵盖人口学、合并症、严重程度评分、微生物结果、ICU 病程指标;先用 Boruta 做特征筛选,再用单因素 + 多因素 logistic 回归挑预测变量。针对血流感染少见导致的类别不平衡,训练时用 SMOTE;用 ROC 曲线下面积(AUC)评估区分度;用 SHAP 解释最终模型。由于主模型里几个关键变量只有入院后才拿得到,研究又额外做了"仅入院信息"的敏感性分析。
  • 结果
    :MIMIC-IV 共 4,121 例符合纳排(其中 468 例血流感染),达州中心医院 150 例(18 例血流感染)。从 50 个临床特征里筛出 6 个关键变量:ICU 住院时长、痰培养革兰阴性菌(Sputum-GNB)、痰培养革兰阳性球菌(Sputum-GPC)、APSIII 评分、SOFA 评分、肝损伤。八种机器学习模型对比下,SMOTE 平衡后梯度提升机(GBM)表现最稳:内部测试集 AUC 0.753(95% CI 0.719–0.788)、整体准确率 0.748;外部验证 AUC 0.703(95% CI 0.576–0.830)。多因素 logistic 里,痰培养阳性、肝损伤、ICU 住院时长均与血流感染独立相关(如 Sputum-GPC OR 1.68,95% CI 1.20–2.34,p=.002;Sputum-GNB OR 1.56,95% CI 1.14–2.13,p=.006;肝损伤 OR 1.50,95% CI 1.02–2.21,p=.039)。仅入院信息的敏感性分析判别能力下降(内部 AUC 0.832、外部 0.799 的全特征版本相比,仅入院版本明显走弱)。
  • 结论
    :这个可解释的入院后机器学习模型,对 ICU 肺炎病人的血流感染风险再评估显示出中等区分度;但外部精度有限、仅入院信息版本表现更弱,说明在真正用于临床、尤其是早期决策之前,还需要进一步打磨。

01 研究背景

每年约有 1500 万人因肺炎住院,其中血流感染(BSI)的发生率随病情严重度变化。ICU 里的肺炎病人因病情危重、免疫受损、频繁有创操作,是血流感染的高危人群——ICU 内血流感染发生率可达 5%–15%,而合并血流感染的 ICU 病人粗死亡率超过 30%。

血流感染一旦发生,不仅显著抬高死亡率,还会大幅延长住院时间、推高治疗费用。相关研究因此建议对所有住院肺炎病人都做血培养,以便合理使用抗生素、监测耐药。

但血培养本身有硬伤:作为诊断血流感染的金标准,它通常要 1 到 5 天才能鉴定出病原体,阳性率却只有 10%–20%。等待时间长、阳性率低,让抗生素的及时升级或降阶变得困难,反而可能助长耐药和不良结局。还有研究发现,肺炎病人的血培养样本约 4.8% 被污染,污染样本既增加费用又延长住院。

正因如此,"是不是该给每个住院肺炎病人都抽血培养"一直存在争议。而且到目前为止,针对 ICU 肺炎病人血流感染风险,还没有一个经过外部验证的预测模型被报道出来。

于是本研究提出核心问题:能不能用 ICU 早期就能拿到的常规信息,构建一个可解释的机器学习模型,对肺炎病人住进 ICU 之后的血流感染风险做一次"再评估",并且让医生看得懂每个变量是怎么把风险推高或拉低的?

02 纳排

本平台 Cohort Builder 同款流程见文末第 6 段。

03 数据

  • 人口学特征
    :性别、入院年龄、体重、身高
  • 生命体征
    :心率、呼吸频率、收缩压、平均动脉压、血氧饱和度、最高体温
  • 合并症
    :高血压、心力衰竭、慢性肺病、糖尿病、肾病、严重肝病、HIV、恶性肿瘤
  • 实验室指标
    :ICU 入院 24 小时内的凝血功能、C 反应蛋白(CRP)、肾功能、全血细胞计数、血气分析等
  • 疾病严重程度评分
    :APSIII 评分、SOFA 评分
  • 微生物结果
    :痰培养与血培养结果(含痰培养革兰阴性菌 Sputum-GNB、革兰阳性球菌 Sputum-GPC)
  • 治疗 / 操作
    :机械通气与有创置管数据
  • 结局定义
    :血流感染(BSI)定义为至少一瓶血培养分离出有临床意义的病原体;按 CDC/NHSN 实验室确认血流感染(LCBI)标准,凝固酶阴性葡萄球菌、芽孢杆菌属、棒状杆菌属等潜在污染菌不计为血流感染
  • 暴露 / 时间分组
    :所有候选变量按可获取的临床时点分两组——入院可得变量(入院前或入院后 24 小时内可拿到)与入院后变量(ICU 病程后期才可得,如 ICU 住院时长、痰培养结果)
  • 缺失处理
    :缺失率超 30% 的变量剔除;缺失率低于 30% 的用链式方程多重插补(MICE)填补;为避免录入错误,连续变量首尾各 1% 被去掉

04 统计方法

  • 描述性
    :分类变量用计数与百分比;非正态连续变量用中位数与四分位距(IQR);组间比较用方差分析(ANOVA)或 Mann-Whitney U 检验,双尾检验,p<0.05 视为有统计学意义。
  • 特征筛选与主分析
    :先用 Boruta 算法从 50 个临床特征里圈出重要变量,再经单因素 + 多因素 logistic 回归确认,最终锁定 6 个关键变量(ICU 住院时长、Sputum-GNB、Sputum-GPC、APSIII、SOFA、肝损伤);在此基础上训练八种机器学习模型——逻辑回归、支持向量机(SVM)、梯度提升机(GBM)、神经网络、XGBoost、AdaBoost、LightGBM、CatBoost。
  • 类别不平衡处理
    :由于血流感染相对少见,训练阶段用合成少数类过采样(SMOTE)改善少数类学习;模型可迁移性则用未经合成的验证数据评估,并在解读结果时考虑过采样对泛化的潜在影响。
  • 验证与可解释性
    :内部用测试集验证、外部用达州中心医院病人验证,区分度以 ROC 曲线下面积(AUC)衡量,并用校准曲线、决策曲线分析(DCA)、混淆矩阵评估校准与临床获益;最后用 SHAP 解释最终模型,量化每个变量对预测的方向与强度,并额外做"仅入院信息"的敏感性分析。

05 结果

基线特征:MIMIC-IV 数据库提取 8,971 例肺炎病人,剔除 1,791 例未做血培养者后剩 7,180 例,再经数据预处理后 4,121 例符合纳排(含 468 例血流感染);达州中心医院纳入 150 例(含 18 例血流感染)。基线特征见 Table 1。

变量筛选:通过 Boruta 算法叠加单因素 + 多因素 logistic 回归,从 50 个临床特征里筛出 6 个对血流感染最关键的变量——ICU 住院时长、Sputum-GNB、Sputum-GPC、APSIII 评分、SOFA 评分、肝损伤(Figure 2)。

独立相关因素(多因素 logistic):ICU 住院时长 OR 1.05(95% CI 1.03–1.06,p<.001 or ci table>

模型对比:八种模型里,平衡后的模型整体表现高于不平衡模型。不平衡数据上,训练集 LightGBM 最佳(AUC 0.823,95% CI 0.799–0.847),内部验证集神经网络最佳(AUC 0.713,95% CI 0.663–0.763)。SMOTE 平衡后,GBM 与 XGBoost 最强——GBM 训练集 AUC 0.856(95% CI 0.839–0.873)、内部验证集 0.753(95% CI 0.719–0.788);XGBoost 训练集 0.844(95% CI 0.827–0.861)、内部验证集 0.746(95% CI 0.711–0.781)(Figure 3)。

外部验证:GBM 在达州中心医院外部验证集上 AUC 0.703(95% CI 0.576–0.830)(Figure 5);校准曲线显示 SMOTE 后 GBM 在中低概率区间预测概率与实际事件频率吻合较好,最高概率区间略有偏移;决策曲线分析(DCA)提示模型有中等临床获益。

可解释性(SHAP):Figure 12 给出各变量对 GBM 模型的平均贡献排序,Figure 13 用蜂群图展示每个变量取值高低如何把预测推向阳性或阴性。以一名实际发生血流感染的病人为例,SOFA=8 贡献 +0.0843、Sputum-GPC 阳性贡献 +0.377、ICU 住院时长 13 天贡献 +0.25,共同把预测推向"血流感染阳性"。

个体解释(SHAP force plot):Figure 14 展示一名阳性病人的逐变量贡献分解,Figure 15 展示一名阴性病人——让医生能看到每个变量对这一个具体病人的风险是加还是减。

06 本平台一键复现

本论文的研究人群与建模数据,在「医学在线-MIMIC超市」平台可以快速准备:在纳排页选 MIMIC-IV,勾"成人(≥18 岁)+ ICU 停留 ≥24 小时 + 单次 ICU 入住 + 做过血培养"作为入组条件,把肺炎病人圈出来;指标侧勾论文同款变量——心率 / 呼吸 / 血压 / 血氧 / 体温等生命体征,凝血 / CRP / 肾功能 / 血常规 / 血气等实验室,APSIII 与 SOFA 严重程度评分,以及痰培养与血培养结果;结局选"血流感染"。导出后用平台的机器学习流程跑同款的特征筛选 + 多模型对比 + 可解释(SHAP),即可在浏览器里复现"用 ICU 早期信息对肺炎病人血流感染风险做一次再评估、并看清每个变量为什么把风险推高或拉低"这一核心结论。

导出的标准化数据可直接喂给后续建模,省掉最耗时的数据抽取与清洗环节;想做更稳的横向印证,还可以把同一套入组条件与指标搬到平台其它已接入的 ICU 数据库(eICU / nwICU / SICdb 等),用同款研究人群在不同来源上各跑一遍。


访问 医学在线-MIMIC超市https://yxzx.hubstack.cn/

管理员微信:yxzx2023999


关于医学在线-MIMIC超市

我们专注于医疗公共数据库一站式科研服务,已接入 MIMIC-IV、eICU、PIC、nwICU、SICdb、INSPIRE、HiRID、CHARLS、HRS、NHANES、SHARE、MHAS、CDC WONDER、ELSA 等主流医疗公共数据库。

无需安装数据库,无需写一行代码,浏览器打开就能完成数据提取 → 清洗 → 统计 → 机器学习 → AI 论文初稿全流程。

网址:https://yxzx.hubstack.cn/ 微信:yxzx2023999

关注「医学在线-MIMIC超市」公众号,助你早日完成 SCI 发表。


文章引用来源:Song B, Yang X, Wang WJ, Fu K, Liu P, Liu C. An interpretable machine-learning model for post-admission reassessment of bloodstream infection risk in ICU patients with pneumonia. Sci Rep. 2026 Jun 6. doi:10.1038/s41598-026-54227-3.

免责声明:本文内容仅供科研学习和参考,如有侵权,请联系我们删除,谢谢。


📖 完整高清原图与更多历史文章

yxzx.hubstack.cn/h


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/197921