MIMIC-IV+可解释机器学习+SHAP，SCI 发文！肺炎住进 ICU 后再评估血流感染风险，模型可解释关键因素

医学在线-MIMIC超市｜零代码玩转主流医疗公共数据库（MIMIC-IV、eICU、INSPIRE、nwICU、SICdb、HiRID、PIC、CHARLS、NHANES、HRS、SHARE、MHAS、CDC WONDER、ELSA），从研究人群构建到 AI 写论文初稿一站搞定。

文章信息

目的
：肺炎病人住进 ICU 后，再发血流感染（BSI）会显著拉高死亡率、住院时长和治疗费用，但血培养要等 1–5 天才出结果、阳性率只有 10%–20%，临床很难及时判断该不该升级抗生素。本研究想做的，是开发并外部验证一个可解释的机器学习模型，用 ICU 早期就能拿到的信息，对肺炎病人的血流感染风险做一次"入院后的再评估"。
设计
：数据来自 MIMIC-IV 数据库与中国一所三甲医院（达州市中心医院）。MIMIC-IV 人群随机拆成训练集与内部测试集，达州人群作为外部验证集。候选变量涵盖人口学、合并症、严重程度评分、微生物结果、ICU 病程指标；先用 Boruta 做特征筛选，再用单因素 + 多因素 logistic 回归挑预测变量。针对血流感染少见导致的类别不平衡，训练时用 SMOTE；用 ROC 曲线下面积（AUC）评估区分度；用 SHAP 解释最终模型。由于主模型里几个关键变量只有入院后才拿得到，研究又额外做了"仅入院信息"的敏感性分析。
结果
：MIMIC-IV 共 4,121 例符合纳排（其中 468 例血流感染），达州中心医院 150 例（18 例血流感染）。从 50 个临床特征里筛出 6 个关键变量：ICU 住院时长、痰培养革兰阴性菌（Sputum-GNB）、痰培养革兰阳性球菌（Sputum-GPC）、APSIII 评分、SOFA 评分、肝损伤。八种机器学习模型对比下，SMOTE 平衡后梯度提升机（GBM）表现最稳：内部测试集 AUC 0.753（95% CI 0.719–0.788）、整体准确率 0.748；外部验证 AUC 0.703（95% CI 0.576–0.830）。多因素 logistic 里，痰培养阳性、肝损伤、ICU 住院时长均与血流感染独立相关（如 Sputum-GPC OR 1.68，95% CI 1.20–2.34，p=.002；Sputum-GNB OR 1.56，95% CI 1.14–2.13，p=.006；肝损伤 OR 1.50，95% CI 1.02–2.21，p=.039）。仅入院信息的敏感性分析判别能力下降（内部 AUC 0.832、外部 0.799 的全特征版本相比，仅入院版本明显走弱）。
结论
：这个可解释的入院后机器学习模型，对 ICU 肺炎病人的血流感染风险再评估显示出中等区分度；但外部精度有限、仅入院信息版本表现更弱，说明在真正用于临床、尤其是早期决策之前，还需要进一步打磨。

01 研究背景

每年约有 1500 万人因肺炎住院，其中血流感染（BSI）的发生率随病情严重度变化。ICU 里的肺炎病人因病情危重、免疫受损、频繁有创操作，是血流感染的高危人群——ICU 内血流感染发生率可达 5%–15%，而合并血流感染的 ICU 病人粗死亡率超过 30%。

血流感染一旦发生，不仅显著抬高死亡率，还会大幅延长住院时间、推高治疗费用。相关研究因此建议对所有住院肺炎病人都做血培养，以便合理使用抗生素、监测耐药。

但血培养本身有硬伤：作为诊断血流感染的金标准，它通常要 1 到 5 天才能鉴定出病原体，阳性率却只有 10%–20%。等待时间长、阳性率低，让抗生素的及时升级或降阶变得困难，反而可能助长耐药和不良结局。还有研究发现，肺炎病人的血培养样本约 4.8% 被污染，污染样本既增加费用又延长住院。

正因如此，"是不是该给每个住院肺炎病人都抽血培养"一直存在争议。而且到目前为止，针对 ICU 肺炎病人血流感染风险，还没有一个经过外部验证的预测模型被报道出来。

于是本研究提出核心问题：能不能用 ICU 早期就能拿到的常规信息，构建一个可解释的机器学习模型，对肺炎病人住进 ICU 之后的血流感染风险做一次"再评估"，并且让医生看得懂每个变量是怎么把风险推高或拉低的？

02 纳排

本平台 Cohort Builder 同款流程见文末第 6 段。

03 数据

人口学特征
：性别、入院年龄、体重、身高
生命体征
：心率、呼吸频率、收缩压、平均动脉压、血氧饱和度、最高体温
合并症
：高血压、心力衰竭、慢性肺病、糖尿病、肾病、严重肝病、HIV、恶性肿瘤
实验室指标
：ICU 入院 24 小时内的凝血功能、C 反应蛋白（CRP）、肾功能、全血细胞计数、血气分析等
疾病严重程度评分
：APSIII 评分、SOFA 评分
微生物结果
：痰培养与血培养结果（含痰培养革兰阴性菌 Sputum-GNB、革兰阳性球菌 Sputum-GPC）
治疗 / 操作
：机械通气与有创置管数据
结局定义
：血流感染（BSI）定义为至少一瓶血培养分离出有临床意义的病原体；按 CDC/NHSN 实验室确认血流感染（LCBI）标准，凝固酶阴性葡萄球菌、芽孢杆菌属、棒状杆菌属等潜在污染菌不计为血流感染
暴露 / 时间分组
：所有候选变量按可获取的临床时点分两组——入院可得变量（入院前或入院后 24 小时内可拿到）与入院后变量（ICU 病程后期才可得，如 ICU 住院时长、痰培养结果）
缺失处理
：缺失率超 30% 的变量剔除；缺失率低于 30% 的用链式方程多重插补（MICE）填补；为避免录入错误，连续变量首尾各 1% 被去掉

04 统计方法

描述性
：分类变量用计数与百分比；非正态连续变量用中位数与四分位距（IQR）；组间比较用方差分析（ANOVA）或 Mann-Whitney U 检验，双尾检验，p<0.05 视为有统计学意义。
特征筛选与主分析
：先用 Boruta 算法从 50 个临床特征里圈出重要变量，再经单因素 + 多因素 logistic 回归确认，最终锁定 6 个关键变量（ICU 住院时长、Sputum-GNB、Sputum-GPC、APSIII、SOFA、肝损伤）；在此基础上训练八种机器学习模型——逻辑回归、支持向量机（SVM）、梯度提升机（GBM）、神经网络、XGBoost、AdaBoost、LightGBM、CatBoost。
类别不平衡处理
：由于血流感染相对少见，训练阶段用合成少数类过采样（SMOTE）改善少数类学习；模型可迁移性则用未经合成的验证数据评估，并在解读结果时考虑过采样对泛化的潜在影响。
验证与可解释性
：内部用测试集验证、外部用达州中心医院病人验证，区分度以 ROC 曲线下面积（AUC）衡量，并用校准曲线、决策曲线分析（DCA）、混淆矩阵评估校准与临床获益；最后用 SHAP 解释最终模型，量化每个变量对预测的方向与强度，并额外做"仅入院信息"的敏感性分析。

05 结果

基线特征：MIMIC-IV 数据库提取 8,971 例肺炎病人，剔除 1,791 例未做血培养者后剩 7,180 例，再经数据预处理后 4,121 例符合纳排（含 468 例血流感染）；达州中心医院纳入 150 例（含 18 例血流感染）。基线特征见 Table 1。

变量筛选：通过 Boruta 算法叠加单因素 + 多因素 logistic 回归，从 50 个临床特征里筛出 6 个对血流感染最关键的变量——ICU 住院时长、Sputum-GNB、Sputum-GPC、APSIII 评分、SOFA 评分、肝损伤（Figure 2）。

独立相关因素（多因素 logistic）：ICU 住院时长 OR 1.05（95% CI 1.03–1.06，p<.001 or ci table>

模型对比：八种模型里，平衡后的模型整体表现高于不平衡模型。不平衡数据上，训练集 LightGBM 最佳（AUC 0.823，95% CI 0.799–0.847），内部验证集神经网络最佳（AUC 0.713，95% CI 0.663–0.763）。SMOTE 平衡后，GBM 与 XGBoost 最强——GBM 训练集 AUC 0.856（95% CI 0.839–0.873）、内部验证集 0.753（95% CI 0.719–0.788）；XGBoost 训练集 0.844（95% CI 0.827–0.861）、内部验证集 0.746（95% CI 0.711–0.781）（Figure 3）。

外部验证：GBM 在达州中心医院外部验证集上 AUC 0.703（95% CI 0.576–0.830）（Figure 5）；校准曲线显示 SMOTE 后 GBM 在中低概率区间预测概率与实际事件频率吻合较好，最高概率区间略有偏移；决策曲线分析（DCA）提示模型有中等临床获益。

可解释性（SHAP）：Figure 12 给出各变量对 GBM 模型的平均贡献排序，Figure 13 用蜂群图展示每个变量取值高低如何把预测推向阳性或阴性。以一名实际发生血流感染的病人为例，SOFA=8 贡献 +0.0843、Sputum-GPC 阳性贡献 +0.377、ICU 住院时长 13 天贡献 +0.25，共同把预测推向"血流感染阳性"。

个体解释（SHAP force plot）：Figure 14 展示一名阳性病人的逐变量贡献分解，Figure 15 展示一名阴性病人——让医生能看到每个变量对这一个具体病人的风险是加还是减。

06 本平台一键复现

本论文的研究人群与建模数据，在「医学在线-MIMIC超市」平台可以快速准备：在纳排页选 MIMIC-IV，勾"成人（≥18 岁）+ ICU 停留 ≥24 小时 + 单次 ICU 入住 + 做过血培养"作为入组条件，把肺炎病人圈出来；指标侧勾论文同款变量——心率 / 呼吸 / 血压 / 血氧 / 体温等生命体征，凝血 / CRP / 肾功能 / 血常规 / 血气等实验室，APSIII 与 SOFA 严重程度评分，以及痰培养与血培养结果；结局选"血流感染"。导出后用平台的机器学习流程跑同款的特征筛选 + 多模型对比 + 可解释（SHAP），即可在浏览器里复现"用 ICU 早期信息对肺炎病人血流感染风险做一次再评估、并看清每个变量为什么把风险推高或拉低"这一核心结论。

导出的标准化数据可直接喂给后续建模，省掉最耗时的数据抽取与清洗环节；想做更稳的横向印证，还可以把同一套入组条件与指标搬到平台其它已接入的 ICU 数据库（eICU / nwICU / SICdb 等），用同款研究人群在不同来源上各跑一遍。

访问 医学在线-MIMIC超市：https://yxzx.hubstack.cn/

管理员微信：yxzx2023999

关于医学在线-MIMIC超市

我们专注于医疗公共数据库一站式科研服务，已接入 MIMIC-IV、eICU、PIC、nwICU、SICdb、INSPIRE、HiRID、CHARLS、HRS、NHANES、SHARE、MHAS、CDC WONDER、ELSA 等主流医疗公共数据库。

无需安装数据库，无需写一行代码，浏览器打开就能完成数据提取 → 清洗 → 统计 → 机器学习 → AI 论文初稿全流程。

网址：https://yxzx.hubstack.cn/　微信：yxzx2023999

关注「医学在线-MIMIC超市」公众号，助你早日完成 SCI 发表。

文章引用来源：Song B, Yang X, Wang WJ, Fu K, Liu P, Liu C. An interpretable machine-learning model for post-admission reassessment of bloodstream infection risk in ICU patients with pneumonia. Sci Rep. 2026 Jun 6. doi:10.1038/s41598-026-54227-3.

免责声明：本文内容仅供科研学习和参考，如有侵权，请联系我们删除，谢谢。

📖 完整高清原图与更多历史文章

yxzx.hubstack.cn/h