MIMIC-IV+可解释机器学习+SHAP,SCI 发文!肺炎住进 ICU 后再评估血流感染风险,模型可解释关键因素
医学在线-MIMIC超市|零代码玩转主流医疗公共数据库(MIMIC-IV、eICU、INSPIRE、nwICU、SICdb、HiRID、PIC、CHARLS、NHANES、HRS、SHARE、MHAS、CDC WONDER、ELSA),从研究人群构建到 AI 写论文初稿一站搞定。文章信息
- 目的:肺炎病人住进 ICU 后,再发血流感染(BSI)会显著拉高死亡率、住院时长和治疗费用,但血培养要等 1–5 天才出结果、阳性率只有 10%–20%,临床很难及时判断该不该升级抗生素。本研究想做的,是开发并外部验证一个可解释的机器学习模型,用 ICU 早期就能拿到的信息,对肺炎病人的血流感染风险做一次"入院后的再评估"。
- 设计:数据来自 MIMIC-IV 数据库与中国一所三甲医院(达州市中心医院)。MIMIC-IV 人群随机拆成训练集与内部测试集,达州人群作为外部验证集。候选变量涵盖人口学、合并症、严重程度评分、微生物结果、ICU 病程指标;先用 Boruta 做特征筛选,再用单因素 + 多因素 logistic 回归挑预测变量。针对血流感染少见导致的类别不平衡,训练时用 SMOTE;用 ROC 曲线下面积(AUC)评估区分度;用 SHAP 解释最终模型。由于主模型里几个关键变量只有入院后才拿得到,研究又额外做了"仅入院信息"的敏感性分析。
- 结果:MIMIC-IV 共 4,121 例符合纳排(其中 468 例血流感染),达州中心医院 150 例(18 例血流感染)。从 50 个临床特征里筛出 6 个关键变量:ICU 住院时长、痰培养革兰阴性菌(Sputum-GNB)、痰培养革兰阳性球菌(Sputum-GPC)、APSIII 评分、SOFA 评分、肝损伤。八种机器学习模型对比下,SMOTE 平衡后梯度提升机(GBM)表现最稳:内部测试集 AUC 0.753(95% CI 0.719–0.788)、整体准确率 0.748;外部验证 AUC 0.703(95% CI 0.576–0.830)。多因素 logistic 里,痰培养阳性、肝损伤、ICU 住院时长均与血流感染独立相关(如 Sputum-GPC OR 1.68,95% CI 1.20–2.34,p=.002;Sputum-GNB OR 1.56,95% CI 1.14–2.13,p=.006;肝损伤 OR 1.50,95% CI 1.02–2.21,p=.039)。仅入院信息的敏感性分析判别能力下降(内部 AUC 0.832、外部 0.799 的全特征版本相比,仅入院版本明显走弱)。
- 结论:这个可解释的入院后机器学习模型,对 ICU 肺炎病人的血流感染风险再评估显示出中等区分度;但外部精度有限、仅入院信息版本表现更弱,说明在真正用于临床、尤其是早期决策之前,还需要进一步打磨。
01 研究背景
每年约有 1500 万人因肺炎住院,其中血流感染(BSI)的发生率随病情严重度变化。ICU 里的肺炎病人因病情危重、免疫受损、频繁有创操作,是血流感染的高危人群——ICU 内血流感染发生率可达 5%–15%,而合并血流感染的 ICU 病人粗死亡率超过 30%。
血流感染一旦发生,不仅显著抬高死亡率,还会大幅延长住院时间、推高治疗费用。相关研究因此建议对所有住院肺炎病人都做血培养,以便合理使用抗生素、监测耐药。
但血培养本身有硬伤:作为诊断血流感染的金标准,它通常要 1 到 5 天才能鉴定出病原体,阳性率却只有 10%–20%。等待时间长、阳性率低,让抗生素的及时升级或降阶变得困难,反而可能助长耐药和不良结局。还有研究发现,肺炎病人的血培养样本约 4.8% 被污染,污染样本既增加费用又延长住院。
正因如此,"是不是该给每个住院肺炎病人都抽血培养"一直存在争议。而且到目前为止,针对 ICU 肺炎病人血流感染风险,还没有一个经过外部验证的预测模型被报道出来。
于是本研究提出核心问题:能不能用 ICU 早期就能拿到的常规信息,构建一个可解释的机器学习模型,对肺炎病人住进 ICU 之后的血流感染风险做一次"再评估",并且让医生看得懂每个变量是怎么把风险推高或拉低的?
02 纳排
本平台 Cohort Builder 同款流程见文末第 6 段。
03 数据
- 人口学特征
- 生命体征:心率、呼吸频率、收缩压、平均动脉压、血氧饱和度、最高体温
- 合并症:高血压、心力衰竭、慢性肺病、糖尿病、肾病、严重肝病、HIV、恶性肿瘤
- 实验室指标:ICU 入院 24 小时内的凝血功能、C 反应蛋白(CRP)、肾功能、全血细胞计数、血气分析等
- 疾病严重程度评分
- 微生物结果:痰培养与血培养结果(含痰培养革兰阴性菌 Sputum-GNB、革兰阳性球菌 Sputum-GPC)
-
治疗 / 操作
- 结局定义:血流感染(BSI)定义为至少一瓶血培养分离出有临床意义的病原体;按 CDC/NHSN 实验室确认血流感染(LCBI)标准,凝固酶阴性葡萄球菌、芽孢杆菌属、棒状杆菌属等潜在污染菌不计为血流感染
- 暴露 / 时间分组:所有候选变量按可获取的临床时点分两组——入院可得变量(入院前或入院后 24 小时内可拿到)与入院后变量(ICU 病程后期才可得,如 ICU 住院时长、痰培养结果)
- 缺失处理:缺失率超 30% 的变量剔除;缺失率低于 30% 的用链式方程多重插补(MICE)填补;为避免录入错误,连续变量首尾各 1% 被去掉
04 统计方法
- 描述性:分类变量用计数与百分比;非正态连续变量用中位数与四分位距(IQR);组间比较用方差分析(ANOVA)或 Mann-Whitney U 检验,双尾检验,p<0.05 视为有统计学意义。
- 特征筛选与主分析:先用 Boruta 算法从 50 个临床特征里圈出重要变量,再经单因素 + 多因素 logistic 回归确认,最终锁定 6 个关键变量(ICU 住院时长、Sputum-GNB、Sputum-GPC、APSIII、SOFA、肝损伤);在此基础上训练八种机器学习模型——逻辑回归、支持向量机(SVM)、梯度提升机(GBM)、神经网络、XGBoost、AdaBoost、LightGBM、CatBoost。
- 类别不平衡处理:由于血流感染相对少见,训练阶段用合成少数类过采样(SMOTE)改善少数类学习;模型可迁移性则用未经合成的验证数据评估,并在解读结果时考虑过采样对泛化的潜在影响。
- 验证与可解释性:内部用测试集验证、外部用达州中心医院病人验证,区分度以 ROC 曲线下面积(AUC)衡量,并用校准曲线、决策曲线分析(DCA)、混淆矩阵评估校准与临床获益;最后用 SHAP 解释最终模型,量化每个变量对预测的方向与强度,并额外做"仅入院信息"的敏感性分析。
05 结果
基线特征:MIMIC-IV 数据库提取 8,971 例肺炎病人,剔除 1,791 例未做血培养者后剩 7,180 例,再经数据预处理后 4,121 例符合纳排(含 468 例血流感染);达州中心医院纳入 150 例(含 18 例血流感染)。基线特征见 Table 1。
变量筛选:通过 Boruta 算法叠加单因素 + 多因素 logistic 回归,从 50 个临床特征里筛出 6 个对血流感染最关键的变量——ICU 住院时长、Sputum-GNB、Sputum-GPC、APSIII 评分、SOFA 评分、肝损伤(Figure 2)。
独立相关因素(多因素 logistic):ICU 住院时长 OR 1.05(95% CI 1.03–1.06,p<.001 or ci table>
模型对比:八种模型里,平衡后的模型整体表现高于不平衡模型。不平衡数据上,训练集 LightGBM 最佳(AUC 0.823,95% CI 0.799–0.847),内部验证集神经网络最佳(AUC 0.713,95% CI 0.663–0.763)。SMOTE 平衡后,GBM 与 XGBoost 最强——GBM 训练集 AUC 0.856(95% CI 0.839–0.873)、内部验证集 0.753(95% CI 0.719–0.788);XGBoost 训练集 0.844(95% CI 0.827–0.861)、内部验证集 0.746(95% CI 0.711–0.781)(Figure 3)。
外部验证:GBM 在达州中心医院外部验证集上 AUC 0.703(95% CI 0.576–0.830)(Figure 5);校准曲线显示 SMOTE 后 GBM 在中低概率区间预测概率与实际事件频率吻合较好,最高概率区间略有偏移;决策曲线分析(DCA)提示模型有中等临床获益。
可解释性(SHAP):Figure 12 给出各变量对 GBM 模型的平均贡献排序,Figure 13 用蜂群图展示每个变量取值高低如何把预测推向阳性或阴性。以一名实际发生血流感染的病人为例,SOFA=8 贡献 +0.0843、Sputum-GPC 阳性贡献 +0.377、ICU 住院时长 13 天贡献 +0.25,共同把预测推向"血流感染阳性"。
个体解释(SHAP force plot):Figure 14 展示一名阳性病人的逐变量贡献分解,Figure 15 展示一名阴性病人——让医生能看到每个变量对这一个具体病人的风险是加还是减。
06 本平台一键复现
本论文的研究人群与建模数据,在「医学在线-MIMIC超市」平台可以快速准备:在纳排页选 MIMIC-IV,勾"成人(≥18 岁)+ ICU 停留 ≥24 小时 + 单次 ICU 入住 + 做过血培养"作为入组条件,把肺炎病人圈出来;指标侧勾论文同款变量——心率 / 呼吸 / 血压 / 血氧 / 体温等生命体征,凝血 / CRP / 肾功能 / 血常规 / 血气等实验室,APSIII 与 SOFA 严重程度评分,以及痰培养与血培养结果;结局选"血流感染"。导出后用平台的机器学习流程跑同款的特征筛选 + 多模型对比 + 可解释(SHAP),即可在浏览器里复现"用 ICU 早期信息对肺炎病人血流感染风险做一次再评估、并看清每个变量为什么把风险推高或拉低"这一核心结论。
导出的标准化数据可直接喂给后续建模,省掉最耗时的数据抽取与清洗环节;想做更稳的横向印证,还可以把同一套入组条件与指标搬到平台其它已接入的 ICU 数据库(eICU / nwICU / SICdb 等),用同款研究人群在不同来源上各跑一遍。
访问 医学在线-MIMIC超市:https://yxzx.hubstack.cn/
管理员微信:yxzx2023999
关于医学在线-MIMIC超市
我们专注于医疗公共数据库一站式科研服务,已接入 MIMIC-IV、eICU、PIC、nwICU、SICdb、INSPIRE、HiRID、CHARLS、HRS、NHANES、SHARE、MHAS、CDC WONDER、ELSA 等主流医疗公共数据库。
无需安装数据库,无需写一行代码,浏览器打开就能完成数据提取 → 清洗 → 统计 → 机器学习 → AI 论文初稿全流程。
网址:https://yxzx.hubstack.cn/ 微信:yxzx2023999
关注「医学在线-MIMIC超市」公众号,助你早日完成 SCI 发表。
文章引用来源:Song B, Yang X, Wang WJ, Fu K, Liu P, Liu C. An interpretable machine-learning model for post-admission reassessment of bloodstream infection risk in ICU patients with pneumonia. Sci Rep. 2026 Jun 6. doi:10.1038/s41598-026-54227-3.
免责声明:本文内容仅供科研学习和参考,如有侵权,请联系我们删除,谢谢。
📖 完整高清原图与更多历史文章
yxzx.hubstack.cn/h