文章简介:
本研究基于大规模重症监护数据库,围绕“脓毒症合并急性呼吸衰竭”这一高危人群,构建并验证了一种可解释的机器学习预测模型,用于评估 ICU 入院后 28 天死亡风险。研究以 MIMIC-IV(v3.1)数据库作为训练队列,并采用 eICU-CRD(v2.0)进行独立外部验证,系统比较了多种主流机器学习算法。通过临床指南与专家共识筛选候选变量,并结合 Boruta 特征选择与多重共线性诊断,最终构建以 XGBoost 为核心的预测模型。结果显示,该模型在内部验证中具有较高区分度(AUC 0.812),在外部队列中仍保持稳定性能(AUC 0.714),并通过 SHAP 方法实现了对关键风险因素的可解释分析。研究进一步将模型整合为可在线使用的风险预测平台,为临床实践提供直观、可操作的决策支持工具。
亮点:
1、本研究基于入ICU后24小时内可获得的常规临床指标,构建了用于预测脓毒症合并急性呼吸衰竭患者28天死亡风险的可解释XGBoost模型。
2、在7种机器学习算法的系统比较中,XGBoost在训练队列(MIMIC-IV)中表现最佳(AUC=0.812),并在独立外部验证队列(eICU-CRD)中保持稳定的判别能力(AUC=0.714)。
3、通过“指南与专家共识驱动的候选变量筛选 + Boruta算法 + VIF去共线”的严谨流程,最终确定20个稳健且具有临床可及性的关键预测特征。
4、结合SHAP及部分依赖分析明确了氧合状态、肝功能、营养/炎症状态及疾病严重程度等因素对短期死亡风险的定量贡献,并实现模型的临床可解释与可转化应用。
临床意义:
脓毒症合并ARF患者进展快、死亡风险高,亟需早期风险分层以指导治疗决策与ICU资源配置。本研究模型基于入ICU后24小时内的常规指标即可快速预测28天死亡风险,对短期预后具有重要价值,为临床管理提供可解释、可推广的量化工具。