本研究旨在利用深度学习技术,结合术前、术中和术后24小时内的数据,实现对术后肝衰竭的早期检测。
数据收集与处理:
收集来自中国六个不同地区医院的1832名患者的围手术期电子健康记录(EHR)数据,包括患者的基本特征、术前、术中和术后24小时内的各项指标。
从MIMIC-IV数据库中提取242名患者的数据,以评估模型在西方人群中的泛化能力。
对缺失和不一致的数据进行处理,确保数据的完整性和一致性。
模型构建:
使用Bio-Clinical BERT (BC-BERT)作为基础模型,将EHR数据编码成高维特征嵌入,并考虑时间相关性。
利用上下文感知Transformer模块进行特征提取,分析围手术期数据中的时间事件和特征之间的关系。
采用两层MLP模型作为主分类器,用于PHLF检测;采用层次化门控MLP模型作为分级分类器,用于对PHLF进行分级。
模型训练与验证:
将中国队列分为训练集(681名患者)和内部验证集(171名患者)。
使用训练集训练模型,并使用内部验证集评估模型的性能。
将模型应用于外部验证集(包括五个中国外部验证队列和一个西方队列)进行评估,以验证模型的泛化能力。
模型解释:
使用t-SNE分析评估模型将围手术期临床因素编码成高维特征嵌入的能力,并考虑时间属性。
使用SHAP方法解释模型的预测结果,分析每个特征对预测结果的影响,并解释特征之间的相互作用和时间关系。
模型临床应用评估:
评估模型在不同围手术期阶段数据上的预测性能,包括术前、术中和术后24小时内的数据。
评估模型在预测临床相关PHLF(Grade B/C)和Grade A PHLF方面的性能。
根据是否存在已知的PHLF风险因素进行亚组分析,评估模型在不同风险水平人群中的预测性能。
评估模型对PHLF进行风险分层的能力,将患者分为高风险和低风险组,并比较两组之间的临床特征和结局。
将模型与临床医生进行比较,评估模型在早期检测PHLF方面的性能。
评估模型在处理不完整变量输入方面的能力,包括随机缺失变量输入和缺失不 influential 变量输入。