在模型开发过程中,整个样本按3:1的比例分成训练样本和测试样本。采用XGBoost和决策树相结合的方法预测VR-AKI和VU-AKI。XGBoost超参数包括学习率、在树的某个叶节点上进一步划分所需的最小损失减少量、树的最大深度、训练实例的子样本比。为了避免过度拟合,需要微调超参数。在本文中使用了bootstrap验证(BV,bootstrap validation),将原始数据集随机分成5个大小相等的子样本。最终XGBoost模型中的树数由最后100次BV迭代中每次测试日志损失的最小BV决定(图2)。
使用AUROC来评估模型辨别能力。特征重要性是通过将误差减少的总和除以一个变量来计算的,这反映了每个变量在分类VR-AKI和VU-AKI时所做的贡献。