研究队列共3,402名慢性肾病患者,其中1,142人(33.57%)共病为HL。通过皮尔逊卡方检验和Wilcoxon秩和检验,发现了年龄、性别、SBP、DBP、BMI、LYM%、MO%、NEUT%、EO%、BASO%、RBC、MCV、MCH、RDW、PLT、ALB、ALP、BUN、Ca等指标的显著组间差异(p≤ 0.05)2+,HCO3−,GLU,LDH,P,结核,TP,TG,UA,SCR,Na,K,CL++−,以及 OP,这些后来都被纳入了功能选择中(表1以及图3).
单变量和多变量逻辑回归分析识别出15个独立预测变量用于模型构建。这些变量被纳入最终临床预测模型,详细回归系数和置信区间为表2.
本研究采用九种机器学习算法构建预测模型,包括XGBoost、LR、LightGBM、RF、AdaBoost、GBDT、MLP、KNN和GNB。所有模型的ROC曲线均通过五折交叉验证生成。模型性能基于AUC评估,XGBoost和RF在训练集中表现优异,XGBoost在验证集中表现出最高的预测准确率。在训练集中,XGBoost模型的截止值为0.766,性能指标如下:准确率 = 0.974,敏感度 = 0.966,特异度 = 0.982,PPV = 0.981,NPV = 0.966,F1评分 = 0.974,Cohen's kappa = 0.947。射频模型的阈值为0.520,准确率=0.973,灵敏度=0.980,特异度=0.966,PPV = 0.966,NPV = 0.980,F1评分=0.973,Cohen's kappa = 0.946(图4). 在验证集中,XGBoost模型保持了0.766的截止值,准确率=0.865,敏感度=0.823,特异度=0.906,PPV = 0.898,NPV = 0.837,F1评分=0.859,Cohen's kappa = 0.729(图5). 比较分析显示,XGBoost算法在训练和验证阶段均表现优于其他模型,展现出稳健的泛化性和诊断精度。这些发现表明XGBoost被确定为临床决策框架的最佳预测模型。
XGBoost模型通过五重交叉验证构建和验证。如图所示图6,模型在训练集中获得了0.984的AUC,截止值为0.841,性能指标如下:准确率 = 0.940,灵敏度 = 0.907,特异度 = 0.972,PPV = 0.970,NPV = 0.914,F1评分 = 0.937。在验证集中,表现一致,AUC = 0.984,截止值 = 0.841,准确率 = 0.936,灵敏度 = 0.903,特异度 = 0.969,PPV = 0.966,NPV = 0.910,F1 评分 = 0.934。在测试集中,模型的AUC为0.939,截止值=0.854,准确率=0.842,敏感度=0.774,特异度=0.917,PPV=0.910,净值=0.788,F1评分=0.837。