用于预测糖尿病足溃疡患者住院截肢率的可解释机器学习模型

✦

深度学习辣汤小组文献阅读学习之一百零五篇

✦

用于预测糖尿病足溃疡患者住院截肢率的可解释机器学习模型

DeepLearning 深度学习辣汤小组

2023/4/25

2021年，来自重庆大学生物工程学院的Xie Puguang等人使用LightGBM和SHapley Additive可解释算法开发可解释的机器学习模型，以预测糖尿病足溃疡（DFU，Diabetic Foot Ulcer）患者住院截肢的风险。并在International Wound Journal（IF：3.099 医学3区）期刊上发表题为“An explainable machine learning model for predicting in-hospital amputation rate of patients with diabetic foot ulcer”的文章。

DOI：

https://doi.org/ 10.1111/iwj.13691

一、研究背景

糖尿病患病率在近年来逐年增加，引起了并发症并降低了生活质量。DFU是一种严重的并发症，常常导致糖尿病患者的高截肢率，5年死亡率超过50％。因此，预防截肢对于改善患者的生活质量和生存率至关重要。当前的DFU分类系统存在局限性，传统的线性模型无法捕捉风险因素之间复杂的非线性关系。机器学习在疾病诊断和预后方面表现出优越的性能，但先进的模型通常被视为“黑匣子”，解释能力有限。在本研究中，开发了一种先进的机器学习模型，用于预测DFU患者的住院截肢风险。采用无模型方法优化“黑匣子”模型，提高了医生使用模型的信心，并为住院患者个性化分析截肢风险因素提供了新的方法。

二、数据集

本研究是一项回顾性队列研究，时间跨度为2009年至2020年。研究对象为患有DFU的患者。研究排除了年龄小于18岁、死亡或在被转介至重庆大学中心医院之前已进行截肢手术、治疗期间被转介至其他医疗机构的患者。研究收集了住院期间参与者的电子病例的数据，包括人口统计特征、医疗和用药史、临床和实验室数据、Wagner溃疡分级、足部感染分级以及临床结果（截肢和死亡）。研究将参与者根据其临床结果分为三组：非截肢组、小手术截肢组和大手术截肢组。其中小截肢定义为踝下任何截肢，而大截肢定义为踝上的截肢。数据集随机分为训练(60%)、校准(20%)或测试数据集(20%)。

三、方法

研究使用LightGBM这种机器学习方法构建模型，预测住院期间的非截肢、小截肢和大截肢的风险，该模型使用训练集进行训练，并使用五重交叉验证进行评估。使用基于treeParzen估计的贝叶斯超参数优化方法确定模型的最佳超参数。使用SHapley Additive exPlanations（SHAP）算法解释模型输出并理解预测结果。研究使用五个评估指标来评估模型性能，包括ROC曲线下面积（AUC）、灵敏度、特异度、阳性预测值（PPV，Positive Predictive Value）和阴性预测值（NPV，Negative Predictive Value）。

四、结果与结论

如图1所示，开发的模型在测试集中分别展示了以下预测能力:非截肢（AUC=0.90），轻度截肢（AUC=0.86），重度截肢（AUC=0.85）。模型的其他评价指标，包括敏感性、特异性、NPV和PPV，如表1所示。上述结果表明，多类分类模型具有较强的预测能力，其加权平均AUC(0.90)、敏感性(87.1%)、特异性(74.4%)、NPV(79.7%)和PPV(86.3%)。此外，如图2所示，各类别的校准曲线均接近45°线，而Brier评分（名解1）的加权平均值为0.086，说明模型的预测概率接近观测概率。

如图3所示，通过计算训练集样本中模型预测的平均值，可以得出一名住院期间接受了小型截肢手术的患者非截肢、轻度截肢、重度截肢的基线风险分别为0.76、0.11、0.13，使用模型后，显示出该患者非截肢、轻度截肢、重度截肢的预测概率分别为0.28、0.51、0.21。这表明SHAP算法潜在地解释了如何根据基线风险（名解2）和患者特征获得预测概率。

总而言之，本研究开发了一种可解释的机器学习模型，用于预测DFU患者在住院期间的截肢风险。该模型被发现具有很高的预测能力，可以准确估计DFU患者的截肢率。SHAP 算法用于解释模型的预测，并深入了解每个特征对预测的贡献。

名词解释

1.Brier评分：Brier评分是一种用来衡量概率预测准确性的指标。如果预测的概率越接近实际结果，则Brier评分越低，表示预测的准确性越高。如果预测的概率和实际结果之间差异很大，则Brier评分会很高，表示预测不准确。

2.基线风险（baseline risk）是指在未进行任何干预或治疗的情况下人群中发生某种疾病或事件的概率。