该研究是一项回顾性、多中心的队列研究,纳入2004年4月至2022年9月期间来自中国11家医疗中心1787名未经抗病毒治疗的CHB合并HS患者。689名患者作为训练队列(肝活检队列),509名患者肝活检验证队列1和589名患者超声验证队列2分别作为两个独立的外部验证队列。该研究应用shapley additive explanations方法评估23个特征在诊断中重度炎症(Scheuer’s system≥G3)的重要性。
分别使用7种机器学习方法GBC、RF、XGB、ADB、GNB、LR和KNN构建模型,最终来自训练队列的11个变量(AST、PT、PLT、ALB、GGT、HBeAg阳性、HBsAg、WBC、INR、BMI和Tbil)被纳入GBC模型用于识别中度至重度炎症。在训练队列中,GBC的AUC范围为0.62~0.86。在验证队列1(肝活检队列)和2(超声队列)中,AUC的范围分别为0.61~0.89和0.72~0.78(图1)。

图1. 机器学习模型诊断中度至重度肝脏炎症的ROC曲线
A.训练队列,B.验证队列1,C.验证队列2
表1. 机器学习模型对中度至重度肝脏炎症的诊断效能
为深入探讨GBC模型在特定患者群体中的诊断性能,研究进一步评估GBC模型在不同年龄、性别、BMI、HBeAg状态、HBV DNA水平和是否患有糖尿病患者亚组中诊断中重度肝脏炎症的表现。在训练队列和两个外部验证队列中,GBC模型在
HBV DNA ≥105 IU/mL的患者中具有最高的AUC,分别为0.87(95%CI:0.84~0.91)、0.90(95%CI:0.86~0.94)和0.79(95%CI:0.74~0.83)。
该研究通过多种机器学习方法构建CHB合并HS患者的无创炎症预测模型,最终选择GBC构建模型,同时评估GBC模型在外部肝活检和超声诊断的HS验证队列及不同亚组中的性能,证明GBC模型的可推广性和稳定性。为方便临床医生使用该模型,该团队建立一个免费网站https://py3.reallife-liver.com/。该研究建立的GBC模型有可能成为一种有价值的无创诊断工具,用于精准识别并发HS的CHB患者的肝脏炎症。
南京大学医学院附属鼓楼医院李婕教授、杭州师范大学附属医院施军平教授、上海交通大学医学院附属瑞金医院谢青教授为本文的共同通讯作者。南京中医药大学鼓楼临床医学院博士研究生芮法娟、洛杉矶Cedars-Sinai医院消化科杨毅辉博士、天津市第二人民医院徐亮主任为本文的共同第一作者。