Hepatology: 机器学习模型在识别NAFLD和NAFLD相关肝硬化的临床显著阶段方面优于无创检测

生信必修课：R语言生信数据分析及可视化作图（网络）培训班【9月10-11日】

如何每次免费参加医药加的视频号直播课？

长按二维码回复预约，找小编领取预约码，免费参加直播课，在直播时送一个粉丝牌，选择【主播每次开播都提醒我】，就可以订阅视频号。

会员圈成员每周可通过腾讯会议参加医药加的直播课，还可以下载各种资源与向专家咨询提问。

背景：

非酒精性脂肪肝(NAFLD)是最常见的肝脏疾病之一，影响了超过25%的普通人群，并在医疗系统中承担了巨大的成本。随着时间的推移，NAFLD可发展为更严重的疾病，如非酒精性脂肪性肝炎(NASH)和肝硬化。NASH是通过Brunt标准进行组织学评估，并在试验进入时使用NAFLD活动评分(NAS)进行数值评估，NASH常与2期纤维化(F2)结合，以确定哪些患者可能从药物治疗中受益，因为这些患者发生肝硬化和死亡等肝脏相关并发症的风险增加。因此，那些显著的NASH (NAS≥4)和≥F2被特别选择纳入临床试验。一些非侵入性检查(NITs)来识别这一高危亚组，包括NIS4和FAST评分。其他对纤维化进行风险分层的检测包括NAFLD纤维化评分(NFS)、纤维扫描LSM、FIB-4、磁共振成像(MRI)弹性成像和肝活检。尽管所有这些测试本身都很有用，但每一种诊断工具都有局限性和缺点。例如，肝活检作为目前识别肝纤维化的参考标准，存在采样误差风险、成本高、并发症风险等局限性。纤维扫描是昂贵的，并没有广泛地在胃肠道或初级保健诊所。FAST评分依赖于纤维扫描结果，因此与纤维扫描有相同的问题。FIB-4和NFS通常只能识别具有F3或更高级别的测试，并且这两个测试都有一个很大的不确定区域。因此，对低成本、低风险、敏感、准确的NIT的研究一直在进行。

机器学习(ML)模型利用计算机算法进行自我学习和改进，而无需明确的人类指令。ML模型基于相似性和差异性对输入进行分类，通过数据挖掘识别模式，基于概率衡量决策，通过正反馈和负反馈进行学习。ML模型在一个包含所有变量和感兴趣的结果的训练队列上进行训练，以便学习数据点之间的关系。一旦训练完成，模型将在一个单独的测试队列中进行评估，该队列只包含预测结果的变量。将预测结果与已知结果进行比较，以确定模型的准确性。

简介：

2022年6月30日，来自美国西达斯西奈医学中心医学系的Mazen Noureddin教授课题组在Hepatology（IF: 17.2）杂志上发表题为“Machine Learning Models Are Superior to Non-Invasive Tests in Identifying Clinically Significant Stages of NAFLD and NAFLD-Related Cirrhosis”的文章^[1]。作者评估了机器学习(ML)模型在识别临床显著的NAFLD相关肝纤维化和肝硬化方面的表现。发现，ML模型总体上优于纤维扫描、FIB-4、FAST和NFS。ML可能是鉴别NAFLD患者临床明显肝纤维化和肝硬化的有效工具。

主要结果：

病人特征。

总体而言，平均年龄为56.6岁，55.55%为女性，37.96%患有2型糖尿病，50.07%患有高血压。平均ALT为36.0 U/L, AST为28.0 U/L，总胆红素为0.6 mg/dL。F0占31.16%，F1占26.35%，F2占14.53%，F3占14.53%，F4占13.43%。

ML在≥F2、≥F3、≥F4评估中的表现。

所有ML模型的准确性和AUC主要高于FibroScan、FIB-4、FAST和NFS。这里，作者展示了RF模型的结果，因为这个ML模型具有最高的性能。对于≥F2, 随机森林算法（RF）的准确性(被定义为正确预测的患者的总比例)、AUC、特异性和PPV均高于FibroScan (p < 0.05)。RF和FibroScan的敏感性和NPV差异无统计学意义(p≥0.05)。RF的准确率、AUC、灵敏度和NPV均高于FIB-4 (p < 0.05)。RF与FIB-4的特异性和PPV差异无统计学意义(p≥0.05)。

对于≥F3,RF的准确率、AUC、特异性和PPV均高于FibroScan (p < 0.05)。RF和FibroScan的敏感性和NPV差异无统计学意义(p≥0.05)。RF的准确率、AUC、灵敏度和NPV均高于FIB-4 (p < 0.05)。但RF的特异性低于FIB-4 (p < 0.05)。RF与FIB-4的PPV差异无统计学意义(p≥0.05)。

对于F4, RF的准确性、特异性、PPV均高于FibroScan (p < 0.05)。然而，RF的敏感性低于纤维扫描(p < 0.05)。RF与FibroScan的AUC和NPV差异无统计学意义(p≥0.05)。与FIB-4相比，RF显示更高的准确性、灵敏度和NPV (p < 0.05)。RF与FIB-4的AUC、特异性、PPV差异无统计学意义(p≥0.05)。

图1：≥F2, ≥F3, F4和NAS≥4+≥F2的流程

ML在NASH + NAS≥4 + ≥F2评估中的性能。

用约登指数(Youden’s index)获取截断值时，RF与FAST在准确性、AUC、敏感性、特异性、PPV、NPV等方面均无统计学差异(p0.05)。然而，总体数字更高。RF显示AUC、PPV和NPV高于FIB-4 (p < 0.05)。RF与FIB-4在准确性、敏感性、特异性方面差异无统计学意义(p≥0.05)。RF的AUC、敏感性、PPV和NPV均高于NFS (p < 0.05)。RF和NFS在准确性和特异性方面差异无统计学意义(p≥0.05)。

当使用90%的灵敏度来获得截止值时，RF显示出比FAST更高的准确度、灵敏度和PPV (p < 0.05)。RF的净pv低于FAST (p < 0.05)。RF与FAST的AUC及特异性差异无统计学意义(p≥0.05)。RF的准确率、AUC、特异性和PPV均高于FIB-4或NFS (p < 0.05)。RF的NPV低于FIB-4或NFS (p < 0.05)。RF与FIB-4或NFS的敏感性差异无统计学意义(p≥0.05)。

当使用90%的特异性来获取截断值时，RF的敏感性和PPV均高于FAST (p < 0.05)。RF的准确率和NPV均低于FAST (p < 0.05)。RF与FAST在特异性和AUC方面差异无统计学意义(p≥0.05)。RF显示比FIB-4或NFS更高的AUC、灵敏度和PPV (p < 0.05)。RF的准确率和NPV均低于FIB-4或NFS (p < 0.05)。RF与FIB-4或NFS的特异性差异无统计学意义(p≥0.05)。

最后，与FIB-4和NFS相比，对于NASH + NAS≥4 +≥F2, RF在不确定区域内的患者比例较低(在90%的敏感性和90%的特异性之间)(p < 0.05)。RF与FAST在不确定区患者的百分比差异无统计学意义(p≥0.05)。

RF在特殊患者队列中的性能。

在一个仅包含65岁及以上人群的队列中，使用F3截断RF与FIB-4比较，特异性或PPV没有统计学意义的差异(p≥0.05)。与FIB-4相比，RF具有更高的准确度、AUC、灵敏度和NPV (p < 0.05)。在一个仅包含糖尿病患者的队列中，使用F3作为RF的截止值来比较RF与NFS时，在准确性、敏感性、特异性、PPV或NPV方面没有统计学上的显著差异(p≥0.05)。RF具有较高的AUC (p < 0.05)。

当使用F2临界值作为RF模型，并将BMI<40 kg/m²的队列与BMI≥40 kg/m²的队列进行比较时，其准确性、AUC、敏感性、特异性、PPV或NPV均无统计学差异(p≥0.05)。当RF采用≥F3的截止值，RF与自身进行同样的比较时，AUC、特异性、PPV、NPV无统计学差异(p≥0.05)。使用BMI<40 kg/m² 队列的RF比使用BMI≥40 kg/m²队列的RF具有更高的准确性和敏感性(p < 0.05)。当采用F4截断值进行相同比较时，准确性、AUC、敏感性、特异性、PPV、NPV均无统计学差异(p≥0.05)。当使用NASH与NAS≥4 +≥F2的截断值并进行相同的比较时，准确性、AUC、敏感性、特异性、PPV或NPV均无统计学差异(p≥0.05)。

图2：≥F2、≥F3、F4和NAS≥4+≥F2的ML模型AUC及诊断评分

结论和展望：

在该研究中，作者建立了LR、RF和ANN模型来预测NAFLD患者肝纤维化分期≥F2、≥F3、F4和NASH伴NAS≥4 +≥ F2。然后，比较了ML模型与纤维扫描、FIB-4、FAST和NFS的性能。作者的结果表明，在ML模型中，RF表现最好。与FibroScan、FIB-4、FAST和NFS相比，ML模型在预测NAFLD患者纤维化方面与FibroScan、FIB-4、FAST和NFS相同或更准确。此外，ML模型在区分我们队列中的阳性和阴性类方面总体上优于纤维扫描、FIB-4、FAST和NFS。ML可以作为一种准确、廉价的工具，帮助医生识别临床NAFLD患者明显的肝纤维化和肝硬化。本研究可为今后疾病预测ML模型的开发奠定基础。

原文链接：https://aasldpubs.onlinelibrary.wiley.com/doi/10.1002/hep.32655

参考文献：

[1] Chang D, Truong E, Mena EA, Pacheco F, Wong M, Guindi M, Todo TT, Noureddin N, Ayoub W, Yang JD, Kim IK, Kohli A, Alkhouri N, Harrison S, Noureddin M. Machine Learning Models Are Superior to Non-Invasive Tests in Identifying Clinically Significant Stages of NAFLD and NAFLD-Related Cirrhosis. Hepatology. 2022 Jul 9. doi: 10.1002/hep.32655. Epub ahead of print. PMID: 35809234.

展示部分高价值问答与精品资源如下：

2022年医药加精品学习班直播档期

（支付学费可先领取全程视频，再参加一次腾讯会议直播，每月都轮回排班）

医药加科研神器，可免费下载文献以及各种生信工具免费使用，点击下面阅读原文！