第一作者:Ayis Pyrros
通讯作者:Ayis Pyrros
第一单位:美国Duly Health and Care
DOI:10.1038/s41467-023-39631-x
本文使用深度学习(DL)结合X光片(CXR)及电子健康记录(EHR)数据检测二型糖尿病(T2D),该模型在内部数据集的AUC为0.84,外部数据集AUC为0.77,预测患者中的5%在随后被检测为T2D。
T2D患病率很高,影响了大约10%的美国人口。目前的筛查方法依赖于空腹血糖和血红蛋白A1C水平,对于35-70岁的超重或肥胖成年人,建议每3年筛查一次。尽管CXR主要不用于糖尿病的检测,但它们是一种常见的成像程序,可以提供关于未来医疗费用、健康差距和合并症的有价值的信息。DL有可能通过识别先进的生物标志物来彻底改变疾病检测,利用现有的EHR数据实现基于人群的健康倡议。DL已经在检测与代谢综合征相关的生物标记物以及使用腹部计算机断层扫描和胸部X光检查预测医疗费用和合并症方面表现出了希望。因此,作者探索使用多任务DL模型从大型临床数据集中的动态额部CXR中检测T2D。
1.使用多任务DL模型结合CXR与HER检测患者T2D。
1.数据集
模型训练集数据,由271,065个CXR组成(160,244名独特患者,2010-2021),测试集数据由9943个CXR构成(2022,图1)。通过k重交叉验证技术(回溯性内部验证数据集)进一步评估原始训练数据集。最后用来自另一个机构(Emory队列,我们的外部验证数据集)的5026个CXR(图1)进行了外部验证。
图1 从前瞻性、外部验证和回顾性k倍队列中选择病例和对照的流程图
2.主要分析结果
与没有利用CXR图像信息的Logistic回归(LR)模型相比,DL模型表现出更好的性能。在9943名患者的单独测试队列中,DL模型对T2D预测的AUC为0.84,而LR模型的AUC为0.79。DL模型在T2D控制较差的患者和符合T2D筛查标准的患者亚组中也表现良好。此外,将DL模型的预测结合到LR模型中,改善了T2D预测的AUC(图2)。如图3所示,所有患有T2D的受试者的DL模型预测显著高于没有T2D的受试者(图3a)。T2D控制不良的受试者得分高于对照受试者或无糖尿病的受试者(图3b)。
3.可解释性分析
在这项长达11年的回顾性队列研究中,在29,420名患者中25%(7,409名)在首次CXR后被诊断为T2D。该人群中T2D的发病率为每年每1000名高危人群中5.1例。深度学习(DL)模型随着时间推移表现稳定,1年(AUC=0.80)、3年(0.79)、5年(0.79)和10年(0.78)。DL模型在外部数据集上进行了验证,获得了0.77的AUC。在由9943名患者组成的前瞻性测试队列中,84.3%的患者没有T2D,11.3%的患者T2D得到控制,4.4%的患者T2D控制较差(图1)。T2D患者一般年龄较大,在不同的T2D队列中有人口统计学上的差异。基于种族/民族的分组分析没有显示出统计意义。生成遮盖图以显示模型决策的基础,中央胸部、下颈部、上腹部和腋窝区域的特定图像特征可以用于预测T2D(图4,图5)。
图4 闭塞图识别具有高和低诊断评分的代表性CXR关键特征
Ayis Pyrros,Duly Health and Care放射科医生。研究方向:AI在糖尿病领域应用。
本文开发DL模型,以使用CXR准确识别T2D患者。DL模型预测T2D的曲线下面积(AUC)为0.84,包括控制较差的T2D。当与Logistic回归模型相结合时,DL模型提高了T2D预测的判别性能。DL模型表现出高度敏感性和特异性,超过了美国预防服务工作组的指导方针。该模型的可解释性通过咬合映射和自动编码器进行了演示,揭示了预测T2D的特定解剖特征为中央胸部、下颈部、上腹部和腋窝区域。该DL模型有助于T2D的早期识别和干预,降低相关并发症的风险,改善患者的预后。
转载须知
【原创文章】AItellU原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为AItellU所有。AItellU保留所有法定权利,违者必究。
投稿、转载及合作邮箱:
zjhuangjunjie@163.com
原文链接:
https://www.nature.com/articles/s41467-023-39631-x