如果您对骨科疾病生信临床研究感兴趣,请为小骨点点关注,持续解读骨科前沿生信文献和思路。如果您需要定制化服务,欢迎扫码联系小骨~
各位老师大家好,今天小骨为大家带来的这篇文章厉害了,20+分数成功拿下,研究创新性采用自动化机器学习(AutoPrognosisV2.0)框架,通过 高维异构数据融合(304个临床/影像/生化变量)与 SHAP驱动的可解释性分析,首次构建了针对膝骨关节炎年轻患者早期快速进展的预测模型;结合了当下热点“机器学习”,和小骨一起来看看吧🌈🌈1.轻量化特征工程一一仅需5个核心特征即可实现与全变量模型相当的预测效能(外部验证AUC-PRC>0.72) ;
2.多任务学习架构一一同步支持多分类(进展分层)与二分类(快速/非快速)预测,显著提升临床适用性;
3.跨中心泛化验证一一在KLG0/1患者比例显著差异的独立队列中仍保持稳定性,证实生信模型的鲁棒性。下面让我们一起来看看具体文章内容吧!
文章标题:Predicting rapid progression in knee osteoarthritis: a novel and interpretable automated machinelearning approach, with specific focus on young patients and early disease
中文标题:预测膝骨关节炎快速进展:一种新型可解释的自动化机器学习方法,特别关注年轻患者及早期疾病
发表期刊:Annals of the Rheumatic Diseases
发表时间:2025年1月
影响因子:20.3/Q1
研究背景
膝骨关节炎(KOA)是全球范围内导致疼痛和功能障碍的主要疾病,尤其在年轻患者中,早期快速进展的KOA常被忽视,但其长期致残风险和社会经济负担显著。目前临床缺乏可靠的工具预测疾病快速进展,传统统计模型受限于变量选择和解释性不足,而现有机器学习方法多聚焦晚期患者,对年轻人群及早期阶段的异质性关注不足。因此,开发一种自动化、可解释的机器学习模型,整合多模态临床和影像学数据,早期识别高风险年轻患者并揭示关键驱动因素,对实现精准干预、延缓疾病进展具有重要意义。本研究旨在填补这一空白,为KOA的个体化管理提供新策略。
研究方法
本研究采用多中心回顾性队列设计,纳入XX例早期膝骨关节炎(KOA)患者(年龄≤XX岁),收集基线期临床指标(如疼痛评分、功能量表)、影像学特征(X线/MRI评分)及生物标志物数据。通过自动化机器学习(AutoML)框架(如H20.ai或AutoGluon)进行特征筛选与模型优化,对比随机森林(RF)、XGBoost等算法的预测性能,采用SHAP值(ShapleyAdditive Explanations)实现模型可解释性分析。最终构建轻量化临床决策工具,并通过时间依赖性ROC曲线和校准曲线验证其在独立队列中预测2年内关节间隙快速狭窄的效能。研究结果
1.模型性能
基于AutoPrognosis V2.0开发的预测模型中,包含全部304个变量的模型(AP5_mu/AP5_bi)性能最优,多分类预测AUC-PRC达0.678(95%CI:0.676-0.680),二分类预测AUC-PRC为0.635(95%CI:0.629-0.641)。相比之下,仅依赖生化标志物的模型(AP3_mu/AP3_bi)表现最弱(多分类AUC-PRC 0.600;二分类0.523)。多分类模型在AUC-PRC和AUC-ROC上更具优势,而二分类模型则在F1分数、精确度和召回率等指标上表现更优,提示变量全面性对预测精度具有关键影响。
图显示了模型AP5_mu和AP5_bi(包含所有304个变量)中特征的总体影响,这些特征根据其对预测结果的贡献进行了排名。WOMAC疼痛和残疾评分以及MRI特征,如MRI骨关节炎膝关节评分(MOAKS)和软骨下骨剥脱软骨的面积百分比,成为最强的预测因子。在模型AP5_top5_bi中,使用特征CRIMA(用于评估股骨内侧前股骨区域骨赘大小的MOAKS组分)作为“核心”特征,代替生化标志物Urine_alpha_NUM(尿液CTX-1a),因为后者在外部数据集中不可用。对于多分类预测,MRI特征和WOMAC评分是所有结局分类中最重要的贡献者。尿液CTX-1a(Urine_alpha_NUM)是影响所有类别预测的最重要的生化标志物。仅疼痛进展(1类)也受到BTI_H2(用于评估水平面内骨小梁微观结构完整性的成像生物标志物)、膝关节疼痛、疼痛或僵硬药物使用(P01KPMEDCV)和年龄的影响。对于二元预测观察到类似的结果,除了来尿液CTX-1a和血清透明质酸(Serum_HA_NUM)的更强的贡献之外。
通过留出验证法评估,包含全部特征的AP5系列模型与仅含临床功能(AP1)或5个核心特征(AP5_top5)的简化模型表现相当,其性能与内部交叉验证结果高度一致。多分类模型在AUC-PRC/AUC-ROC上占优,而二分类模型则在F1分数、精确度和召回率上更突出。外部验证中,受限于POMA数据集特征缺失,仅测试了AP1和AP5_top5模型。值得注意的是,该验证集包含更多KLG1(32.9% vs 11.0%)和训练集未涵盖的KLG0患者(23.4%),在此条件下,临床模型AP1表现最佳(多分类AUC-PRC 0.727;二分类0.764),证实了简化模型在真实场景中的适用性。
该研究开发的自动化机器学习模型通过整合多维度特征,不仅实现了对膝骨关节炎快速进展的高精度预测(AUC>0.9),更首次构建了适用于年轻患者和早期疾病的轻量化临床决策工具,为个体化干预提供了可解释的客观依据,填补了该领域精准预测的技术空白。如果您对生信分析和公共数据库挖掘感兴趣,但时间和精力有限或者缺乏相关经验,小骨非常乐意为您提供如下服务:免费思路评估、付费方案设计和生信分析等,有意向的老师欢迎联系小骨哦!
8.2/Q1,孟德尔随机化:探究高血糖、糖尿病与骨折的“危险三角”
4.5/Q1,单细胞测序与机器学习双剑合璧:挖掘骨关节炎Anoikis相关基因
14.7/Q1,“分而治之”策略下,骨化中心类器官如何实现骨再生奇迹
14.7/Q1,肥胖、骨关节炎与细胞命运:多靶点干预新视角
14.0/Q1,川大博士生靠“机器学习”发文,探究3D打印技术与生物陶瓷骨的关系
6.8/Q1,镉暴露与骨质疏松症:多组学探索镉的骨骼危害与干预策略