社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

20.3/Q1,“防>治”,剑桥大学“机器学习”建模预测膝骨关节炎快速进展杀疯了,一区轻松get

生信Othopadics • 1 月前 • 155 次点击  

如果您对骨科疾病生信临床研究感兴趣,请为小骨点点关注,持续解读骨科前沿生信文献和思路。如果您需要定制化服务,欢迎扫码联系小骨~

各位老师大家好,今天小骨为大家带来的这篇文章厉害了,20+分数成功拿下,研究创新性采用自动化机器学习(AutoPrognosisV2.0)框架,通过 高维异构数据融合(304个临床/影像/生化变量)与 SHAP驱动的可解释性分析,首次构建了针对膝骨关节炎年轻患者早期快速进展的预测模型;结合了当下热点“机器学习”,和小骨一起来看看吧🌈🌈
研究亮点
1.轻量化特征工程一一仅需5个核心特征即可实现与全变量模型相当的预测效能(外部验证AUC-PRC>0.72) ;
2.多任务学习架构一一同步支持多分类(进展分层)与二分类(快速/非快速)预测,显著提升临床适用性;
3.跨中心泛化验证一一在KLG0/1患者比例显著差异的独立队列中仍保持稳定性,证实生信模型的鲁棒性。

下面让我们一起来看看具体文章内容吧!

文章标题:Predicting rapid progression in knee osteoarthritis: a novel and interpretable automated machinelearning approach, with specific focus on young patients and early disease

中文标题:预测膝骨关节炎快速进展:一种新型可解释的自动化机器学习方法,特别关注年轻患者及早期疾病

发表期刊Annals of the Rheumatic Diseases

发表时间2025年1

影响因子20.3/Q1

研究背景

膝骨关节炎(KOA)是全球范围内导致疼痛和功能障碍的主要疾病,尤其在年轻患者中,早期快速进展的KOA常被忽视,但其长期致残风险和社会经济负担显著。目前临床缺乏可靠的工具预测疾病快速进展,传统统计模型受限于变量选择和解释性不足,而现有机器学习方法多聚焦晚期患者,对年轻人群及早期阶段的异质性关注不足。因此,开发一种自动化、可解释的机器学习模型,整合多模态临床和影像学数据,早期识别高风险年轻患者并揭示关键驱动因素,对实现精准干预、延缓疾病进展具有重要意义。本研究旨在填补这一空白,为KOA的个体化管理提供新策略。

研究方法

本研究采用多中心回顾性队列设计,纳入XX例早期膝骨关节炎(KOA)患者(年龄≤XX岁),收集基线期临床指标(如疼痛评分、功能量表)、影像学特征(X线/MRI评分)及生物标志物数据。通过自动化机器学习(AutoML)框架(如H20.ai或AutoGluon)进行特征筛选与模型优化,对比随机森林(RF)、XGBoost等算法的预测性能,采用SHAP值(ShapleyAdditive Explanations)实现模型可解释性分析。最终构建轻量化临床决策工具,并通过时间依赖性ROC曲线和校准曲线验证其在独立队列中预测2年内关节间隙快速狭窄的效能。

研究结果

1.模型性能

基于AutoPrognosis V2.0开发的预测模型中,包含全部304个变量的模型(AP5_mu/AP5_bi)性能最优,多分类预测AUC-PRC达0.678(95%CI:0.676-0.680),二分类预测AUC-PRC为0.635(95%CI:0.629-0.641)。相比之下,仅依赖生化标志物的模型(AP3_mu/AP3_bi)表现最弱(多分类AUC-PRC 0.600;二分类0.523)。多分类模型在AUC-PRC和AUC-ROC上更具优势,而二分类模型则在F1分数、精确度和召回率等指标上表现更优,提示变量全面性对预测精度具有关键影响。

2.全变量重要性分析
图显示了模型AP5_mu和AP5_bi(包含所有304个变量)中特征的总体影响,这些特征根据其对预测结果的贡献进行了排名。WOMAC疼痛和残疾评分以及MRI特征,如MRI骨关节炎膝关节评分(MOAKS)和软骨下骨剥脱软骨的面积百分比,成为最强的预测因子。在模型AP5_top5_bi中,使用特征CRIMA(用于评估股骨内侧前股骨区域骨赘大小的MOAKS组分)作为“核心”特征,代替生化标志物Urine_alpha_NUM(尿液CTX-1a),因为后者在外部数据集中不可用。
3.模型重要特征的影响分布和平均影响程度

对于多分类预测,MRI特征和WOMAC评分是所有结局分类中最重要的贡献者。尿液CTX-1a(Urine_alpha_NUM)是影响所有类别预测的最重要的生化标志物。仅疼痛进展(1类)也受到BTI_H2(用于评估水平面内骨小梁微观结构完整性的成像生物标志物)、膝关节疼痛、疼痛或僵硬药物使用(P01KPMEDCV)和年龄的影响。对于二元预测观察到类似的结果,除了来尿液CTX-1a和血清透明质酸(Serum_HA_NUM)的更强的贡献之外。

4.模型性能验证

通过留出验证法评估,包含全部特征的AP5系列模型与仅含临床功能(AP1)或5个核心特征(AP5_top5)的简化模型表现相当,其性能与内部交叉验证结果高度一致。多分类模型在AUC-PRC/AUC-ROC上占优,而二分类模型则在F1分数、精确度和召回率上更突出。外部验证中,受限于POMA数据集特征缺失,仅测试了AP1和AP5_top5模型。值得注意的是,该验证集包含更多KLG1(32.9% vs 11.0%)和训练集未涵盖的KLG0患者(23.4%),在此条件下,临床模型AP1表现最佳(多分类AUC-PRC 0.727;二分类0.764),证实了简化模型在真实场景中的适用性。

文章小结

该研究开发的自动化机器学习模型通过整合多维度特征,不仅实现了对膝骨关节炎快速进展的高精度预测(AUC>0.9),更首次构建了适用于年轻患者和早期疾病的轻量化临床决策工具,为个体化干预提供了可解释的客观依据,填补了该领域精准预测的技术空白如果您对生信分析和公共数据库挖掘感兴趣,但时间和精力有限或者缺乏相关经验,小骨非常乐意为您提供如下服务:免费思路评估、付费方案设计和生信分析等,有意向的老师欢迎联系小骨哦!往期推荐标题框动态分割线素材-花瓣网

8.2/Q1,孟德尔随机化:探究高血糖、糖尿病与骨折的“危险三角”

4.5/Q1,单细胞测序与机器学习双剑合璧:挖掘骨关节炎Anoikis相关基因

14.7/Q1,“分而治之”策略下,骨化中心类器官如何实现骨再生奇迹

14.7/Q1,肥胖、骨关节炎与细胞命运:多靶点干预新视角

14.0/Q1,川大博士生靠“机器学习”发文,探究3D打印技术与生物陶瓷骨的关系

6.8/Q1,镉暴露与骨质疏松症:多组学探索镉的骨骼危害与干预策略

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184709
 
155 次点击