
如果您对骨科疾病生信临床研究感兴趣,请为小骨点点关注,持续解读骨科前沿生信文献和思路。如果您需要定制化服务,欢迎扫码联系小骨~
文章标题:Data-driven identification of predictive risk biomarkers for subgroups of osteoarthritis using interpretable machine learning
中文标题:使用可解释的机器学习对骨关节炎亚组的预测性风险生物标志物进行数据驱动识别
发表期刊:Nature Communications
发表时间:2024年4月
影响因子:
14.7/Q1
研究目的
骨关节炎(OA)是最普遍的关节炎形式,由于疼痛和功能受限,会导致高发病率,是导致残疾的主要原因。骨关节炎(OA)生物学机制复杂,驱动因素尚不清楚。
研究方法
作者利用UKB数据库中的多组学数据,通过机器学习模型中筛选生物标志物,并识别具有不同风险概况的亚组。UK Biobank(简称UKB)。该数据库包含50万名英国志愿者的详细健康数据,也囊括了各种非肿瘤疾病,面向全球研究者开放共享。
研究结果
1.OA研究人群
研究者从UKB中筛选出103,086名骨关节炎(OA)患者,同时选取了67,772的非OA对照组。作者旨在评估OA确诊后5年内的风险生物标志物,以识别高危个体,并为老龄化社会中的预防策略提供科学依据。
在OA研究和验证队列确定后,作者将多源纵向患者数据,集成至XGBoost模型。利用可解释AI框架,分析人群、精确度和个性化层面的OA风险标志物。
3.从5年多模式临床数据预测OA
整合回顾性临床数据至XGBoost模型,以预测5年内OA风险(Clin模型),其交叉验证ROC-AUC得分为0.72。研究还评估了Clin模型在预测不同关节OA亚型(手臂、足部、髋、膝或脊柱)的效能,ROC-AUC介于0.67至0.73。基础模型仅考虑年龄、性别、BMI,预测OA的ROC-AUC为0.67。通过计算SHAP值,揭示了年龄和较高BMI为OA风险的主要预测因素。
文章小结
该研究利用UKB数据库的多组学数据,通过机器学习方法筛选了标记物,为骨关节炎临床和基础研究提供参考。如果您对生信分析和公共数据库挖掘感兴趣,但时间和精力有限或者缺乏相关经验,小骨非常乐意为您提供如下服务:免费思路评估、付费方案设计和生信分析等,有意向的老师欢迎联系小骨哦!