如果您对骨科疾病生信临床研究感兴趣,请为小骨点点关注,持续解读骨科前沿生信文献和思路。如果您需要定制化服务,欢迎扫码联系小骨~
还在担心骨科发文没思路,不如来看这篇机器学习的文章,或许对各位老师寻找研究方向有一点帮助哦,下面一起来看本文的研究亮点吧下面让我们一起来看看具体文章内容吧!
文章标题:Early prediction of bone destruction in rheumatoid arthritis through machine learning analysis of plasma metabolites
中文标题:通过血浆代谢物的机器学习分析,早期预测类风湿性关节炎的骨破坏
发表期刊:Arthritis Res Ther
发表时间:2025年5月
影响因子:4.4/Q2
研究背景
类风湿性关节炎(rheumatoid arthritis, RA)是一种以破坏性关节炎为特征的慢性进行性自身免疫性疾病。病理特征是滑膜炎和血管翳,通常会导致关节软骨和骨侵蚀。在晚期,RA 可导致关节畸形和功能丧失,显著影响患者的生活质量 。流行病学研究表明,RA 的发病率约为 0.46% ;骨破坏相关残疾随着疾病进展而增加 。及早识别严重关节损伤高风险患者对于开始治疗以减缓骨侵蚀至关重要。通过放射学检查可检测到的快速骨侵蚀与较差的预后有关 ,并且在诊断后一年内可影响超过 50% 的患者 。C 反应蛋白 (CRP) 和类风湿因子 (RF) 等临床标志物的升高有助于预测 RA 患者的骨侵蚀进展 ,并且已经建立了一系列预测模型 。然而,这些标志物的敏感性和特异性往往是有限的,特别是在血清学阴性患者或接受药物治疗的患者中。需要一些新的生物标志物来更好地评估疾病状况。
研究方法
该队列包括 60 名 RA 患者,使用液相色谱-质谱仪系统确定了基线代谢物特征。在一年的随访期后,使用 van der Heijde 改良的总夏普评分 (mTSS) 评估影像学结果,以量化骨破坏。使用几种机器学习算法分析代谢物与影像学进展之间的纵向关联,并计算核心代谢物的显着性。创建了一个包含代谢物和临床指标的新模型,以评估其对影像学进展的预测性能;将该模型与其他预测模型进行比较。
研究结果
1.研究队列的基线临床特征
本研究纳入60例完成1年随访的类风湿关节炎(RA)患者,通过基线及随访期双手影像学检查评估骨破坏进展(mTSS评分)。基线中位mTSS为13.50,1年中位ΔmTSS为3.50,据此将患者分为缓慢进展组(ΔmTSS≤3.50)和快速进展组(ΔmTSS>3.50)。单变量分析显示,两组间仅甲氨蝶呤(MTX)使用频率存在显著差异(缓慢进展组更高,P<0.05),其余临床特征无统计学差异。该研究设计通过纵向影像学定量评估,为后续机器学习模型建立提供了标准化的骨破坏进展分组依据。
2
.代谢物特征
所有患者在基线时都进行了血浆代谢物检测。在检测到的 774 种代谢物中,753 种被分为 15 个超类(图 A). 大多数代谢物属于脂质或脂质样分子 (450, 58.14%)。KEGG 分析显示脂质代谢、聚糖生物合成和代谢、氨基酸代谢和碳水化合物代谢富集。该分析还强调了细胞过程的富集,例如运输、分解代谢以及细胞生长和死亡(图 B).主成分分析 (PCA) 用于可视化组间代谢物特征。尽管某些样品存在一些聚集,但缓慢进展组和快速进展组在代谢物组成上表现出明显的差异。偏最小二乘判别分析 (PLS-DA) 产生了类似的结果。两组间共有 77 种代谢物存在显著差异。与缓慢进展组相比,快速进展组表现出 9 种代谢物的表达增加,而 68 种代谢物的表达降低(图 D, E) 的热图说明了这些变化。阿拉伯数字差异代谢物分为 7 个超类,其中大多数分为脂质或脂质样分子。3.基于 ML 算法的核心代谢物筛选
为了总结两组血浆代谢物的特征,我们旨在从总数据集中确定最关键的代谢物。首先,采用 LASSO 回归进行大规模变量选择,从 774 种代谢物中鉴定出 23 种代谢物(图 AB)。随后使用各种 ML 算法执行优化。将 23 种代谢物作为自变量输入到 9 个 ML 模型 (XGBoost、LightGBM、Random Forest、AdaBoost、Decision Tree、GBDT、GNB、MLP 和 SVM) 中。然后确定样本结局 。在这些模型中,随机森林在训练集中表现出最佳性能 ,而 GNB 在验证集中表现出最佳结果 。丢弃随机森林以降低潜在过拟合的风险,并且由于其稳定性而选择 GNB 进行后续分析(图 CD)。在 GNB 算法中使用 SHAP 方法计算 23 种代谢物的重要性值,确切值如条形图所示,并通过逐步前向选择和交叉验证找到 4 种核心代谢物的最佳组合(图 D)。3这些代谢物包括芒果酸 、O-乙酰左旋肉碱 、5,8,11-二十碳三烯酸 和 16-甲基庚烷酸。 与缓慢进展组相比,快速进展组的这四种代谢物水平较低,r 值表明与快速进展结局呈负相关。这种代谢物组合被输入到 GNB 算法模型中,该模型在训练、验证和测试集中显示出快速放射学进展风险结果的出色区分(图 F)。计算并报告四种核心代谢物的重要性值以供模型解释(图GH)。
。

4.代谢物与骨破坏进展的临床结果相关
四种核心代谢物用于计算总体代谢指数,称为标准化 BERS。两组患者的 BERS 值显示在箱形图中(图 A) 和差异分析显示,慢进展组的 BERS 水平更高 (P < 0.001)。我们探讨了 BERS 与骨破坏相关临床结局风险之间的联系。较高的 BERS 值与较低的影像学快速进展风险相关。
单变量回归结果表明 BERS 与影像学快速进展呈负相关 (OR = 0.01,95% CI = 0.01–0.03,P = 0.003)。 趋势测试发现第 3 个和第 4 个百分位数的患者风险降低。RCS 显示 BERS 与影像学快速进展的风险之间存在非线性关系,随着较高的 BERS 降低至中位范围,风险显著增加(图 C).

文章小结
该研究通过机器学习分析血浆代谢物,首次实现RA骨破坏的早期精准预测(AUC>0.9),并揭示色氨酸-Omega3代谢失衡的关键作用,为临床干预提供新靶点。
如果您对生信分析和公共数据库挖掘感兴趣,但时间和精力有限或者缺乏相关经验,小骨非常乐意为您提供如下服务:免费思路评估、付费方案设计和生信分析等,有意向的老师欢迎联系小骨哦!

96.2/Q1,实体瘤新“敌情”:肿瘤浸润性克隆性造血的“双刃剑”效应
8.5/Q1,瑞金医院刘东团队靠孟德尔随机化发文Sci子刊:减肥反而伤心脏?女性护心关键在肌肉不在脂肪
27.4/Q1,膝关节软骨退变的“元凶”:多组学整合揭示骨关节炎关键细胞群
9.4/Q1,上交大第六人民医院NHANES数据库+“孟德尔”揭秘维生素D与肌肉质量背后的因果关联