5.7/Q2，有数据不知道怎么发文？来看这篇机器学习做模型，切入点有效原来好的推拿真能“治病”，轻松拿下5分

如果您对骨科疾病生信临床研究感兴趣，请为小骨点点关注，持续解读骨科前沿生信文献和思路。如果您需要定制化服务，欢迎扫码联系小骨~

还在担心骨科发文没思路，不如来看这篇机器学习的文章，或许对各位老师寻找研究方向有一点帮助哦，下面一起来看本文的研究亮点吧

海量数据不好处理，不如运用机器学习技术，从海量临床数据中挖掘关键特征，构建预测模型。与传统统计方法相比，机器学习能够自动学习数据中的复杂模式和非线性关系，从而更精准地预测颈痛患者对脊椎手法治疗的获益情况。此外，本研究在数据收集和处理过程中，采用了严格的质量控制标准，确保了数据的准确性和可靠性，为模型的有效性奠定了坚实基础。高效且精准的筛查工具经过严格的验证，该快速筛查工具展现出了卓越的性能。它能够在短时间内对大量患者进行评估，快速筛选出可能从脊椎手法治疗中获益的个体，极大地提高了临床工作效率。如果各位老师想借用单位现有数据发文不如参考这篇。

担心自己处理不了数据，需要机器学习技术的老师可扫码联系小骨哦🌟🌟

下面让我们一起来看看具体文章内容吧！

文章标题：Development and validation of a quick screening tool for predicting neck pain patients benefiting from spinal manipulation: a machine learning study

中文标题：开发和验证用于预测受益于脊柱推拿的颈部疼痛患者的快速筛查工具：一项机器学习研究

发表期刊：Chin Med

发表时间：2025年5月

影响因子：5.7/Q2

研究背景

颈痛（NP）是全世界残疾多年的主要原因之一。虽然脊柱手法是一种常见的物理治疗干预NP，其可变的病人反应和固有的风险需要谨慎的病人选择。本研究旨在开发和验证一个基于机器学习的预测模型，以确定NP患者最有可能从脊柱手法中获益。

研究方法

这项多中心研究分析了回顾性队列中的623名NP患者和来自单独医院的319名患者进行外部验证，数据收集于2020年5月至2024年11月。治疗成功为脊柱推拿两周后，数值评分量表（NRS）降低≥50％，颈部残疾指数（NDI）降低≥30％。通过密度图比较了数据填充方法，并进行了δ调整灵敏度分析。然后采用Boruta算法和LASSO回归从40个初始特征中选择相关预测器，并对Boruta-selection、LASSO-selection、contrue和union四个特征子集进行评价，确定最优组合。使用内部验证（70％训练，30％测试）和外部验证对9种机器学习算法进行了测试。性能指标包括接收者工作特征曲线（AUC）下面积、准确性、F1评分、敏感性、特异性和预测值。SHAP框架增强了模型的可解释性。Youden指数被用于确定临床决策支持的最佳预测概率阈值，并开发了一个基于web的应用用于临床实施。

研究结果

1.人口和基线特征

这是一项回顾性队列研究，数据来自中国中医科学院望京医院颈痛数据库。数据库中的数据是匿名的，不需要患者同意就可以纳入研究。共有623名患者纳入最终分析，其中335名（53.8％）在SMT（Surface-mount Technology，表面安装技术）干预后被归类为高获益患者，288名（46.2％）被归类为低获益患者。包括40项功能）。

2.特征选择

为了确定NP患者SM获益的最佳预测因子，我们采用了结合LASSO回归和Boruta算法的双方法特征选择方法，然后对不同特征子集进行综合性能评估。套索回归交叉验证过程图B）确定了最佳正则化参数λ1se为0.057，表示最小均方误差（λmin=0.021）的一个标准误差内的最大λ。系数路径图。图C）说明跨越不同λ值的序列变量消除过程，说明所选特征的稳定性和重要性。Boruta算法，如图。通过与随机置换阴影特征的比较，评价特征重要性。特征根据其相对重要性得分（Z-score）分为选择（蓝色）或拒绝（红色）。

3.模型开发和性能比较

在识别出9个特征的基础上，采用10 ML算法建立模型。其中，MLP的性能最好，测试AUC为0.823（95％CI:0.750，0.874），其次是RF，AUC为0.806（图1A）。此外，MLP在训练和测试AUC之间表现出最小的差异（训练AUC=0.829），表明具有良好的泛化能力。相比之下，KNN表现出一些过度拟合。LGBM、XGB、Bagging和DT也表现出不同程度的过拟合（图2)。在精度-召回（PR）曲线分析中，MLP继续表现出最佳性能，实现了最高的平均精度（AP=0.823），其次是GNB(AP=0.804)和LGBM(AP=0.797)（图1B）。决策曲线分析（DCA），以评估不同阈值概率模型的临床效用。结果表明，MLP和LGBM的净效益始终最高，提示其在临床决策中具有优越的实用价值（图1C）。校准曲线被用来评价预测概率的可靠性。MLP和RF都显示校准曲线与理想对角线紧密对齐，表明概率估计准确，Brier得分分别为0.171和0.181，反映了最佳校准性能图1D）。

九种机器学习模型预测颈痛患者脊柱手法获益的性能评估和临床应用。一个ROC曲线的前六个模型，AUC值报告的验证集；B前六名车型的PR曲线；C前六名车型的DCA。D显示了9个模型的校准曲线，Brier分数表示概率估计的准确性

预测NP患者MT获益的模型性能和校正。说明了9 ML模型的ROC曲线，并计算了训练和验证数据集的AUC值

4.模型解释

根据SHAP特征重要性排序，最有影响的特征依次为：症状持续时间、旋转、屈曲加重、年龄、伸直、肌肉紧绷、弹簧试验-疼痛和屈曲加重。在全局解释中，我们使用了SHAP热图图A）和简要示意图（图B）说明这些特征的平均贡献，强调那些对模型预测影响最大的特征。SHAP依赖性图C进一步演示每个特征值和模型预测输出之间的关系。为了演示SHAP输出对治疗决策的贡献，我们使用SHAP力图和瀑布图可视化了模型对高效益和低效益组的解释。具体来说，这些图显示了每个特征对特定样本预测结果的贡献。每个特征的影响用红色条形表示正贡献，蓝色条形表示负贡献，条形的长度表示其各自影响的大小。高效益患者图D）症状持续时间、屈曲和旋转等关键特征对预测有积极作用，而对于低效益患者（图E）年龄、症状持续时间等特征对治疗结果有负面影响。

文章小结

该研究的机器学习模型在颈痛患者中确定脊柱操作的合适人选方面表现强劲，为临床医生提供了一个循证实用工具，以优化患者选择并潜在改善治疗结果。

如果您对生信分析和公共数据库挖掘感兴趣，但时间和精力有限或者缺乏相关经验，小骨非常乐意为您提供如下服务：免费思路评估、付费方案设计和生信分析等，有意向的老师欢迎联系小骨哦！

往期推荐标题框动态分割线素材-花瓣网

6.1/Q1，糖尿病药物再显神通：二甲双胍或可延缓肌肉衰老

14.1/Q1，“单细胞”怎么发Adv Sci，来看北大第一医院是如何操作的探究维C 如何抑制肾癌的骨转移

10.2/Q1，多组学整合+AI预测：双热点进行糖尿病骨病靶点挖掘与纳米酶治疗响应的生信解码

14.3/Q1，综述性文章也能拿高分，来看肌肉骨骼疾病的多组学探索：从细胞异质性到空间组织的深度剖析

8.5/Q1，瑞金医院刘东团队靠孟德尔随机化发文Sci子刊：减肥反而伤心脏？女性护心关键在肌肉不在脂肪

27.4/Q1，膝关节软骨退变的“元凶”：多组学整合揭示骨关节炎关键细胞群

9.4/Q1，上交大第六人民医院NHANES数据库＋“孟德尔”揭秘维生素D与肌肉质量背后的因果关联