Py学习  »  机器学习算法

IF=6.1,NHANES+机器学习如何发高分?全新选题方向待挖掘!

挑圈联靠 • 8 月前 • 260 次点击  

欢迎来看雪球的生信套路!医学顶刊最近动作不少:JAMA宣布推出全新短篇综述系列,鼓励提交与肥胖、肥胖管理相关的所有文章类型。

未来文章可能涵盖的主题包括新兴甚至更有效的减肥药物、肥胖多模式管理等。怎么样?即使肥胖及相关慢病不是你的研究方向,不妨也来学习一下相通的思路。


今天看一篇使用机器学习方法评估化学物质与肥胖之间联系的文章:


Evaluating the relationship between environmental chemicals and obesity: Evidence from a machine learning perspective

评估环境化学物质与肥胖之间的关系:来自机器学习视角的证据


期刊:Ecotoxicology and Environmental Safety

IF:6.1

发布时间:2025/06/06


 技术路线 


数据收集与预处理:

从美国国家健康与营养调查(NHANES)2011-2012年的数据中,筛选出1183名符合条件的参与者,收集了环境化学物质暴露、人口统计学信息、肥胖评估指标等数据,并对数据进行了必要的预处理,如自然对数转换等。


特征选择:

通过弹性网络模型,结合10折交叉验证,选出了与总体肥胖和腹部肥胖最相关的前20种环境化学物质。


机器学习模型构建与评估:

构建了包括支持向量机(SVM)、随机森林(RF)、k-最近邻(KNN)、朴素贝叶斯(NB)、AdaBoost和XGBoost在内的六种机器学习模型。通过10折交叉验证和多种评估指标(如AUC、准确率、精确率、召回率、F1分数和Brier分数)对模型性能进行评估,发现SVM和XGBoost模型在预测总体肥胖方面表现最佳,SVM在预测腹部肥胖方面表现最佳。


SHAP分析:

通过SHAP分析,确定了对总体肥胖和腹部肥胖预测贡献最大的变量,如4-OH-PHEN、2-OH-NAP、2-OH-PHEN、UMo、3-OH-FLUO等,并展示了环境化学物质在模型中的重要性排名。


环境化学物质与肥胖的关联分析:

经多因素调整后,发现4-OH-PHEN、2-OH-NAP、2-OH-PHEN与总体肥胖呈显著正相关,UMo、3-OH-FLUO与总体肥胖呈显著负相关;4-OH-PHEN与腹部肥胖呈显著正相关,3-OH-FLUO、USr、BPb与腹部肥胖呈显著负相关。此外,通过剂量-反应关系分析发现UMo与肥胖之间存在非线性关系。


中介效应分析:

中介分析显示高密度脂蛋白(HDL)部分中介了2-OH-PHEN暴露与总体肥胖之间的正相关关系,以及3-OH-FLUO暴露与总体肥胖之间的负相关关系;总胆固醇(TC)部分中介了BPb暴露与腹部肥胖之间的负相关关系;甘油三酯(TG)部分中介了4-OH-PHEN暴露与腹部肥胖之间的正相关关系。



 研究结果 


Fig 1 六个机器学习模型预测全身性和腹部肥胖的性能评估


Fig 2 XGBoost模型的SHAP汇总图和SHAP值排名


Fig 3 SHAP值排名前五的环境化学物质与全身性肥胖和腹部肥胖的关联


Fig 4 全身性肥胖(A)和腹部肥胖(B)与SHAP值排名前五的环境化学物质的剂量反应关系图


Fig 5 脂质在环境化学物质与肥胖的关联中的中介作用



可以用免费工具进行课题调研,先人一步!







如果想深入挖掘临床公共数据库,既不用花时间精力额外收集数据,又能发表较优质的SCI;但又没有时间学习,达到能够独立分析的水平......怎么办?可以选择多种分段、多种套路组合的个性化服务!


搞不定选题,我们帮你出方案;

搞不定分析,我们帮你拿成果;

搞不定投稿返修,我们全流程陪跑......


雪球老师带队,已陪跑5000+科研项目,收到2500+客户报喜,值得信赖的团队,值得入场的优质个性化套路服务👇

 雪球的生信套路 每周周中讲解 

注意没有星标⭐的话

容易错过更新哦

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/185042