社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

接接接!双疾病共病模式+机器学习+SHAP拿下20分的柳叶刀子刊!阜外潘湘斌&基础所姜晶梅团队牛!

生信塔 • 6 天前 • 59 次点击  

共病模式的探讨一直是非常好的选题,其研究手段也是多种多样,有利用生信方法从分子层面探讨的,有临床数据分析共病之间的关联性的,也有利用孟德尔随机化探讨因果关联的......

今天辛博分享一个利用GBD临床数据+机器学习+SHAP方法来探讨缺血性心脏病和缺血性卒中的共病模式的研究。该研究发表在LancetGlobalHealth(IF-=19.9)期刊上,是非常有含金量的一篇文章啦!而且该研究并没有追求使用最新数据,选题+分析守正出奇斩获高分!

是的没错,用GBD临床数据库也可以探讨共病模式,尤其是做心血管方向的小伙伴,GBD提供了非常全面的心血管相关数据,并且心血管的合并症有多种疾病类型,简直是为我们量身打造的!当然不同于传统的共病模式探讨,GBD的数据决定了我们的讨论方向不能向机制方面走,从空间视角 更适配。当然,除了心血管疾病之间的共病模式,还可以探讨其他疾病类型,只要能获得数据支撑我们都可以做!

(GBD2023数据就要更新了,对GBD临床数据挖掘分析感兴趣的小伙伴快准备起来吧!如果有学习需求可以来了解下我们的GBD课程或培训班,还有服务器等你来使用哦!对共病选题感兴趣的小伙伴,也可以滴滴生信塔,方案设计or个性化分析助力您拿下SCI!

图片

研究背景

缺血性心脏病(IHD)和缺血性中风是全球主要死因,多数研究孤立探讨二者,缺乏全球范围共病研究,本研究旨在从空间视角分析其共病模式与风险因素。

研究方法

从GBD2019数据库提取203个国家和地区25岁及以上人群的疾病发病率和68个风险因素暴露率。依据发病率四分位数划分共病模式区域,经三步筛选确定风险因素,用负二项回归计算相关指标评估疾病负担。

数据来源

GBD2019数据库:提供了203个国家和地区25岁及以上人群的缺血性心脏病(IHD)和缺血性中风发病率数据,以及68个详细风险因素的暴露率数据。该数据库涵盖全球369种疾病、87种风险因素在不同年龄、性别、地区和时间段的疾病负担、发展趋势及风险评估信息。

ArcGIS世界矢量地图集:提供不同国家和地区的政治、经济层面信息,用于与疾病发病率和风险因素暴露数据进行空间匹配,以国家或地区作为基本分析单位,确定了203个国家和地区为研究区域,排除了托克劳群岛(Tokelau)。

研究结果

全球IHD的发病率显著高于缺血性中风。IHD和缺血性中风发病率在四分位数水平上的总体空间分布表现出高度相似性,其特征为北半球和东半球的发病率较高,南半球和西半球的发病率较低,IHD和缺血性中风发病率的空间分布有明显重叠。

其中两疾病一致区域覆盖范围最广,包括203个国家和地区中的89个(43.84%)。IHD主导区(203个国家和地区中的59个,占29.06%)和缺血性中风主导区(203个国家和地区中的55个,占27.09%)所涵盖的国家数量大致相等。 两种疾病发病率最高的国家和地区主要位于欧洲和北非。相反,发病率最低的国家和地区大多位于中非和南美洲。

IHD主导区主要位于北美、大洋洲、西欧和西南亚的国家。澳大利亚,IHD的发病率处于全球最高水平,而缺血性中风的发病率处于中低水平。然而,缺血性中风主导区主要位于东亚、南亚、南部非洲和南美洲的国家。在巴西,缺血性中风的发病率处于中高水平,而IHD的发病率处于最低水平。

图片

图1缺血性心脏病(IHD)发病率的全球分布(A)、缺血性中风发病率的全球分布(B),以及缺血性心脏病和缺血性中风发病率的共病特征(C)

使用Shapley可加性解释(SHAP)方法研究了38个可能影响IHD和缺血性中风发病率的候选风险因素(图2)。对IHD和缺血性中风都选取了前15个具有正向影响的变量进行进一步分析,以确保变量数量充足且筛选标准一致。最终,确定影响IHD的9个因素为:高体重指数(BMI)、低温、肾功能障碍、全谷物摄入不足、体力活动少、反式脂肪酸摄入高、加工肉类摄入高、收缩压高(SBP)和豆类摄入少。影响缺血性中风的8个因素为:肾功能障碍、吸烟、收缩压高、高钠饮食、低温、二手烟、低密度脂蛋白胆固醇高和高BMI。

图片

图2缺血性心脏病(A)和缺血性中风(B)的Shapley可加性解释(SHAP)汇总图

在控制其他因素后,通过建模确定了9个有显著影响的风险因素,其中包括IHD和缺血性中风的3个共同风险因素、IHD的3个特定风险因素以及缺血性中风的3个特定风险因素(图3)。三个共同风险因素是收缩压高、肾功能障碍和低温 肾功能障碍对IHD的影响最大,肾功能障碍暴露每增加1个标准差,IHD的发病率就会增加19%。同样,收缩压高对缺血性中风有显著影响。显著影响IHD的三个特定风险因素包括全谷物摄入不足、反式脂肪酸摄入高和加工肉类摄入高其中加工肉类摄入高的影响最大。对于缺血性中风,三个显著因素包括高钠饮食、吸烟和二手烟,其中吸烟的影响最大

图片

图3影响缺血性心脏病(A)和缺血性中风(B)的风险因素的相对风险(RR)及95%置信区间

就共同风险因素的空间分布特征而言, 收缩压高和肾功能障碍表现出高度相似性(图4)。东半球国家的暴露率高于西半球国家,尤其是位于欧亚大陆北部的国家,如俄罗斯和中国,它们的分布在很大程度上重叠。低温暴露主要涉及北半球的地区,包括加拿大、美国、俄罗斯和哈萨克斯坦。

IHD特定风险因素的空间分布主要反映了饮食模式(图4)。全谷物摄入最缺乏的地区从北非延伸到西亚。反式脂肪酸暴露率最高的地区横跨美洲大陆,并延伸到亚洲和大洋洲。豆类摄入少的情况在欧亚大陆北部最为普遍,暴露率超过80%,在蒙古甚至达到99.99%。缺血性中风的特定风险因素主要涉及行为特征,包括高钠饮食和吸烟的分布,主要集中在中国、美国、阿根廷、印度尼西亚和俄罗斯的寒冷地区中国的高钠暴露率超过30%,中国、美国、阿根廷、印度尼西亚和俄罗斯的吸烟率超过10%。二手烟暴露集中在中国、格陵兰、埃及、阿尔及利亚和利比亚,暴露率超过40%。这些国家的吸烟和高钠暴露在空间上表现出显著的相似性,斯皮尔曼相关系数高达0.41。吸烟和二手烟之间的相关系数为0.36。

图片

图4九种风险因素的全球分布

基于9个风险因素的四分位数建立的复合风险指数范围为0到27。数值越高表明综合暴露越严重,IHD和缺血性中风的风险越高。风险指数最高的地区相对集中,主要在东欧以及东亚和北亚。风险指数最低的地区也相对集中,主要在中非和南非以及南美洲的部分地区。这种分布模式与IHD和缺血性中风发病率的空间分布紧密匹配,再次表明这两种疾病的发病率与多种风险因素的综合影响有关

在203个国家和地区中,风险指数的总体频率接近正态分布,最常见的值是14。有四个国家的风险指数最低,为2,这表明这些国家的风险因素综合暴露水平最低。格鲁吉亚的风险指数最高,为25。

图片

图5基于九种风险因素的综合风险指数的四分位数水平全球分布(A)和频率分布(B)

总结

20分的柳叶刀子刊就这样凭借 GBD2019数据+双疾病共病模式探讨拿下了,这么新颖的选题,这么高性价比的思路和分析怎么能不学? GBD天然适合心血管研究方向的临床医生,如果还不学习or挖掘就亏大啦!想不费力的发高分文章就来找生信塔!如需相关课程或培训班也可以来了解下,入股不亏!

生信塔有话说


生信塔公众号持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐,快来查看吧!想复现这种思路或者定制更多创新性思路欢迎直接call生信塔,我们团队竭诚为您的科研助力!


文献思路复现

定制生信分析

生信服务器

 往期 · 推荐 

IF 16.7!高质量、综合GBD数据库炸裂登场!武大中南医院&湖北医科大襄阳医院携手,3图3表拿下高分,简直美滋滋~

十投九中+纯生信友好=神刊!复旦肿瘤医院李大卫团队2区6分模板文,单细胞数据挖掘+乳酸化修饰,科研人错过血亏!

11种机器学习“飞”上1区Top,诺奖热点不容错过!苏州大学李艳红团队,预后模型这波操作太燃了!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/183729
 
59 次点击