社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

文献详解丨16+文章教你如何用机器学习挖掘2型糖尿病特征

i生信 • 4 年前 • 691 次点击  

文献解读

今天给大家分享的是2020年12月7日西湖大学郑钜圣团队在Diabetes Care(IF: 16.019)杂志上发表的论文。作者利用可解释的机器学习框架筛选出与2型糖尿病相关的21个特征,由其中14个核心微生物特征组成的微生物组风险评分(MRS不仅能有效预测2型糖尿病的发病风险,还与未来血糖增加呈现正相关,而且与肠道微生物来源的血液代谢物有关联。作者还利用粪便微生物移植动物实验证明了MRS与2型糖尿病之间的关系,最终还发现体脂分布是调节肠道菌群和2型糖尿病的关键因素该论文是典型的数据挖掘,再加上丰富的实验验证,内容充实,结构严谨,再充分运用机器学习手段深入研究输入特征和疾病之间的关系,开发一个可以准确预测疾病发病风险的模型,算是数据挖掘类文章常用的套路,值得我们深入学习和体会。特此分享给大家,如有不足之处请批评指正。





研究背景

2型糖尿病是一种受宿主遗传环境因素影响的复杂疾病,无论发达国家还是发展中国家它的患病率都在迅速上升。其中肠道微生物组被认为是一种可调节的环境因素,在2型糖尿病的发展过程中起着重要作用,因此最近的研究兴趣聚焦于对肠道微生物群相关的治疗和预防靶点的鉴定。虽然过去几年有研究者已经探索过肠道微生物组与2型糖尿病的关系,但其结果并不一致。到目前为止很少有证据真正将特定肠道微生物组学特征与2型糖尿病联系起来。
尽管近年来机器学习在生物医学领域得到了广泛的应用,但是它在临床上的应用仍然有限,因为它的预测往往很难解释。值得注意的是随着近几年方法学的发展,可解释的算法可以很好地解释机器学习算法中传统的“黑匣子”。新算法与大规模肠道菌群数据的结合有可能从根本上揭示肠道菌群与2型糖尿病之间的关系,但是还没有这样的研究报道过。因此,本文的目的旨在大规模人群中使用可解释的机器学习分析框架来识别与2型糖尿病相关的人类肠道微生物群特征,进一步评估这些微生物与宿主血液代谢物之间的相关性,以深入了解2型糖尿病相关肠道微生物群在宿主代谢中的作用第二个目的是利用这些纵向队列数据确定可能改变2型糖尿病与相关肠道微生物组关系的潜在肥胖、饮食和生活方式因素。



数据与方法流程

三个研究队列的具体特征如图1所示

本研究的工作流程概述如下图所示


结果展示

1.识别的微生物组合与2型糖尿病风险
作者利用LightGBM(Light Gradient Boosting Machine)确定了21个有助于2型糖尿病预测的特征,其中15个是微生物组学特征(unweighted_nmds6 and observed_species是微生物多样性的指标,其他则是分类相关特征)。这21个特征跟297个全部的输入特征相比显示出相似的预测能力,并且所选的大部分特征之间具有低到中等的相互关系。作者还发现LightGBM在预测2型糖尿病方面优于logistic回归随机森林算法。
这些选定的微生物特征比宿主基因和其他环境因素(FraminghamOffspring Risk Score (FORS) + lifestyle + diet)显示出更高的2型糖尿病预测准确性(图1A)。将选定的微生物组特征添加到模型(FORS + lifestyle + diet)中,在内部验证队列(P = 0.0024)中曲线下面积从0.63(95% CI 0.55–0.71)增加到0.73(95% CI 0.66–0.8),在内部测试队列(P = 0.016)中曲线下面积从0.66(95% CI 0.57–0.76)增加到0.73(95% CI 0.65–0.82),在外部验证队列1(P = 0.0036)中从0.51(95% CI 0.45–0.57)增加到0.64(95% CI 0.56–0.71)。在发现队列(p = 0.49)和验证队列1(p = 0.14)中,排除糖尿病前期患者前后基于微生物组的分类器的预测性能没有显著差异。


为了估计2型糖尿病发展过程的个体微生物风险,根据14个识别出的微生物群特征(表2)生成了MRS(microbiome risk score)。在发现队列(RR (risk ratio) 1.28,95% CI 1.23–1.33)、外部验证队列1(RR 1.23,95% CI 1.13–1.34)和外部验证队列2(RR 1.12,95% CI 1.06–1.18)中,MRS(MRS的每1个单位变化)始终与2型糖尿病风险呈正相关(图1B)。作者还发现基于发现队列(包括159例2型糖尿病患者)中1068个鸟枪式宏基因组样本的数据,MRS与2型糖尿病的关联可以被重复。与16S rRNA结果一致,基于元基因组的MRS始终显示与2型糖尿病风险呈正相关(新MRS的每单位变化:RR 1.33,95% CI 1.17–1.51)(图1B)。然而基于传统方法得出的MRS结果无法在两个外部队列中得到验证。


2.识别的微生物组合与血糖增加

作者对空腹血糖正常(空腹血糖 < 7 mmol/L)的249名参与者进行了前瞻性调查。本组参与者的起始终末血糖平均值分别为5.2(0.5)mmol/L和5.4(0.6)mmol/L。其结果显示在两个统计模型中,MRS与未来血糖增加显著正相关(P < 0.05)(图1C)。


3.识别的微生物组合与宿主血液代谢组学

我们对发现队列(N = 903)和外部验证队列1(N = 113)的血清样本进行了有针对性的代谢组学分析,并评估了与2型糖尿病相关的微生物组合(即MRS)与199种血清代谢物的相关性。作者发现MRS与发现队列和外部验证队列1中的六种代谢物有着一致相关性(图1D)。

MRS与2-苯基丙酸、氢化肉桂酸和吲哚-3-丙酸呈负相关,这些都与肠道微生物代谢有关。脱氧胆酸和甘氨脱氧胆酸是存在于结肠环境微生物菌群的酶作用产生的次级胆汁酸。最近的研究表明肠道微生物群的改变不仅会影响胆汁酸,而且会影响胆汁酸受体信号(即FXR和TGR5)。据报道FXR参与葡萄糖稳态、能量消耗和脂质代谢。这些观察提供了深入了解在宿主代谢中识别出的微生物特征的潜在功能机制


4.基线肥胖和饮食因素与2型糖尿病相关的微生物组

在发现队列的纵向分析中,基线BMI与MRS呈正相关,而臀围喝茶负相关(图2A)。

 
5.体型、肠道菌群与2型糖尿病的关系
肥胖 是2型糖尿病最重要的危险因素。在本研究中由于BMI和臀围与MRS密切相关,作者假设肠道菌群与2型糖尿病的关系可能受到肥胖状态的调节。在发现队列(β 0.007,95% CI 0.0037-0.011)和外部验证队列1(β 0.015,95% CI 0.0023-0.03)中,MRS(MRS每1个单位变化)与躯干-四肢脂肪比的分布呈正相关(P < 0.05)(图2B)。在发现队列(Pinteraction = 0.012)和外部验证队列1(Pinteraction = 0.037)中,还发现随着潜在的混杂因素的调整,MRS和躯干-四肢脂肪质量比对2型糖尿病风险有显著的交互作用(图2C)。在发现队列最低的MRS水平(MRS tertile 1)中2型糖尿病的校正RR(95% CI)为1(参考),1.83(0.86-3.88)和3.61(1.81-7.18)分别对应个体的躯干与四肢脂肪质量比的三分位数1、2和3。在最高的MRS三分位数中分别为4.5(2.21-9.17)、6.14(3.12-12.08)和11.79(6.28-22.16)。并且在外部验证队列1中发现了类似的相互作用结果(图2C)。



研究结论

在本研究中作者通过将可解释机器学习框架大规模人类队列研究相结合,确定了与2型糖尿病预测相关的肠道微生物的稳健组合。与宿主基因或传统风险因素相比,肠道微生物的组合显示出更高的2型糖尿病预测准确性。作者还利用肠道微生物特征构建了一个新的风险评分,并在另外两个独立的队列中成功重复了MRS-2型糖尿病的关联。然后作者发现MRS与一些肠道微生物群衍生的血液代谢物相关。粪便微生物群转移实验进一步证实了鉴定出的微生物组合对2型糖尿病发展的影响。最后还确定了可能调节2型糖尿病相关微生物组学特征的潜在调节因素,并证明身体脂肪分布可以改变MRS与2型糖尿病之间的关系。

参考文献:
Wanglong Gou, Chu-wen Ling, Yan He, Zengliang Jiang, Yuanqing Fu, Fengzhe Xu, Zelei Miao, Ting-yu Sun, Jie-sheng Lin, Hui-lian Zhu, Hongwei Zhou, Yu-ming Chen, Ju-Sheng Zheng, Interpretable Machine Learning Framework Reveals Robust Gut Microbiome Features Associated With Type 2 Diabetes, Diabetes Care, Dec 2020, dc201536; DOI: 10.2337/dc20-1536.


注:本推文未经许可禁止转载。

阅读推荐:


    Python社区是高质量的Python/Django开发社区
    本文地址:http://www.python88.com/topic/106486
     
    691 次点击