社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

4+共病+机器学习+PPI+药物预测+分子对接,内容丰富简单,想做共病思路的可作为模版!!

生信分析手册 • 3 月前 • 105 次点击  

导语

今天给同学们分享一篇生信文章“ Exploring the association between osteoporosis and kidney stones: a clinical to mechanistic translational study based on big data and bioinformatics ”,这篇文章发表在Biol Direct 期刊上,影响因子为4.9 。

结果:

研究对象的肾结石人口特征
共有 13,357 名患者参与了这项研究。男性骨质疏松的诊断标准定义为:股骨颈(FN)骨密度(BMD)低于 0.609 g/cm2 ,腰椎 L1 BMD 低于 0.692 g/cm 2 ,L2 BMD 低于 0.756 g/cm 2 ,L3 BMD 低于 0.759 g/cm 2 ,以及 L4 BMD 低于 0.754 g/cm 2 。男性股骨颈和 L1-L4 腰椎骨量减少的诊断标准分别为:0.609–0.825 g/cm 2 ,0.692–0.876 g/cm 2 ,0.756–0.946 g/cm 2 ,0.759–0.952 g/cm 2 ,以及 0.754–0.944 g/cm 2 。女性骨质疏松的诊断标准为:股骨颈 BMD 低于 0.551 g/cm 2 ,L1 BMD 低于 0.640 g/cm 2 ,L2 BMD 低于 0.744 g/cm 2 ,L3 BMD 低于 0.783 g/cm 2 ,以及 L4 BMD 低于 0.784 g/cm 2 。女性股骨颈和 L1-L4 腰椎骨量减少的诊断标准分别为:0.551–0.756 g/cm 2 ,0.640–0.832 g/cm 2 ,0.744–0.936 g/cm 2 ,0.783–0.973 g/cm 2 ,以及 0.784–0.965 g/cm 2 (表 1 )。表 2 展示了研究参与者的临床和实验室特征。参与者被分为两组:1,243 名患有肾结石的患者和 12,114 名没有肾结石的患者。 与没有肾结石的人群相比,肾结石组的个体年龄更大,主要为男性,且为非西班牙裔白人。此外,他们受教育程度较低,吸烟和饮酒率较高,糖尿病和高血压的患病率也更高。

在 NHANES 中,骨质疏松症/骨量减少与 KSD 的观察性关联
单变量分析显示,与无肾结石的患者相比,肾结石患者的股骨颈骨矿密度(BMD)较低(0.78 ± 0.14 vs. 0.81 ± 0.16),骨量减少的患病率更高(54.7% vs. 48.5%),以及骨质疏松症的患病率更高(10.4% vs. 8.5%)。然而,在 L1-L4 腰椎 BMD 方面,两组之间未观察到显著差异。按性别分层后,作者发现女性患者中肾结石组的腰椎 BMD 较低。方差膨胀因子(VIF)分析显示,除骨矿密度数据外,其余协变量之间不存在显著的共线性。因此,作者深入研究了不同解剖部位骨矿密度同时与肾结石发生率之间的相关性。随后的多因素分析确定了 BMD 与肾结石患病率之间存在显著的负相关关系。特别是,骨量减少和骨质疏松症患者的肾结石发生风险更高。 在模型 3 中,校正了所有协变量后,股骨颈骨密度(OR = 0.35;95% CI = 0.18–0.68,P = 0.002)、L1 骨密度(OR = 0.43;95% CI = 0.25–0.74,P = 0.002)、L2 骨密度(OR = 0.47;95% CI = 0.28–0.78,P = 0.004)、L3 骨密度(OR = 0.49;95% CI = 0.30–0.80,P = 0.005)和 L4 骨密度(OR = 0.48;95% CI = 0.29–0.78,P = 0.003)均与肾结石风险呈负相关。骨量减少患者肾结石的患病率更高(OR = 1.24;95% CI = 1.08–1.43,P = 0.002),骨质疏松症患者肾结石的患病率也更高(OR = 1.41;95% CI = 1.11–1.79,P = 0.005)。

使用限制性三次样条图来评估骨矿物质密度(BMD)与肾结石风险之间的剂量反应关系。作者的分析揭示 BMD 与肾结石风险之间存在显著负相关。这种关联在按性别分层时保持一致。在女性组中,股骨颈(FN)BMD、L2 BMD 和 L4 BMD 与肾结石风险呈线性负相关,而在男性组和整个人群中观察到非线性负相关(图 2 )。


BMD 与肾结石之间的剂量-反应关系分析。BMD 与肾结石关联的受限三次样条图。RCS 回归分析时调整了年龄、种族、性别、婚姻状况、教育程度、吸烟状况、饮酒状况、高血压、糖尿病、维生素 D、钙、磷和镁等因素(模型 3)。蓝色实线代表比值比(OR),蓝色阴影区域代表 95%置信区间(CI)。P 值表示模型与观测数据之间差异的显著性程度。P 值越小,差异越显著。P 非线性值反映了数据中是否存在非线性关系。如果 P 非线性值较小,则表明可能存在非线性关系。 在所有参与者中,股骨颈骨密度(FN BMD)与肾结石患病率呈非线性负相关(P 值≤0.001,P 非线性=0.013),腰椎 1 骨密度(L1 BMD)与肾结石患病率呈非线性负相关(P 值≤0.001,P 非线性≤0.001),腰椎 2 骨密度(L2 BMD)与肾结石患病率呈线性负相关(P 值=0.018,P 非线性=0.164),腰椎 3 骨密度(L3 BMD)与肾结石患病率呈线性负相关(P 值=0.013,P 非线性=0.085),腰椎 4 骨密度(L4 BMD)与肾结石患病率呈非线性负相关(P 值=0.002,P 非线性=0.021)。在男性群体中,股骨颈骨密度与肾结石患病率呈非线性负相关(P 值=0.004,P 非线性=0.031),腰椎 1 骨密度呈非线性负相关(P 值≤0.001,P 非线性≤0.001),腰椎 2 骨密度呈线性负相关(P 值=0.017,P 非线性=0.075),腰椎 3 骨密度呈非线性负相关(P 值=0.002,P 非线性=0.015),腰椎 4 骨密度呈非线性负相关(P 值=0.004,P 非线性=0.011)。在女性群体中,股骨颈骨密度与肾结石患病率呈线性负相关(P 值=0.026,P 非线性=0.731),腰椎 1 骨密度呈非线性负相关(P 值=0.001,P 非线性=0.003),腰椎 2 骨密度呈线性负相关(P 值=0.063,P 非线性=0.699),腰椎 3 骨密度呈线性负相关(P 值=0.075,P 非线性=0.137),腰椎 4 骨密度与肾结石患病率呈线性负相关(P 值=0.017,P 非线性=0.996)。

KSD 和 OP 中差异表达基因(DEGs)的鉴定
在标准化所需数据集后,作者在 KSD 数据集中鉴定出 1651 个差异表达基因( GSE73680 ),其中包括 1548 个上调基因和 103 个下调基因。类似地,在 OP 数据集中也鉴定出 1651 个差异表达基因( GSE56815 ),包含 840 个上调基因和 811 个下调基因。火山图和热图分析揭示了 KSD 和 OP 数据集中基因的差异表达模式(图 3 A-D)。进一步的交集分析鉴定出 14 个共表达基因,包括 9 个共同上调基因(WNT1、BTN2A1、MPZ、ACTN2、KLK3、ONECUT2、CRB1、ATMIN、CHI3L1)和 5 个共同下调基因(FLNA、RECK、KANK2、RAMP1、ACTA2)(图 3 E-F)。作者采用两种机器学习算法 Lasso 和 Boruta 来鉴定最关键的核心基因,最终确定 WNT1 是 KSD 和 OP 的关键基因(图 4 A-G)。


差异基因表达分析。A 火山图描绘了GSE73680 中的差异表达基因(DEGs)。B 热图展示了对应 DEGs 在 GSE73680 的表达模式。C 火山图描绘了 GSE56815 中的 DEGs。D 热图展示了对应 DEGs 在 GSE56815 的表达模式。E GSE73680 和 GSE56815 中的共上调基因。F GSE73680 和 GSE56815 中的共下调基因。


使用机器学习算法进行识别。A 使用 Lasso 回归筛选GSE73680 的关键基因,曲线最低点处最佳基因数量(n = 7)。B-C 使用 Boruta 算法筛选核心基因,共筛选出 2 个基因。D 使用 Lasso 回归筛选 GSE56815 的关键基因,曲线最低点处最佳基因数量(n = 10)。E–F 使用 Boruta 算法筛选核心基因,共筛选出 9 个基因。G 两种算法识别出的共同基因

从两个公共数据库分析共同基因靶点
为了整合现有的生物数据,作者使用"骨质疏松/骨量减少"和"肾结石"作为关键词,在 CTD 和 GeneCards 数据库中搜索相关基因。然后,作者使用维恩图结合这些数据库中的骨质疏松/骨量减少和肾结石相关基因,识别出 267 个共同基因靶点,表明骨质疏松/骨量减少和肾结石之间存在显著交集(图 5 A-B)。随后,作者使用 Cytoscape 中的 Centiscape 2.2 插件进行核心靶点筛选,联合分析了 MCC、MNC、Radiality、Stress、BottleNeck 和 EcCentricity 算法。这种方法识别出 AKT1 和 TNF 是最突出的核心靶点(图 5 C-I)。这些靶点连同先前机器学习分析中识别的核心基因,随后用于药物预测。


基于公共数据库筛选了共享基因。A CTD 和 GeneCards 分析中常见靶点和基因的相互作用 Venn 图。B 常见靶点的 PPI 网络和聚类分析。C-H 依次通过 MCC、MNC、Radiality、Stress、BottleNeck 和 EcCentricity 算法计算得出前 10 个核心基因。I 对获得的靶点进行综合分析。

 基于 GeneMANIA 的功能关联
使用 GeneMANIA 构建的蛋白质-蛋白质相互作用(PPI)网络,除了作者确定的三个核心靶点外,还包括了另外 20 个可能与其相互作用的基因(图 6 A)。这些相互作用包括物理相互作用(77.64%)、共表达(8.01%)以及其他类型。网络的功能分析突出了药物靶点和相关基因的作用及其功能。结果揭示了与外源性凋亡信号通路和炎症反应调节的相关性,显示了免疫与炎症之间的强功能联系,这与骨质疏松和肾结石的发病机制一致。GMFA 方法整合了共表达、遗传相互作用和物理相互作用,以捕获与疾病相关的广泛基因[ 14 ]。在随后的 KEGG 富集分析中,GMFA 将 mTOR 信号通路确定为共享机制中最显著的通路(图 6 B)。


GeneMANIA 功能关联(GMFA)网络分析。使用 GeneMANIA 构建的蛋白质相互作用(PPI)网络。每个圆圈的颜色表示每个基因所参与的功能通路。B KEGG 富集分析

 免疫细胞浸润分析
为研究阿尔茨海默病(AD)和强直性脊柱炎(AS)的发病机制,作者检测了患者组织中的免疫细胞浸润模式。利用 CIBERSORT 算法,作者获得了不同免疫细胞类型的浸润评分。 GSE73680 数据集的分析显示,与正常组相比,KSD 组的静息树突状细胞和 M1 巨噬细胞的浸润显著升高,而静息肥大细胞的浸润显著降低(图 7 A-C)。相反,检测单核细胞的 OP 数据集显示,正常组与骨质疏松组之间的免疫细胞浸润无显著差异,进一步证实了作者研究的可靠性(图 7 D-F)。


KSD 和 OP 的免疫细胞浸润分析。A-C 使用 CIBERSORT 算法分析GSE73680 中各种免疫细胞浸润的比例。D-F 使用 CIBERSORT 算法分析 GSE56815 中各种免疫细胞浸润的比例。

候选药物预测
在本研究中,作者采用 DSigDB 来预测潜在的干预措施。基于作者的筛选结果和文献综述,作者确定了九种可能为替代疗法提供潜力的药物。这些包括但不限于贝替宁、薯蓣皂苷、夹竹桃碱、槲皮素、鞘磷酰基、鹅掌楸碱、芳樟醇、西洛他唑和橙皮苷(表 4 )。这些药物大多具有抗炎、抗氧化和激素调节特性,这与骨质疏松症和肾结石的发病机制及其共病相一致。

分子对接
为评估药物候选物与其靶标的亲和力并评估这些靶标的可成药性,本研究进行了分子对接。使用 CB-Dock2 平台识别了九种药物候选物与其相应靶标蛋白的结合位点及相互作用。对于每种相互作用,作者计算了结合能,最终在蛋白质与药物之间获得了 18 个成功的对接结果(图 8 A-R  )。在该分析中,作者发现小檗碱与 AKT1 结合最为稳定,西洛他唑也稳定地与 AKT1 结合,而薯蓣皂苷则稳定地与 TNF 结合,其结合能分别为−10 kcal/mol、−10.7 kcal/mol 和−10.2 kcal/mol。


现有蛋白质小分子的对接结果。A AKT1 对接 butein。B TNF 对接 butein。C AKT1 对接 cilostazol。D TNF 对接 cilostazol。E AKT1 对接 diosgenin。F TNF 对接 diosgenin。G AKT1 对接 evodiamine。H TNF 对接 evodiamine。I AKT1 对接 garcinol。J TNF 对接 garcinol garcinol。K AKT1 对接 linalool。L WNT1 对接 linalool。M AKT1 对接 naringenin。N TNF 对接 naringenin。O AKT1 对接 sphingosine 1-phosphate。P TNF 对接 sphingosine 1-phosphate。Q AKT1 对接 tylophorine。R TNF 对接 tylophorine。


总结

骨丢失与肾结石风险增加相关。靶向 mTOR 信号通路可能为治疗骨质疏松和肾结石提供一种潜在的治疗方法。 。对这篇文章感兴趣的老师,欢迎扫码咨询!


往期推荐

                                                                                                                      


纯生信选刊


• 纯生信文章的春天!

• 选刊正确=成功发表!


非肿瘤生信


• 6+非肿瘤代谢思路

• 非肿瘤联合铁死亡生信思路


预后模型


• 7+乳酸相关预后模型

• m7G甲基化+肿瘤生信思路


单基因生信


• 8+单基因干湿结合生信思路

• 单基因突变和淋巴结转移


单细胞系列


• 7+的脂肪细胞+单细胞测序

• 单细胞+Bulk seq生信思路

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184123