Py学习  »  机器学习算法

纯生信两月速发中科院二区!差异分析+WGCNA+PPI网络+机器学习,思路简单易复现

生信学霸 • 6 天前 • 40 次点击  

弥漫性大B细胞淋巴瘤(DLBCL)是成人中最常见的淋巴瘤类型,尽管联合免疫化疗(R-CHOP)方案能使部分患者实现长期缓解,但仍有患者复发或对治疗无反应。M2型巨噬细胞具有免疫抑制作用,在各种肿瘤的发生和进展中起着至关重要的作用。然而,M2巨噬细胞在DLBCL中的具体作用尚不明确。Biology Direct 上发表的新文章通过分析公共数据库数据,揭示了M2巨噬细胞相关基因在DLBCL中的关键作用,并筛选出SMAD3、IL7R、IL18、FAS和CD5五个基因作为潜在的诊断和预后生物标志物,为该疾病的诊疗提供了新方向。

标题:Identification of M2 macrophage-related genes associated with diffuse large B-cell lymphoma via bioinformatics and machine learning approaches

期刊:Biology Direct(IF 4.9)

出版商:BioMed Central

发表:2025年4月29日

DOI:https://doi.org/10.1186/s13062-025-00649-4

关键词:弥漫性大B细胞淋巴瘤 | M2巨噬细胞 | 免疫浸润 | 生物信息学 | 机器学习

技术手段:WGCNA、机器学习算法、蛋白互作网络构建、免疫浸润分析、生存分析等

核心思路:免疫细胞浸润分析比较两组免疫细胞浸润差异>>差异分析+WGCNA分析,筛选出与M2巨噬细胞相关的候选基因>>功能富集分析揭示其生物学功能和相关通路>>构建PPI网络并识别关键基因,进一步通过LASSO、SVM-RFE和RF算法筛选出具有诊断价值的基因>>基于7个特征基因构建逻辑回归模型和列线图,评估其诊断性能>>生存+预后分析,评估特征基因预后价值>>GSEA+GSVA分析,评估M2巨噬细胞浸润与DLBCL相关通路之间的关系


 材料与方法 

Materials and Methods

数据来源:从GEO数据库获取了DLBCL相关基因表达数据集和临床信息(GSE9327、GSE23647、GSE32018、GSE83632和GSE181063)。

数据预处理和差异分析:使用sva包消除批次效应,并通过limma包进行差异表达基因分析。

免疫细胞浸润分析:使用CIBERSORT算法预测免疫细胞浸润比例,并用R语言对结果进行可视化。

WGCNA分析:使用WGCNA包识别与M2巨噬细胞相关的基因模块。

蛋白互作(PPI)网络构建:利用STRING数据库和Cytoscape软件构建PPI网络,cytoHubba插件识别关键基因。

生物标志物识别和模型构建:结合LASSO、SVM-RFE和RF算法筛选诊断相关基因,并利用glm包基于七个生物标志物基因构建logistic回归模型。

生存分析和独立预后分析:使用survival和survminer包进行Kaplan-Meier生存分析;使用单因素Cox回归分析评估基因的预后价值。

GSEA:使用GSEA包分析M2巨噬细胞高表达组和低表达组之间的差异相关通路。

GSVA:使用GSVA包分析M2巨噬细胞浸润与DLBCL相关通路之间的关系。


 分析结果 

Results

DLBCL中DEGs的鉴定

目的:通过差异表达分析鉴定DLBCL中的DEGs。

结果:

1. 对GSE9327,GSE23647,GSE32018和GSE83632数据集进行批次效应处理,并用limma包进行了归一化;

2. PCA散点图展示了批次效应消除前后的基因表达数据变化,结果显示批次效应得到了有效消除(图 1A,B);

3. 差异分析显示,在合并数据集中共识别出77个差异表达基因(DEGs),包括42个上调基因和35个下调基因(图1C,D)。

图1


免疫浸润分析

目的:分析DLBCL与对照组之间的免疫微环境差异,特别是免疫细胞浸润的情况。

结果:

1. 根据免疫浸润分析结果,绘制了展示实验组和对照组中22个免疫细胞的免疫细胞浸润结果的条形图(图2A);

2. 实验组中记忆B淋巴细胞、初始CD4+T淋巴细胞、滤泡辅助T淋巴细胞、γδ T淋巴细胞、活化自然杀伤细胞、M1巨噬细胞、M2巨噬细胞和中性粒细胞的比例高于对照组(图2B);

3. 相反,初始B淋巴细胞、CD8+T淋巴细胞、静息CD4+记忆T淋巴细胞、调节性T淋巴细胞、静息自然杀伤细胞、单核细胞和静息肥大细胞的比例在实验组中低于对照组(图2B);

4. 相关性分析显示,单核细胞与γδ T淋巴细胞、单核细胞与中性粒细胞以及初始B淋巴细胞与记忆B淋巴细胞之间存在较强的相关性(图2C)。

图2


鉴定60个与M2巨噬细胞浸润相关的潜在基因

目的:通过WGCNA分析识别与M2巨噬细胞浸润相关的基因,以探讨其在DLBCL中的作用。

结果:

1. 通过WGCNA分析,确定了三个模块,其中青色模块与M2巨噬细胞的相关性最高(图3A-C);

2. M2 巨噬细胞的特征基因与绿松石模块中的模块化基因表现出显著相关性(图3D);

3. 通过青色模块与DEGs的交集分析,识别出60个与M2巨噬细胞浸润相关的潜在基因(图4A)。

图3


潜在基因的功能分析和核心网络基因的鉴定

目的:对M2巨噬细胞浸润相关的60个潜在基因进行功能分析,并识别其中的核心网络基因,以深入了解这些基因在DLBCL中的作用。

结果:

1. GO分析显示,这些基因参与了细胞黏附、免疫细胞调节等生物学过程(图4B);

2. KEGG分析显示,这些基因与癌症中的转录失调、造血细胞谱系、p53信号通路和细胞周期等通路相关,并且在多种免疫相关特征中显著富集(图4C);

3. 应用SVM-RFE算法选择了25个铁死亡相关基因和22个坏死相关基因(图4I-L);

4. 使用STRING数据库和Cytoscape对这60个潜在基因进行PPI分析,并通过cytoHubba插件识别出10个核心网络基因(图4D,E)。

图4


7个差异表达基因被鉴定为DLBCL的诊断基因

目的:筛选出具有诊断价值的DEGs。

结果:

1. 通过LASSO逻辑回归算法、SVM-RFE算法和RF算法识别出7个具有诊断价值的交叉基因:SMAD3、IL7R、IL18、FAS、CD5、CCR7和CSF1R(图5A);

2. 7个特征基因的染色体位置如饼图所示,IL7R和CSF1R位于5号染色体上,而IL18和CD5位于11号染色体上(图5B);

3. 与对照组相比,实验组中SMAD3、IL7R、CD5、CCR7和CSF1R的表达水平降低,而IL18和FAS的表达水平升高(图5C);

图5


4. 基于7个特征基因构建的逻辑回归模型在区分DLBCL患者和健康个体方面表现出良好的性能,AUC值为0.921(图6A);

5. ROC曲线分析显示,所有7个基因的AUC值均大于0.7,表明它们具有良好的区分能力(图6B);

6. 基于这7个特征基因的列线图模型具有良好的预测性能(图6C,D)。

图6


7个生物标志物基因的生存和预后分析

目的:分析7个特征基因在DLBCL患者的预后价值。

结果:

1. 在GSE181063数据集中,CD5/FAS/IL7R/IL18/SMAD3低表达组患者的总生存期显著短于高表达组,而CCR7和CSF1R的表达水平与总生存期无显著相关性(图7A-E);

2. 单因素Cox回归分析显示,SMAD3、IL7R、IL18、FAS和CD5可作为DLBCL的预后标志物(图7F-J)。

图7


M2巨噬细胞浸润与DLBCL相关的各种途径密切相关

目的:探讨M2巨噬细胞浸润与DLBCL相关通路之间的关系。

结果:

1. GSEA-KEGG途径分析显示,细胞质DNA感应通路、氧化磷酸化和核糖体通路主要富集于M2巨噬细胞的高表达组中,而低表达组则富含钙信号通路、造血细胞谱系、黑色素生成、Notch信号通路和紧密连接通路(图8A,B);

2. GSVA分析显示,M2巨噬细胞高表达组可能激活过氧化物酶体、PPAR信号通路、嘧啶代谢和通过细胞色素P450的外源物质代谢通路,而低表达组可能激活减数分裂、焦点粘附、T细胞受体信号和近端紧密连接通路(图8C)。

图8


 结论 

Conclusion

本文按照“差异分析+WGCNA+PPI分析”方式,筛选出M2巨噬细胞相关的候选基因,并进一步利用三种机器学习算法筛选出7个具有诊断价值的基因(SMAD3、IL7R、IL18、FAS、CD5、CCR7和CSF1R)。随后,研究基于这7个特征基因构建了逻辑回归模型和列线图,可有效区分DLBCL样本和正常样本,并预测患者的疾病风险。结果表明,这些基因在DLBCL患者和健康个体之间存在显著表达差异,其中SMAD3、IL7R、IL18、FAS和CD5五个基因表达水平与患者的生存率显著相关,可作为潜在的诊断和预后生物标志物。此外,M2巨噬细胞浸润与多种DLBCL相关通路存在密切关联,提示其在肿瘤微环境中的重要作用。

END

公众号后台私信太多回复不及时,SCI论文润色翻译自上线以来,润色服务已累计助力9000+SCI文章成功发表,业务覆盖全国大多数高校、三甲医院!确保录用率,高效、便捷、精准,解决毕业与晋升燃眉之急

SCI论文润色|翻译|降重|投稿咨询|SCI期刊推荐等业务详情请扫码咨询!


不想错过生信文献解读

欢迎大家添加生信学霸为星标推荐

SangerBox小红书

打开小红书,扫码关注

每天更新生信相关资讯

SangerBox交流群 

QQ群:744969477

SangerBox平台交流群

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184086
 
40 次点击