热门免费资源:
先给大家看看机器学习发SCI有多简单,作者利用公开数据集和机器学习算法,预测了炎症性肠病(IBD)患者冠状动脉疾病(CAD)的病变进展风险。总共就6个步骤:1. 差异表达基因(DEGs)鉴定,2.加权基因共表达网络分析,3. 基因富集分析及通过蛋白质互作网络鉴定差异表达基因,4.通过多种机器学习方法识别中心基因,5. 关键生物标志物的评估、确定及筹码图构建,6.关键生物标志物及诊断模型的评估:

l题目:通过机器学习和生物信息学策略识别预测炎症性肠病中冠状动脉疾病进展的关键生物标志物
数据来源
数据集/队列 | 数据库 | 数据类型 | 详细信息 |
GSE62646 | GEO | mRNA表达数据 | 来源于外周血单核细胞 |
GSE123342 | GEO |
mRNA表达数据 | 来源于外周血样本 |
GSE75214 | GEO | mRNA表达数据 | 来源于结肠粘膜 |
GSE36807 | GEO | mRNA表达数据 | 来源于肠道活组织检查 |
GSE59867 | GEO | mRNA表达数据 | 来源于外周血单核细胞 |
研究思路
研究团队通过多种生物信息学方法分析了与IBD患者中CAD进展相关的基因,通过差异表达基因(DEGs)分析筛选出与IBD关联的关键模块,并进一步通过PPI(蛋白质相互作用)网络分析筛选出中心基因。接着,研究人员利用机器学习算法(RF、SVM-RFE和LASSO回归)对这些候选基因进行筛选和评估,最终确定了五个与CAD进展有关的关键基因。最后通过ROC曲线和筹码图对这些基因进行了评估和验证。

研究结果
1. 差异表达基因(DEGs)鉴定
研究人员首先使用了R中的‘Limma’包进行差异表达基因(DEGs)分析(图1A,1B),来识别不同表达水平的基因。研究人员对急性心肌梗死(AMI)患者组和冠状动脉疾病(CAD)患者组之间的基因表达进行了比较。设置统计标准为(|FC| > 2,p < 0.05),筛选出了570个DEGs,其中340个基因的表达水平上调,230个基因的表达水平下调。同样地,对IBD组与健康对照组之间的基因表达进行了比较,鉴定出了430个DEGs,其中283个基因上调,147个基因下调。

图1 冠状动脉疾病与急性心肌梗死间与相关的差异表达基因分析
2.加权基因共表达网络分析
研究人员使用加权基因共表达网络分析(WGCNA)来识别基因共表达模块并确定与特定生物过程或疾病状态相关的关键模块(图2AB)。研究人员首先通过软功率值评估网络的尺度独立性和平均连接性,分析后设定最佳软功率值为16。研究人员对IBD数据集(GSE75214 + GSE36807)进行模块识别和合并,共识别出12个共表达模块(图2D,2E)。随后,通过计算每个模块与IBD特征(如疾病状态、临床参数等)之间的相关性,确定了暗橙色模块和蓝色模块在IBD中的显著正相关和负相关,具有最高的相关系数(图2F,2G)。


图2炎症性肠病加权基因共表达网络分析
3. 基因富集分析及通过蛋白质互作网络鉴定差异表达基因
研究团队利用GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)两大功能富集分析工具,成功地鉴定出了85个在IBD相关显著模块和揭示CAD进展的DEGs中的共同基因。进一步的功能富集分析揭示,这些DEGs不仅在免疫应答、细胞内部结构及蛋白质同源二聚体活性等多个生物过程、细胞组分和分子功能上展现出显著富集(图3A-C),还在关键的生物通路如NOD样受体信号通路、Th17细胞分化,以及TNF/HIF-1信号通路中表现出高度富集(图3D)。为了进一步挖掘与CAD进展中的关键因子,研究团队构建了一个PPI(蛋白质-蛋白质相互作用)网络,研究人员通过精细筛选成功识别出了20个核心基因(图3F)。


图3 IBD相关DEGs在AMI中的功能富集分析
4.通过多种机器学习方法识别中心基因
研究人员使用了随机森林(RF)、支持向量机递归特征消除(SVM-RFE)和LASSO回归等三种机器学习算法来筛选中心生物标志物。通过RF算法,研究人员根据基因的重要性选取了10个最有影响力的基因(图4A,4B)。接着通过SVM-RFE分析确定了预测CAD与IBD进展中准确率最高的前17个基因(图4C,4D)。最后,研究人员通过LASSO回归找到了九个在模型中能实现最低二项偏差的基因(图4E,4F)。通过对这三种算法的结果进行交集分析,得到了五个最有潜力的候选中心基因,分别是CTSD、CEBPD、CYP27A1、STAT1和S100A11。

图4 使用多种机器学习算法选择冠状动脉粥样硬化病变进展的关键差异基因
5. 关键生物标志物的评估、确定及筹码图构建
研究人员接着对五个候选中心基因(CTSD、CEBPD、CYP27A1、STAT1和S100A11)在稳定CAD和AMI组中的相对表达水平进行了评估,并构建了ROC曲线来评估其预测稳定CAD发展为AMI的诊断能力。通过测试集和验证集的数据,发现这五个基因在预测CAD进展方面具有良好的诊断价值(图5A-5J)。在验证集中,CTSD、CEBPD和CYP27A1的AUC值都超过了0.8。最后,基于这三个基因构建了一个筹码图,通过量化每个基因的相对表达来评估IBD患者冠状动脉粥样硬化病变进展的风险(图5K),该筹码图的AUC值为0.89,表明其在预测性能方面具有很高的准确性(图5L)。
图5 生物标志物预测能力的评估与回顾及诊断模型图谱构建
6.关键生物标志物及诊断模型的评估
研究团队深入分析了五个候选基因在稳定CAD和AMI组中的表达水平。研究人员在测试数据集(GSE62464 + GSE123342)和验证数据集(GSE59867)中进行了t检验或Wilcoxon秩和检验,结果显示这些基因在AMI组中与CAD组相比呈现出显著的表达差异。特别是CTSD、CEBPD和CYP27A1三个基因,具有高度显著性的表达差异(图6A,图6B)。

图6 肝癌转移内异质性的表征
(下滑查看更多)
难的是什么,不会写代码,不会个性化分析。没关系,我们给大家免费分享。只要你按照这个视频和代码,换一个疾病,分分钟就是一篇SCI。今天,给大家免费分享的是:
”非肿瘤列线图诊断模型机器学习联合WGCNA筛选生物标志物实操课(原价12399元)”
🔽①长按下方二维码关注🔽

②输入关键词:12399
②输入关键词:12399
②输入关键词:12399
课程如下:


套路非常简单,难得的是这一套代码,只要你换一个疾病,按照这个实操和代码操作,就是一篇SCI。非常适合零基础想极速发表SCI的同学。
”非肿瘤列线图诊断模型机器学习联合WGCNA筛选生物标志物实操课(原价12399元)”
🔽①长按下方二维码关注🔽

②输入关键词:12399
②输入关键词:12399
②输入关键词:12399
顶级CNS插图如下:

但是自己画一只小鼠可能需要花一整天的时间。
所以,今天小编给大家免费赠送:
“生物医学之家CNS插图可编辑素材永久VIP账户”
生物医学之家CNS插图素材部分截图如下:

这些素材都是用Adobe illustrator绘制的,打开后可以继续编辑修改,这些素材原价是9999元的,现在免费给大家送永久账户。如下免费获取永久VIP账户:
🔽①长按下方二维码关注🔽

②输入关键词:永久VIP
②输入关键词:永久VIP
②输入关键词:永久VIP
免费发送1万个永久VIP账户,有了这个账号之后,你可以无限、永久下载生物医学之家的CNS插图素材。共有1万张素材,囊括了各种生物、人体组织、细胞、病毒、植物等。素材首页如下:

一、比如我需要用到小鼠插图来描述自己的小鼠动物实验模型,那就直接搜索鼠,有几百张小鼠插图就出现了:







有了VIP账号之后就可以随意下载。下载下来是AI绘制的可编辑图:

可以随意修改颜色:

也可以随意修改大小:

Ctrl+c和V复制粘贴到自己的画板中,并对齐:

随后画一条线,示意要D369打药:

随后添加字体,这样审稿人一看就知道你做了什么动物模型。

最后保存和导出,一定要记得保存,保存就是矢量图了,以后还能修改。导出就是导出为图片,用来讲PPT或者投稿。

还在等什么?赶快免费获取账号呀,发SCI、作图的时候肯定用得着。
“生物医学之家CNS插图可编辑素材永久VIP账户”
如下免费获取:
🔽①长按下方二维码关注🔽

②输入关键词:永久VIP
②输入关键词:永久VIP
②输入关键词:永久VIP
还有,我们下载的素材,也可以右键取消分组:

然后修改任何一个你想要修改的元素,比如修改液体的颜色:



也可以将注射器放在背上,模拟皮下注射:

还可以将小鼠变为黑色:


还在等什么?赶快免费获取账号呀,发SCI、作图的时候肯定用得着。
“生物医学之家CNS插图可编辑素材永久VIP账户”
如下免费获取:
🔽①长按下方二维码关注🔽

②输入关键词:永久VIP
②输入关键词:永久VIP
②输入关键词:永久VIP
二、比如我需要绘制细胞机制图。那就搜索细胞:








有了这些素材,分分钟就可以绘制如下这种高分插图:

三、各种Nature插图原图:



下载下来之后每个细微的元素都可以修改:




我们一共上传1万张Nature插图。大家赶紧获取永久VIP账户吧,投稿绘图的时候用得着:
“生物医学之家CNS插图可编辑素材永久VIP账户”
如下免费获取:
🔽①长按下方二维码关注🔽

②输入关键词:永久VIP
②输入关键词:永久VIP
②输入关键词:永久VIP
更多免费资源:
辛苦整理,全文无任何广告!
觉得有用的话,您就点个在看、点赞!