Py学习  »  机器学习算法

机器学习开启“开挂”模式!恭喜中山一院邹健勇团队拿下9分+!自测数据+公共数据挖掘,代谢重编程是真的香!

生信塔 • 7 月前 • 188 次点击  

“代谢重编程”一直是近年来国自然的热门思路,那除了目前经典的“糖酵解”、“乳酸代谢”等之外,还有什么更新颖的思路?毕竟,“创新性”才是科研精髓,能显著降低数据量和实验量,性价比太高了。

那生信塔今天带来的是一篇由中山大学一附院邹健勇团队,发表在“Int J Biol Sci(9.8分)”上,阐述胸腺瘤中的鞘糖脂代谢。

本文除了汇聚“鞘糖代谢”这个稍显小众的方向外,还使用机器学习进行代谢分析,创新点再次get;并且,该研究团队将自测数据与公共数据相整合,一下就提升了文章质量!整体数据量大,思路亮眼,逻辑严谨!可以说9分+就该他发呀~

(Ps: 想创新的宝子们,我这有热乎的生信热点和设计,想要的话就来联系生信塔呀~~)

l题目:鞘糖脂生物合成调节因子在胸腺瘤恶性进展中的作用

          

 

数据来源    

所有胸腺瘤组织及邻近正常胸腺组织均取自中山大学第一附属医院胸外科手术患者。

数据集/队列

数据库

数据类型

样本信息

TCGA-THYM

UCSC

RNA-Seq

112例胸腺瘤样本

          

 

研究思路

本研究构建胸腺瘤多组学整合分析框架:基于TCGA-THYM队列,运用多组学整合分型策略,通过特征融合聚类算法实现分子亚型智能识别。创新性建立"分层聚类-预后建模-特征筛选"三级分析体系:采用转录组特征分层聚类进行亚型划分,构建生存预后关联模型筛选关键亚型;运用动态差异表达解析技术锁定预后相关DEGs集群;结合功能注释云平台完成通路-代谢网络重构。突破性引入跨组学验证体系,整合代谢组LC-MS/MS数据建立代谢调控网络动态建模,最终形成"基因表达-通路活性-代谢重塑"多维预后评估系统。

主要结果

1. 胸腺瘤亚型鉴定及差异分析

121个胸腺瘤样本通过无监督聚类分为三组,1组和3组生存率差异最大。分析发现两组间有1370个差异表达基因,这些基因被分为不同簇,分别与免疫过程和表皮发育等不同生物学过程相关    

1 胸腺瘤亚型鉴定及差异分析

2. 不同亚型之间的富集分析及生存分析

 利用GSEA构建不同亚型的通路互作网络,发现脂质代谢和免疫/炎症相关通路显著富集。基于GSVA评分的生存分析显示,脂质代谢相关通路与患者生存密切相关。通过GSVA和Limma差异分析,确定了12个上调和25个下调的代谢通路,包括糖鞘脂生物合成-乳糖和新乳糖系列等关键通路。    

2 不同亚型之间的富集分析及生存分析

3. 不同的代谢途径开发胸腺瘤机器学习分类器    

使用线性回归、决策树和随机森林等机器学习方法分析37个差异代谢通路。决策树和随机森林模型确定了糖鞘脂生物合成-乳糖和新乳糖系列等对胸腺瘤预后至关重要的通路。    

3 不同的代谢途径开发胸腺瘤机器学习分类器

4. 核心通路对胸腺瘤患者长期生存的影响

糖鞘脂生物合成-乳糖和新乳糖系列通路是胸腺瘤进展的核心。K-M生存分析显示该通路的GSVA评分越高,患者预后越差。对通路内22个基因的表达相关性分析显示基因间存在关联,部分基因在肿瘤组织中的表达有显著变化。

4 核心通路对胸腺瘤患者长期生存的影响   

5. 胸腺瘤的代谢组学分析

针对10个样本的代谢组学分析共检测到1758种代谢物。聚类分析和PCA显示组间代谢物分布存在异质性。OPLS-DA模型分析确定了534种差异代谢物,它们之间存在显著的相互作用。 

5 胸腺瘤的代谢组学分析    

6. 差异代谢物的功能富集分析

差异代谢物的皮尔逊分析显示它们之间存在协同或不相容关系。DA评分显示胸腺瘤病理过程中脂质和动脉粥样硬化、胆固醇代谢等通路表达下降,而醚脂代谢等通路表达上升。KEGG通路分析显示甘油磷脂代谢等通路富集了差异代谢物。

6 差异代谢物的功能富集分析

7. B3GNT5高表达与较差的无病生存期相关

胸腺瘤组织中B3GNT5和ST3GAL6表达上调。高B3GNT5表达与较差的无病生存期相关,而ST3GAL6表达与无病生存期无关。

    7 B3GNT5高表达与较差的无病生存相关

文章小结

总之,本文以“代谢重编程”的角度入手,通过“机器学习”等方法,利用“自有数据+公共数据”的模式,成功实现近乎纯生信的TOP发文,这还不是轻松拿捏审稿人的心思~简直666!生信塔公众号持续为大家带来最新生信思路,想复现这种思路或者私人定制更多新颖想法的小伙伴们,欢迎直接滴滴生信塔,生信侠团队竭诚为您的科研助力!

生信塔有话说


生信塔公众号持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐,快来查看吧!想复现这种思路或者定制更多创新性思路欢迎直接call生信塔,我们团队竭诚为您的科研助力!


文献思路复现

定制生信分析

生信服务器


 往期 · 推荐 

IF 16.7!高质量、综合GBD数据库炸裂登场!武大中南医院&湖北医科大襄阳医院携手,3图3表拿下高分,简直美滋滋~

十投九中+纯生信友好=神刊!复旦肿瘤医院李大卫团队2区6分模板文,单细胞数据挖掘+乳酸化修饰,科研人错过血亏!

11种机器学习“飞”上1区Top,诺奖热点不容错过!苏州大学李艳红团队,预后模型这波操作太燃了!  

 

          

 

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/179890