Py学习  »  机器学习算法

“水刊”中的顶刊,顶刊中的“水刊”竟对机器学习如此钟爱!中山大学徐瑞华团队:ecDNA+泛癌分析值得一投!

生信图书馆 • 1 年前 • 244 次点击  

你没事吧?没事就来馆长!这里有最新的高分文献分享和让你眼前一亮的实验思路。今天馆长为大家带来的是广东重点实验室肿瘤中心团队在 nature communications上发表的新作-——基于机器学习探究ecDNA在癌症中的临床意义,作者利用团队自己开发的计算框架GCAP,通过多方面方法进行验证,其研究思路和数据处理方法让人不得不叹服!学到就是赚到,NC出品必是精品,快点记好笔记进来学!

先来让我给大家浅讲一下本文的精彩要点:

1、开发新型计算框架,增强实验创新性:本研究为更好的利用全外显子组测序数据集来识别和表征临床癌症样本中的ecDNA扩增,由团队自行开发了一个计算框架——GCAP,新型好用的计算框架很大程度上增加了研究的创新性,推进数据分析进展。然而并非所有人都能做到开发一款新的计算框架,想发文又苦于没有更好的数据分析工具的小伙伴们可以来找馆长哦~

定制生信分析

云服务器租赁

加好友备注“66”领取试用

2、大样本数据增强结果可靠性:本文收集了386个肿瘤正常配对WES数据,以及扩增中24种癌症类型的相应肿瘤WGS数据的ecDNA状态,泛癌分析更能加强实验结果的可靠性,为ecDNA作为癌症预后标志物提供了新的证据。

3、本文用ecDNA证明了癌症生存风险分层和ICI治疗疗效预测的生物标志物。有助于理解ecDNA扩增在癌症发病机制中的作用,并提供可能显著影响治疗干预措施的发展的见解。

大家是不是已经被本文缜密的实验思路和多样的研究方法震撼住了!已经心动的小伙伴们快快扫码,来找馆长领取更多科研思路和新鲜算法,实现轻松复现~        

l题目:基于机器学习的ecDNA识别揭示了其在癌症中的临床意义

l杂志:nature communications

l影响因子:IF=16.6

l发表时间:2024年1月

公众号回复“原文”二字可以领取本文献,文献编号240626

研究背景

ecDNA扩增是肿瘤的一种重要形式的体细胞局灶拷贝数扩增,已被发现是一种普遍的事件,在广泛存在的癌症类型中驱动侵袭性肿瘤生长、多药耐药和不良生存结果,这些发现表明了ecDNA作为癌症诊断的分子标记物和癌症治疗的药物靶点的潜力。然而,高通量癌症基因组数据的ecDNA扩增的方法仍然缺乏,而且ecDNA在常见的异质性恶性肿瘤或晚期治疗环境中的临床相关性仍有待阐明。

数据来源

数据/材料类型

数据库

详细信息

细胞株

ATCC

细胞培养人胃癌细胞株SNU16、HGC27、MKN45、NCI-N87、KATO III、MKN7、SNU216、MKN74、人食管癌细胞株KYSE-410、OE19和前列腺细胞株PC3

患者样本

中山大学肿瘤防治中心

胃癌和结直肠癌患者的肿瘤样本

基因组数据

TCGA

全外显子组测序数据,反PD1临床试验队列的全外显子组测序数据

研究思路

作者利用新开发的计算框架GCAP,并通过多方面的方法对其进行验证,揭示了ecDNA扩增和微卫星不稳定性(MSI)之间的一致的泛癌症模式,此外建立了ecDNA扩增作为一个危险因素的作用,并在1015例结直肠癌患者的队列中细化了基因组亚型。最后研究结合了来自四个专注于抗pd-1免疫治疗的临床试验的数据,证明了ecDNA扩增作为指导胃肠道癌症检查点封锁的生物标志物免疫治疗的关键作用。

主要结果

1、构建基于机器学习的计算框架和实现,以识别染色体外DNA扩增        

作者使用XGBOOST算法36训练了一个机器学习模型,提供了高性能和更好的调优灵活性。设计了一个计算框架来优化拷贝数谱的特征工程,构建ecDNA扩增预测模型,并评估其在临床癌症研究中的性能和潜在应用,研究结果证明了从WES数据集中检测ecDNA的可行性,并提出了一个预测癌症基因组测序中ecDNA扩增的机器学习模型(图1)。

图1 以全外显子组测序数据为导向的癌症染色体外DNA扩增的鉴定、评估、分析和应用框架

2、GCAP对染色体外DNA扩增鉴定的评价

作者为了验证GCAP在ecDNA扩增鉴定中的能力,使用了癌细胞系和临床样本来评估其稳健性和泛化性。ecDNA的阳性状态和PC3成功检测GCAP WES数据,依次确认中期DNA荧光原位杂交分析ecDNA货物致癌基因,WGS-based放大器重建,以及Circle-Seq读取映射(图2)。使用GCAP,从临床肿瘤WES数据中鉴定了两个具有ecDNA+状态的ERBB2扩增胃癌,进一步加强了GCAP在临床样本分析中的可信度。

图2 癌细胞系基因组ecDNA扩增鉴定的评价

3、通过泛癌症分析重新获得ecDNA相关的生存结果和基因组特征        

作者首先进行了样本水平的病灶扩增分型,然后比较了非病灶扩增亚型和圆形病灶扩增亚型的生存结果和基因组特征。在三组中观察到不同的生存结果(图3),对两个泛癌症数据库的一致分析结果进一步证实,GCAP是一种稳健的癌症队列导向的方法,用于识别ecDNA扩增的肿瘤,并从病灶扩增方面解决明显的肿瘤异质性。接下来分析了局灶性扩增的全基因组分布和癌基因含量。TCGA中圆形扩增和非圆形扩增的全基因组分布模式与PCAWG中一致(图4)。证明了GCAP在基因水平分析中的可靠性,并强调了这些经常发生的致癌基因在ecDNA形成中的作用。

图3 在泛癌症数据库中,ecDNA相关生存结果和基因组改变模式的一致恢复 

 

图4 局灶性扩增和染色体外DNA相关致癌基因的全基因组分布

4、结直肠癌基因组分子分型的改进        

作者为了研究细化CRC基因组亚型的可行性,将每种癌症的SYSUCC亚型(HM、GS、CIN-LR和CIN-HR)和fCNA亚型(非病灶、非圆形和圆形)的标记合并,然后将总体生存危险相近的亚组分别合并为一个亚组,构建了6个CRC的基因组亚型(图5)。

图5 结直肠癌病灶扩增分型可预测患者的总生存期,并产生具有不同突变过程的精细基因组亚型

5、ecDNA扩增对癌症免疫治疗具有预测作用和预后作用

作者通过GCAP利用前瞻性临床试验中的WES数据集来揭示ecDNA扩增和ICI治疗反应之间的关系。进一步分析了SYSUCC AGC队列中的总生存率,发现进行ecDNA扩增的癌症患者的总生存率低于未进行ecDNA扩增的癌症患者。在SYSUCC NPC队列中也观察到类似的趋势(图6)。

图6 染色体外DNA扩增是抗pd1单药治疗的总生存率的预后

文章小结

该团队利用团队自己开发的计算框架GCAP,通过多方面方法进行验证,证明了ecDNA扩增作为指导胃肠道癌症检查点封锁的生物标志物免疫治疗的关键作用。如果屏幕前的你们也想学习大佬们的科研思路和数据分析方法,那就快扫码来找馆长吧~数不胜数的好点子、全面的服务与技术支持一定会帮您更上一层楼!


      馆长有话说





馆长会持续为大家带来最新生信思路,也可以提供特色数据库构建、免费思路评估、付费生信分析和方案设计以及实验项目实施等服务,对数据库构建和生信分析感兴趣的朋友可以咨询馆长哦!

生信分析

方案设计

服务器租赁

扫码咨询馆长

孟德尔随机化

生信友好期刊

单细胞测序

非肿瘤生信

往期推荐

1. 孟德尔随机化大显神威,高分文章手到擒来!21+Nature子刊深度剖析伴侣越来越像背后不容错过的遗传学突破,新颖性MAX!

2. 这泼天的富贵被瑞金医院团队接到了!他们靠191个患者样本的蛋白质组学+预后模型拿下了82分+Nature顶级大子刊!

3. 这本6+神刊,纯生信友好,且投且珍惜!天津医科大团队,携国自然新宠泛凋亡,纯生信轻松拿下!今日份抄作业首选!


       

 

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/171697
 
244 次点击