Py学习  »  机器学习算法

自然·通讯,一作解读 | 基于非编码RNA基因表达的机器学习算法成功预测癌症病人药物敏感性

测序中国 • 5 年前 • 735 次点击  


在癌症治疗中,药物反应的个体差异大多根源于肿瘤细胞的异质性[1]。近年来,越来越多的研究发现非编码基因(non-coding RNA, ncRNA)在癌症的发生、发展中有着重要的作用。其中,lncRNA是一类长度超过200个核苷酸的ncRNA,在肿瘤细胞生长、迁移及耐药发生中的关键调控作用是癌症基因组学中的一大热门领域[2-8]。然而,除却少部分调控作用明确的lncRNA,人们对大部分lncRNA在肿瘤细胞耐药中扮演的角色仍然知之甚少。

近日,匹兹堡大学药物遗传研究中心的杨达和张敏课题组在Nature Communications发表了研究论文Systematic Identification of Non-coding pharmacogenomic landscape in cancer。该研究整合了现有的高通量转录组测序与1,001个细胞系中的抗癌药物敏感性数据,通过机器学习模型在265种抗癌药物与2,614个长非编码RNA(long non-coding RNA, lncRNA)中筛选出了27,341对lncRNA-药物可预关联(lncRNA-drug predictive pairs)。研究者们进一步利用这些lncRNA建立了基于弹性网络回归(Elastic Net Regression)的药敏预测模型,成功预测了细胞系中的药敏数据与部分TCGA癌症病人的治疗效果。

在该项研究中,研究人员深入分析了2,614个与癌症相关的lncRNA在505个肿瘤细胞系中的转录组表达谱,利用自展法(bootstrap)与弹性网络回归 (Elastic Net Regression)对来自GDSC公开数据库的265种抗癌化合物的药敏数据进行深入挖掘。该算法适用于多特征、少样本的数据,可过滤对因变量影响较小的特征而保留对因变量影响较大的特征。基于这种稀疏特性,研究者们通过自展法反复取样计算频率,在众多候选lncRNA中选出了最能预测药敏的一小部分,称其为“lncRNA-药物可预关联”。研究者们又在两个独立的公开药敏数据库CCLE 与CTRP中验证了由筛选出的可预关联,发现相比于传统的相关性分析,由弹性网络回归模型筛选出的lncRNA-药物关联具有更高的特异性。他们亦在这些可预关联中发现了许多已被报道的与癌症药敏相关的lncRNA,比如与cisplatin耐药相关的MEG3、HOTAIRNEAT1等。

药物研发的临床实验环节耗时耗力,因此,研究人员会在低成本、高通量的细胞系中进行初步的药敏筛查,以日趋完善的细胞药敏数据来建立病人药敏的预测模型,从而提高药物研发的成功率。在使用癌症细胞系药物基因组数据库建立基于非编码RNA基因表达的药物敏感性机器学习算法之后,本研究的研究人员进一步深入分析了来自多种癌症的TCGA病人样本,发现细胞系与病人样本中的lncRNA表达谱相似性很高。基于这一结果,他们使用之前筛选出的lncRNA-药物可预关联,以细胞系的药敏数据作为训练集,为每一种药物都训练了一个药敏预测模型。研究人员将这些模型运用于药物治疗信息相对较为完备的TCGA病人样本中,预测了每一个病人对其接受过的化疗药物的敏感性。他们以病人的生存时间作为耐药的表征,发现在接受他莫昔芬(tamoxifen)治疗的卵巢癌患者、5-FU治疗的胃癌患者及紫杉醇(paclitaxel)治疗的子宫内膜癌患者中,那些被模型预测为耐药的患者皆具有相对较差的预后。研究人员同时对比了现有的基于蛋白质编码基因表达谱的预测模型,发现基于lncRNA的模型在上述样本中具有更好的预测表现,提示了lncRNA在药敏预测中的巨大潜力。

与此同时,研究人员注意到有相当一部分lncRNA与多种药物都构成可预关联,结合这些药物的作用机制与作用靶点,他们发现这些lncRNA可细分为两类:一类lncRNA只与拥有相似机制的药物药敏性有关,而另一类则与多种机制的多种药物都有关联。对于第一类lncRNA,研究人员以实验验证了与BET抑制剂iBET762的耐药性呈可预关联的lncRNA EPIC1,并通过实验与转录组测序分析发现它对BET抑制剂耐药的调控与MYC通路的激活高度相关。BET抑制剂(Bromodomain and Extra-Terminal motif Inhibitors)是最近发现的一类非常热门的抗癌小分子药物。BET抑制剂的抗癌作用的其中一个主要机制是通过抑制癌基因MYC的表达。在杨达组于今年4月发表于Cancer Cell上的文章中[9],本论文的作者之一王泽华博士证实了EPIC1可直接结合MYC并激活MYC靶基因的转录。结合本文的发现,EPIC1很可能通过提高MYC的转录活性来拮抗BET抑制剂引起的MYC表达抑制从而导致耐药性。而对于第二类lncRNA,研究人员通过进一步的信息学与通路共表达分析,发现这些lncRNA普遍与药物代谢相关通路有着很好的相关性,他们推测这些lncRNA可能会对药物本身在细胞中的代谢进行调控,而与药物的作用靶点无关。

该研究的作者认为,测序技术的完善与越来越多药敏数据库的建立促使了研究人员从药物本身的角度出发,去寻找与药物存在潜在调控关系的基因与新的调控机制;而与此同时,机器学习的飞速发展亦使研究者们可以更高效地整合、分析海量的高维数据,从而去挖掘那些错综复杂的、隐藏在表面之下的潜在关联。论文的第一作者为匹兹堡大学的在读博士生王越,她认为这项研究可作为抛砖引玉,使人们更重视lncRNA与癌症发生、治疗间的关系,也希望它能为未来基于lncRNA的精准治疗及相关研究提供参考。


直播预告:一作亲临解读

9月12日20:00本文第一作者匹兹堡大学王越博士将亲临探基学院“开讲啦,一作!栏目,对该研究成果进行深度解读扫描下方二维码,关注探基,点击“课程报名”,进入“开讲啦,一作!”,一起学习lncRNA与癌症药物敏感性的最新科技动态

参考文献: 

1. Konermann, S. et al. Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex. Nature 517, 583-588, doi:10.1038/nature14136 (2015).

2. Guttman, M. et al. Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals. Nature 458, 223-227, doi:10.1038/nature07672 (2009).

3. Schmitt, A. M. & Chang, H. Y. Long Noncoding RNAs in Cancer Pathways. Cancer Cell 29, 452-463, doi:10.1016/j.ccell.2016.03.010 (2016).

4. Wang, D. et al. LncRNA MALAT1 enhances oncogenic activities of EZH2 in castration-resistant prostate cancer. Oncotarget 6, 41045-41055, doi:10.18632/oncotarget.5728 (2015).

5. Marques Howarth, M. et al. Long noncoding RNA EWSAT1-mediated gene repression facilitates Ewing sarcoma oncogenesis. J Clin Invest 124, 5275-5290, doi:10.1172/JCI72124 (2014).

6. Agrelo, R. et al. SATB1 defines the developmental context for gene silencing by Xist in lymphoma and embryonic cells. Dev Cell 16, 507-516, doi:10.1016/j.devcel.2009.03.006 (2009).

7. Lee, S. et al. Noncoding RNA NORAD Regulates Genomic Stability by Sequestering PUMILIO Proteins. Cell 164, 69-80, doi:10.1016/j.cell.2015.12.017 (2016).

8. Ling, H. et al. CCAT2, a novel noncoding RNA mapping to 8q24, underlies metastatic progression and chromosomal instability in colon cancer. Genome Res 23, 1446-1461, doi:10.1101/gr.152942.112 (2013).

9. Wang, Z. et al. lncRNA Epigenetic Landscape Analysis Identifies EPIC1 as an Oncogenic lncRNA that Interacts with MYC and Promotes Cell-Cycle Progression in Cancer. Cancer Cell 33, 706-720 e709, doi:10.1016/j.ccell.2018.03.006 (2018).

· END ·


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/bawx1EoqaL
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/23397
 
735 次点击