Py学习  »  机器学习算法

一个月接收!又见“癌症相关成纤维细胞”,真的这么火吗?!基于“转录组+机器学习”的精准预后,复现性极强!

生信图书馆 • 1 周前 • 32 次点击  

说到肿瘤预后,很多小伙伴们的第一感觉是做的太多了,很难找到切入点了。莫慌莫慌,跟着生信湾,不愁没有创新思路,看看今天带来了什么?没错!是癌症相关成纤维细胞(CAFs),它是肿瘤微环境的重要组成部分,在癌症发展和耐药性中发挥重要作用

生信湾今天分享的这篇文章,就是利用RNA测序分析乳腺癌和前列腺癌CAFs,开发并验证了与患者预后相关的关键基因,为个体化治疗提供潜在靶点。而且文章1个月就接收了,这么优秀的文章快来跟生信湾一起看看吧~

1. CAFs基因表达谱的深入分析:研究通过RNA测序技术对乳腺癌和前列腺癌的CAFs进行了深入的转录组分析,揭示了与肿瘤进展相关的特定基因表达差异。

2. 肿瘤微环境的异质性研究:研究识别了CAFs在不同肿瘤中的异质性,并探讨了这种异质性如何影响肿瘤的发展和治疗反应,为理解肿瘤微环境的复杂性提供了新的视角。

3. 基于CAFs的预后模型开发:利用机器学习技术,研究开发了基于CAFs衍生基因签名的预后模型,这些模型在多个独立数据集中显示出高准确性,为癌症患者的个性化治疗和管理提供了新的工具。

(PS:癌症相关成纤维细胞是肿瘤生信研究的热点,难怪能获得审稿人青睐,居然一个月就接收了!同样的思路,换个疾病又是一篇!生信湾都忍不住心动了~想复现这种思路或者定制更多创新性思路欢迎直接扫码联系生信湾哦~)

定制生信分析

云服务器租赁

(加微信备注66领取试用)

题目:癌症相关成纤维细胞(CAF)基因特征可预测乳腺癌和前列腺肿瘤患者的预后
杂志:Journal of Translational Medicine
影响因子:IF=6.1

发表时间:20246

在过去二十年中,为了改善预后预测和治疗决策,已经开发了基于肿瘤衍生的RNA表达特征的前列腺和乳腺癌标志物。然而,肿瘤微环境中癌症相关成纤维细胞(CAFs)相关基因特征在乳腺癌和前列腺癌中的重要性仍待深入研究。本研究利用RNA测序技术对来自乳腺癌和前列腺癌患者的CAFs进行了转录组分析,以识别与预后相关的新基因标志物,为这些恶性肿瘤的个体化治疗提供见解。
本研究首先利用RNA测序技术对乳腺癌和前列腺癌患者的CAFs进行转录组分析,鉴定差异表达基因(DEGs)。然后,将DEGs与公共数据集中的肿瘤患者数据进行比较,进行通路富集分析和K-means聚类分析,构建特定基因标志物。最后,通过生存分析和决策树算法验证,评估这些基因标志物对患者预后预测的准确性。
1、乳腺癌和前列腺癌的转录图谱
本研究通过RNA测序分析乳腺癌和前列腺癌的CAFs的转录谱,发现810个基因在乳腺癌CAFs中上调,1181个基因下调。利用TCGA数据库进一步验证,发现乳腺癌患者中有2291个基因上调,2227个基因下调(图1)。这些基因的差异表达可能与肿瘤进展和患者预后密切相关。
图1 乳腺、前列腺癌及原发肿瘤中deg的鉴定
2、聚类分析揭示了CAF衍生的基因标记与乳腺癌患者预后不良相关
对比TCGA数据集中的810个CAFs上调基因和2291个乳腺癌患者上调基因,发现206个共有基因。通过KEGG通路分析,这些基因在多个通路中富集,尤其是“Focal adhesion”通路,包含与侵袭性癌症特征相关的多个基因(图2)。
图2 乳腺癌tCAFs和癌症患者中上调基因的通路富集分析
然后,基于“Focal adhesion”通路基因表达水平,TCGA乳腺癌患者被分为两个不同的簇。簇1的643名患者相较于簇2的459名患者表现出8个基因的高表达(PAK1因在两簇间无差异表达被排除)。生存分析显示,高表达簇1中基因(ITGA11, THBS1, FN1, EMP1, ITGA2, FYN, SPP1, EMP2)的乳腺癌患者总体生存率较差(图3)。
图3 基于“Focal adhesion”通路基因水平聚类TCGA乳腺癌患者的生存分析 
为加强聚类结果,基于乳腺CAFs衍生的基因特征训练决策树模型,以聚类标签为类别值。TCGA、METABRIC和AFFYMETRIX数据集样本分为训练和测试集,通过准确率、精确度和召回率评估模型性能。结果表明,该基因签名在三个数据集中均有高准确度和精确度,其中ITGA11、THBS1、FN1、EMP1和SPP1为区分两类患者的最佳基因。这表明高表达的基因签名与乳腺癌患者较差的生存率相关,有助于预测乳腺癌患者的预后(图4)。
图4 通过决策树分类分析验证乳腺癌患者k-means聚类
3 、在前列腺癌患者中鉴定具有预后价值的CAF衍生基因标记
为了确定CAFs衍生基因是否具有临床意义,将前列腺CAFs中的1181个上调基因与前列腺癌患者中的2227个上调基因交叉对比,发现217个共有基因。KEGG分析显示这些基因在细胞因子-细胞因子受体相互作用”通路中显著富集,提示其在前列腺癌中的潜在临床意义(图5)。
图5 前列腺癌和癌症患者中上调基因的通路富集分析
为探究CAFs相关基因的临床意义,本研究对TCGA队列中的前列腺癌患者进行了k-means聚类分析,分为两个簇。簇2患者的11个基因表达高于簇1,而GDF11、TNFSF14和GDF15因表达无差异而排除。生存分析显示,簇1患者的无病生存期和无进展生存期较簇2差,表明这些基因可能预示前列腺癌患者的不良预后(图6)。
图6 基于“细胞因子-细胞因子受体相互作用”通路的基因水平聚类TCGA前列腺癌患者的生存分析
为增强TCGA前列腺癌队列聚类结果的可解释性,建立了一个决策树模型(图7),并在测试集上进行了测试。模型评估显示0.966的准确率、0.948的精确度和0.986的召回率。属性使用情况表明,除了LIFR外,所有评估基因均主要代表患者的簇成员身份。
图7 通过决策树分类分析验证前列腺癌患者k-means聚类
此文章紧跟热点“癌症相关成纤维细胞”,通过转录组测序和机器学习,开发并验证了乳腺癌和前列腺癌中与预后相关的关键基因,为个体化治疗提供潜在靶点。看完这篇文章思路有没有觉得「肿瘤预后」的研究还有很多可做之处?按照此文章思路进行研究,复现性很强!如果有兴趣,但是技术受限,快来联系生信湾求助吧!
文献信息:PMID: 38937754
DOI: 10.1186/s12967-024-05413-2

定制生信分析

云服务器租赁

合集 · 推荐

机器学习

孟德尔随机化

网络药理学

临床公共数据库分析

注:本文原创表明为原创编译,非声张版权,侵删!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172096
 
32 次点击