社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

小众方向+转录组+机器学习建模,干湿结合,常规预后分析也能发双一区TOP

生信学霸 • 3 周前 • 46 次点击  

溶酶体作为富含不同水解酶的膜结合细胞器,是降解多余细胞质大分子以维持细胞稳态的重要枢纽。新兴研究将溶酶体定位为细胞内运输、代谢重编程、细胞平衡和信号传导途径的关键调节因子。大量证据表明溶酶体在CRC进展中发挥重要作用,但溶酶体相关基因(LRGs)在结肠腺癌(COAD)中的预后意义和治疗潜力仍有待深入探索。Journal of Genetics and Genomics 上发表的新文章通过整合LASSO和Cox回归分析构建了一个基于6个溶酶体相关基因的预后风险模型,同时发现高风险患者具有免疫抑制性肿瘤微环境和更具侵袭性的恶性特征,揭示了DPP7在COAD中的促癌作用及潜在治疗价值。

标题:Harnessing lysosomal genetics: development of a risk stratification panel and unveiling of DPP7 as a biomarker for colon adenocarcinoma

期刊:Journal of Genetics and Genomics(IF 6.6)

出版商:Institute of Genetics and Developmental Biology

发表:2025年4月18日

DOI:https://doi.org/10.1016/j.jgg.2025.04.009

关键词:结肠腺癌 | 溶酶体 | 预后检查 | DPP7 | 免疫微环境

技术手段:转录组分析、机器学习算法、生存分析、功能分析、mIF等

核心思路:


 材料与方法 

Materials and Methods

数据来源:从TCGA和GEO数据库获得COAD的转录组数据、临床信息和突变谱,并排除了缺乏OS数据或OS持续时间少于1个月的样本。

差异表达LRGs鉴定:使用R包Limma对COAD转录组数据进行差异分析,并应用FDR<0.05和log2|fold change|≥1的标准筛选DEGs;将DEGs与通过GO注释获得的871个LRGs取交集,以获得差异LRGs。

预后模型构建与验证:通过单因素Cox回归分析和LASSO方法筛选预后LRGs,并用多因素Cox回归分析构建包含6个LRGs的预后模型;在TCGA队列和外部验证队列中,通过ROC曲线分析、KM生存分析、C指数等方法评估模型预测性能及稳定性,并与136个已发表的预后模型比较。

免疫景观评估:采用CIBERSORT等免疫浸润算法来量化免疫细胞浸润水平,并用Spearman相关性分析浸润免疫细胞丰度与风险评分之间的关系;应用ssGSEA算法探究肿瘤组织中免疫细胞组成及潜在免疫相关通路。

恶性特征分析:应用z-score算法量化14种肿瘤相关恶性特征,分析LRG风险评分与这些特征的相关性。

药物敏感性分析 :使用R包pRRophetic计算化疗药物的半数抑制浓度(IC50)值,并结合GDSC数据库预测药物反应,筛选潜在化疗药物。


 分析结果 

Results

COAD中差异表达的LRGs

目的:鉴定COAD中差异表达的溶酶体相关基因(LRGs),并探究其在肿瘤发生、发展中的潜在作用。

结果:

1. 在TCGA-COAD队列中,共鉴定出5231个差异表达基因,其中1850个下调,3381个上调(图1A);

2. 通过交集分析,从这些DEGs中筛选出194个溶酶体相关基因(LRGs),随后利用单因素Cox回归分析进一步筛选出24个与预后显著相关的LRGs(图1B-D);

3. 这24个LRGs的突变景观显示,在454个COAD肿瘤样本中,27.53%的样本检测到基因组改变,其中7个基因的突变频率≥3%,LRP2的突变率最高,为15%(图1E);

4. CNV分析显示,大多数基因表现为拷贝数获得,而AGRN、ADAM8、CEACAM6、LRP2、CLVS2、GRP、FUCA1和GPRASP1主要表现为拷贝数丢失(图1F-H)。

图1


基于LRG的预后模型构建与评估

目的:构建一个基于LRGs的预后风险模型,并评估其性能。

结果:

1. 运用LASSO算法和多因素Cox回归分析,结合生存时间和COAD基因表达数据,进一步筛选出与预后相关的6个关键基因,并构建预后风险模型(图2A,B);

2. ROC曲线显示,在TCGA训练集和测试集中,模型具有良好的预测准确性,AUC值均大于0.6(图2C,D);

3. 在TCGA和5个外部验证队列中,高风险组患者的生存结局明显差于低风险组,这一结果在荟萃队列分析中得到了支持(图2E-L);

4. 相比年龄、性别、肿瘤分级及TNM分期等临床特征,6-LRG特征在预测生存结局方面准确性更高,且可以作为COAD患者的独立预后生物标志物;

5. 与136个已发表的预后模型相比,6-LRG模型在预测准确性方面表现更为出色,1年和3年生存率的AUC值均位列第一,5年生存率的AUC值也优于大多数已发表模型。

图2


TMA队列中6个LRGs的评估

目的:通过分析自有TMA队列中6个LRGs的表达情况,进一步验证6-LRG预后模型在COAD中的预后意义和临床应用价值。

结果:

1. 内部TMA队列的mIF分析结果显示,除LRP2外,其他5个LRGs在CRC组织中的表达水平显著高于配对的正常组织,与公共数据集结果一致(图3A-C);

2. 热图展示了6个LRGs的表达水与临床病理参数(如患者年龄、性别、分期、细胞密度等)之间的关系(图3D);

3. 基于阳性细胞密度的生存分析显示,低风险组患者的生存时间显著长于高风险组患者(P<0.05),而基于阳性细胞率的KM分析也呈现出相似的趋势,进一步证基于6-LRG的风险评分可作为COAD可靠预后生物标志物(图3E,F)。

图3


免疫细胞浸润和TME景观

目的:检查不同风险组患者免疫细胞浸润和肿瘤微环境(TME)方面的差异。

结果:

1. 应用CIBERSORT等算法的免疫细胞浸润分析显示,低风险组和高风险组在巨噬细胞M1/M0、T细胞等特定免疫细胞丰度上存在显著差异;

2. 低风险患者展现出更低的基质和免疫评分,表明其TME中非肿瘤细胞比例较高;

3. 瀑布图显示高风险组中TP53、APC等基因的突变频率显著升高,这些基因的突变可能与免疫逃逸和肿瘤进展有关;

4. 此外,ssGSEA表明LRG特征与免疫细胞浸润丰度和免疫功能之间存在显著的负相关;

5. 除了CD276外,大多数免疫检查点基因在低风险患者中的表达水平显著更高。


COAD的LRG特征和恶性特征

目的:探究基于6个LRGs的风险模型与COAD的恶性特征之间的关联,以揭示该风险模型在肿瘤进展中的潜在作用。

结果:

1. 通过应用z-score算法量化包括血管生成、凋亡、细胞周期等14种肿瘤相关恶性特征和相关性分析,发现风险评分与炎症、分化、转移、凋亡和增殖等恶性特征呈强正相关,表明溶酶体活动增强可能推动更具侵袭性的肿瘤表型;

2. 来自TISCH 2.0数据库的四个单细胞数据集分析结果显示,ADAM8、DPP7和PLA2G16在多个与癌症进化密切相关的细胞中高表达,表明它们可能在肿瘤的进展中发挥重要作用。


潜在化疗化合物的鉴定

目的:识别对COAD不同风险组患者具有潜在治疗价值的化疗药物,并探讨其可能的作用机制。

结果:

1. 通过药物敏感性分析发现20种化疗药物在两组风险患者中的敏感性存在显著差异,其中Dacinostat、Epothilone B、CCT007093、OSU-03012、Sabrina和SB 216763低风险患者中有更好的治疗效果,而THZ-2-49、SGC0946、Quizartinib、Masitinib、YM201636在高风险患者中活性更强;

2. 通过分析这些化合物的作用机制,发现它们主要通过调节自噬、细胞周期、受体酪氨酸激酶(RTK)信号和PI3K/mTOR通路等关键过程来发挥作用。


高DPP7表达与COAD患者的不良预后相关

目的:探讨DPP7基因在COAD中的表达水平与患者预后之间的关系,以验证DPP7是否可作为COAD的预后生物标志物。

结果:

1. 通过比较CRC组织和邻近正常组织之间6个LRGs的表达水平以及ROC曲线,ATP6V1C2和DPP7在CRC组织中的表达显著高于正常组织,且具有出色的诊断性能(图4A,B);

2. CRISPR扰动分析显示,LRP2和DPP7是影响CC细胞增殖的关键调节因子(图4C,D);

3. 鉴于DPP7在这些CC细胞系中的表达显著升高,因此选择DPP7进行后续分析(图4E);

4. 生存分析显示,高表达DPP7的CRC患者相较于低表达患者,总体生存率(OS)显著降低,并且DPP7表达水平与肿瘤晚期呈正相关(图4F-I);

5. mIF分析结果进一步证实了DPP7在CRC组织中的高表达(图4J,K)。

图4


沉默DPP7会损害CC的恶性进展

目的:通过体内外实验验证DPP7作为COAD治疗靶点的潜力。

结果:

1. 通过qRT-PCR量化DPP7在正常胎儿人结肠(FHC)细胞和5个CC细胞系中的表达情况,发现DPP7表达在CC细胞中显著升高,在SW480和LOVO细胞中检测到的水平最高(图5A);

2. 为了进一步分析其功能作用,研究建立了稳定的DPP7耗竭的SW480和LOVO细胞系,并用qRT-PCR和Western blotting分析证实了mRNA和蛋白质水平的有效敲低(图5B-E);

3. CCK-8实验和集落形成实验结果显示,DPP7沉默显著抑制了SW480和LOVO细胞的增殖能力和克隆形成能力(图5F-I);

4. 划痕实验和Transwell实验表明,DPP7沉默显著降低了SW480和LOVO细胞的迁移和侵袭能力(图5J-M);

5. GSVA分析显示,EMT与DPP7存在很强的正相关(图5N);

6. 进一步的Western blotting分析显示,DPP7沉默上调了E-钙黏蛋白的表达,下调了N-钙黏蛋白、波形蛋白和Snail的表达,表明DPP7沉默能够抑制EMT过程(图5O,P);

7. 在裸鼠皮下移植瘤模型、尾静脉注射肺转移模型和经脾脏注射肝转移模型中,DPP7沉默显著降低了肿瘤体积和重量以及肺和肝转移灶的数量,进一步证实了DPP7沉默能够有效抑制肿瘤生长和转移(图5Q-S)。

图5


 结论 

Conclusion

本文选择了小众方向溶酶体进行结肠腺癌(COAD)预后研究,视角独特,因而创新性较高。研究以溶酶体功能障碍作为切入点, 利用转录组数据和机器学习方法筛选了预后相关的关键LRGs,并构建了一个预后风险模型。该模型在多个独立队列中展现出卓越的预测性能,优于其他136个已发表的模型,具有重要的临床转化价值。同时,研究揭示了DPP7作为关键LRG 的功能作用,其在结肠腺癌的发生和发展中发挥着关键作用,沉默DPP7可有效抑制肿瘤生长和转移,为结肠腺癌的精准治疗提供了新的潜在靶点。

END

公众号后台私信太多回复不及时,SCI论文润色服务可以添加下图客服微信👇,其他合作或平台交流可加入我们平台交流群(Q群二维码在下面👇)找管理员对接,与你的同行们共同交流、学习、进步。

SCI论文润色|翻译|降重|投稿咨询|SCI期刊推荐等业务详情请扫码咨询!


不想错过生信文献解读

欢迎大家添加生信学霸为星标推荐

SangerBox小红书

打开小红书,扫码关注

每天更新生信相关资讯

SangerBox交流群 

QQ群:744969477

SangerBox平台交流群




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182067
 
46 次点击