Py学习  »  机器学习算法

单细胞+机器学习经典组合助力肿瘤预后研究,结合代谢热点,轻松拿捏一区5+SCI

生信学霸 • 1 年前 • 239 次点击  

肾细胞癌(RCC)是最常见的肾癌形式,在男性和女性中分别排名第六和第十。RCC中肾透明细胞癌(ccRCC)约占所有RCC病例的70%,是最主要的亚型,并且ccRCC患者预后较差,仅少数患者能从精准肿瘤学中获益。色氨酸代谢失调已成为肿瘤进展的关键因素,包括免疫抑制、增殖、转移和代谢重编程。然而,它在ccRCC中的确切作用仍不清楚,并且明显缺乏基于色氨酸代谢的预测模型或特征。


Integrated machine learning reveals the role of tryptophan metabolism in clear cell renal cell carcinoma and its association with patient prognosis

Biology Direct 上发表的新文章通过综合分析多组学数据揭示了色氨酸代谢在肾透明细胞癌中的重要作用,并开发了一个色氨酸代谢相关预后模型TMRS,为个性化治疗提供了新视角。


期刊:Biology Direct(IF 5.7)

出版商:BioMed Central

发表:2024年12月21日

DOI:https://doi.org/10.1186/s13062-024-00576-w

关键词:肾透明细胞癌 | 色氨酸代谢 | 机器学习 | 预后模型 | 免疫浸润

技术手段:WGCNA、单细胞组、转录组、机器学习算法、qRT-PCR等

核心思路:


分析有术、思路创新

更多个性化生信分析方案

扫码咨询,获取您的专属私人定制!


方法



数据来源:从公共数据库(GDC、PDC、GEOTCGA等)和过往研究获取6个公共数据集,其中GSE156632用于单细胞研究和模型验证。

单细胞分析:使用R包Seurat处理数据和标准化分析,并用Monocle2算法重构上皮细胞发育轨迹。

通路活性与基因富集分析:使用R包AUCell评估单细胞水平活性;使用R包GSVA在细胞层面上评估色氨酸代谢通路活性,并利用ssGSEA算法计算基因集富集分数。

共表达网络分析:使用R包WGCNAhdWGCNA构建共表达网络,识别与色氨酸代谢相关的基因模块。

模型构建和评估:通过Cox回归分析筛选出与预后相关的色氨酸代谢相关基因,随后对TCGA训练集应用10种机器学习算法的246种组合来构建预后模型;对其他数据集使用C-index、Kaplan-Meier分析和ROC曲线等方法评估模型准确性。

实验验证:通过qRT-PCR、Western blot、CCK8实验和transwell实验在临床样本和细胞系中验证基因表达差异和功能影响。


结果



01

肾透明细胞癌肿瘤细胞中色氨酸代谢发生异常改变

目的:通过单细胞RNA测序数据(GSE156632)来评估色氨酸代谢在ccRCC中的作用。

结果:

1. 在ccRCC患者的肿瘤样本和相邻正常样本中,发现色氨酸代谢通路富集分数在不同上皮细胞中存在显著差异,表明色氨酸代谢与上皮细胞的不同生物学状态相关;

2. 上皮细胞的亚聚类和注释确定了这种差异主要源自近端小管细胞;

3. 将近端小管细胞被进一步细分为正常、过渡(表达正常近端小管和恶性细胞标记)和恶性细胞,而色氨酸代谢分数在这些细胞类型中逐渐下降,表明其参与了近端小管细胞的恶性转化(图1A);

4. 拟时序分析显示,色氨酸代谢评分随着拟时间的增加而稳步下降,进一步支持色氨酸代谢异常在细胞恶性转化起重要作用(图1B)。

图1


02

鉴定与色氨酸代谢相关的Hub基因

目的:识别ccRCC中单细胞和批量RNA测序数据中与色氨酸代谢相关的hub genes

结果:

1. 对近端小管细胞进行了hdWGCNA分析,确定了6个不同颜色模块基因,其中绿松石模块的特征基因与色氨酸代谢富集分数关联最强(图1C);

2. 对TCGA-KIRC队列的转录组数据进行WGCNA分析,发现紫色模块基因与色氨酸代谢富集分数的相关性最高(图1D)

3. 结合hdWGCNAWGCNA分析结果确定了142个共有的色氨酸代谢相关基因(图1E)

4. 单因素Cox回归分析表明,这142个基因中有35个与患者预后显著相关,这些基因被选为进一步分析的对象(图1F)。

图1


03

集成机器学习方法构建模型与性能评估

目的:通过集成机器学习方法构建最优预后模型并评估其性能。

结果:

1. 将TCGA-KIRC数据集按7:3的比例随机分为训练集和内部验证集,并用不同机器学习组合进行基因筛选和模型构建,其中SC(bwd)+GBM组合的模型最优(图2A);

2. 基于AIC值从35个基因中选择了11个基因构成TMRS,这11个基因在模型中的重要性和部分依赖图表明了每个基因对模型预测的贡献和影响(图2B,C);

3. TMRS风险评分与“KEGG_Tryptophan_Metabolism”特征的ssGSEA富集分数呈负相关,表明TMRS能准确反映ccRCC中色氨酸代谢状态(图2D);

4. 高风险TMRS组的患者总体生存率(OS)显著较差,且与较差的PFS相关(图2E);

5. ROC曲线分析显示TMRS在预测1年、3年和5年生存率方面具有较高的AUC值,进一步证实TMRS的预测能力(图2F)。

图2


04

列线图构建

目的:评估TMRS的独立预后价值并构建列线图。

结果:

1. TMRS风险评分在晚期疾病和高等级患者中更高,且在多因素Cox回归分析中显示出独立预后价值(图3A-C);

2. 基于TMRS的列线图在预测OSPFS方面表现出色,具有高C-index值和良好的校准曲线(图3D-F);

3. 决策曲线(DCA)进一步确定了OS列线图的临床价值,展示了其指导治疗决策和有效改善患者护理的潜力(图3G)。

图3


05

探索TMRS对患者治疗结果的潜在机制

目的:探究TMRS如何影响患者的预后。

结果:

1. UMAP可视化显示,TMRS风险评分不同的患者之间存在显著的生物学状态差异(图4A);

2. Hallmark特征的基因集变异分析确定了所有数据集中与TMRS显著相关的途径,包括与代谢、恶性肿瘤和免疫反应相关的途径(图4B);

3. ESTIMATE分析表明,TMRS评分与免疫评分正相关,与肿瘤纯度负相关(图4C,D);

4. ssGSEA算法表明,TMRS评分升高的患者中大多数免疫细胞的丰度更高,包括“抗癌”和“促癌”免疫细胞(图4E);

5. CIBERSORT算法结果显示,调节性T细胞和M0巨噬细胞均显著增加,而部分数据集中的M1巨噬细胞、单核细胞和静息肥大细胞显著减少(图4F);

6. 这些结果表明高TMRS评分与更异常的代谢途径、增加的肿瘤恶性程度和增强的免疫反应相关,进一步支持TMRS作为预测ccRCC患者预后和治疗反应的潜在生物标志物的价值。

图4


06

TMRS与预后的关联

目的:分析TMRS在单细胞水平上与不良预后和更高恶性程度的关联。

结果:

1. 单细胞转录组分析证实了上述发现,TMRS风险评分从正常细胞到过渡细胞,再到恶性细胞逐渐增加,强调了TMRS与恶性程度的关联(图5A-C)

2. Scissor算法分类结果显示,Scissor+恶性细胞表现出显著更高的TMRS风险评分和更高比例的高风险细胞,强调了高TMRS与不良预后的强相关性(图5D-F)。

3. 单细胞水平的通路分析结果显示,与TMRS风险评分正相关的HALLMARK特征主要与免疫(如异体移植排斥、干扰素γ反应和炎症反应)和肿瘤恶性程度(如上皮-间质转化、E2F靶标和G2M检查点)相关,而与TMRS风险评分负相关的途径主要涉及代谢过程(图5G,H)。

4. 这些结果与批量转录组分析结果一致,并且与TMRS水平较高的患者预后明显较差的情况相一致。

图5


07

TMRS与基因组特征以及患者治疗反应之间的关联

目的:探讨TMRSccRCC患者的基因组特征以及对免疫疗法和靶向治疗的响应性之间的关联。

结果:

1. 高TMRS风险评分的患者有出更高的特定肿瘤抑制基因(如SETD2、BAP1KDM5C)突变频率和更多的拷贝数变异,表明高TMRS评分与基因组不稳定性有关(图6A,C,D);

2. 高TMRS风险评分患者的MATH评分显著升高,而TMB水平没有显著差异,表明高TMRS评分可能与肿瘤内部异质性增加有关(图6B);

3. TIDE分析显示TMRS风险评分与TIDE评分和T细胞功能障碍评分正相关,表明高TMRS评分的患者可能对免疫疗法的反应较差(图6E-H);

4. 在免疫治疗队列中,高TMRS风险评分的患者总体生存率和无进展生存率显著降低,进一步证实高TMRS风险评分的患者对免疫治疗的反应减弱(图6I,J);

5. 通过OncoPredict算法进行药物预测,发现高TMRS风险评分的患者对卡博替尼和索拉非尼的敏感性增加,表明这些药物可能在高TMRS评分的患者中更有效(图6K)。

图6


07

实验验证TMRS基因异常表达及DDAH1在肿瘤恶性化中的作用

目的:验证TMRS中基因的异常表达以及DDAH1在肿瘤恶性中的作用。

结果:

1. qRT-PCR结果显示,在25对临床ccRCC样本及其相邻正常组织中,TMRS所有基因在肿瘤样本中的表达均显著下调,与早期数据库观察结果一致(图7A);

2. KM分析表明,临床队列中高TMRS风险评分的患者预后较差(图7B);

3. Western blot结果显示,DDAH1蛋白在肿瘤样本中的表达也显著下调,与CPTAC数据库的结果相符(图7C);

4. 细胞功能实验结果显示,DDAH1敲低显著增强了786-OCaki-1细胞系的增殖和迁移能力(图7D-F);

5. 色氨酸代谢检测结果显示,DDAH1敲低后,细胞培养上清液中犬尿氨酸与色氨酸的比值显著增加,表明DDAH1的表达水平与色氨酸代谢途径的激活密切相关(图7G);

6. 这些发现表明DDAH1表达降低可能导致ccRCC细胞恶性程度增强。

图7


结论



本文从“色氨酸代谢代谢+肾透明细胞癌的预后模型”方向出发,利用集成机器学习算法成功开发了一个与色氨酸代谢相关的肾透明细胞癌预后模型。研究发现TMRS与免疫、代谢、细胞增殖和转移等通路相关,并与肿瘤的基因组特征、免疫治疗和靶向药物敏感性有关。此外,研究还验证了TMRS中的基因在ccRCC患者中的异常表达,并确定了DDAH1基因在ccRCC细胞增殖和转移中的重要作用。然而,由于临床研究的限制,进一步验证标志物在预后和免疫治疗方面的效果的大规模前瞻性研究仍然有待开展。


1

END

1

公众号后台私信太多回复不及时,SCI论文润色服务可以添加下图客服微信👇,其他合作或疑难解答可加入我们平台交流群(Q群二维码在下面👇)找管理员对接,同时与你的同行们共同交流、学习、进步。

SCI论文润色|翻译|降重|投稿咨询|SCI期刊推荐等业务详情请扫码咨询!


不想错过生信文献解读

欢迎大家添加生信学霸为星标推荐

SangerBox小红书

保存图片打开小红书,扫码关注

每天更新生信相关内容

SangerBox交流群 

保存图片打开QQ,扫码关注

SangerBox平台交流群直接联系

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/177748