今天分享一篇2026 年发表于 Molecular Cancer的顶刊生信佳作,作者团队以IDH 野生型胶质母细胞瘤(GBM)为研究对象,整合基因组、转录组、蛋白质组、放射组、病理组五组学,搭配机器学习构建预后分层模型,再用单细胞转录组、空间转录组解析异质性,最终锁定PDIA4/EIF3I/RFT1三个核心靶点并完成干湿结合验证,堪称多组学 + AI + 肿瘤异质性 + 临床转化的教科书级范式。中文标题:基于多组学数据的机器学习模型支持风险分层,并识别胶质母细胞瘤中的分子异质性和治疗靶点
发表时间:2025年3月
影响因子:33.9/Q1
胶质母细胞瘤(GBM)存在高度分子异质性,现有预后分层多依赖单一组学,难以全面解析肿瘤特征,需整合多组学与机器学习构建更精准的风险分层体系。
收集 IDH 野生型 GBM 患者的放射组学、病理组学、基因组、转录组与蛋白质组数据,采用后期融合策略结合多种机器学习构建预后模型,完成风险分层;再通过多组学差异、单细胞 / 空间转录组解析异质性,并筛选与验证PDIA4、EIF3I、RFT1为治疗靶点。
研究以郑州大学第一附属医院的1187例IDH野生型胶质母细胞瘤患者为内部队列,整合转录组、蛋白质组、全外显子测序、MRI影像、病理全切片、单细胞及空间转录组等多模态数据,并结合TCGA、CGGA等多中心外部数据集完成验证。采用晚期融合策略,先构建各单模态预后模型,再通过Cox回归与十折交叉验证整合为五组学多模态融合风险分层模型。结果显示,该多模态模型在风险分层、预测准确度、临床净获益、模型拟合度、校准能力及分层效能等各类评价指标上,均显著优于单组学及四组学模型,稳健性与综合性能更佳。探究基因突变与拷贝数变异(CNV)在高低风险GBM队列中的差异:高风险组基因突变、C>A置换显著富集,两组TMB无明显差异;队列存在共有高频突变基因,TP53在高风险组突变频率更高。不同风险组的突变基因、驱动基因及共突变通路功能特征差异显著,高风险多富集细胞周期、基因表达、免疫调控相关通路,低风险侧重DNA修复、代谢与神经元功能等。另外,两组染色体拷贝数扩增与缺失模式不同,CNV相关基因的通路富集存在明显分化,进一步佐证高低风险组的分子机制差异。探究GBM高低风险组的转录组与蛋白质组分子异质性,本研究开展差异表达及系列富集分析。结果显示两组通路特征差异显著:高风险组富集免疫反应、细胞周期、基质重塑、代谢及基因表达调控等通路;低风险组集中于神经过程、钙信号、突触活性与神经元-肿瘤互作相关通路。GSEA、GSVA分析互相验证,证实转录组与蛋白质组的通路富集模式一致、结果稳健。
通过多组学差异分析、ORA及GSVA探究GBM分子异质性:高低风险组在各组学层面通路特征稳定,高风险组活化细胞增殖、细胞周期、免疫及致癌信号通路,低风险组富集神经元活动与分子运输相关通路。该风险分层体系区别于传统GBM转录组亚型,可覆盖更广的肿瘤异质性。
依托多模融合风险分层,筛选高风险组多组学高表达基因,最终锁定PDIA4、RFT1、EIF3I三个潜在治疗靶点。体外细胞实验证实,敲低三者可显著抑制GBM细胞增殖、迁移与侵袭;构建裸鼠颅内原位模型的体内实验进一步验证,沉默靶基因能有效抑制肿瘤生长并延长小鼠生存期。综上,三个关键基因可正向调控GBM恶性进展,是极具潜力的治疗靶点。
6.细胞类型特异性风险分层及单细胞分辨率下的治疗目标定位
通过单细胞测序分析GBM高低风险组的细胞异质性:完成质控与23类细胞注释后,借助多模态风险模型划分风险分组并对比细胞亚群构成。该样本整体以髓系细胞和肿瘤细胞为主,神经元、淋巴细胞及血管细胞占比偏低。低风险组显著富集少突胶质细胞与TAM-MG亚群;Ro/e分析显示,高风险组多种免疫及肿瘤相关细胞相对增多,低风险组少突胶质细胞、TAM-MG细胞占比更高,多数细胞类型在两组间无明显差异。
对高低风险组各细胞亚群开展GSEA功能分析,树突状细胞、单核细胞、少突胶质细胞与NK细胞的组间功能差异最为显著。高风险组上述细胞普遍富集干扰素应答、抗原呈递、线粒体代谢、蛋白翻译及细胞周期相关通路;低风险组则以脂质代谢、多种信号通路、表观遗传调控与应激反应通路为主。
Scissor分析划分出两类预后相关细胞亚群:不良预后相关细胞以恶性肿瘤细胞为主,良好预后相关细胞多为树突状细胞、T细胞等免疫细胞,单核细胞预后关联具有场景依赖性。
此外,PDIA4、RFT1、EIF3I三个治疗靶点主要表达于肿瘤及血管相关细胞,可为GBM亚型靶向治疗提供依据。
借助空间转录组结合RCTD解卷与单细胞参考,本研究解析GBM肿瘤空间异质性,划分出四种具有独特细胞组成的细胞生态位。各生态位细胞构成特征分明:生态位1以髓系单核细胞为主,生态位2富集神经元相关细胞,生态位3富含CAF,生态位4偏向恶性肿瘤细胞。
不同生态位存在稳定的细胞关联模式,且在肿瘤组织内呈空间分区分布。高低风险组整体微环境占比相近,但高风险组轻度富集生态位2、4,低风险组偏向生态位1。整体证实GBM存在空间隔离的多细胞生态结构,为肿瘤微环境及靶向治疗的空间特征提供了依据。
这篇 Molecular Cancer 真正做到了:
数据够大:自建大队列 + 多中心外部验证
技术够全:五组学 + 机器学习 + 单细胞 + 空间转录组
机制够深:从突变→通路→微环境→细胞→空间→功能
转化够强:发现可靶向的新靶点,直接指向临床应用