Py学习  »  机器学习算法

5 组学 + 机器学习 + 单细胞 + 空转 + 实验验证|Molecular Cancer解析胶质母细胞瘤精准分层与靶点挖掘

Med-MIMIC • 昨天 • 13 次点击  


点击蓝字

关注我们

今天分享一篇2026 年发表于 Molecular Cancer的顶刊生信佳作,作者团队以IDH 野生型胶质母细胞瘤(GBM)为研究对象,整合基因组、转录组、蛋白质组、放射组、病理组五组学,搭配机器学习构建预后分层模型,再用单细胞转录组、空间转录组解析异质性,最终锁定PDIA4/EIF3I/RFT1三个核心靶点并完成干湿结合验证,堪称多组学 + AI + 肿瘤异质性 + 临床转化的教科书级范式。


中文标题:基于多组学数据的机器学习模型支持风险分层,并识别胶质母细胞瘤中的分子异质性和治疗靶点

发表:Mol Cancer

发表时间:2025年3月

影响因子:33.9/Q1

研究背景

胶质母细胞瘤(GBM)存在高度分子异质性,现有预后分层多依赖单一组学,难以全面解析肿瘤特征,需整合多组学与机器学习构建更精准的风险分层体系。

研究方法


收集 IDH 野生型 GBM 患者的放射组学、病理组学、基因组、转录组与蛋白质组数据,采用后期融合策略结合多种机器学习构建预后模型,完成风险分层;再通过多组学差异、单细胞 / 空间转录组解析异质性,并筛选与验证PDIA4、EIF3I、RFT1为治疗靶点。

研究结果

1.多模态预后模型的开发与验证


研究以郑州大学第一附属医院的1187例IDH野生型胶质母细胞瘤患者为内部队列,整合转录组、蛋白质组、全外显子测序、MRI影像、病理全切片、单细胞及空间转录组等多模态数据,并结合TCGA、CGGA等多中心外部数据集完成验证。采用晚期融合策略,先构建各单模态预后模型,再通过Cox回归与十折交叉验证整合为五组学多模态融合风险分层模型。
结果显示,该多模态模型在风险分层、预测准确度、临床净获益、模型拟合度、校准能力及分层效能等各类评价指标上,均显著优于单组学及四组学模型,稳健性与综合性能更佳。

    2.高风险组和低风险组的基因组变异谱


    探究基因突变与拷贝数变异(CNV)在高低风险GBM队列中的差异:高风险组基因突变、C>A置换显著富集,两组TMB无明显差异;队列存在共有高频突变基因,TP53在高风险组突变频率更高。
    不同风险组的突变基因、驱动基因及共突变通路功能特征差异显著,高风险多富集细胞周期、基因表达、免疫调控相关通路,低风险侧重DNA修复、代谢与神经元功能等。
    另外,两组染色体拷贝数扩增与缺失模式不同,CNV相关基因的通路富集存在明显分化,进一步佐证高低风险组的分子机制差异。

        3.GBM中转录组-蛋白质组的异质性


        探究GBM高低风险组的转录组与蛋白质组分子异质性,本研究开展差异表达及系列富集分析。结果显示两组通路特征差异显著:高风险组富集免疫反应、细胞周期、基质重塑、代谢及基因表达调控等通路;低风险组集中于神经过程、钙信号、突触活性与神经元-肿瘤互作相关通路。GSEA、GSVA分析互相验证,证实转录组与蛋白质组的通路富集模式一致、结果稳健。

            4.跨多组学层级的综合生物通路分析


            通过多组学差异分析、ORA及GSVA探究GBM分子异质性:高低风险组在各组学层面通路特征稳定,高风险组活化细胞增殖、细胞周期、免疫及致癌信号通路,低风险组富集神经元活动与分子运输相关通路。该风险分层体系区别于传统GBM转录组亚型,可覆盖更广的肿瘤异质性。

            5.潜在治疗靶点的识别与实验验证


            依托多模融合风险分层,筛选高风险组多组学高表达基因,最终锁定PDIA4、RFT1、EIF3I三个潜在治疗靶点。体外细胞实验证实,敲低三者可显著抑制GBM细胞增殖、迁移与侵袭;构建裸鼠颅内原位模型的体内实验进一步验证,沉默靶基因能有效抑制肿瘤生长并延长小鼠生存期。综上,三个关键基因可正向调控GBM恶性进展,是极具潜力的治疗靶点。

            6.细胞类型特异性风险分层及单细胞分辨率下的治疗目标定位


            通过单细胞测序分析GBM高低风险组的细胞异质性:完成质控与23类细胞注释后,借助多模态风险模型划分风险分组并对比细胞亚群构成。该样本整体以髓系细胞和肿瘤细胞为主,神经元、淋巴细胞及血管细胞占比偏低。低风险组显著富集少突胶质细胞与TAM-MG亚群;Ro/e分析显示,高风险组多种免疫及肿瘤相关细胞相对增多,低风险组少突胶质细胞、TAM-MG细胞占比更高,多数细胞类型在两组间无明显差异。

            对高低风险组各细胞亚群开展GSEA功能分析,树突状细胞、单核细胞、少突胶质细胞与NK细胞的组间功能差异最为显著。高风险组上述细胞普遍富集干扰素应答、抗原呈递、线粒体代谢、蛋白翻译及细胞周期相关通路;低风险组则以脂质代谢、多种信号通路、表观遗传调控与应激反应通路为主。 

            Scissor分析划分出两类预后相关细胞亚群:不良预后相关细胞以恶性肿瘤细胞为主,良好预后相关细胞多为树突状细胞、T细胞等免疫细胞,单核细胞预后关联具有场景依赖性。 

            此外,PDIA4、RFT1、EIF3I三个治疗靶点主要表达于肿瘤及血管相关细胞,可为GBM亚型靶向治疗提供依据。

            7.通过空间转录组学剖析GBM中的空间异质性


            借助空间转录组结合RCTD解卷与单细胞参考,本研究解析GBM肿瘤空间异质性,划分出四种具有独特细胞组成的细胞生态位。各生态位细胞构成特征分明:生态位1以髓系单核细胞为主,生态位2富集神经元相关细胞,生态位3富含CAF,生态位4偏向恶性肿瘤细胞。

            不同生态位存在稳定的细胞关联模式,且在肿瘤组织内呈空间分区分布。高低风险组整体微环境占比相近,但高风险组轻度富集生态位2、4,低风险组偏向生态位1。整体证实GBM存在空间隔离的多细胞生态结构,为肿瘤微环境及靶向治疗的空间特征提供了依据。

              文章小结

              这篇 Molecular Cancer 真正做到了:

              数据够大:自建大队列 + 多中心外部验证

              技术够全:五组学 + 机器学习 + 单细胞 + 空间转录组

              机制够深:从突变→通路→微环境→细胞→空间→功能

              转化够强:发现可靶向的新靶点,直接指向临床应用

                如果您对神经疾病的生信文献有兴趣,请为小编点点关注,如果您需要生信分析的定制化服务,欢迎联系小编~



                往期推荐

                IF 7.5,单基因生信分析+糖酵解+分子对接揭示:胶质母细胞瘤代谢新靶点

                IF 7.1,单细胞 + 网络机器学习 + 铁死亡|复发性胶质母细胞瘤再破局,星形胶质细胞ZFP36成核心治疗靶点

                IF 7.9,偏头痛伴抑郁 vs 不伴抑郁:脑网络动态差异被 HMM + 机器学习精准解码

                分享让更多人看看

                Python社区是高质量的Python/Django开发社区
                本文地址:http://www.python88.com/topic/197671