数据收集与预处理
整合转录组、甲基化、突变、拷贝数数据,统一标准化。
GC 的转录组数据与相应的临床数据:TCGA
甲基化数据、体细胞突变数据和拷贝数变异 (CNV) 数据:UCSC Xena
患者生存数据:GEO( GSE186205、GSE62254、GSE84437 和 GSE15459 ),其中GSE186205 数据集源自 GC 细胞系,专门包含与铂耐药性相关的信息。
差异表达与耐药基因筛选
从 3283 个差异基因中筛选出 191 个与已知耐药基因集交集的 PRAGs。
分子亚型划分(SNF + 10 种聚类算法)
基于 PRAGs、甲基化、突变信息对 GC 分型。
确定 k=3 最优,获得 CS1、CS2、CS3 三个与铂类耐药相关的分子亚型;CS2 预后最差。
亚型生物学特征解析
CS1-DNA 修复↑/免疫↓;CS2-ECM、PI3K-Akt↑/免疫中等;CS3-免疫↑。
稳定性与外部验证
META-STAD 队列中 NTP、PAM 分类一致性高(κ>0.65),CS2 仍预后最差。表现出分型良好的稳定性。
单细胞转录组分析(GSE183904)
鉴定 11 个细胞类型;耐药基因富集于恶性上皮细胞,并划分高/低耐药组(DRG)。
cNMF + SCENIC 模块分析
发现驱动耐药的关键恶性细胞模块及转录调控网络。
M1 模块在高 DRG 特异富集,其 TFs(KLF9、FOS、ATF3)显著上调。
细胞通讯与空间转录组
高 DRG 恶性细胞与内皮细胞通讯增强(VEGFA-VEGFR 等),并形成局部聚集的耐药生态位。
机器学习预后模型构建
建立基于耐药基因的 GC 预后模型,101 种算法组合中 RSF 模型最优(C-index=0.711),含 11 基因(含 KLF9),1/3/5 年 AUC 达 0.99/0.99/0.95。
免疫治疗与药物反应预测
评估模型对免疫治疗及药物敏感性的预测价值。
高 DRG 患者 OS 差、免疫治疗反应率低;对 dasatinib、erlotinib 等药物敏感性下降。
体外功能验证
KLF9 过表达抑制 AGS 细胞增殖、侵袭,降低铂类 IC50,下调 IL-6、IL-1β、TNF-α。