宫颈癌是最常见的妇科恶性肿瘤之一，严重威胁着全球女性的健康。流行病学数据显示，中国宫颈癌的发病率和死亡率近几十年来持续攀升，形势尤为严峻。值得注意的是，局部晚期宫颈癌（LACC）在中国等发展中国家尤为常见，其标准治疗方案是同步放化疗（CCRT），但即便接受CCRT治疗，仍有约30%的患者面临治疗失败的风险，无病生存期（DFS）仅为70%。

目前，临床常用的LACC预后预测方法存在诸多局限性。如基于国际妇产科联盟（FIGO）分期的方法难以有效区分同分期患者的预后差异，无法精准反映肿瘤的内在生物学异质性；传统的临床预后模型纳入的影响因素有限，同样无法全面评估患者的预后情况；影像组学模型受限于样本量小、缺乏外部验证等，准确性及可扩展性较差。

为解决上述难题，中国科学院深圳先进技术研究院梁晓坤团队与北京协和医院胡克、侯晓荣团队等合作开发并验证了一种基于深度学习的多模态预后模型CerviPro，该模型整合了治疗前后CT影像、手动提取影像组学特征以及临床变量等多种数据，能预测接受根治性放疗LACC患者的DFS。在内、外部验证中，CerviPro预测性能稳健，能有效将患者分为高、低风险组。总之，CerviPro为临床提供更可靠的预后评估工具，助力个性化治疗策略的制定。

研究团队共纳入来自不同医院、1,018例接受根治性放疗的LACC患者，将其分为训练队列（691例）、内部验证队列（173例）和外部验证队列（154例）。患者的中位年龄为52岁，多数处于FIGO 2018分期的IIB期，鳞状细胞癌是主要的病理类型。中位随访时间为47.3个月，期间有20.1%的患者出现复发或疾病进展。

CerviPro模型整合了深度特征、手动影像组学特征和临床特征等三类关键特征。

深度特征：使用基于3D U-Net的自动分割网络处理治疗前后盆腔CT影像，随后利用预训练基础模型提取8,192个高维特征；通过主成分分析（PCA）将其降维至30个特征，可保留关键预后信息，并最大限度减少冗余。

手动影像组学特征：提取包括形状、纹理、统计分布指标等在内的214个参数，经过方差筛选后，保留147个与生存结局显著相关的特征。

临床特征：涵盖年龄、FIGO分期、肿瘤大小、血红蛋白水平、鳞状上皮细胞癌抗原（SCC）水平等9个临床变量。

最后将上述三类特征标准化后进行融合，形成多模态特征集，输入多层感知器（MLP）进行生存预测。

CerviPro模型的代码可在GitHub（https://github.com/yangguang-siat/CerviPro）上获取。

图1. CerviPro模型

接下来，研究团队对CerviPro进行性能评估。Kaplan-Meier分析显示，在训练和内部验证队列中，该模型能有效区分不同风险水平的患者，表现优于其他模型，体现出良好的稳健性和准确性。但在外部验证中，模型风险分层能力下降，表明其跨中心泛化性面临挑战。

图2. 在训练、内部验证和外部验证队列中，使用CerviPro模型预测DFS的Kaplan-Meier生存曲线

进一步，研究团队分析了CerviPro模型在不同时间点（12个月、36个月和60个月）对DFS的预测性能。在训练、内部验证队列中，模型的AUC 值分别为0.96、0.92、0.87和0.79、0.80、0.80，表明具有较强的预测准确性、稳定性以及优异的敏感性和特异性。外部验证队列中，模型AUC值降至0.64-0.63，表明其跨中心泛化能力有限，这与样本量、随访时间、患者特征及影像数据异质性等有关。

此外，随着预测时间延长至60个月，各队列的AUC值均呈下降趋势，这可能反映了与长期DFS预测相关的复杂性和不确定性增加。

图3. 12、36和60个月时DFS预测的ROC曲线和AUC值

研究团队比较了不同特征组合的模型表现。在训练队列中，CerviPro模型AUC达0.86，显著优于单一临床特征、深度特征或手动影像组学特征模型，证明多模态特征融合在捕获DFS相关复杂信息方面具有协同作用。在内部验证队列中，该模型表现依旧出色，AUC为0.82。

在外部验证队列中，CerviPro模型AUC为0.71 、0.65，尽管有所下降，但经过迁移学习更新（使用20%外部数据）后AUC提升至0.76-0.79，充分证明了多模态特征融合的显著优势。

图4. 使用不同特征集跨队列进行DFS预测的ROC曲线和AUC值

研究团队将CerviPro与其他模型进行预测性能比较，发现该模型在所有队列中的一致性指数（C指数）最高，风险分层效果最显著。在内部验证队列中，CerviPro模型C指数为0.806，显著高于 Cox模型和DeepSurv模型；Kaplan-Meier分析显示，其能明显区分高、低风险组，可捕捉特征与生存结局的复杂非线性关系。在外部验证队列中，Cox和DeepSurv模型性能显著下降，CerviPro模型性能虽稍有下降但表现相对稳定，凸显了多模态深度学习方法在应对临床数据异质性挑战方面的优势。

为探究多中心数据对模型性能的影响，研究设计了两种再训练场景。在场景A中，CerviPro使用原始训练队列和两个外部验证队列的组合数据集进行再训练，结果显示其在原始内部验证队列上的性能基本稳定，C指数略有上升，表明模型在原始临床环境中稳定性交强，即使加入了外部数据，其预测能力在该环境下依然可靠。

场景B中，将一个外部队列纳入训练集，在另一个预留的外部队列进行评估，发现模型性能显著提升，12个月AUC提高0.06、C指数提高0.038，表明整合来自不同中心的异质数据能够提供有价值的互补信息 ，可增强模型的泛化能力，并强调了开发统一的多机构训练框架以应对数据集变异的必要性。

综上所述，通过系统整合治疗前后CT影像、深度/手动影像组学特征及临床变量等多模态数据，CerviPro能精准区分高/低复发风险宫颈癌患者，可指导高危人群接受免疫治疗等强化策略，同时避免低危患者过度治疗。该模型基于自动化分割与常规临床数据的设计具有显著临床转化潜力，可适配现有诊疗工作流。

未来需通过更大规模的前瞻性实验、标准化影像协议、扩大多中心数据集、延长随访时间等方式进一步优化CerviPro模型，同时纳入真实世界数据并开展更大规模前瞻性验证，以推动其在临床常规实践中的应用。

参考文献：

Wang, W., Yang, G., Liu, Y. et al. Multimodal deep learning model for prognostic prediction in cervical cancer receiving definitive radiotherapy: a multi-center study. npj Digit. Med. 8, 503 (2025). https://doi.org/10.1038/s41746-025-01903-9

·END·

阅读推荐

高彩霞团队开发无痕可编程染色体编辑技术

诺奖得主Jennifer Doudna等成立儿童CRISPR治疗中心

刘文欣团队发表局晚期宫颈癌新辅助免疫化疗临床研究成果

HERGAST：破解超大规模空间转录组分析难题

快点亮"在看”吧

npj Digital Med | 梁晓坤/胡克/侯晓荣团队开发多模态深度学习模型CerviPro，助力宫颈癌患者精准预后预测

高彩霞团队开发无痕可编程染色体编辑技术

高彩霞团队开发无痕可编程染色体编辑技术