翻译后修饰(PTMs)是蛋白质功能的重要调控因子,其受扰动是错义变异导致疾病的重要机制。深度学习能够帮助预测PTM位点并识别受变异影响的PTM,但受限于缺乏大规模、高质量的训练数据。研究人员提出了PTMAtlas,一个通过系统性重分析241个公共质谱数据集生成的数据库,包含397,524个高置信度PTM位点;并开发了DeepMVP,在PTMAtlas上训练的深度学习框架,可预测磷酸化、乙酰化、甲基化、SUMO化、泛素化和N-糖基化等六种修饰类型。DeepMVP在六类PTM预测中均显著优于现有工具,并在预测错义变异导致的PTM改变时表现出与实验结果高度一致的性能。该研究为PTM研究提供了稳健平台,也为评估编码变异的功能后果提供了可扩展的新框架。
相关研究于2025年8月26日发表在Nature Methods上。
PTMs在蛋白质活性、稳定性、定位和相互作用中发挥关键作用,对信号转导、代谢和环境响应至关重要。错义变异通过影响PTM位点或其邻近区域,可能破坏原有修饰或引入新的修饰,从而导致疾病。然而,现有的计算工具大多聚焦于磷酸化且依赖于已深入研究的激酶,难以扩展至其他类型的修饰。近年来,虽然出现了基于深度学习的非酶依赖模型,但其准确性依然受限,主要原因是缺乏高质量、大规模的数据集。研究人员推断,通过系统性重分析公共质谱数据集生成高质量训练数据,并结合先进的深度学习模型,能够显著提升PTM预测性能,并可靠评估变异对PTM的影响。
研究人员系统性重分析了241个PTM富集质谱数据集,构建了涵盖六大主要PTM类型的数据库 PTMAtlas。在此基础上,开发了DeepMVP模型,用于PTM位点预测和变异效应评估。DeepMVP采用卷积神经网络(CNN)与双向门控循环单元(GRU)的组合架构,并通过遗传算法优化,再结合模型集成策略提升鲁棒性。
研究人员共鉴定出397,524个高置信度PTM位点,包括乙酰化(33,010)、甲基化(15,843)、N-糖基化(7,920)、磷酸化(194,903)、SUMO化(39,071)和泛素化(106,777)。与现有数据库(如PSP、UniProt等)相比,PTMAtlas在覆盖度和质量上均有显著提升。
利用PTMAtlas训练的DeepMVP在六种PTM类型的预测任务中均取得了优于其他八种主流工具的表现,AUC值全部超过0.85,其中N-糖基化预测的AUC高达0.98。研究人员还通过严格的序列相似性控制验证了模型的泛化能力,确认DeepMVP在不同数据划分下均能保持稳定的性能。
借助DeepMVP,研究人员在全人类及病毒蛋白质组范围内进行了六类PTM的预测,显著扩展了覆盖范围。例如,在SARS-CoV-2蛋白质组中,DeepMVP预测了超过1,600个位点的多种修饰,并与实验结果高度一致,进一步验证了模型的准确性。
研究人员手工整理了235个文献验证的变异–PTM对,并在此基础上评估了DeepMVP的预测性能。结果显示,DeepMVP在81%的事件中正确识别了PTM位点,并在方向性预测上总体准确率达到97%。此外,在CPTAC癌症蛋白质组学数据集的验证中,DeepMVP在检测变异引起的PTM改变方面优于现有工具,且与实验结果高度一致。
在ClinVar数据库中,DeepMVP预测32%的致病性变异会显著影响PTM,涉及超过12,000个修饰事件,其中部分结果与已知致病机制吻合(如LMNA S22A与心脏传导病、RAF1 S259F与Noonan综合征等),也提出了新的潜在功能假设。在泛癌分析中,DeepMVP预测31%的体细胞错义突变可改变PTM,并通过实验在TP53和VHL变异中得到验证,揭示了可能的致癌机制。
错义变异通过改变PTM进而影响蛋白质功能,是疾病发生的重要途径。现有预测方法受限于单一修饰类型和数据不足,无法实现全面评估。DeepMVP结合高质量的PTMAtlas数据库和先进的深度学习设计,实现了跨六类修饰的高精度预测,不仅在蛋白质组范围内扩展了PTM位点覆盖,也可靠地识别了变异导致的修饰改变。研究人员展示的案例(如ClinVar致病变异和癌症突变)表明,DeepMVP能够连接基因变异与功能后果,为揭示疾病机制和开发潜在治疗靶点提供新的工具。未来,随着更多实验数据的积累,DeepMVP有望进一步提升性能,并推广至更广泛的蛋白质修饰研究与临床应用。
参考资料
Wen, B., Wang, C., Li, K. et al. DeepMVP: deep learning models trained on high-quality data accurately predict PTM sites and variant-induced alterations. Nat Methods (2025).
https://doi.org/10.1038/s41592-025-02797-x
感兴趣的读者,可以添加小邦微信加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位
或姓名-学校-职务/研究方向。