Py学习  »  机器学习算法

JACS | MetalloDock: 基于物理感知深度学习解码金属蛋白-配体相互作用并助力金属蛋白药物研发

DrugAI • 2 周前 • 31 次点击  

本文介绍一项来自浙江大学侯廷军教授、潘培辰研究员、李丹教授团队和陈文腾副教授发表的研究工作。该研究提出了一种名为MetalloDock的金属蛋白分子对接框架,旨在解决现有分子对接方法在金属配位体系中精度不足、泛化能力受限等关键问题。MetalloDock创新地将自回归空间解码机制与受物理约束的几何构象生成范式相结合,通过配位原子感知模块显式引入金属配位先验,并提出金属引导拓扑生长算法(metal-guided topological growth algorithm, MTGA),从金属中心出发逐步重建配体结合构象。在对接精度、金属-配体相互作用建模以及金属蛋白靶标虚拟筛选等多个任务中,MetalloDock均展现出最先进(SOTA)的性能,为金属蛋白靶向药物研发提供了一种新的计算工具。

研究背景

金属蛋白是生物体系中一类重要的功能蛋白,其通过与一种或多种金属离子形成特定配位结构,在核酸修饰和酶催化等多种生命过程中发挥关键作用。金属蛋白的功能异常往往与多种疾病的发展密切相关,因此,靶向金属蛋白已成为药物研发中的重要策略之一。然而,与常规蛋白–配体相互作用不同,金属–配体配位过程涉及复杂的电荷转移和极化效应,其配位几何构型也会随金属离子的氧化态、自旋态及周围化学环境的变化而发生调整,从而表现出灵活的配位数和方向性特征。这些因素使得传统分子对接方法及基于固定电荷力场的打分函数难以准确刻画金属配位体系,限制了其在金属蛋白靶点中的适用性。目前仅有少数分子对接工具针对金属蛋白进行了特化设计,且大多局限于锌离子体系,难以覆盖更复杂的金属配位环境。此外,现有深度学习对接模型大多未针对金属蛋白体系进行专门优化,且受限于高质量金属蛋白–配体数据的匮乏,其在金属介导相互作用建模方面仍存在明显不足。因此,发展面向金属蛋白体系的专用计算方法,并构建高质量数据资源,已成为推动金属蛋白靶向药物发现的关键挑战。


方法概述

本研究提出了一种面向金属蛋白靶点的智能分子对接框架MetalloDock。为提升模型在金属配位体系中的泛化能力与预测精度,研究团队基于蛋白质数据库(PDB)系统构建了一个大规模的高质量金属蛋白–配体复合物数据集。此外,研究团队设计了一种层次化的多尺度表征架构,通过金属蛋白质的原子–残基混合表征与配体的原子–片段混合表征,并引入跨粒度特征融合机制,在保证计算效率的同时有效捕捉关键相互作用信息。为了精确建模金属-配体相互作用,MetalloDock引入了配位原子感知模块预测最可能参与金属配位的配体原子,并将其作为后续构象生成的起始原子,从而在生成过程中显式引入金属配位先验。在此基础上,作者提出了金属引导的拓扑生长算法,以金属中心为锚点,结合E(3)等变图神经网络(EGNN)优先预测该配位原子的空间坐标,先行重建金属配位几何结构,随后沿配体的共价拓扑结构逐步完成构象的自回归生成。最后,MetalloDock通过混合密度网络(MDN)对金属蛋白-配体复合物中的节点距离分布进行概率建模,并将该分布转化为统计势,用于定量评估金属蛋白–配体的结合强度。

图1. MetalloDock方法概述。


结果与讨论

金属蛋白-配体对接性能

研究团队在自主构建的金属蛋白–配体测试集上系统评估了MetalloDock的对接性能,并与多种传统分子对接工具及代表性深度学习方法进行了全面对比。结果显示,MetalloDock在整体对接成功率上显著优于所有对比方法,即使在更具挑战性的双金属配位体系中,依然能保持稳定的对接性能,展现出对复杂金属配位体系的适应能力。此外,MetalloDock在Zn2+、Mg2+、Ca2+、Mn2+、Fe2+、Co2+等多种体系中表现出稳定的跨金属泛化性能,凸显其作为通用金属蛋白对接框架在药物发现中的实际应用潜力。

图2.不同对接方法的性能比较。


金属配位环境感知能力

由于MetalloDock采用基于自回归的分子对接架构,构象生成质量高度依赖起始配位原子的选择,因此配位原子的准确识别成为决定对接结果的关键因素。在测试集中,MetalloDock对配体配位原子的预测准确率高达88.9%,为高质量结合构象的生成提供了有力保障。进一步地,研究团队借助CMM在线平台评估了各模型对金属配位环境中配位原子的识别性能,结果表明,MetalloDock能够准确再现金属中心的配位数及配位原子类型,复现能力显著优于其他方法,体现出其对金属配位化学本质的有效学习。此外,MetalloDock支持用户指定配位原子作为对接锚点,在多种体系中进一步提升了对接表现,凸显了其在实际金属蛋白药物设计中的应用潜力。 

图3. MetalloDock对配位原子的预测性能。


金属配位几何构型重建能力

金属蛋白分子对接的核心挑战之一在于准确刻画金属–配体配位相互作用。研究团队从配位距离、配位角度和几何复现度等多个维度,对不同模型的金属配位几何构型重建能力进行了系统评估。结果显示,MetalloDock在配位距离预测上与晶体结构最为接近,在配位角度预测中亦表现优异。基于CMM平台的几何复现分析进一步表明,MetalloDock在多种金属配位环境下均保持较高的金属配位几何构型复现率,能够稳定重现实验中真实存在的金属配位模式。

图4. 各模型对金属配位几何的重建率。


虚拟筛选性能评估

研究团队系统评估了MetalloDock在金属蛋白靶点虚拟筛选中的表现,并与多种主流深度学习模型和传统分子对接工具进行了全面对比。结果显示,MetalloDock在所有指标中均显著优于所有对比方法,能够有效富集金属蛋白靶点的活性化合物,充分体现了对金属–配体相互作用的精准建模能力。在最优设置下,MetalloDock在排名前0.5%的候选分子中实现了高达21.8的富集因子。这些结果表明,MetalloDock 能有效降低实验筛选成本,为金属蛋白靶向药物发现提供了一种高效可靠的计算工具。

图5. 各模型的虚拟筛选性能。


MetalloDock 助力发现新型PSMA抑制剂

研究团队针对前列腺特异性膜抗原(PSMA)这一金属蛋白靶点,验证了MetalloDock 在真实药物发现场景中的应用潜力。通过对Specs商业化合物库中约20万个分子进行虚拟筛选,MetalloDock成功鉴定两个对PSMA具有亚微摩尔水平抑制活性的小分子。分子对接结果显示,这两种化合物均可与口袋内Zn2+例子形成金属配位作用,充分验证了MetalloDock在大规模化合物库中高效富集金属靶向抑制剂的能力。

图6. MetalloDock识别PSMA抑制剂的工作流。


总结

本研究发布了MetalloDock,这是首个专为金属蛋白-配体对接任务设计的深度学习分子对接模型。该方法将自回归构象生成与物理约束的几何建模相结合,在金属配位体系的结合构象预测与结合亲和力评估中展现出显著优势。MetalloDock不仅能够准确感知金属配位环境,还能准确重建金属配位几何构。其在真实药物发现场景中的成功应用进一步验证了该方法在金属蛋白靶向药物研发中的实用价值,展示了 MetalloDock 作为新一代金属蛋白分子对接工具的广阔应用前景。


参考资料

MetalloDock: Decoding Metalloprotein–Ligand Interactions via Physics-Aware Deep Learning for Metalloprotein Drug Discovery. Hui Zhang, Xujun Zhang, Qun Su, Yangyang Zheng, Linlong Jiang, Kai Zhu, Qiaolin Gou, Odin Zhang, Shi Li, Bo Peng, Shaokai Ni, Yushen Du, Jiayi Tang, Yu Kang, Chang-Yu Hsieh, Dan Li, Wenteng Chen, Tingjun Hou, and Peichen Pan. Journal of the American Chemical Society.

DOI: 10.1021/jacs.5c15876

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/191775