
原文题目:Scaffolding protein functional sites using deep learning
DOI:10.1126/science.abn2100蛋白质的生化功能通常由构成功能位点的残基子集执行——例如,酶活性位点或蛋白质或小分子结合位点——因此具有新功能的蛋白质的设计可分为两个步骤。第一步是确定产生所需活性的功能位点几何形状和氨基酸身份——对于酶,这可以使用量子化学计算来完成,对于蛋白质粘合剂,可以通过片段对接计算. 或者,可以从具有所需活性的天然蛋白质中提取功能位点。在这里,我们关注第二步:给定来自任何来源的功能位点描述,设计一个氨基酸序列,该序列折叠成包含该位点的三维 (3D) 结构。以前的方法可以支撑由一个或两个连续链段组成的功能位点,但是,除了螺旋束,这些不能轻易扩展到由三个或更多链段组成的更复杂的位点,并且生成的主链不能保证是可设计的(即,可被某些氨基酸序列编码)。
功能性从头蛋白质设计的理想方法是(i)将功能位点以最小的变形嵌入可设计的支架蛋白质中;(ii) 适用于任意场地几何形状,搜索所有可能的支架拓扑结构和二级结构组成,以找到最适合容纳指定场地的那些;(iii)共同产生骨架结构和氨基酸序列。我们之前证明了 trRosetta 结构预测神经网络 可用于通过在序列空间 中的蒙特卡罗采样期间最大化序列折叠为某些(未指定)3D 结构的 trRosetta 输出概率来生成新蛋白质)。我们将此过程称为“幻觉”,因为它产生的解决方案被网络认为是理想的蛋白质,但与任何已知的天然蛋白质都不对应;晶体和核磁共振结构证实了幻觉序列折叠成幻觉结构。trRosetta 还可用于设计折叠成目标骨架结构的序列,方法是使用结构重述损失函数进行序列优化,奖励预测结构与目标结构的相似性。鉴于这种设计序列和结构的能力,我们推断 trRosetta 可以适用于解决功能性站点脚手架问题。这里介绍的脚手架功能位点的方法除了所需功能位点的结构和序列之外不需要任何输入,并且与以前的方法不同,不需要指定支架的二级结构或拓扑结构,并且可以同时生成序列和结构。尽管最近对使用机器学习设计蛋白质序列的兴趣激增,但蛋白质结构的设计相对来说还没有得到充分探索,可能是因为难以有效地表示和学习结构。生成对抗网络和变分自动编码器已被用于生成特定折叠家族的蛋白质骨架,而我们的方法利用 RoseTTAFold 在整个 PDB 上的训练来生成几乎无限的新结构多样性,并能够搭建任何所需的功能残基群。我们的“激活最大化”幻觉方法扩展了该领域的相关工作通过利用其关键优势,使用针对特定问题定制的任意损失函数并设计任意长度序列而无需重新训练的能力。由于其速度和通用性,我们的修复方法从给定的功能位点扩展以生成连贯的序列结构对的能力应该在蛋白质设计中得到广泛的应用。随着更准确的蛋白质结构、界面和小分子结合预测网络的开发,这两种方法单独以及两者的结合应该会增强能力。原文链接:https://www.science.org/doi/10.1126/science.abn2100


2022年医药加精品学习班直播档期
(支付学费可先领取全程视频,再参加一次腾讯会议直播,每月都轮回排班)
8月6日-8月7日 | 医药加膜片钳与光遗传及钙成像技术研讨会 | 腾讯会议+视频回放 |
8月13日-8月14日 |
计算机辅助药物设计网络学习班 | 腾讯会议+视频回放 |
8月13日-8月14日 | 肠道菌群与代谢组学课题设计网络精讲班 | 腾讯会议+视频回放 |
8月19日-8月21日 | 生信多组学数据整合挖掘与分析 | 腾讯会议+视频回放 |
8月20日-8月21日 | 循证医学Meta分析及网络Meta分析精讲班 | 腾讯会议+视频回放 |
8月27日-8月28日 | 单细胞及空间转录组课题设计与数据分析培训 | 腾讯会议+视频回放 |
8月27日-8月27日 | 宏基因组与代谢组学R语言分析及可视化实操班 | 腾讯会议+视频回放 |
9月3日-9月4日 | 多组学联合网络药理学、分子对接及实验验证培训班 | 腾讯会议+视频回放 |
9月3日-9月4日 |
基因编辑技术与动物模型构建精讲班 | 腾讯会议+视频回放 |
9月3日-9月4日 | TCGA,GEO生信高通量数据挖掘两天两晚精讲班 | 腾讯会议+视频回放 |
9月10日-9月11日 | 高分SCI文章与标书作图 | 腾讯会议+视频回放 |






医药加科研神器,可免费下载文献以及各种生信工具免费使用,点击下面阅读原文!