社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

连发Nature!深度学习将蛋白质设计玩弄于股掌之中!

BioMedAdv • 1 周前 • 30 次点击  

RoseTTAFold,作为David Baker教授团队早期开发的蛋白质结构预测工具,在学术界与工业界广受认可。然而,随着时间推移,仅局限于预测已知结构的蛋白质并不能满足生物医药和生物工程领域对创新设计的需求。这促使David Baker教授团队继续深入研究突破。在此背景下,RFdiffusion应运而生,继承了RoseTTAFold的优良基因,但在功能上实现了质的飞跃,不仅能够预测蛋白质结构,更能够从无到有地进行创新设计。这种“从零开始”的设计理念赋予科学家们前所未有的设计自由度,这一突破不仅标志着蛋白质设计技术的重大进步,也意味着科研人员可以更深入地探究生命现象的本质,甚至创造出全新的生物功能和应用。

计算机辅助药物设计的应用场景非常广泛,几乎涵盖了药物研发的各个阶段和各种类型的药物。可以帮助科学家快速、准确地发现和验证药物靶点。可以基于结构的药物设计(SBDD)、基于配体的药物设计(LBDD)以及高通量虚拟筛选(HTVS)等技术,从大量化合物中筛选出具有潜在活性的先导化合物,并对其进行优化,提高其药效和降低其毒性。可以预测药物分子与生物大分子(如蛋白质、核酸等)之间的相互作用模式。这有助于研究人员理解药物的作用机制,并设计出更精确、更有效的药物。对于传统中药,计算机辅助药物设计也可以帮助分析其活性成分和作用机制,为中药现代化和国际化提供科学依据。

综上所述,本次培训会议是在深度学习驱动蛋白质设计这一新兴领域快速发展的背景下举办,旨在促进相关领域的科研人员、工程师及产业界人士对该领域的理解与技术掌握,推动深度学习技术在蛋白质设计领域以及计算机辅助药物设计、药物研发领域的创新应用与实际转化。

本次培训会议的主办方为北京软研国际信息技术研究院,承办方互动派(北京)教育科技有限公司,会议会务合作单位为北京中科四方生物科技有限公司,具体相关事宜通知如下:

专题一

(线下授课)

深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用

(详情内容点击上方名称查看)

2024年05月31日-06月02日

北京面授(第一天报到,授课2天)

专题二

(直播5天)

计算机辅助药物设计-从蛋白质结构到药物候选物的全方位实战

(详情内容点击上方名称查看)

2024年06月01日-06月02日

2024年06月08日-06月10日

专题三

(直播3天)

GROMACS分子动力学模拟、药物开发溶剂筛选技术与应用

(详情内容点击上方名称查看)

2024年06月08日-06月10日



01

培训特色


1、本次课程会提供无限次回放视频,发送全部案例模型文件。

2、前沿技术深度聚焦:

课程紧密围绕近年来的Nature、Science等顶级期刊文献研究热点与重大突破,全面剖析其基本原理、高级功能和实际应用案例,为参加培训的学员提供详尽的最前沿研究成果,包含前沿理论知识与技术方法实践。

3、实用技能与案例教学:

课程不仅讲解理论知识,更注重实践操作与案例分析。通过练习环节,学员将亲手操作,提升实际应用能力。

案例分析则帮助学员理解这些技术在解决具体科学问题或工业挑战中的实际应用效果,增强理论与实践的结合。

☆往期学员反馈:


02

培训讲师


深度学习蛋白质设计讲师

由国家双一流、985高校特聘研究员、博士生导师讲授。近五年发表SCI研究论文20余篇,获国际生物设计会议奖励(The International BioDesign Research Conference)。

主持基金委蛋白质设计相关项目和科技部重点研发计划课题多项。主要擅长分子设计、分子模拟方法研究等。

计算机辅助药物设计讲师

由全国重点大学、国家“双一流”、“211工程”重点建设医药类高校副教授,硕士生导师讲授。发表SCI研究论文20余篇,主持和参与国家级、省部级自然科学基金项目多项。拥有多年新药分子设计和开发经验,主要擅长CADD、AIDD等药物设计方法研究。

GROMACS分子动力学讲师

由湖北省重点建设高校、国内一流学科建设高校特聘教授、国立台湾大学博士后毕业、美国研究型大学和世界名校留学生讲授。在国内外学术期刊发表研究论文二十余篇,曾先后主持和参与国家自然科学基金和省自然科学基金数十项。

拥有十余年的分子模拟、化学反应动力学、量子化学研究经验,主要擅长计算分子模拟、分子动力学、热力学、化学反应动力学等研究,其中溶剂化自由能计算方法研究被评为“Top Tier”的研究贡献。



03

培训内容


深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用

目录及主要内容

RFdiffusion

创新结构生成技术

一、背景介绍

1、从蛋白质预测到蛋白质设计

2、结构生成过程中的物理能量函数与约束

3、基于Deep learning的预测模型和生成模型

4、结构验证与性能评估

二、RFdiffusion基于指定骨架的蛋白质结构设计

核心知识点:利用用户提供的特定结构框架进行蛋白质结构设计

应用案例:

1、无约束单体设计(contigmap):全新骨架的蛋白质结构创新设计,通过RFdiffusion实现从头生成新颖、非同源蛋白质结构

2、特定骨架引导设计 (scaffoldguided):利用已有结构骨架指导蛋白质结构创新与改造

RFdiffusion 

高级应用及领域热点

三、RFdiffusion含活性位点的蛋白质结构设计

核心知识点:使用RFdiffusion构建具有特定生物活性的蛋白质结构

应用案例:

1、Motifscaffold: inference.input_pdb & contigmap.inpaint_seq:如何整合已知活性位点信息,嫁接到设计的新蛋白质结构上

实例分析:酶活位点嫁接,对称位点嫁接的设计策略与实施

四、蛋白质-蛋白质相互作用界面(PPI):Binder设计

核心知识点:RFdiffusion设计能有效介导蛋白间相互作用的Binder区域

应用案例:

1、ppi.hotspots:识别和利用PPI热点信息来定制Binder结构

2、设计实例:针对指定骨架和/或特定motif的Binder结构创建

五、RFdiffusion中的对称性设计

核心知识点:阐述如何在蛋白质结构设计中考虑并实现对称性特征

应用案例:

1、Inference.symmetry: 对称性建模与控制

2、potentials:优化对称单元间的能量分布与稳定性

六、多样性

核心知识点:探究RFdiffusion在处理结构多样性上的机制和优势

应用案例:diffuser.partial_T:局部扩散与全局优化结合,提高结构多样性和稳健性、RFdiffusion中的noise

ProteinMPNN

LigandMPNN 序列设计基础与高级应用

七、ProteinMPNN序列设计入门

核心知识点:介绍ProteinMPNN的核心架构与训练过程,掌握ProteinMPNN和LigandMPNN在不同场景下的蛋白质结构序列设计流程

应用案例:

1、Monomer单体序列设计:用ProteinMPNN针对单体蛋白质进行序列设计

2、Complex复合物zhong 指定链设计:利用ProteinMPNN在复合物环境下设计特定链的序列,涉及链间相互作用的考虑与优化。

Models, Helper scripts, number of sequences:深入了解模型使用方法、辅助脚本的功能以及决定生成序列数量的因素

八、指定设计位点与氨基酸偏好性设置

核心知识点:在蛋白质设计中如何运用深度学习工具来精准控制特定氨基酸残基的位置与特性

应用案例:

1、Fix position与Redesign position:保留某些部位不变(Fix position)和重新设计其他部位(Redesign position)的具体操作。

Bias AA与Omit AA:在设计过程中如何设置氨基酸偏好性,包括优先选择某些氨基酸(Bias AA)和排除特定氨基酸(Omit AA),以满足特定功能需求或生物物理化学特性。

RFdiffusion与

ProteinMPNN 高级应用案例分析

九、MPNN进阶应用 

核心知识点:MPNN对称性处理与同聚多体设计、MPNN设计多样性与温度参数调控

应用案例:

1、MPNN处理对称性Symmetry:讲解MPNN如何识别和处理蛋白质的对称性特征,特别是对于Homooligomers(同聚多体)的设计。

2、Tied position(绑定位置):探讨MPNN在处理需要保持多个位置协同变化以维持特定对称模式的情况下的具体方法。

MPNN设计多样性:探究MPNN如何通过温度参数调整来促进设计序列的多样性,以及多样性对最终蛋白质功能和稳定性的影响。

十、Colabfold 结构预测与深度学习应用

1、MSA、pLDDT和pAE:介绍多序列比对(Multiple Sequence Alignment)、预测精度得分(predicted Local Distance Difference Test, pLDDT)和原子接触误差(predicted Atomic Error, pAE)在蛋白质结构预测中的重要作用。

2、逆转网络与幻想蛋白设计

探讨如何通过深度学习技术逆向设计已知结构或创造新型蛋白质结构的可能性。

互动讨论

1、分享与解析近期领域内热点研究成果中RFdiffusion + ProteinMPNN的实际应用案例

2、讨论并解决实际操作中可能遇到的问题与挑战,进一步提升学员对深度学习在蛋白质结构设计领域中的理解和应用能力

最新顶刊文献中对应的该课程内深度学习蛋白质结构设计技术

RoseTTAFold Diffusion

De novo design of protein structure and function with RFdiffusion. Nature. 2023, 620(7976):1089-1100

De novo design of high-affinity binders of bioactive helical peptides. Nature. 2024, 626(7998):435-442 (多肽Binder)

Computational design of sequence-specific DNA-binding proteins. bioRxiv. 2023.09.20.558720 (核酸Binder)

Atomically accurate de novo design of single-domain antibodies. bioRxiv. 2024.03.14.585103v1

ProteinMPNN

Robust deep learning–based protein sequence design using ProteinMPNN. Science. 2022, 378(6615):49-56.

Improving Protein Expression, Stability, and Function with ProteinMPNN. J Am Chem Soc. 2024, 146(3):2054-2061.

LigandMPNN

Atomic context-conditioned protein sequence design using LigandMPNN. bioRxiv. 2023.12.22.573103v1

RoseTTAFold and RFDesign

Accurate prediction of protein structures and interactions using a three-track neural network. Science. 2021, 373 (6557) : 871-876.

Efficient and accurate prediction of protein structure using RoseTTAFold2. bioRxiv. 2023.05.24.542179v1

Accurate prediction of protein–nucleic acid complexes using RoseTTAFoldNA. Nat Methods. 2024, 21(1):117-121.

Generalized biomolecular modeling and design with RoseTTAFold All-Atom. Science. 2024, eadl2528.

Scaffolding protein functional sites using deep learning. Science. 2022, 377(6604):387-394.

trRosetta and trDesign

Improved protein structure prediction using predicted interresidue orientations. Proc Natl Acad Sci U S A. 2020, 117 (3) : 1496-1503.

Protein sequence design by conformational landscape optimization. Proc Natl Acad Sci U S A. 2021, 118(11):e2017228118.

De novo design of small beta barrel proteins. Proc Natl Acad Sci U S A. 2023, 120(11):e2207974120.

Colabfold, Alphafold and ESMfold

ColabFold making protein folding accessible to all. Nat Methods. 2022, 19(6):679-682.

Improved protein structure prediction using potentials from deep learning. Nature. 2020, 577(7792):706-710.

Highly accurate protein structure prediction with AlphaFold. Nature. 2021, 596(7873):583-589.

Protein complex prediction with AlphaFold-Multimer. bioRxiv. 2021.10.04.463034v2.

Evolutionary-scale prediction of atomic-level protein structure with a language model. Science. 2023,379(6637):1123-1130.

幻想蛋白

De novo protein design by deep network hallucination. Nature. 2021, 600(7889):547-552.

Hallucinating symmetric protein assemblies. Science. 2022, 378(6615):56-61.

De novo design of luciferases using deep learning. Nature. 2023, 614(7949):774-780. (受控幻想)

部分案例展示:

计算机辅助药物设计-从蛋白质结构到药物候选物的全方位实战

目录及主要内容

生物分子互作基础与蛋白数据库应用

一、生物分子相互作用研究方法

核心知识点:

1、蛋白-小分子、蛋白-蛋白相互作用原理

2、分子对接研究生物分子相互作用

3、蛋白蛋白对接研究分子相互作用

二、PDB蛋白数据库

核心知识点:

1、PDB数据库介绍及在药物研发中的价值

2、PDB蛋白数据库功能

3、PDB数据解读与下载

4、靶点蛋白结构类型、背景分析与相关资源获取

实战演练:

1、PDB数据库的使用

2、靶点蛋白结构序列下载

3、批量下载蛋白质晶体结构

蛋白结构分析与建模

三、Pymol软件应用

核心知识点:

1、Pymol软件安装与初始设置

2、基本知识介绍(如氢键等)与图解技巧

3、小分子与蛋白、蛋白与蛋白相互作用可视化

4、表面图、静电势表示与结构叠加及比对

5、绘制相互作用力及动画制作

实战演练:

1、尼洛替尼与靶点相互作用分析、结合口袋表面图制作

2、Bcr/Abl靶点结构叠合、蛋白相互作用动画制作

3、ACE2与病毒Spike复合物相互作用图解

四、同源建模

核心知识点:

1、同源建模的功能及使用场景

2、Swiss-Model 同源建模流程

3、蛋白序列搜索与比对(blast等方法)

4、蛋白模板选择与模型搭建

5、模型评价与优化(蛋白拉曼图)

实战演练: 

用病毒Spike蛋白序列进行同源建模与评价

五、小分子构建与化合物库

核心知识点:

1、Chemdraw软件应用

2、小分子结构构建与理化性质(如分子量、clogP等)计算

3、小分子数据库-DrugBank、ZINC、ChEMBL、天然产物、中药成分等数据库使用

实战演练:

构建大环、氨基酸、DNA、RNA等分子 ;从指定数据库中挖掘目标化合物信息

分子对接与虚拟筛选

六、分子对接深度解析

核心知识点:对接原理与对接软件(如AutoDock、DOCK等)

1、半柔性对接

1.1 小分子配体优化准备

1.2 蛋白受体优化及坐标文件准备

1.3 蛋白受体格点计算

1.4 半柔性对接计算

2、柔性对接

2.1 小分子配体优化准备

2.2 蛋白受体优化及坐标文件准备

2.3 蛋白受体格点计算

2.4 柔性对接计算及结果评价

2.5 半柔性对接与柔性对接比较与选择

3、对接结果评价

3.1 晶体结构构象进行对比

3.2 能量角度评价对接结果

3.3 聚类分析评价对接结果                      3.4 最优结合构象的选择

3.5 已知活性化合物对接结果比较

实战演练:

1、激酶Bcr/Abl靶点抑制剂的半柔性对接及对接结果分析

2、激酶Bcr/Abl靶点抑制剂的柔性对接及对接结果分析

3、半柔性对接与柔性对接比较与选择

七、虚拟筛选

核心知识点:

1、虚拟筛选定义、流程构建及演示

2、靶点蛋白选择、化合物库获取

3、虚拟筛选与结果分析(打分值、能量及相互作用分析)

实战演练:Bcr/Abl靶点抑制剂的虚拟筛选并分析筛选结果

八、小分子格式转换

核心知识点:

1、开源工具OpenBabel软件介绍

小分子结构类型与格式转换

拓展对接场景与药物设计策略

九、特殊对接场景与应用

核心知识点:

1、蛋白-蛋白、蛋白-核酸大分子对接

1.1 蛋白-蛋白\核酸对接的应用场景、相关程序的介绍

1.2 受体和配体蛋白前期优化准备

1.3 载入受体和配体分子

1.4 蛋白-蛋白\核酸相互作用对接位点设定

1.5 蛋白-蛋白\核酸对接结果分析与解读

2、蛋白-多肽对接

2.1 蛋白-多肽相互作用简介

2.2 蛋白-多肽分子预处理

2.3 蛋白-多肽分子对接

2.4 对接结果展示与分析

3、含金属离子的蛋白靶点与小分子对接

3.1 金属酶蛋白-配体的相互作用

3.2 蛋白及配体分子的收集与预处理

3.3 金属离子的处理与准备

3.4 金属辅酶蛋白-配体的对接

3.5 对接结果展示与分析

实战演练:

1、病毒Spike蛋白及宿主蛋白ACE2的对接

2、新冠靶点3CL与多肽/类多肽抑制剂对接

3、基质金属蛋白酶MMP与抑制剂对接

十、多元化对接应用场景

核心知识点:

4、小分子-小分子对接

4.1 小分子-小分子相互作用简介

4.2 小分子结构预处理

4.3 小分子-小分子对接

4.4 对接结果展示与分析

5、核酸-小分子对接

5.1 核酸-小分子的应用场景、核酸-小分子相互作用简介

5.2 核酸-小分子的预处理

5.3 核酸-小分子对接

5.4 相关结果的展示与分析

6、共价对接

6.1 共价对接的原理及应用场景

6.2 蛋白和共价结合配体的预处理

6.3 药物分子与靶蛋白的共价对接

6.6 相关结果的展示与分析

实战演练:

1、环糊精与药物小分子对接

2、DNA-G-四链体与配体对接

3、激酶靶点EGFR抑制剂的共价对接

前沿药物设计策略与实践

十一、基于碎片药物设计

核心知识点:

1、理论与方法

2、化合物库构建策略

(骨架替换、碎片连接、碎片生长)

3、分别建立基于药效团、结合口袋、分子描述符的化合物库生成

4、基于BREED规则的化合物库构建

5、基于碎片的化合物库筛选

实战演练:

基于片段的Bcr/Abl靶点抑制剂优化与改造

十二、基于反向找靶的“老药新用”实践

核心知识点:

1、“老药新用”和“反向找靶”背景介绍

2、基于配体相似性实现“反向找靶”

3、基于药效团筛选实现“反向找靶”

4、基于反向对接实现“老药新用”

实战演练:

已上市药物分子的老药新用以及其他任意小分子的反向找靶实践

部分案例展示:

向下滑动查看



GROMACS分子动力学蛋白模拟、药物开发溶剂筛选技术与应用

目录及主要内容

GROMACS程序入门

一、GROMACS程序入门

1、主要算法介绍:最速下降法、共轭梯度法、有限差分法

2、力场介绍:AMBER、CHARMM、MMX、CVFF、OPLS;力场类型、参数和分类

3、基础知识:积分迭代器、积分步长选取、温度控制、压力控制、周期性边界条件

4、模拟基本流程:能量最小化、NVE弛豫、NVT控温、NPT控压、MD平衡模拟

5、计算化学基本概念:范德华表面、分子表面、接触表面、溶剂可及表面、势能面

实战演练:

1、Linux入门操作及方法

2、并行环境搭建

3、win版、linux版编译安装及运行

4、GROMACS文件类型:PDB、GRO、TOP/ITP、XVG、MDP

5、力场概念、分类及力场参数修改:探究力场具体形式,为以后创建自己体系做准备,以OPLS为例,力场的各种参数说明及修改

GROMACS在生物体系建模中的应用

二、生物体系建模

1、辅助工具软件:Packmol、GaussView、vmd、Grace等

2、模型建模/TOP文件的生成:生物小分子PDB构建、模型及原子类型定义、结构调整(键长、键角、二面角)生物小分子top结构构建、itp文件建立、拓扑文件生成工具

实战演练:

1、构建一个简单的生物分子体系模型并运行

2、蛋白质、核酸、多肽、溶剂等复杂体系构建

三、建模结果分析

1、模拟结果分析方法整合

2、结构稳定性分析:RMSD、RMSF、PCA等

3、动态行为分析:轨迹可视化、自由体积、扩散系数等

4、相互作用分析:氢键网络、接触面积、界面水分子等

实战演练:

1、模拟轨迹分析:trajectory,sasa,rdf,freevolume等

2、生成拓扑结构和坐标文件:editconf,genconf,pdb2gmx等

3、模拟能量分析:energy,enemat等

4、系统动态结构分析:cluster,confrms,midist等

5、空间分布性质:gyrate,msd,rdf,traj等

6、分子结构分析:hbond,order,principal,spol等

7、静电作用分析:dielectric,dipoles,potential等

四、水溶性蛋白质与配体作用的分子动力学模拟及结果分析

1、配体与蛋白处理:坐标文件与拓扑文件修改

2、模拟过程与参数设置:能量最小化、NVT/NPT平衡、取样策略

3、分子动力学结果分析

实战演练:

1、配体分子的处理、 蛋白结构的处理

2、修改蛋白坐标文件、修改拓扑文件

3、构建盒子并放入溶剂、平衡系统电荷

4、能量最小化、NVT平衡、NPT平衡

5、模拟结果取样、模拟结果分析:

轨迹文件观察、能量数据作图、计算斜方差、测量回旋半径、计算结构的RMSD值、计算原子位置的根均方波动、计算模拟过程中分子间的氢键的数目、距离或角度 

五、生物膜磷脂双分子层生物膜、膜蛋白等建模

1、理解生物膜磷脂双分子层的结构特点

2、膜蛋白的多样性和功能机制

3、使用分子建模技术对生物膜进行建模与模拟的方法

实战演练:

1、磷脂分子结构、双分子层建模  

2、模拟水通道(蛋白、多肽等)

3、插入溶剂分子、模拟系统达平衡 

4、分析溶剂分子扩散速率、分子间的氢键的数目、距离或角度  

高级进阶模拟分子自由能计算实践

六、自由能计算(伞形采样法为例)

伞形采样法:创建反应路径构型、伞形采样、结合自由能计算

实战演练:

1、创建一系列反应路径分子构型

2、提取模拟间隔质心轨迹

3、模拟每个构型的伞形采样

4、柱状图分析计算结合自由能

5、模拟结果讨论                       

七、药物分子开发溶剂筛选     

1、热力学积分方法:溶剂筛选的理论基础

2、药物分子建模:构建药物在不同相态的模型

3、分配系数计算:理论计算与快速预测方法

实战演练:

1、药物分子溶解在水相,油相和醇相的建模

2、计算不同相态下的分配系数

3、快速预测药物分配系数

部分案例展示:

向下滑动查看




04

报名须知


时间地点

深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用

2024年05月31日-06月02日

北京面授(第一天报到,授课2天)


计算机辅助药物设计-从蛋白质结构到药物候选物的全方位实战

2024年06月01日-06月02日

2024年06月08日-06月10日

在线直播(授课5天)


GROMACS分子动力学模拟、药物开发溶剂筛选技术与应用

2024年06月08日-06月10日

在线直播(授课3天)

报名费用

(含报名费、培训费、资料费)

深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用:

¥3700元/人

CADD蛋白质结构分析、分子对接、碎片药物设计、老药新用技术与应用:

¥4900元/人

GROMACS分子动力学蛋白模拟、药物开发溶剂筛选技术与应用

¥2900元/人

1、2024年5月10日前报名缴费可享受200元早鸟价优惠(仅限前十名);

2、之前参加过我单位其它课程的学员可享受老学员100元优惠;

注:费用提供用于报销的正规机打发票及盖有公章的通知文件,如需开具会议费的单位请联系招生老师索取会议邀请函;北京中科四方生物科技有限公司作为本次会议会务合作单位,负责注册费用收取和开具发票。

增值服务

1、凡报名线上课程学员将获得本次培训书本(或电子课件)教材及所有案例文件;

2、提供无限次回放视频:凡报名学员课程结束后可获得所学专题课程无限次回放视频;

3、凡报名线上课程学员将获得课程相关Windows版本软件安装指导(一年有效期);

4、参加培训并通过考试的学员,可以获得:由北京软研国际信息技术研究院培训中心颁发的《深度学习蛋白质设计技术与应用工程师》、《计算机辅助药物设计工程师》、《分子动力学技术与应用工程师》专业技能结业证书;

联系方式


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/170103
 
30 次点击