社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

AlphaFold3引领生物药物新革命!国内大佬手把手教您深度学习蛋白质设计

BioArt • 1 月前 • 127 次点击  

2024 年 5 月 8 日,谷歌 DeepMind 与 Isomorphic Labs 联合在《自然》期刊上发布蛋白质领域最新人工智能模型 AlphaFold 3!这一模型能够准确预测蛋白质、DNA、RNA 以及配体等生命分子的结构及其相互作用方式。这是继AlphaFold 2 之后的又一重大突破

在预测类药物相互作用方面,AlphaFold 3 实现了前所未有的准确度,包括蛋白质与配体的结合以及抗体与其靶蛋白的结合。在 PoseBusters 的基准测试中,AlphaFold 3 的准确率比现有最佳传统方法高出 50%,而且无需任何结构信息输入,成为首个超越传统物理预测工具的人工智能系统。这种预测抗体与蛋白质结合的能力,对于理解人类免疫反应的各个方面以及新抗体的设计至关重要。

深度学习在蛋白质设计领域的前沿研究主要集中在蛋白质结构预测、蛋白质序列设计、蛋白质-蛋白质相互作用预测、蛋白质功能注释和蛋白质优化与筛选等方面。这些研究方向为开发新的功能性蛋白质和药物靶点提供了新思路,并在生物医学、药物研发和生物材料等领深度学习在蛋白质设计领域的应用被认为是当前的前沿研究方向之一,深度学习在蛋白质设计领域的不断发展为新药研发、生物制药、生命科学研究等领域带来了许多创新和机会

              2024年最值得期待的三大技术

一、深度学习蛋白质设计

二、CADD计算机辅助药物设计

三、AIDD人工智能药物发现设计



echnology



深度学习在蛋白质设计领域的前沿研究主要集中在蛋白质结构预测、蛋白质序列设计、蛋白质-蛋白质相互作用预测、蛋白质功能注释和蛋白质优化与筛选等方面。这些研究方向为开发新的功能性蛋白质和药物靶点提供了新思路,并在生物医学、药物研发和生物材料等领深度学习在蛋白质设计领域的应用被认为是当前的前沿研究方向之一,蛋白质结构预测与设计领域的未来将充满创新和跨学科的发展,为解决生物医学、生物工程和生物能源等方面的重大问题提供更多可能性。

蛋白质折叠和结构预测
:深度学习模型可以预测蛋白质的三维结构,这对理解蛋白质的功能和开展蛋白质设计至关重要。通过深度神经网络模型和注意力机制的应用,可以更准确地预测蛋白质的折叠和结构。
蛋白质序列设计
:深度学习可以用于预测蛋白质序列的功能和稳定性。通过神经网络模型和自然语言处理技术的结合,可以设计出具有特定功能和稳定性的蛋白质序列,例如酶活性、药物靶点等。
蛋白质-蛋白质相互作用预测
:深度学习模型可以预测蛋白质和蛋白质之间的相互作用,从而帮助设计新的蛋白质复合物和抗体。
蛋白质功能注释和预测
:深度学习可以进行蛋白质功能注释和预测,识别蛋白质的功能域、结构域和功能位点等。这有助于预测蛋白质的功能和相应的生物学作用。
蛋白质优化和筛选
:深度学习可以用于优化和筛选设计出的蛋白质。通过神经网络和生成对抗网络的应用,可以提高蛋白质的稳定性、可溶性和活性,以满足特定的设计要求。
蛋白质-蛋白质相互作用预测
:深度学习可用于预测蛋白质与蛋白质之间的相互作用,从而实现蛋白质和配体的高效率设计和筛选等。

近年来发过哪些顶刊以及方向:

Nature communications| 使用基于结构的残基偏好进行蛋白质设计

Nature biotechnology| 用于功能性蛋白质设计的机器学习

Scientific reports| Deep-WET:一种基于深度学习的方法,使用具有加权特征的词嵌入技术预测 DNA 结合蛋白

Cell Systems| 深度学习为蛋白设计开启了新时代

Nat. Comput. Sci| 基于深度学习的无rotamer蛋白质设计

Comput Struct Biotech| 深度学习用于蛋白质设计:从结构到序列与功能

本课程围绕蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程主要面向有编程基础的学员,对基础知识进行详细讲解,并且会结合前沿文献讲解相关技术的应用。帮助学员们, 通过本次培训学员将了解蛋白质设计的底层逻辑与基本规则,并掌握蛋白质设计中的常见蛋白质设计算法的实际操作,具备基本的蛋白质设计算法开发的基础能力及前沿视野。





















01

深度学习蛋白质设计课表

第一天   Python编程基础

1. Python 基础

➣Python 简介:了解Python的历史、特点和与其他编程语言的比较。

➣安装和设置环境:安装Python,设置Python开发环境(如Anaconda、Jupyter notebook)。

➣基本语法:数据类型(整数、浮点数、字符串、布尔值)、变量、基本运算符。

➣控制结构:条件语句(if-else)、循环语句(for循环、while循环)。

➣函数:定义函数、参数、返回值、作用域、递归。

➣数据结构:列表、元组、字典、集合、操作和常用方法。

➣文件操作:读写文件,文件与异常处理。

2. Python 进阶

➣类和对象:面向对象编程基础,创建类,实例化对象,理解封装、继承和多态。

➣模块和包:导入标准模块,使用第三方包,创建自定义模块和包。

➣高级功能:列表推导式、生成器、迭代器、装饰器和匿名函数。

3. Python 在科学计算中的应用

➣NumPy:数组创建、数组操作、数学计算、线性代数等。

Matplotlib:基础图表、科学图形、图表定制。

4. 数据分析与可视化

➣Pandas:数据结构(Series、DataFrame)、数据载入、数据清洗、数据统计、数据合并。

➣数据可视化:使用 Matplotlib 和 Seaborn 进行高级数据可视化。

5. 蛋白质设计中的特定应用

➣BioPython:序列处理、数据库访问、生物学数据的分析。

➣脚本编写:自动化常见的蛋白质设计任务,如序列对比、结构预测。

➣机器学习:使用Scikit-learn进行特征提取、模型训练、评估和优化。

6. 实战项目

➣项目1:蛋白质序列数据分析,如统计特定序列的频率、可视化序列分布等。

➣项目2:蛋白质结构预测,使用机器学习技术预测蛋白质的二级结构或功能位点。

➣项目3:开发一个小型的蛋白质设计工具,集成数据处理、分析及可视化功能。

第二天  shell命令行操作基础

1. Shell环境简介

➣什么是Shell:了解Shell是什么,以及它如何与操作系统交互。

➣不同类型的Shell:Bash, Zsh, Tcsh的介绍。

➣访问Shell:如何打开终端窗口,基础的命令行界面操作。

2. 基础命令

➣文件系统操作:cd, ls, pwd, mkdir, rm, touch 等命令的使用。

➣文件操作:cat, more, less, head, tail, grep, find等命令。

➣权限和所有权:使用chmod, chown, chgrp改变文件的权限和所有权。

➣文本处理:echo, cat, cut, sort, uniq, tr, awk, sed等工具的基本使用。

➣归档和压缩:tar, gzip, gunzip, zip, unzip等命令。

3. Shell脚本编写

➣创建和执行Shell脚本:如何编写一个简单的脚本并使其可执行。

➣变量和数据类型:学习如何在脚本中定义和使用变量。

➣流程控制:

➣条件语句:if, else, elif, case等语句的使用。

➣循环结构:for, while, until循环的使用。

➣函数:如何定义和使用函数。

➣输入和输出:处理用户输入和脚本输出。

➣引用和转义字符:学习如何在命令行中正确使用单引号、双引号和转义字符。

4. 高级Shell编程

➣调试Shell脚本:如何调试Shell脚本,包括设置和使用调试选项。

正则表达式:基本正则表达式的应用,结合grep, sed, awk使用。

➣环境管理:了解PATH和其他环境变量的作用和管理方法。

➣脚本的安全性:编写安全的脚本以避免常见的安全问题。

5. 实用案例和项目

➣数据备份脚本:创建一个自动备份你的重要文件的脚本。

➣文件整理脚本:编写一个自动整理下载文件夹中文件的脚本。

➣PDB文件分析脚本的编写

第三天 蛋白质设计基础: 从经典力场到深度学习

1. 如何计算蛋白质构象的能量?

a) 蛋白质可视化与编辑常用方法

i. pymol使用方法简介

ii. chimera使用方法简介

iii. pdb文件格式详解

iv. 使用python biopython、pymol等库编辑蛋白质结构

b) 分子力学、溶剂化能简介

i. 分子力学公式形式

ii. 溶剂化能的计算方法

iii. MM/PBSA方法计算结合自由能

2. 基于统计势函数的蛋白质设计方法——Rosetta

a) 统计势函数的一般定义

b) 蛋白质设计中的统计势函数

i. Rosetta统计势定义

ii. Rosetta能量函数常见项及物理意义

c) 基于Rosetta势函数的蛋白设计

i. 设计流程

ii. 实验结果

3. 蛋白-蛋白对接的强大——无先验知识的蛋白质药物设计流程

a) 蛋白-蛋白对接简介

i. 蛋白-蛋白对接的定义

ii. RifGen对接方法介绍

b) 蛋白质药物设计

i. 设计流程

ii. 实验结果

4. 深度学习强势登场——蛋白质设计模型ProteinMPNN

a) MPNN 消息传递神经网络简介

b) ProteinMPNN模型简介

i. 模型结构介绍(输入、输出、参数……)

ii. 模型使用(主编程语言Python)

c) 基于ProteinMPNN的蛋白质设计

i. 设计流程

ii. 实验结果

5. 平分秋色还是天壤之别?两种蛋白设计方法的比较

a) 深度学习模型具有更高的序列恢复率

b) 深度学习模型可实现rosetta、alphafold不可完成的设计任务

c) 深度学习模型的短板

第四天 Alphafold vs Rosettafold

1.蛋白结构预测背景介绍

2.早期蛋白质结构预测算法:从统计分析到深度残差网络

2.1 直接耦合分析和互信息计算

2.2 深度残差网络和蛋白质接触图预测

2.3 蛋白质距离矩阵预测

3. 几何约束的梯度下降法到端到端深度学习的蛋白结构预测

3.1 trrosetta和alphafold简介

3.2 端到端几何深度学习方法介绍

4. AF和AF2的差异与创新

4.1 第一代Alphafold简介

4.2 Alphafold2详解

5. Rosettafold详解

5.1 SE3网络

 第五天  基于Alphafold的下游应用

1. AF2多体蛋白结构预测的关键问题与解决途径

1.1 多序列比对中序列拼接配对问题

1.2 模板匹配问题

2. 利用AF2做蛋白和多肽柔性对接

2.1蛋白质表面几何物理化学互补问题

2.3 多肽柔性/构象处理

3. 利用AF2做蛋白结构和序列新设计

3.1 trrosetta幻想设计

3.2 AF2序列和结构幻想设计

4. 利用AF2做结构聚类发现新结构和功能

4.1 alphadatabase数据库结构简介与分析

4.2 foldseek结构比对工具介绍

4.3 新结构与新功能

5. 利用AF2做多构象预测和功能发现

5.1 MSA采样聚类分析及结构预测

5.2 不同MSA可以预测构象之间的转变和功能

6. 利用AF2的部分算法模块做模型质量评估和侧链构象等

  6.1 三角机制提升蛋白质模型质量评估

6.2 局部三角机制和evoformer用于蛋白质侧链预测

第六天  蛋白质的从头生成模型

1. Rosettafold的基本架构回顾

2. 基于Rosettafold的改进

a) 有关扩散模型

b) 基于扩散模型的模型修改

3. RFdiffusion实现通用性蛋白结构生成

a) 蛋白质binder生成

b) 基于骨架结构的蛋白质结构生成

c) 蛋白质单体的从头生成

d) 多聚体蛋白的从头生成

4. ProteinGenerator实现蛋白质骨架与序列的co-design

a) 隐空间中的蛋白质序列-结构的联合分布

b) 与rfdiffusion的异同

5. Rosettafold AA实现多类生物大分子结构预测与生成

a) 加入小分子结构预测器

b) 将局部坐标系迁移到小分子结构

6. Chroma的基本构架与实现

a) 模型讲解

b) 利用chroma逼近蛋白构象空间全空间采样与生成

第七天  大语言模型在蛋白质设计中的应用及多肽设计

1. ProGEN的基本实现

a) 模型构架讲解

b) 与基于结构方法的比较

2. ProGEN的性能与改进 

3. ESM-fold的基本构架

a) ESM网络构架

b) ESMfold网络讲解

c) 与alphafold方法的对比

4. ESM-fold的性能评估

5. 基于大语言模型的蛋白质生成模型的下游应用

a) 蛋白质结构的快速预测

b) 大型蛋白复合物结构预测

6. 多肽设计与蛋白质设计的区别与联系

a) 分子结构稳定性

i. 二级结构含量

ii. 氢键网络与局部二级结构

b) 分子的功能性异同

c) 蛋白质设计方法在多肽设计面临的瓶颈

7. 多肽设计算法

a) 基于Rosetta实现多肽设计

i. Flexpepdock

ii. Anchor extension

b) 基于RF diffusion实现多肽设计

i. 参数的设定与优化方案

ii. 生成结构的评估

c) 基于alphafold 梯度下降进行多肽骨架和序列设计

d) 多肽对接算法

i. 基于Autodock 的多肽对接

ii. 基于alphafold的多肽柔性对接

iii. 其余对接算法

8. 基于多肽蛋白复合物训练的深度学习多肽设计算法


02

课程目标

结构预测基础: 学生将学会通过生物信息学工具分析蛋白质序列,预测其二级结构和三维结构,并理解结构与功能之间的关联。

模型应用与评估: 学生将能够使用机器学习和深度学习模型进行蛋白质结构预测,同时学习如何评估模型的准确性和可靠性,选择正确的工具加以应用。

药物设计: 掌握与蛋白质结构预测相关的药物设计原理,学会设计靶向特定蛋白质的药物分子与多肽药物分子,理解蛋白类药靶相互作用的机制。

03

通过课程学习您将得到

基于深度学习的通用型蛋白设计模型近几年来发展迅速,本课程围绕蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程从零基础开始讲解,对基础知识进行详细讲解,并且会结合前沿文献讲解相关技术的应用。帮助学员们, 通过本次培训学员将了解蛋白质设计的底层逻辑与基本规则,并掌握蛋白质设计中的常见蛋白质设计算法的实际操作,具备基本的蛋白质设计算法开发的基础能力及前沿视野。

















04

授课架构

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答

05

课程解疑、学员评价以及资料

老师针对每一个学员的培训疑问都会耐心解答,每次培训将近2000余次解疑

将近300余页PPT还有相应代码,提供软件安装和指导,报名成功就发送预习视频进行预习


主讲老师们来自国内top1高校,组内工作主要聚焦新型蛋白质设计与蛋白质结构预测算法开发与自动化药物高通量筛选方向,已在Nature Chemistry子刊, JCAS,Angew,JMC,JCTC等权威期刊上发表SCI检索论文20余篇


02

CADD计算机辅助药物设计

课程目标

Science Technology

CADD计算机辅助药物设计:依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。

计算机辅助药物设计(computer aided drug design)是以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的关系,设计和优化先导化合物的方法。计算机辅助药物设计实际上就是通过模拟和计算受体与配体的这种相互作用,进行先导化合物的优化与设计。计算机辅助药物设计大致包括活性位点分析法、数据库搜寻、全新药物设计

   

01

CADD计算机辅助药物设计课表

第一天上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白的下载与预处理

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1优势及主要功能介绍

3.2界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白

-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点

PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

以α-糖苷转移酶和多糖分子对接为例

5.核酸-小分子对接

5.1核酸-小分子的应用现状

5.2相关的程序介绍

5.3核酸-小分子的结合种类

5.4核酸-小分子对接

5.5相关结果的分析

以人端粒

g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶

2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白

(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟(linux与gromacs使用安装)

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4.origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1高斯的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例      

02

课程目标

让学员熟练掌握:PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、分子动力学等技术

03

培训对象

目前计算机辅助药物设计受众人体众多,列如CADD、药物设计、药学、药物研发、药物筛选、新药研发、药物化学、生物制药、免疫、天然产物、兽药研发,生物信息、中药药理、中药化学、网络药理、结构药理、食品安全、食品风味、食药研发、食品研发、抗肿瘤药物、肿瘤免疫、酶工程、遗传、抗体药物、农业工程、化学、有机合成、有机化学、结构生物、合成生物等众多科研人员。


04

培训架构

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答


05

授课资料

老师备课PPT将近1000余页,培训软件都会提供以及指导安装    目前为止已经举办30余期,参会学员达3000余人,学员评价一致非常满意,算是国内CADD计算机辅助药物设计最好的培训课程


计算机辅助药物设计主讲老师来自国内高校北京协和医院药物研究所,主要擅长药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,有十余年的研究经验,以第一作发表论文20余篇

SPORTS


03

AIDD人工智能药物发现与设计发现



课程目标

Science Technology

 AIDD人工智能药物发现与设计:是人工智能和机器学习技术使制药领域实现了现代化。目前机器学习和深度学习算法已被应用于多肽合成、虚拟筛选、毒性预测、药物监测和释放、药效团建模、定量构效关系、药物重定位、多药理和生理活性等药物发现过程。可以很好的将传统的面向化学的药物发现与人工智能药物设计相结合。此外,世界各地的系统生物学和化学科学家与计算科学家合作,开发现代ML算法和原理,大大的可以促进药物的发现和开发。

   

01

AIDD人工智能药物发现与设计课表

第一天

1.AIDD概述及药物综合数据库介绍

2.人工智能辅助药物设计AIDD概述

3.安装环境

(1)anaconda

(2)vscode

(3)pycharm

(4)虚拟环境

4.第三方库基本使用方法

(1)numpy

(2)pandas

(3)matplotlib

(4)requests

5.多种药物综合数据库的获取方式

(1)KEGG(requests爬虫)

(2)Chebi(libChEBIpy)

(3)PubChem(pubchempy / requests)

(4)ChEMBL(chembl_webresource_client)

(5)BiGG(curl)

(6)PDB(pypdb)

第二天 ML-based AIDD

1.机器学习

(1)机器学习种类:

①监督学习

②无监督学习

③强化学习

(2)典型机器学习方法

①决策树

②支持向量机

③朴素贝叶斯

④神经网络

⑤卷积神经网络

(3)模型的评估与验证

(4)分类评估:准确率、精确率、召回率、F1分数、ROC曲线、AUC计算

(5)回归评估:平均绝对误差、均方差、R2分数、可释方差分数

(6)交叉验证

2.sklearn工具包基本使用

3.rdkit工具包的基本使用

4.化合物编码方式和化合物相似性理论知识

5.项目实战1:基于ADME和Ro5的分子筛选

6.项目实战2:基于化合物相似性的配体筛选

7.项目实战3:基于化合物相似性的分子聚类

8.项目实战4:   基于机器学习的生物活性预测

9.项目实战5:基于机器学习的分子毒性预测

第三天 GNN-based AIDD

1.图神经网络

(1)框架介绍: PyG,DGL,TorchDrug

(2)图神经网络消息传递机制

(3)图神经网络数据集设计

(4)图神经网络节点预测、图预测任务和边预测任务实战

2.论文精讲:DeepTox: Toxicity Prediction using Deep Learning

3.项目实战1:基于图神经网络的分子毒性预测

(1)SMILES分子数据集构建PyG图数据集

(2)基于GNN进行分子毒性预测

4.项目实战2:基于图神经网络的蛋白质-配体相互作用预测

(1)蛋白质分子图形化,构建PyG图数据集

(2)基于GIN进行网络搭建及相互作用预测

第四天 NLP-based AIDD

1.自然语言处理

(1)Encoder-Decoder模型

(2)循环神经网络 RNN

(3)Seq2seq

(4)Attention

(5)Transformer

2.项目实战1:基于自然语言的分子毒性预测

(1)SMILES分子数据集词向量表示方法

(2)基于NLP模型进行分子毒性预测

3.项目实战2:基于Transformer的有机化学反应产量预测 (Prediction of chemical reaction yields using deep learning)

4.论文精读及代码讲解:《Mapping the space of chemical reactions using attention-based neural networks》

第五天 分子生成与药物设计

1.分子生成模型

(1)循环神经网络RNN

(2)变分自动编码器VAE

(3)生成对抗网络GAN

(4)强化学习RL

2.项目实战1: 基于图数据的小分子化合物生成模型《A Graph to Graphs Framework for Retrosynthesis Prediction》

3.项目实战2: 基于NLP的抗体生成模型《Generative language modeling for antibody design》

第六天深度学习的蛋白质-配体相互作用预测

蛋白质基本知识介绍

蛋白质的基本格式:序列、二级结构、三级结构

多重序列对比

数据库介绍与相关数据爬取

PDB数据库

UniProt数据库

KLIFS数据库

基于RDKit的蛋白质基本处理

基于RDKit的药效团特征与可视化

基于RDKit的骨架和片段处理

基于RDKit的分子3D构象生成与优化

项目实战:基于序列的蛋白质属性预测

项目实战:基于结构的蛋白质属性预测

项目实战:基于深度学习的蛋白质-配体相互作用

基于深度学习的结合位点比较和脱靶预测

基于深度学习的蛋白质结合位点检测

基于分子对接预测小分子在蛋白质结合位点的结合模式

蛋白质-配体相互作用模型搭建

基于蛋白质-配体相互作用分析器PLIP深入了解蛋白质-配体相互作用

基于机器学习的分子对接来预测蛋白质-配体的结合亲和力(回归任务)

基于三维构象的蛋白质-配体对接及NGLView可视化

基于蛋白质三维数据使用原子卷积网络进行蛋白质-配体相互作用预测



02

课程目标

AIDD人工智能药物发现与设计课程:让学员了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力


03

培训历程

目前为止已经举办30余期,参会学员达2800余人,学员评价一致非常满意,填补了国内人工智能药物研发技术的空白

04

培训对象

目前AIDD药物研发设计受众人体众多,列如CADD、药物设计、药学、药物研发、药物筛选、新药研发、药物化学、生物制药、免疫、天然产物、兽药研发,生物信息、中药药理、中药化学、网络药理、结构药理、食品安全、食品风味、食药研发、食品研发、抗肿瘤药物、肿瘤免疫、酶工程、遗传、抗体药物、农业工程、化学、有机合成、有机化学、结构生物、合成生物等众多科研人员。


05

培训架构

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答


05

授课老师

 AIDD授课老师老师,有十余年的计算机算法研究和程序设计经验。研究方向涉及生物信息学,深度学习,药物靶标识别,药物不良反应等。参与了国自然基金2项,主持了省厅级科研项目3项。一作身份发表SCI论文数篇,包括BMC Bioinformatics, Journal of Biomedical Informatics, International Journal of Molecular Sciences等知名期刊。



授课时间安排

01

深度学习蛋白质设计授课时间

2024.06.08-2024.06.09(9:00-11:30)--(13:30-17:00)


2024.06.15-2024.06.16(9:00-11:30)--(13:30-17:00)


2024.06.22-2024.06.23(9:00-11:30)--(13:30-17:00)


2024.06.29(9:00-11:30)--(13:30-17:00)

共计全7天的课 通过腾讯会议直播    线上实操    提供全部录播


02

CADD计算机辅助药物设计授课时间

2024.06.08-2024.06.09(9:00-11:30)--(13:30-17:00)


2024.06.15-2024.06.16(9:00-11:30)--(13:30-17:00)


2024.06.22-2024.06.23(9:00-11:30)--(13:30-17:00)


2024.06.29(9:00-11:30)--(13:30-17:00)

共计全7天的课 通过腾讯会议直播    线上实操    提供全部录播


 

03

AIDD人工智能药物发现与设计授课时间

2024.06.11-2024.06.14 (19:00-22:00)


2024.06.17-2024.06.20(19:00-22:00)


2024.06.24-2024.06.27(19:00-22:00)


共计全6天的课 通过腾讯会议直播    线上实操     提供全部录播




培训费用及福利

课程报名费用:


深度学习蛋白质设计:

公费价:每人每班¥6880元 (含报名费、培训费、资料费、提供课后全程回放资料)

自费价:每人每班¥6480元 (含报名费、培训费、资料费、提供课后全程回放资料)


CADD计算机辅助药物设计与AIDD药物发现与设计:

公费价:每人每班¥5880元 (含报名费、培训费、资料费、提供课后全程回放资料)

自费价:每人每班¥5480元 (含报名费、培训费、资料费、提供课后全程回放资料)

重磅优惠:

报二送一(同时报名两个班免费赠送一个学习名额赠送班任选)

报四送二(同时报名四个班免费赠送两个学习名额赠送班任选)

优惠1:

两班同报:10880元  (原价18640)

三班同报:14880元   (原价23620)

可免费学习一年特惠:24880元 (可免费学习一整年本单位举办的任意课程)

可免费学习两年特惠:(28880元可免费学习两整年本单位举办的任意课程)

优惠2:提前报名缴费可享受300元优惠(仅限十五名)

报名学习课程可赠送往期课程回放(报多少赠多少)

(可点击跳转详情链接):

回放一:机器学习生物医学

回放二:机器学习单细胞分析专题

回放三:单细胞空间转录组专题

回放四:比较基因组学专题

回放五:机器学习蛋白组学专题

回放六:机器学习微生物专题

回放七:蛋白质晶体结构解析

回放八:机器学习代谢组学技术

培训特色及福利






1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答


授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!



腾讯会议实时直播解答|手把手带着操作



学员对于培训给予高度评价



学员培训后投顶刊


报名咨询方式

           报名咨询微信:15238680799




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/170306
 
127 次点击