基于机器学习的分子动力学
第一部分(分子动力学基础)
理论内容
1. 从大数据时代到AI4SCIENCE时代
2.传统分子动力学模拟:经验力场与第一性原理分子动力学
3.机器学习概述
4.机器学习力场的特性,发展和分类
5.机器学习力场构建的一般流程
实操内容(以含氟有机体系为案例)
1. 使用mamba/conda配置虚拟环境,安装LAMMPS,OpenMM,DFTB,XTB,MDtraj,Obabel,ASE等软件
2. 综合使用sobtop软件快速生成任意有机分子的GAFF力场参数文件,并使用OpenMM执行分子模拟
3. sobtop软件的基本介绍和批量操作
4. GAFF力场的概述
5.OpenMM的基本使用
6. 使用XTB或ORCA等软件得到高精度量化数据集
6.1 XTB或ORCA的特点与使用,以及后处理
7. 使用DFTB执行半经验方法GFN2-xTB级别的周期性AIMD
7.1为什么是GFN2-xTB?
7.2如何使用DFTB软件执行周期性的AIMD,及其使用技巧
8. 综合使用机器学习势函数和LAMMPS软件执行分子动力学模拟
8.1 LAMMPS的基本使用
8.2 机器学习模型的加载和注意事项
9. 使用MDtraj软件来分析经验力场,AIMD和机器学习分子模拟的RDF,MSD,以及键角和二面角的分布情况
9.1 MDtraj软件的基本使用
9.2 RDF,MSD,扩散系数的介绍与代码实现
9.3 键角和二面角分布的统计与绘图实现
第二部分(机器学习力场的发展--不变模型系列)
理论内容
1. 机器学习力场的开篇工作:
1.1 BPNN模型详解与发展
2. 基于图卷积框架的SchNet模型
2.1 图神经网络和图卷积网络的概述
2.2 SchNet模型的特点与代码实现
3. 基于3D空间建模完备性与效率的几何系列模型:
3.1 消息传递神经网络框架
3.2 DimeNet,SphereNet和ComENet模型的详解与比较
4. 生态最好的机器学习力场模型
4.1 DeePMD系列工作的详解
实操内容(以合金体系为案例)
1. 使用dpdata转化数据格式,并生成训练,验证和测试数据集
2. DeePMD的超参数概述
3. DeePMD的使用,包括训练,冻结,压缩和测试
4. 综合使用LAMMPS和DeePMD模型执行高精度的分子动力学模拟
5. 分子模拟的数据后处理与分析
第三部分(机器学习力场的发展--等变模型系列,领域热点)
理论内容
1. 等变的概念,特点,分类和应用
2. 等变与不变的区别
2.1 球谐函数与winger-D矩阵
2.2 高阶等变的特点与应用
3. 介绍e3nn框架的基本概念,特点和使用
3.1 不可约概念与张量积
3.2 e3nn如何实现非线性?
4. 等变机器学习力场的经典模型:
4.1 Nat. Commun.上高被引的NequIP模型的详解和代码框架
5. 高效/高精度的基于ACE的等变模型
5.1 ACE方法,消息传递和等变框架的集大成--MACE模型
5.2 方法的完备性,效率和系列发展
6. 适用于大规模GPU并行框架的等变模型
6.1 消息传递网络在GPU并行时的弊端
6.2 NequIP团队在Nat. Commun.的新作--Allegro模型
6.3 方法详解与比较
实操内容(锂电池材料为案例)
1. NequIP模型或MACE模型的超参数介绍和使用
2. 基于MACE模型的势函数构造与LAMMPS或ASE的集成
3. MACE模型与DeePMD模型的对比,包括精度,数据效率等
4. 计算RDF,MSD与扩散系数等性质,复现Nat. Commun.文章结果
第四部分(数据收集方法)
1. 理论部分
2. 公开数据集
3. 主动学习技术
4. 采用预训练模型来微调或蒸馏
实操部分(液态水为案例)
1. 使用ASE在PYTHON环境下实现主动学习和代码详解
1.1 多GPU并行或单GPU多任务形式并行,结合XTB,ASE等软件协同
2. 使用DPGEN执行主动学习
3. 使用预训练模型进行微调
3.1 使用DPA2或MACE-OFF等
3.2 预训练微调与从头训练的对比
部分案例图片


