社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjour...
陶哲轩重写20年本科经典教材!Lean编程数学证明,GitHub已放出
【2025版附安装包】超详细Python+Pycharm安装保姆级教程,永久免费使用,Python环...
揭秘:2025最新AI吸金榜TOP 25,谁在闷声赚大钱?ChatGPT月活超Twitter!|AI...
让 ChatGPT 成为打工人的工作大脑,OpenAI 重磅发布两项功能!
整理 Python 中的图像处理利器(共10个)
Open AI 更新:ChatGPT 推出会议记录功能,正式支持 MCP 协议
分享一款图形化的 .DS_Store文件泄露、.git目录泄露、.svn目录泄露漏洞利用工具
OpenAI首次回应人机情感问题:越来越多人对ChatGPT产生依赖,模型感知意识会继续增强
获1.3亿美元融资,NewLimit利用机器学习指导表观遗传程序设计,延长人类健康寿命研究已有初级成...
关注
Py学习
»
机器学习算法
SchNet|一种适用于分子和材料的深度学习架构
DrugAI
• 3 年前 • 1189 次点击
深度学习
促进
人工智能快速发展,并对语音识别以及生物信息学,物理化学的影响越来越大。一般而言,机器学习特别是深度学习非常适合于表示量子力学相互作用,能够建模非线性势能面或加强对化合物空间的探索。在这里,
文章
介绍了深度学习
架构
SchNet
,该
架构
专门设计用于通过使用连续卷积层对原子系统进行建模。
文章
利用
SchNet
来预测小分子的分子动力学模拟的势能面和守恒力场,并对
c
20
-
富勒烯的量子
化
学性质进行了示范性的研究,这在常规的从头算分子动力学中是不可行的。
一、
介绍
加速发现具有所需性质的分子和材料是计算化学和材料科学长期面临的挑战。然而,在探索广阔的化学空间时,精确
的
量子化学计算的成本
却
令人望而却步。近年来,使用机器学习来克服这一瓶颈的
研究
有所增加,
目前,
深度学习已经应用于使用图神经网络从分子结构预测性质。然而,由于输入中缺少原子位置,这些仅限于对平衡结构的预测。直到最近,才开发出直接从原子类型和位置学习的
预测
方法。虽然神经网络通常被认为是一个
“
黑
盒
”
,但最近人们越来越努力地解释它们的预测,以了解它们是如何运作的,甚至是如何提取科学见解。这可以通过分析经过训练的模型或直接设计可解释的模型来实现。对于量子化学,一些人提出了这样一种具有深
度
张量神经网络(
DTNN
)的可解释体系结构,它不仅可以学习原子环境的表示,而且可以从空间和化学上解析量子力学观测
。
在此
,
文章
以这项工作为基础,提出了深度学习体系结构
SchNet
,它允许对复杂的原子相互作用进行建模,以便预测势能面或加速化学空间的探索。
SchNet
作为
DTNNs
的一个变体,能够
在
学习
中
遵循原子系统旋转和平移不变性以及原子
排列
不变性。这使得能够准确预测整个构型化学空间,其中原子之间的相互作用是使用连续卷积层建模的。
文章
证明,这些可以有效地结合周期性边界条件,从而能够准确预测各种大块晶体的形成能。
二、
方法
SchNet
是早期提出的深
度
张量神经网络(
DTNN
)的一个变体,因此共享许多基本构建块。其中包括原子嵌入
块
、相互作用
块
和原子能量贡献
块
。在每一层,原子系统都是通过与周围原子的成对相互作用来细化原子的。在
DTNN
框架中,相互作用
块
由张量层
来进行
建模。
SchNet
利用连续卷积和
卷积核
生成网络对相互作用
块
项进行建模。在下文中,
文章
将介绍这些组件,并描述它们是
构
成
SchNet
体系结构的。有关
SchNet
体系结构的概述,请参见图
1
。
图
1.chNet
架构图(左)和交互块(右)
2.1
原子嵌入
原子系统可以用一组具有核电荷
Z=(Z
1
,
...
,
Z
n
)
和位置
R=(r
1
,
...
,
r
n
)
的
n
个原子点来唯一地描述。通过
SchNet
的
原子嵌入
层,原子由一组特征
X
l
=(x
l
1
,
…
,
x
l
n
)
来描述,
x
l
i
∈R
F
,特征映射的数量用
F
来表示,原子的数量用
n
来表示,当前的层数用
l
来表示。原子
i
的表示使用依赖于原子类型
Z
i
的嵌入进行初始化:
这些嵌入
a
z
在训练期间随机初始化。它们代表的是一个系统的原子,暂时不考虑其环境的任何信息。
2.2
原子层
原子层是密集的层,分别应用于每个原子
i
的表示
x
l
i
:
由于权重
W
l
和偏差
b
l
在原子之间是共享的,文章的体系结构对于原子的数量仍然是可扩展的。当原子表示通过网络时,这些层会转换它们,并处理通过相互作用层合并的原子环境的信息。
2.3
交互块
这里文章用连续滤波卷积层
(cfconv)
建模,这是离散卷积层的推广,例如用于图像或音频数据。这种泛化是必要的,因为原子不像图像像素那样位于规则的网格上,而是可以位
于任意的位置。因此,在传统卷积层中使用的卷积核并不适用。相反,文章需要用一个生成卷积核的神经网络来建模连续卷积
。给定
R
位置
R
的原子表示
X
l
,文章得到了原子
i
与周围所有原子的卷积:
cfconv
层和三个原子层构成了相互作用块的残差,文章使用
ssp(x)=ln(0.5e
x
+0.5)
作为整个网络的激活函数。该激活函数保证了
ssp(0)=0
,并在保证了连续性的同时提高了网络的收敛性。这使文章能够获得光滑的势能面、力场和二阶导数,这是用力进行训练和计算所必需的。
2.4卷积核
生成网络
卷积核生成网络决定了原子之间的相互作用如何建模,并可以用来约束模型并包含化学信息
。文章选择一个全连接的神经网络,它将从原子
i
到邻居
j
的向量作为输入,获得
卷积核的
值
W(r
j
−
r
i
)(
见图
2(
左
))
。这使得文章能够将已知的分子和材料的不变性纳入模型中。
图
2.
卷积核生成网络
(
左
)
与
pbc
示例
(
右
)
2.4.1
旋转不变性
通过计算成对距离而不是使用相对位置,可以直接包括旋转不变性。文章在高斯分布的基础上进一步扩展了距离
2.4.2
周期边界条件
对于具有周期边界条件的原子系统
(pbc)
,每个原子级特征向量
x
i
在所有周期重复中都必须是等价的,即对于重复单元元胞
a
和
b
有:
x
i
=x
ia
=x
ib
。由于卷积的线性,文章能够将
pbc
直接应用于
卷积核,以准确描述原子的相互作用。给定一个用
||r
jb
−
r
ia
||
cut
覆盖所有原子的卷积核
Wl(r
jb
−
r
ia
)
,文章得到了卷积。
这个新的卷积核
W
现在依赖于系统的
pbc
。文章发现,当
卷积核
响应的原子数
x
l+1
i
在截止范围内归一化时,训练更稳定。图
2
(右)中显示了一些可生成的没有
pbc
的
卷积核,有立方金刚石晶体和六角形石墨。金刚石和石墨的卷积核是单原子卷积核根据各自晶格的叠加,它们反映了晶格的结构。
2.5属性预测
最后,根据所得到的原子表示法预测了一个分子或材料的给定性质
P
。文章从全连接的预测网络中计算原子贡献
P
i
(见图
1
中的蓝色层)。文章分别通过对原子贡献求加或平均来计算最终的预测
P
。
其中,计算原子间力的公式如下:
2.6
训练
文章通过最小化平方损失来训练每个属性目标
P
的
SchNet。
为了训练分子动力学轨迹的能量和力,文章使用了一个联合损失。
其中ρ是能量和力损失之间的权衡。
三、结果
3.1学习分子特性
文章训练
SchNet
模型来预测
QM9
数据集的各种性质,该数据集由
131k
个有机小分子组成,其中最多有
9
个重原子。文章使用了一个包含
10,000
个分子的验证集。文章使用
T=6
的
交互块和具有
F=64
的
特征维度,并执行多达
1000
万个梯度下降参数更新。由于
QM9
的分子很小,所以文章不使用
截断半径
。预测误差列于表
1
中,其中,文章与使用
enn-s2s29
进行比较。
SchNet
对极化率α和电子空间范围
hR2i
的预测在准确性方面明显不足。
但
SchNet
在
12
个特性中
超越了
enn-s2s
的预测。
表
1
.
QM9
数据集上的能量预测的平均误差
图
3
中显示了
T
∈
{1
、
2
、
3
、
6}
交互块的学习曲线,与性能最好的
DTNN
模型相比。使用
T=3
交互块的性能最好的
DTNN
只能优于使用
T=1
的
SchNet
模型。文章观察到,使用
110k
个样本
,超过两个交互块的误差仅从
T=2
交互块的
0.015eV
略微提高到
T
∈
{3,6}
的
0.014eV
。当用较少的
样本
进行训练时,差异变得更加显著,而
T=6
虽然参数最多,但误差最小。此外,该模型需要的收敛时间要少得多,例如,使用
110k
个样本将所需的次
数从
T=2
的
2400
次
减少到
T=6
的
750
次以下的
epoch
。
图
3.
QM9
数据集下不同参数选择的平均能量预测误差
3.2学习材料的形成能
文章使用
SchNet
来预测来自
Materials Project(MP)
的
69,640
个结构晶体的形成能。它由各种各样的晶体组成。平均绝对误差列于表二。同样,文章使用
T=6
交互块和具有
F=64
特征维度的原子表示。文章设置了
截断半径
rcut=5
˚
A
,将数据随机分为
60,000
个训练示例,
4,500
个验证示例,其余数据作为测试集。尽管
MP
存储库比
QM9
分子基准更多样化,
SchNet
能够预测形成能的平均绝对误差为
0.035eV/atom
。在一个
3000
个较小的子集训练例子上,
SchNet
仍然比
Faber
等人提出的描述符实现
MAE
达到
0.127eV/
原子的显著改进。
表
2
.
MP
数据集上原子形成能量预测的平均误差
3.3
在
c
20
-
富勒烯分子动力学中的应用
在
MD17
基准集上演示了
SchNet
的准确性之后,文章对
C
20
富勒烯的
ML
驱动分子动力学
(MD)
模拟进行了研究。这个中等大小的分子有一个复杂的
PES
,在这里,文章使用
SchNet
对引入核量子效应(
NQE
)时
C
20
的
PES
的一些基本性质进行了分析。参考数据是通过在理论的广义梯度近似(
GGA
)水平上使用
DFT
运行经典
MD
生成的,使用
Perdew-Burke-Ernzerhof
(
PBE
)交换相关函数和
Tkatchenko-Scheffler
(
TS
)方法来解释范德华相互作用。
为了获得准确的能量和力预测,文章首先对给定的参考数据进行广泛的模型选择。文章使用
20k
个
C
20
样本
作为训练集,
4.5k
个样本用于提前停止,并报告剩余数据的测试错误。表
3
列出了交互块数
T
、原子表示的特征维数
F
和ρ的各种设置的结果。首先,文章选择模型的最佳超参数
T
,
F
,给出ρ
=0.01
。文章发现
T=6
和
F=128
的构型对能量和力都最有效。
对于能量预测,文章在使用ρ
=0.1
时获得了最好的结果。在这里,文章选择仅力模型作为力场来驱动文章的
MD
模拟。总的来说,使用
SchNet
,文章可以执行
1.25ns
的
PIMD
,与
DFT
相比,运行时间减少了
3-4
个数量级,计算资源要少得多。
表
3.
c
20
-
富勒烯的能量和力预测的平均误差
4、结论
文章提出了
SchNet
作为一种通用的量子化学深度学习体系结构,从不同分子和材料数据集的特性预测势能面和力场。
SchNet
能够直接建模周期边界条件。除此之外,文章已经在
PBE+vdWTS
理论水平上对富勒烯
C
20
进行了一个示例性的分子动力学研究,这在常见的
DFT
方法中是不可行的。这些结果可以指导未来的工作,如研究更大的分子和周期系统,以及进一步
拓展可解释的深度学习架构,以协助化学研究。
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/127429
1189 次点击
登录后回复