2025年6月4日,Nat. Comput. Sci.在线发表了耶鲁大学Tianyu Zhu课题组的研究论文,题目为《Unified deep learning framework for many-body quantum chemistry via Green’s functions》。
预测分子和材料在基态和激发态下的电子性质是量子化学和计算材料科学的核心任务。密度泛函理论(DFT)由于其准确性和效率的平衡而成为该任务的主要工具,但它具有众所周知的系统误差和源于近似交换关联泛函的不确定性,这限制了其预测能力。从头算多体电子结构方法(如耦合簇(CC)理论和多体微扰理论(GW))为更鲁棒的量子力学模拟提供了一条有前景的途径。这些方法在催化和需要明确处理电子关联性的材料模拟中尤其需要,例如键断裂和激发态现象以及过渡金属化合物。然而,它们的高计算成本阻碍了它们在大型体系研究或多分子筛选中的应用。
数据驱动的机器学习(ML)已被广泛探索,以加速不同理论水平的量子化学计算。这些机器学习模型主要侧重于一次预测势能或一种电子性质(例如偶极矩和轨道能量)。最近,机器学习模型针对更基本的量子力学量(如平均场哈密顿量、电子密度、Kohn-Sham本征态和单粒子密度矩阵)已经开始出现,其中各种电子性质可以在单个机器学习预测后推导出来。
然而,这些方法通常是为DFT开发的,并受到其固有误差的限制,而能够在统一框架内预测基态和激发态多体性质的机器学习方法仍然很少见。主要原因是多电子波函数的大小相对于分子大小迅速增长,导致模式过于复杂而难以学习。在多体水平上计算的电子密度可以作为机器学习的目标,但直接将基态电子密度信息映射到激发态是一项艰巨的任务。此外,生成多体量子化学训练数据的成本非常高,这就要求机器学习方法具有很高的数据效率。
在此研究中,作者提出了一个针对多体格林函数(MBGF)的深度学习框架,该框架统一了基态和激发态电子性质的预测,同时为多电子关联效应提供了物理见解。通过从平均场特征中学习多体微扰理论或耦合簇自能,本研究的图神经网络在预测单粒子和双粒子激发以及从单粒子密度矩阵导出的量方面取得了具有竞争力的性能。通过多重分子和纳米材料基准测试,证明了其在化学物种、体系尺寸、分子构象和键断裂关联方面的高数据效率和良好的可迁移性。这项研究工作为利用机器学习解决多电子问题开辟了机会。
图2 MBGF-Net在G0W0@PBE0水平上预测QM7和QM9分子的电子性质
图3 MBGF-Net在G0W0@PBE0水平上预测硅纳米团簇的激发态性质
图4 MBGF-Net在G0W0@PBE0水平上预测偶氮苯衍生物的带隙图5 MBGF-Net预测C-O单键断裂的轨道特异性多体性质和下游模拟
Venturella, C., Li, J., Hillenbrand, C. et al. Unified deep learning framework for many-body quantum chemistry via Green’s functions. Nat. Comput. Sci., 2025. https://doi.org/10.1038/s43588-025-00810-z
【其他相关文献】
【注】:小编水平有限,若有误,请联系修改;若侵权,请联系删除!