以不足10万结构数据训练,瑞士洛桑联邦理工提出PET-MAD,原子模拟精度媲美专业模型

从半导体材料到药物活性分子,电子结构始终是理解性能的关键。第一性原理计算依托量子力学,可准确预测物质的结构、稳定性和功能,曾推动材料设计与药物研发的快速进展。但其计算量随体系规模急剧增加,即便是顶级超级计算机,也难以对蛋白质折叠、催化反应等复杂过程进行长时间尺度的模拟, 造成「能表述机制,却难以算得动」的局面。

在传统方法接近算力极限之时,机器学习为原子尺度模拟提供了新的路径。机器学习原子间势通过量子力学数据训练,将复杂电子结构映射为高效的预测模型,在保持接近第一性原理精度的同时,将计算成本降低了数个数量级。二十年来,它已在高温合金、生物大分子等体系中展现出明显优势,弥补了经验力场精度不足与第一性原理成本过高的缺陷。不过,早期模型多针对单一体系,需要反复生成训练数据、重新拟合参数,使跨体系研究难度较大。

因此,通用化成为进一步发展的关键方向。近年来,多种能够适配不同元素与化学环境的通用模型相继出现,但受限于训练数据不足和评价标准不一,其整体性能仍不稳定。

在这一背景下,瑞士洛桑理工学院提出的 PET-MAD 模型带来了新的样本。依托覆盖广泛原子多样性的数据集,以及基于 Point Edge Transformer 的网络结构,它在使用远少于传统规模的训练样本的情况下,仍实现了与 PET-Bespoke 专用模型相当的精度, 为原子模拟向更高效、更普适的方向发展提供了有力示范。

相关研究成果以「PET-MAD as a lightweight universal interatomic potential for advanced materials modeling」为题,已发表于 Nature Communications。

在这里插入图片描述

论文地址:
https://www.nature.com/articles/s41467-025-65662-7

关注公众号,后台回复「PET-MAD」获取完整 PDF

更多 AI 前沿论文:
https://hyper.ai/papers

MAD 数据集:含 85 种元素,近 10 万个结构

MAD 数据集的构建,旨在为通用机器学习原子间势(MLIP)的训练提供一套兼具广泛化学多样性、严格数据一致性与良好实用性的高质量数据基础。其包含了原子序数 1 至 86(除砹外)共 85 种元素、总计 95,595 个结构, 并按其化学与结构特征系统划分为 8 个子集,广泛涵盖了体相晶体、表面、团簇、二维材料及分子体系。

数据集的核心来源于 Materials Cloud 3D 数据库的 MC3D 子集, 包含 33,596 个体相晶体结构。以此为基础,通过引入高斯噪声扰动原子坐标生成了 MC3D-rattled 子集(30,044 个结构),并通过在晶体中随机重排原子种类构建了 MC3D-random 子集(2,800 个结构),二者专门用于增强对极端或非平衡畸变构型的覆盖。

为了满足对表面与低维体系的模拟需求,数据集包含了从体相切割得到的 MC3D-surface 子集(5,589 个低指数晶面模型)和 MC3D-cluster 子集(9,071 个纳米团簇),并从 Materials Cloud 2D 数据库引入了 MC2D 子集(2,676 个二维晶体)。分子体系方面,则通过 SHIFTML-molcrys(8,578 个分子晶体)和 SHIFTML-molfrags(3,241 个分子片段)两个子集予以支撑,其结构均源自权威数据库,确保了样本的可靠性。

在数据生成策略上, MAD 采用了直接复用与结构修饰相结合的方法。MC3D、MC2D、SHIFTML-molcrys 和 SHIFTML-molfrags 等 4 个子集直接采用了已发表的结构,但通过完全相同的 DFT 参数重新计算了能量与力,从根本上消除了不同来源间的系统性偏差。其余子集则通过对基础结构进行物理驱动的修饰(如添加噪声、重排原子、切割表面等),定向拓展了构型的多样性。

PET-MAD:通用原子间势模型的架构与性能要点

PET-MAD 模型的训练基于一套经过帕累托前沿优化(Pareto Frontier Optimization)的架构进行。该架构包含 2 个消息传递层,每层配备 2 个 Transformer 子层,使用 256 维的 token 表征、8 头多头注意力机制,并最终通过一个含 512 个神经元的全连接层输出结果。 为提高训练过程的稳定性,在正式训练前,系统会通过一个线性模型拟合并扣除能量中与原子组成相关的基线贡献。

整个训练在 PyTorch 框架下,借助 Metatrain 软件包完成。计算任务分布在 8 块 NVIDIA H100 GPU 上并行执行,每块 GPU 的批次大小设置为 24 个结构,总计训练了 1,500 个周期,耗时约 40 小时。优化过程采用 Adam 优化器,初始学习率设为 10⁻⁴,并每经过 250 个周期减半一次。损失函数由能量与力的预测均方根误差共同构成,其中能量项的权重被缩放为 0.1。

训练完成后,模型在训练集上达到的平均绝对误差为:能量 7.3 meV / 原子,作用力 43.2 meV / Å;在验证集上则为能量 14.7 meV/原子,作用力 172.2 meV/Å,展现了优秀的拟合精度。

为使通用模型能更好地适应特定化学体系,PET-MAD 引入了低秩适配(LoRA)微调技术。 与传统的全参数微调容易导致「灾难性遗忘(即丧失原有通用知识)」不同,LoRA 技术冻结了基础模型的所有权重,仅在每个注意力模块中注入两对可训练的低秩矩阵,并通过一个缩放参数来调节其影响,从而实现「精准改良而不失通用」的目标。在本研究中,LoRA 的秩固定为 8,缩放参数设为 0.5。

实验表明,在数据量有限的场景下,经 LoRA 微调的模型表现始终优于为该体系从头训练的专用模型。 即便在钛酸钡等复杂体系中,微调模型也能在保持通用精度的同时,产出与专用模型相当的物理可观测量,因此被推荐为面向特定应用的优化方案。

对于通用模型而言,可靠的误差估计至关重要。PET-MAD 通过「最后一层预测刚性(LLPR)」方法来实现不确定性的量化。该方法通过分析模型在训练集上最后一层隐藏特征的协方差,来估计新预测的后验误差,几乎不产生额外计算成本。更具价值的是,LLPR 允许对有限的最后一层权重进行采样,形成一个轻量级的「浅层集成」,从而将不确定性传递到自由能、声子色散曲线等复杂衍生量的计算中。这种方法的计算开销远低于传统的集成方法,非常适合大规模原子模拟的实际需求。

此外,PET-MAD 提供了两种力的预测模式:一种是基于自动微分(反向传播)从能量解析推导出力,这种方式严格满足能量守恒;另一种则是通过一个独立的神经网络模块直接从原子坐标预测力,此种方式可将推理速度提升 2-3 倍,但可能引入微小的能量不守恒。 研究团队通过设计专用的多时间步积分器,有效规避了后一种模式可能带来的采样误差,从而在保障计算效率的同时,确保了动力学模拟的可靠性。

基准与实战双优:以极少专属数据达到专用模型精度

为全面评估 PET-MAD 性能,研究团队先在 Matbench Discovery 等权威基准测试中,将其与 MACE-MP-0、Orb-v2 等主流模型系统对比。为确保公平性,研究人员采用 PET-MAD 兼容的 DFT 参数重算基准子集,消除计算方法差异带来的偏差。

测试结果如下表所示,PET-MAD 仅用不足 10 万结构训练(数据量比同类模型少 1-3 个数量级),以 280 万中等参数量(远低于 Orb-v2 的 2500 万、MACE-MP-0-L 的 1580 万),在分子数据集(SPICE、MD22)上表现超所有对比模型, 无机数据集(inorganic datasets)中与 MatterSim-5M 等先进模型相当,在含高度畸变构型的数据集上优势更显著,部分模型误差达其 50 倍。

在这里插入图片描述

基准测试结果

但基准测试难以全面验证模型在复杂场景的可靠性,研究团队遂选取 6 个多样化且具有挑战性的应用案例,对比 PET-MAD、其 LoRA 微调模型与 PET-Bespoke 专用模型的性能。

1. 固态电解质:硫代磷酸锂(LPS)

研究聚焦于其离子电导率这一关键性能。如下图所示,虽然 PET-MAD 在能量和力上的验证误差(4.9 meV/原子,163.9 meV/Å)高于 PET-Bespoke 专用模型(1.2 meV/原子,35.6 meV/Å),但由其驱动的分子动力学模拟所预测的电导率,在宽温区内与 PET-Bespoke 专用模型及微调模型的结果高度一致, 并准确捕捉了结构基元(PS₄ 四面体旋转)对离子输运的影响,仅对 γ-phase 的相变温度有轻微高估。

在这里插入图片描述

在宽温度范围内,PET-MAD、其 LoRA 微调模型与 PET-Bespoke 专用模型计算得到的各相电导率

2. 半导体材料:砷化镓(GaAs)

在计算其熔点时,采用界面钉扎法的结果如下图显示,经 LoRA 微调的 PET-MAD 与 PET-Bespoke 专用模型的预测结果完全吻合(1169±3 K vs 1169±4 K)。

预训练通用模型的预测值(1111±72 K)虽略低,但其误差远小于 DFT 泛函本身与实验值(1511 K)的固有偏差。此案例也凸显了 PET-MAD 内置的 LLPR 不确定性量化功能的价值,它能以低成本评估并传递误差,为结果可信度提供参考。

在这里插入图片描述

气态和固态 GaAs 化学电位差随温度的变化

3. 高熵合金:CoCrFeMnNi

针对其表面元素偏析行为,研究发现如下图所示,预训练的 PET-MAD 无需针对该体系进行专门训练,便能准确再现「表面富镍、其他元素贫化」的偏析特征,与参考研究定量吻合。

尽管其能量误差(25.8 meV/原子)高于 PET-Bespoke 专用模型(14.6 meV/原子),但后者因训练数据有限(仅 2000 结构)可能存在过拟合风险,PET-MAD 反而表现出更好的稳健性。

在这里插入图片描述

高熵合金的表面过剩计算(Gibbs surface excess)

4. 液态水与量子核效应

通过路径积分分子动力学模拟,PET-MAD 成功刻画了氢原子量子涨落导致的结构有序化与质子离域现象。虽然受限于其所学的 GGA 泛函精度,模拟体系在室温下表现出「过冷液体」特征,但在径向分布函数与热容计算上,其结果与 PET-Bespoke 专用模型高度一致,且其高效性使得这类计算量巨大的量子模拟更为可行。

在这里插入图片描述

具有核量子效应的液态水径向分布函数 g 和热容 CV

5. 分子晶体:丁二酸的 NMR 研究

PET-MAD 驱动的动力学模拟结合化学屏蔽模型,成功揭示了原子核量子运动对 ¹H 核磁共振屏蔽常数分布的影响。如下图所示,氢键质子的屏蔽分布在量子采样下显著展宽并下移,这与基于高精度 DFT 训练的 PET-Bespoke 专用模型结论一致,证明了 PET-MAD 在预测复杂功能特性方面的潜力。

在这里插入图片描述

α 琥珀酸晶体中的化学屏蔽分布

6. 铁电材料:钛酸钡(BaTiO₃)

如下图所示,在 40-400K 温区的柔性胞模拟中,PET-MAD 准确再现了该材料菱方-正交-四方-立方的特征相变序列。虽然因 DFT 局限,预测的相变温度低于实验值,但其与 PET-Bespoke 专用模型的结果偏差不足 30K。 在静态介电常数计算中,它也正确预测了立方相高介电、铁电相低介电的趋势。

在这里插入图片描述

BTO 的温度相关介电响应

从基准测试到多元体系应用均表明,PET-MAD 能以极少专属数据实现接近 PET-Bespoke 专用模型的模拟精度,可靠预测离子输运、相变及表面反应等性质。 其采用的 LoRA 微调可进一步逼近 PET-Bespoke 专用模型性能,而 LLPR 误差估计与双重力预测模式则确保了复杂模拟的高效与稳健,从而成为一个兼具广度与深度的全能型原子间势工具。

MLIPs 产学研融合推动材料研发范式变革

MLIPs 领域凭借其高精度、高效率的显著优势,正日益成为衔接量子化学理论前沿与产业工程应用的关键桥梁。近年来,研究正从验证方法可行性走向深入拓展其能力边界。

例如,剑桥大学与瑞士洛桑联邦理工学院(EPFL)的研究团队通过融合主动学习与增强采样策略,使模型能够自主探索化学反应路径上的关键过渡态构型,从而在无需事先准备大量反应数据的情况下,实现对催化剂活性与选择性的准确预测, 有效突破了现有 MLIP 在描述化学反应动态过程方面的局限。

论文标题:Aedes aegypti Argonaute 2 controls arbovirus infection and host mortality

论文链接:

https://www.nature.com/articles/s41467-023-41370-y

同时,对现有模型的系统性评估与机理揭示也在持续深化。加州大学团队针对 M3GNet、CHGNet 及 MACE-MP-0 等主流通用 MLIPs 进行了全面评测,涵盖表面能、缺陷形成能、声子谱及离子迁移势垒等一系列材料性质。 研究发现,这些模型在涉及高能态或非平衡构型的任务中,普遍存在对能量和力的系统性低估,这为进一步改进模型训练策略与数据构建指明了方向。

论文标题:Systematic softening in universal machine learning interatomic potentials

论文链接:

https://www.nature.com/articles/s41524-024-01500-6

综上,MLIPs 领域的发展已步入一个从算法创新到问题驱动、从基础评测到场景深耕的新阶段。未来,随着更多跨尺度建模挑战被攻克以及行业专用模型的成熟,MLIPs 有望在数字化研发体系中扮演更为核心的角色,加速材料科学与产业创新的双向赋能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值