Nat. Mach. Intell. | 机器学习原子势的“柏拉图范式”：迈向通用基础模型

DrugAI

发布于 2026-05-14 18:16:47

980

基础机器学习原子间势（foundation machine learning interatomic potentials, MLIPs）已经成为原子尺度模拟的重要工具，但不同模型往往在彼此不兼容的潜在空间中编码化学环境，这限制了模型之间的直接比较与协同使用。柏拉图式表征假说认为，足够强大的模型会逐渐收敛到一种共享的现实统计表示。受到这一思想启发，研究人员发现，独立开发的多种 MLIP 在原子环境的几何组织方式上表现出统计一致性。研究通过引入一种基于“原子锚点”的投影方法，将七种不同架构的 MLIP——包括等变与非等变、守恒与非守恒模型——统一映射到共享潜在空间中，并在该空间中保留了化学周期性与结构不变量。

这一统一框架不仅能够实现跨模型的最优传输与可解释的嵌入运算，还可以识别模型中的表征偏差。研究进一步表明，在该共享空间中的偏离程度能够作为一种无需真实标签的结构异常指标，并能提前预警模型物理预测的失败。整体结果说明，柏拉图式表征为材料科学中的基础模型提供了一条实现互操作、可比较与可解释的新路径。

机器学习原子间势的发展经历了从早期基于晶体图的数据拟合模型，到结合高阶体展开、消息传递机制以及等变神经网络的新一代架构演化。近年来，MACE、NequIP、SevenNet、Orb-v3 等模型不断刷新材料模拟中的精度与效率，但这些模型之间存在根本问题：虽然它们都在预测能量、力和应力等物理量，但各自学习到的潜在表示却彼此独立，缺乏统一坐标体系。

与此同时，自然语言处理领域提出了“柏拉图式表征假说”，认为不同目标、不同模态训练出的神经网络，最终会在潜在空间中收敛到共享的现实结构模型。研究人员提出疑问：材料科学中的基础 MLIP 是否也会表现出类似现象？尽管不同 MLIP 的训练数据、交换关联泛函以及化学覆盖范围都不相同，但所有模型都必须逼近相同的量子力学规律以及原子间相互作用本质。

基于这一思想，研究人员提出了一种“锚点投影框架”，用于将不同模型中的原子嵌入统一映射到共享坐标系中，并系统研究七种基础 MLIP 是否会在这一空间中形成共同的潜在几何结构。

方法

研究选取了七种代表性基础 MLIP，包括三种不同规模的 MACE-MP-0 模型、两个基于 OMat24 数据集训练的模型，以及两种 Orb-v3 模型。研究人员从 MP-20 数据集中提取了超过 28 万个原子嵌入，并通过主成分分析观察不同模型的潜在空间结构。结果发现，即便模型训练目标相同，不同架构学习到的表示仍位于完全不同的坐标系中。

为了解决这一问题，研究人员提出“柏拉图投影（Platonic transformation）”。该方法从嵌入空间中选取一组“锚点”，并计算任意原子嵌入与这些锚点之间的余弦相似度，以此构建统一表示。由于所有模型都会被映射到同一组锚点定义的空间，因此模型之间获得了统一坐标框架。研究还使用 DIRECT 采样策略保证锚点能够充分覆盖化学空间，从而提高表示稳定性与多样性。

结果

不兼容潜在空间的统一

研究首先发现，原始 MLIP 嵌入无法直接比较。不同模型即使训练于相同数据集，其潜在表示仍呈现明显不同的聚类方向与空间拓扑。例如 MACE 使用 128 维嵌入，而 Orb-v3 使用 256 维嵌入，并且不同模型之间的元素聚类方式差异巨大。

图1: 不同基础 MLIP 在原始潜在空间中的 PCA 投影，不同模型学习到彼此不兼容的嵌入坐标系。

在应用锚点投影后，所有模型逐渐收敛到共享的潜在几何结构。即使仅使用少量锚点，也能够形成较稳定的元素聚类，例如过渡金属、卤素与主族元素被明显区分。随着锚点数量增加，统一表示逐渐稳定，并形成更细粒度的化学空间层级结构。

研究进一步发现，DIRECT 采样生成的锚点远优于随机采样。DIRECT 能够覆盖更丰富的化学环境，使不同模型在统一空间中的对齐更加紧密，而随机采样则容易导致空间分布偏斜。

图2: 基于锚点的柏拉图投影框架示意图，以及 DIRECT 采样锚点在嵌入空间中的分布。

基础 MLIP 收敛到共享化学几何

为了定量分析不同模型之间的相似性，研究人员引入了三种互补指标，包括：

Procrustes 分析，用于衡量全局拓扑一致性；

mutual k-nearest neighbours，用于衡量局部邻域一致性；

optimal transport，用于衡量潜在分布之间的距离。

结果显示，不同基础 MLIP 在全局拓扑上具有高度一致性，尤其是共享设计理念的模型之间。但在局部邻域结构上，模型差异仍然明显，特别是非等变模型与等变模型之间几乎不存在局部邻域一致性。

研究还发现，统一空间能够自然恢复元素周期表拓扑。卤素、氧族元素与氮族元素会形成平滑连续的聚类轨迹，显示出模型已经隐式学习了化学周期律。然而，非等变模型仍表现出明显偏斜，说明其更依赖统计相关性，而非真实物理对称性。

图3: 不同锚点数量与采样策略下的统一潜在空间变化，展示模型逐渐收敛到共享化学几何。

物理监督而非数据分布驱动柏拉图表征

研究进一步比较了基础 MLIP 与生成模型 Chemeleon。虽然 Chemeleon 使用相同晶体结构数据训练，但由于没有能量与力监督，其潜在空间并未形成清晰的化学周期结构。不同元素在其潜在空间中严重混杂，缺乏基础 MLIP 中观察到的规则聚类。

随后，研究人员分析了 SnSe 双势阱振动模式中的嵌入轨迹。理论上，对称等价结构应映射到相同位置。结果发现，Orb-v3 虽然能够学习势能面的连续性，但无法正确学习对称性，因此产生了两条分叉轨迹；而生成模型则完全无法形成连续结构。研究由此提出一种“诊断层级”：若轨迹平滑但分叉，说明模型学到了势能连续性但未学到对称性；若轨迹无序，则说明模型甚至未理解势能面结构。

图4: 模型相似性量化、元素周期结构恢复，以及生成模型与基础 MLIP 在物理表征上的差异。

跨模型嵌入运算与模型拼接

统一潜在空间还允许不同模型之间进行“嵌入算术”。研究通过三类案例验证了这一点，包括复杂氧化物、TiO₂ 多晶型，以及 BaTiO₃ 固相反应。研究定义了材料级嵌入，并发现不同模型在材料整体表示上具有较高一致性。

在 TiO₂ 多晶型分析中，模型能够识别整体材料身份，但对局部微小结构差异的敏感度仍有限，说明当前 pooling 方法仍存在分辨率瓶颈。

研究还提出“零样本模型拼接”概念，即将一个模型中的反应物嵌入与另一个模型中的产物嵌入组合，形成新的反应表示。实验表明，即便训练数据完全不同，不同模型仍能形成合理兼容的反应嵌入，说明基础 MLIP 已具备一定程度的模块化可组合性。

柏拉图表征作为诊断工具

研究进一步展示了柏拉图空间在模型诊断中的应用。

在迁移学习实验中，研究人员发现，普通微调会导致模型遗忘未见元素，而多头微调则能够维持稳定嵌入轨迹，从而避免灾难性遗忘。

随后，研究利用 two-nearest-neighbour 分析评估模型对等变结构的保持能力。MACE 模型能够稳定识别对称等价原子，而 Orb-v3 完全无法识别等价结构，即使经过柏拉图投影后也无法恢复。进一步分析表明，这种对称性缺失最终会传播到声子预测中，导致明显错误的物理结果。

研究最后提出一种无需真实标签的结构偏离度量方法。基于流形假说，真实稳定结构应聚集在低维流形附近，因此结构距离流形越远，其物理合理性越低。研究发现，高温非平衡结构会逐渐偏离稳定流形，而生成模型生成的新颖结构也会呈现更高的流形距离。这说明柏拉图空间能够作为一种高效的生成材料筛选工具。

图5: 柏拉图表征在迁移学习、等变性诊断以及结构异常检测中的应用。

讨论

研究证明，尽管基础 MLIP 在架构、训练数据与归纳偏置上存在巨大差异，但它们最终仍会收敛到一种共享的潜在几何结构。这种收敛并不是单纯的数据统计结果，而是来源于模型对真实物理约束的学习。研究提出的锚点投影框架能够将不同 MLIP 统一到共享空间中，从而实现模型之间的比较、解释与协同使用。

更重要的是，柏拉图式表征不仅能够支持跨模型嵌入运算与零样本模型拼接，还能够作为一种无需真实标签的物理合理性检测工具，用于发现结构异常、预测失败与生成模型中的离群结构。研究人员认为，随着 AI4Materials 模型规模不断扩大，未来不同物理模型可能会进一步趋向共享几何组织，而“表征兼容性”也可能成为与预测性能同等重要的新评价维度。

整理 | DrugOne团队

参考资料

Li, Z., Walsh, A. Platonic representation of foundation machine learning interatomic potentials. Nat Mach Intell (2026).

https://doi.org/10.1038/s42256-026-01235-7