
DRUGONE
理解分子过程的原子尺度机制,是理性设计材料与药物的核心前提。理论上,分子机制可通过在高维自由能景观上追踪最小自由能路径(MFEP)来刻画,但在实际体系中,自由能景观的直接收敛往往计算代价极高。研究人员提出了一种数据驱动的增强采样框架,将多任务深度学习与 well-tempered metadynamics 相结合,在无需预先计算自由能面的情况下,迭代学习反应物与产物之间的机制路径。该方法还能自动生成机制指纹,以定量方式描述分子过程中事件的发生顺序,并在化学反应、蛋白折叠和配体–受体结合等典型问题中得到验证。

分子模拟是研究化学反应、蛋白构象变化和分子识别机制的重要工具。然而,传统分子动力学模拟受到时间尺度限制,高自由能势垒使得关键转变事件难以被充分采样。尽管多种增强采样方法已被提出,但它们通常依赖于合适的集体变量(CV),而这些变量往往难以事先确定。
另一方面,虽然最小自由能路径在理论上能够完整描述分子机制,但在高维构象空间中直接获得 MFEP 仍面临巨大挑战。因此,研究人员亟需一种无需显式自由能面、又能可靠识别主导机制路径的方法。
方法概述
研究人员提出了一种多任务深度学习 + 增强采样的统一框架,其核心思想包括三点:
利用一维潜在空间的自编码器,将高维分子描述符投影为一条数据驱动的一维流形,用于表示可能的反应或转变路径。
通过判别式学习目标,确保该路径从反应物态出发并终止于产物态,从而赋予潜在变量明确的“反应进度”含义。
使用增强采样方法沿路径方向(以及偏离路径的方向)进行采样,逐步更新模型并优化路径,直至收敛。
这种流程避免了传统路径方法中对中间结构的人工指定,使路径探索更加自动化和稳健。

图1|多任务学习与增强采样耦合的机制路径学习示意图。
机制指纹的构建
在路径收敛后,研究人员利用神经网络解码器,将路径参数映射回高维分子描述符空间。通过监测这些描述符随路径进度的连续变化,可以重建分子过程中的事件序列,例如键的断裂与形成、构象接触的生成或溶剂进入等。
这种表示方式被称为机制指纹,具有以下特点:

图2|路径重构误差与“偏离机制路径”距离的关系示意。
应用示例 I:烯烃氢溴化反应
在烯烃氢溴化反应中,研究人员展示了该方法如何在无需完整自由能面的情况下,快速识别真实的最小自由能路径。模型在迭代过程中自动纠正初始偏离路径,并重建出反应过程中关键键的形成与断裂顺序,从而清晰揭示反应机理。

图3|多任务学习驱动的反应路径迭代优化流程。

图4|氢溴化反应的机制路径与对应机制指纹。
应用示例 II:蛋白折叠机制
在微型蛋白 chignolin 的折叠问题中,该方法成功从非最优的展开路径出发,快速收敛到真实的折叠 MFEP。通过机制指纹分析,研究人员捕捉到了关键氢键断裂与形成的先后顺序,与已有长时间尺度模拟得到的结论高度一致。

图5|chignolin 折叠的最小自由能路径及关键结构演化。
应用示例 III:主体–客体解离机制
在主体–客体体系中,该框架能够区分不同的解离通路,并正确识别由水分子介导的主导解离机制。进一步沿学习到的 MFEP 进行限制性自由能计算,可获得更准确的自由能剖面,验证了路径识别的重要性。

图6|主体–客体体系中干路径与湿路径的对比及机制指纹。
讨论与展望
该研究表明,无需显式构建高维自由能景观,也可以可靠识别分子机制路径。所提出的框架在计算成本、自动化程度和可扩展性方面具有明显优势,特别适用于复杂生物分子体系和 QM/MM 反应体系。
更重要的是,机制指纹的提出,为“基于机制而非结构”的分子性质预测打开了新的可能性。未来,这类指纹有望像结构指纹一样,被直接用于机器学习模型中,用于预测动力学性质、反应选择性或路径依赖行为。
整理 | DrugOne团队
参考资料
R. Elangovan,S. Chatterjee, & D. Ray, Data-driven enhanced sampling of mechanistic pathways, Proc. Natl. Acad. Sci. U.S.A. 122 (49) e2517169122,
https://doi.org/10.1073/pnas.2517169122 (2025).
内容为【DrugOne】公众号原创|转载请注明来源