
准确预测化学反应对于推动合成化学创新至关重要,在药物研发、材料制造与农业化学等领域均具有深远意义。然而,反应预测仍是一项复杂的科学问题,传统方法往往依赖人工经验和大量实验验证,耗时且成本高昂。深度学习的引入为高通量反应预测提供了高效解决方案,但现有模型多基于美国专利局(USPTO)数据集进行训练,将反应简单视为“反应物到产物”的配方映射,缺乏对底层反应机理的理解。为此,研究人员提出了 PMechRP(Polar Mechanistic Reaction Predictor,极性机制反应预测器),一种融合反应机理与电子流建模的深度学习框架。模型基于 PMechDB 数据集训练,该数据库包含细粒度的极性反应步骤,能够刻画电子迁移轨迹与机制细节。研究人员还开发了一个新的辅助模型 ArrowFinder,可直接从反应物与产物结构预测电子流“箭头推进”机制。最终,通过结合 Chemformer 模型集成 与 两阶段 Siamese 框架 的混合工作流,PMechRP 在多个基准测试中实现了高精度、强泛化性与可解释性的统一表现。

化学反应预测是计算化学与分子设计中的核心挑战。尤其对于极性反应(polar reactions),由于涉及复杂的电子重排与中间体形成,其机理理解对产物预测至关重要。
尽管深度学习模型(如 Transformer 或 Graph Neural Network)已广泛应用于反应预测任务,但它们通常仅学习反应的统计模式,而非真正的化学机制。多数模型在美国专利局数据集上训练,这些数据多为宏观反应方程,忽略了关键的电子流与机理细节。
这导致了三个主要问题:
为解决这些问题,研究人员构建了PMechDB 数据集,聚焦极性反应的基本步骤级别信息(elementary steps),并以此为基础开发 PMechRP 框架,使深度学习能够从“电子流机制”层面理解反应过程。


方法
数据集构建:PMechDB
PMechDB 收录了数以万计的极性反应样本,涵盖亲核取代(SN1/SN2)、亲电加成、消除、羰基转化等常见反应类型。每条记录均包含:
为扩大覆盖范围与增强模型鲁棒性,研究人员采用**组合反应生成(combinatorial generation)**策略构造新样本,从而提升模型在未知反应空间的学习能力。
模型架构:PMechRP
PMechRP 采用多模型集成思路,主要包括三种体系:
此外,研究人员设计了 ArrowFinder 模块,通过电子流轨迹学习实现反应机制预测。该模块可在产物预测后生成电子流“箭头图”,从而为模型提供物理层面的解释。
结果
模型性能与泛化能力
研究人员在三个主要数据集上评估 PMechRP:
结果显示,PMechRP 的整体准确率显著优于现有模型:


ArrowFinder 的机制预测表现
ArrowFinder 能直接从反应物–产物对生成电子流箭头,预测关键电子转移方向与反应中心。实验结果显示,其预测的电子流路径与人工标注一致率达 91%,在多步反应中能准确捕捉中间体生成与电荷转移轨迹。研究人员还发现,ArrowFinder 的注意力图与 DFT 能量分析结果高度相关,表明模型学习到了电子分布变化的物理意义。


混合模型框架性能
Chemformer 集成与两阶段 Siamese 网络结合的混合模型在不同任务中均表现最优。其平均 Top-1 准确率达 89.4%,机理一致性提升 10% 以上。Siamese 框架有效消除了“炼金术”式错误产物,使预测更符合化学物理规律。

教材级基准验证与人类基准测试
研究人员设计了人工教学级别数据集,以模拟大学中级有机化学反应题目。PMechRP 的预测成功率达 73.4%,超过本科生平均正确率(约 62%)。这表明模型不仅能从数据中学习统计规律,还能理解反应逻辑。




数据增强与可解释性分析
通过加入组合生成反应,PMechRP 的性能在所有数据集上均显著提升。研究人员利用 ArrowFinder 对 Transformer 预测结果进行机理注释,发现其生成的电子流机制与真实路径高度吻合。
讨论
MARN 的研究展示了融合反应机理的深度学习框架在化学反应预测中的强大潜力。
其主要优势包括:
未来,研究人员计划将 MARN 扩展至自由基与光化学体系,并结合生成模型实现反应路径设计与预测一体化。
整理 | DrugOne团队
参考资料
Mechanism-Aware Deep Learning for Polar Reaction Prediction; Ryan J. Miller, Alexander E. Dashuta, Brayden Rudisill, David Van Vranken, and Pierre Baldi; Journal of the American Chemical Society.
DOI: 10.1021/jacs.5c16838
内容为【DrugOne】公众号原创|转载请注明来源