
DRUGONE
不对称加氢是最重要的手性构建反应之一,但现有机器学习模型通常仅适用于单一前手性位点,难以跨底物–催化剂体系泛化,且无法同时预测双前手性烯烃的立体选择性与绝对构型。研究人员提出 ChemAHNet,一个基于不对称加氢机理构建的深度学习模型,通过三个结构感知模块,从 SMILES 输入中自动捕捉原子级空间与电子相互作用。该模型能够准确预测多类催化剂与底物体系中的主要对映体绝对构型,同时通过催化剂–烯烃的相互作用模式计算立体选择性,避免传统 R/S 标记的歧义。ChemAHNet 无需量子化学描述符,具有良好的外推能力,并可推广至其他不对称催化反应,为面向目标的分子设计提供多尺度结构特征洞察。

随着人工智能在化学合成设计中的迅速发展,反应预测模型展现出广泛潜力。然而,大多数模型忽略了关键的立体化学细节,尤其在需要同时预测对映体比例和绝对构型的烯烃不对称加氢中更为突出。此类反应不仅受底物和催化剂结构影响,还涉及立体拥挤、电子效应与双前手性位点识别等挑战。传统模型依赖预定义量化描述符或特定体系训练,在跨底物、跨催化剂的泛化能力不足,难以服务更实际的化学空间探索。因此,研究人员希望借助反应机理本身,在模型中引入“相互作用模式”概念,以实现更准确、更通用的预测系统。
方法
ChemAHNet 包含三个模块:
该设计遵循烯烃不对称加氢的实际机理,通过对“催化剂位于双键上方或下方”的交互模式建模,使模型自然区分构型路径,避免传统 R/S 标记带来的歧义。

结果
数据集构建与分布特征
研究人员构建了规模为 9,478 条反应的数据集,覆盖三取代、二取代与四取代烯烃,以及多种过渡金属体系(Rh、Ir、Ru、Ni、Co 等)。

模型整体性能:主要对映体预测
将 ChemAHNet 与多种先进模型对比:
其优势来自对“催化剂–烯烃交互模式”的直接学习,而非依赖可能自相矛盾的 R/S 标签。

消融实验:模块贡献分析
移除任一模块都会显著降低性能:
在立体选择性回归中:

立体选择性与绝对构型的联合预测
ChemAHNet 同时预测:
在特定的 Rh/BINOL 系统中,模型达到:
优于多种基于图模型与指纹特征的方法。
模型在外延预测中也表现稳定,包括:
跨反应类型泛化能力验证
ChemAHNet 不依赖量化描述符,因此可轻松迁移到其他不对称催化反应。
在以下体系中均取得高性能:
说明 ChemAHNet 具有跨机理的强泛化能力。

模型可解释性分析
借助 SHAP + XSMILES,模型可定位影响立体选择性的关键原子或取代基。
示例:

讨论
ChemAHNet 展示了化学机理与深度学习结合的优势:
未来改进方向包括:
总体而言,ChemAHNet 为不对称催化的预测与设计提供了强有力工具,为数据驱动的催化开发奠定了坚实基础。
整理 | DrugOne团队
参考资料
Cheng, L., Shao, PL., Lv, J. et al. Chemistry-informed deep learning model for predicting stereoselectivity and absolute configuration in asymmetric hydrogenation. Nat Comput Sci (2025).
https://doi.org/10.1038/s43588-025-00920-8
内容为【DrugOne】公众号原创|转载请注明来源