小分子的化学合成,一直是科学研究中的一项挑战。近年来,深度学习模型在逆合成领域展现出了独特的优势,这些技术能够很好的解决化学家在逆合成设计中的遇到的一些问题。然而,大多数基于AI的逆合成模型都缺乏可解释性,无法阐明逆合成设计中的内在逻辑。
2025年1月18日,西北工业大学生命学院施建宇教授团队在《Nature Communications》上发表文章Single-step retrosynthesis prediction via multitask graph representation learning。
这项研究介绍了一种革命性的方法--Retro-MTGR,该方法能够深度挖掘逆合成反应中的化学逻辑,让药物合成的逆向推理变得更加智能和精准。
逆合成推理
逆合成推理是从目标药物的分子结构出发,逆向推理出合成该药物的化学反应物。与传统的正向合成不同,逆合成推理让科学家们能够更高效地设计药物合成路线,极大地提高药物研发的效率。
Retro-MTGR:AI如何精准预测药物合成路径
施建宇教授团队提出的Retro-MTGR框架(如图1所示),是基于先进的“多任务图表示学习”的AI模型。通过深入学习分子结构中的图信息,Retro-MTGR框架能够同时完成多个任务,具体包括两个主要任务和一个辅助任务:
通过完成这三个任务,Retro-MTGR不仅帮助科学家们更好地理解化学反应机制,还能精准预测药物合成路径,为药物研发提供强大支持。
图1. Retro-MTGR的工作流程图
研究亮点:从键能到分子电性,AI揭示药物合成的深层规律
这项研究的最大亮点之一,在于通过学习分子化学键的结构,键能等属性,揭示了哪些化学键可能成为反应中心,哪些则可能只是普通的化学键(图2)。具体来说:
不仅如此,Retro-MTGR还通过联合嵌入空间分析了合成子和离去基的电性分布,揭示了反应过程中的关键规律(如图3所示),这包括:反应中的两个合成子总是具有相反的电性并且彼此相距甚远;属于同一个反应物的合成子和离去基通常具有相反的电性并且彼此靠近;反应中同时出现的两个离去基经常具有相反的电性并且彼此相距甚远。
图2.化学键嵌入空间的展示
图3.合成子和离去基的联合嵌入空间展示
实验验证:准确预测药物合成路径
为了验证这一创新框架的有效性,研究团队通过预测两种药物Sonidegib和Acotiamide的逆合成路线,并与实际合成路线进行了对比。
图4. 对于两种药物的预测逆合成路线和真实化学合成路线展示
结果表明,Retro-MTGR推断出的合成路线与实际结果高度一致(如图4所示),这无疑证明了其在药物研发中的巨大潜力。
总结和展望
为了开发一个高度可解释的判别模型来揭示化学合成机制,本文提出了一个Retro-MTGR框架。基于分子图,在Retro-MTGR中同时考虑了三个相关任务,其中两个主要的监督判别任务负责识别反应中心和识别LGs,而一个辅助的自监督任务负责生成更好的原子嵌入。
与16种最先进的方法进行比较的结果,证明了Retro-MTGR的优越性。此外,在RTU和RTK场景中,不同的训练测试策略和不同大小的数据集验证了它的稳健性和可扩展性。涉及两种新药的实验验证结果表明,Retro-MTGR推断的逆合成路线与化学合成测定获得的逆合成路线一致。
Retro-MTGR是一个优秀的单步逆合成推断模型。未来,研究团队将在Retro-MTGR的基础上整合其他化学合成因子(例如反应产率,反应条件等)来开发一个可靠的多步逆合成模型以解决复杂分子逆合成路线规划的任务。
参考资料:
Zhao, PC., Wei, XX., Wang, Q. et al. Single-step retrosynthesis prediction via multitask graph representation learning. Nat Commun 16, 814 (2025). https://doi.org/10.1038/s41467-025-56062-y.