近年来,生成模型(Generative Models)在分子科学,特别是药物发现中,发挥着越来越重要的作用。从头药物设计(De Novo Drug Design, DNDD)是药物发现的关键步骤,其主要目的是在不依赖于已有分子骨架的情况下设计出全新分子。这种方法可以极大地拓宽化学空间,发现具有特定药效的全新小分子。在这类任务中,生成模型,尤其是扩散模型(Diffusion Models),被认为是能够生成具有特定3D分子结构的强大工具,特别是在以3D结构为基础的药物设计中,如分子对接(molecular docking)和蛋白质-配体复合物预测。
2024年9月29日,来自卡内基梅隆大学的研究人员在Journal of Chemical Information and Modeling上发表综述“Diffusion Models in De Novo Drug Design”。
本文综述了当前扩散模型在3D分子生成领域的技术实现,涵盖了分子生成任务中的原子和键表示、反向扩散去噪网络的架构,以及生成稳定的3D分子结构时面临的挑战。扩散模型在从头药物设计中的应用领域还包括基于结构的药物设计(structure-based drug design, SBDD)、目标特异性分子生成、分子对接以及蛋白质-配体复合物的动力学研究。本文通过总结最前沿的扩散模型技术,阐明了这些模型在推动药物发现中的作用及其现有的局限性。
图1 扩散模型示意图
生成模型在分子科学中的应用
在药物发现中,生成模型近年来取得了重要进展,尤其是在1D、2D和3D空间中生成小分子。随着深度学习的快速发展,递归神经网络(RNN)、变分自编码器(VAE)、生成对抗网络(GAN)、图神经网络(GNN)等不同的生成模型架构被应用于分子生成任务中。RNN主要用于基于字符串的分子表示,例如SMILES和SELFIES,而VAE和GAN模型则广泛应用于2D图和3D原子坐标的生成。
尽管1D和2D空间中的分子生成已经相对成熟,3D分子生成仍然面临挑战。这是由于分子形状的复杂性以及模型需要满足E(3)和SE(3)等值性要求,即分子在旋转和平移下保持不变的特性。然而,分子的3D几何结构决定了其电化学性质,从而影响其药理学、药代动力学、代谢、毒性和免疫反应等。因此,学习和生成3D分子几何结构有助于推动基于结构的药物设计,特别是在蛋白质和DNA配体的研究中。
图2 使用扩散dels生成分子的过程概述
扩散模型的基本原理与发展
扩散模型最早在2015年由Sohl-Dickstein等人提出,最初是为了通过前向和逆向过程学习复杂的概率分布。然而,它们在2020年因图像生成中取得的惊人成果而迅速流行,并被应用于图生成和生物计算等领域,包括分子生成、分子对接和分子动力学等。
扩散模型通过引入噪声来扰乱数据,然后反向过程去除噪声以生成新的样本。分子生成任务中,最常用的扩散模型是去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPMs),该模型包括两个马尔科夫链:一个将数据转换为标准高斯噪声的前向链,和一个通过深度神经网络学习去噪变换的逆向链。通过逆向扩散过程,模型能够从噪声中恢复分子的3D结构。
扩散模型在从头药物设计中的应用
在全新药物设计中,扩散模型主要用于以下任务:
1. 3D分子生成:扩散模型在生成3D分子结构方面具有独特优势,特别是在复杂化学空间的探索中。生成的分子可以通过后续的分子动力学模拟进行验证,以确保其物理和化学稳定性。
2. 基于目标的分子设计:扩散模型可以根据特定的目标(例如蛋白质结合位点)生成具有高选择性的小分子药物。这种方法通过条件生成技术,将分子的生成过程与目标蛋白质的物理化学性质联系起来,以提高生成分子的药效。
3. 分子对接与动态模拟:通过扩散模型生成的分子可以直接应用于分子对接和分子动力学模拟中,用于预测分子与靶标蛋白之间的相互作用。这种方法能够提高分子设计的效率,并减少对实验筛选的依赖。
图3 反向扩散中常用的神经网络架构的简单说明:A-transformers、B-GNNs和C-CNNs(3D)
扩散模型的技术实现与挑战
在分子生成任务中,如何有效地表示和编码分子中的原子和键是扩散模型面临的主要挑战之一。扩散模型通常使用图表示(graph representation)来编码分子结构,其中节点表示原子,边表示键。在3D图中,节点不仅包含原子类型的信息,还包含原子的位置,而边可以显式表示为键特征或通过3D坐标的距离隐式编码。
此外,扩散模型还需要满足E(3)等值性要求,即模型需要在平移、旋转和反射等几何变换下保持不变。这对于生成分子的3D结构至关重要,尤其是在考虑分子的对称性和手性时。为了应对这一挑战,研究人员开发了基于几何图神经网络(Geometric Graph Neural Networks, GNNs)的模型,这些模型能够同时学习分子的几何结构和化学性质,从而提高生成分子的稳定性。
扩散模型生成的分子需要在多个层面上保证其生成结果的有效性。这包括分子图的连通性、化学稳定性以及原子的化学价。研究人员通过引入物理化学约束,例如键角、二面角和键长等,来增强生成分子的稳定性和合理性。
扩散模型在分子生成任务中的优势与前景
与其他生成模型相比,扩散模型在分子生成任务中的主要优势在于其能够生成具有高度复杂性和准确性的分子结构。通过逐步去噪过程,扩散模型可以从噪声中恢复出符合物理化学规律的分子。此外,扩散模型能够通过条件生成技术,控制分子的特定性质(例如药物活性、选择性和毒性),从而为药物设计提供更多的可能性。
未来,随着扩散模型的不断优化和计算能力的提升,这些模型在药物发现中的应用将更加广泛。特别是在基于结构的药物设计、蛋白质-配体相互作用预测以及分子动力学模拟等领域,扩散模型有望进一步提高药物发现的效率,并推动新型疗法的开发。
扩散模型作为一种强大的分子生成工具,已经在药物发现中展现出巨大的潜力。通过将深度学习与统计物理相结合,扩散模型能够有效地生成具有复杂3D结构的分子,并应用于全新药物设计、分子对接和分子动力学模拟等任务。随着该技术的进一步发展,扩散模型有望成为推动药物发现和优化的重要工具。
参考资料:
Alakhdar A, Poczos B, Washburn N. Diffusion Models in De Novo Drug Design[J]. Journal of Chemical Information and Modeling, 2024.
--------- End ---------