前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >GraphNVP | 用于分子图生成的可逆流模型

GraphNVP | 用于分子图生成的可逆流模型

作者头像
DrugAI
发布2021-01-28 23:16:03
发布2021-01-28 23:16:03
1.1K0
举报
文章被收录于专栏:DrugAIDrugAI

分子生成

具有理想药理特性新分子的发现是计算药物发现中的关键问题。传统上,这项任务是通过临床合成候选化合物并对其进行实验来完成的。但是,由于化学空间是巨大的,合成分子并对其进行广泛的实验是非常耗时的任务。从头设计药物不是在分子中寻找具有所需特性的空间,而是设计具有我们感兴趣特性的新化合物。

事实证明,深度学习的最新进展,尤其是深度生成模型在从头药物设计中具有不可估量的价值。

分子表征

将深度学习应用于分子生成的重要步骤是如何表示化合物。早期的模型依赖于SMILES的基于字符串的表示形式 。基于RNN的语言模型或变分自动编码器(VAE)用于生成SMILES字符串,然后将其转换为分子。使用SMILES的一个主要问题是,尽管相应的SMILES几乎相似,但它们对SMILES的细微变化并不稳健,从而导致分子截然不同。这些问题促使最近的研究依靠分子的更具表现力的图形表示。因此,这个问题被称为 分子图生成。

分子由无向图表示,其中原子和键分别表示节点和边缘。分子的结构由邻接张量表示和节点特征矩阵 X 用于表示原子的类型(例如,氧,氟等)。分子生成问题简化为可以表示有效分子的图的生成,可以利用诸如GAN或VAE之类的深度生成模型的问题。可以根据以前的工作如何生成图形将其分为两类。一些模型顺序生成分子图 ,从而以逐步的方式添加节点(原子)和边缘(键)。替代方法很简单,只需一步 即可以与图像生成模型类似的方式生成图形 。

可逆性的重要性

与上面介绍的VAE和GAN相比,使用可逆流的模型的优势在于可以直接使可能性最大化。

精确的优化 对于药物的分子生成至关重要,因为它们对单个原子(节点)的微小替换高度敏感。流模型的另一个优点是,由于它们是设计可逆的,因此可以保证完美的重构,并且不需要耗时的过程。只需在潜在矢量上运行模型的相反步骤,即可生成分子图。此外,GAN模型中缺少编码器,这使操作样本生成具有挑战性。例如,使用GAN模型生成类似于查询分子的分子(例如,用于药物发现的前导优化)并不容易,而基于流的模型则很容易。

模型

GraphNVP

GraphNVP是第一个基于可逆流的图形生成模型,该模型遵循一次生成策略。引入了两种潜在表示,一种用于节点分配,另一种用于邻接张量,以分别捕获图结构及其节点分配的未知分布。使用两种新类型的耦合层:邻接耦合 和 节点特征耦合, 以获取这两个潜在表示。在图生成过程中,首先生成邻接张量,然后使用图卷积网络生成节点特征张量 。

结果

从训练集中随机选择一个分子并将其编码为潜在载体 ž0 使用提出的模型。然后,选择两个彼此正交的随机轴。解码位于这两个轴跨越的二维网格上的潜点 ž0 作为起源。下面的可视化表示所学习的潜在空间是平滑的,因此相邻的潜在点对应于具有微小变化的分子。

参考资料

  • https://arxiv.org/abs/1905.11600
  • https://github.com/pfnet-research/graph-nvp

作者&编辑丨王建民

研究方向丨药物设计、生物医药大数据

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档