前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >中山大学杨跃东团队提出AIxFuse模型,通过基于药效团组合协同学习的结构感知进行双靶点药物设计

中山大学杨跃东团队提出AIxFuse模型,通过基于药效团组合协同学习的结构感知进行双靶点药物设计

作者头像
智药邦
发布2024-10-14 16:15:18
1150
发布2024-10-14 16:15:18
举报
文章被收录于专栏:智药邦

双靶点药物设计在癌症和自身免疫性疾病等复杂疾病的治疗中引起了很大的关注。一种广泛采用的设计策略是结合药效团来利用两个靶点的结构-活性关系的知识。然而,药效团的结合经常受限于长期和昂贵的试验,因为两个靶点的蛋白质口袋施加了复杂的结构限制。

2024年6月13日,中山大学杨跃东教授团队在Chemical Science上发表文章Structure-aware dual-target drug design through collaborative learning of pharmacophore combination and molecular simulation。

作者提出了一种结构感知的双靶点药物设计方法AIxFuse,该方法通过学习药效团融合模式来满足分子对接模拟的双靶点结构约束。AIxFuse采用两个自我博弈强化学习(self-play reinforcement learning, RL) 的智能体,通过双靶点分子对接评分等综合反馈,学习药效团的选择与融合。分子对接分数是通过主动学习(AL)策略进行学习的。通过融合RL和AL, AIxFuse学习生成具有多种所需属性的分子。实验结果表明,AIxFuse在一系列任务中超越了现有方法。

如图1所示,AIxFuse首先收集两个靶点的靶向蛋白结构和已知活性化合物(图1A)。随后,利用Glide的分子对接模拟它们的蛋白质-配体复合物结构。从这些复合物结构中,利用PLIP程序提取蛋白质-配体相互作用(PLI)。然后将提取的PLI组合以定义药效团(图1B),并根据相互作用评分、频率评分等对药效团进行排序。得分最高的药效团将每个化合物分成核心链和侧链片段。这些片段可以通过两个搜索树重新排列(图1C),其中两个树的叶节点将融合以产生药效团融合的分子。作者采用行为关键类强化学习(RL)框架学习最佳药效团融合模式。它由两个自我博弈的蒙特卡罗树搜索(MCTS)演员(actor)和一个双靶点对接评分评论家(critic)组成actor-critic框架。MCTS参与者的目标是最大化生成分子的奖励的上置信限(UCB)。更具体地说,奖励函数包含各种属性,包括药物相似性、合成可及性和双靶点对接分数。采用主动学习(AL)迭代训练多任务AttentiveFP模型作为双靶点对接评分器。经过协作强化学习和人工智能的几次迭代,最终的模型将用于生成分子。

图1 AIxFuse结构图

药效团融合策略强调在不同靶标中保留重要的药效团这里药效团可以定义为蛋白质-配体相互作用(PLI)的组合。作者设计了一个专用模块,用于提取核心片段,保留活性化合物中存在的基本药效团。该模块旨在促进自动提取和指导选择。由于大多数活性化合物无法获得共晶结构,作者使用了PLIP工具对分子对接复合物结构进行分析。

对于每个药效团,作者系统地提取其最小连接子结构,称为核心片段,如图1B所示。作者的兴趣在于具有以下特征的核心片段:(1)与关键残基相互作用或接触,(2)在多种活性化合物中普遍存在,(3)适当的大小。为了实现这一点,作者使用相互作用、距离和重原子序数的评分函数来筛选片段。此外,对于由两个或两个以上化合物共享的核心片段,作者将其得分进行汇总,以便药物化学家喜欢的片段排名更高。最终选择得分最高的核心片段构建两个靶点的树。整个药效团提取和选择过程如图1B所示。

从AlphaZero中使用的蒙特卡罗树搜索(Monte Carlo Tree Search, MCTS)中获得灵感,作者开始探索利用树结构来表示药物团融合的化学空间。虽然以前的研究尝试使用树形结构作为分子的表示,但作者的方法与众不同,因为它引入了一个定义明确的起点。这个起点,在图1C中表示为核心片段,来源于药效团提取模块。因此,作者的树形结构的初始层致力于核心的选择,这对特定关键药效团的保存施加了控制。

一旦从两棵树中选择了两个核心,接下来的挑战就变成了如何修改和融合它们。鉴于从活性化合物中提取核心的副产物是侧链片段,因此考虑使用两棵树中的侧链来构建连接体是很自然的。链接器的构建过程分为三个阶段。首先,从两个核心片段中选择两个锚原子作为连接体生长锚,在图1C中命名为生长锚。其次,对于每个锚,作者从其中提取一个侧链。第三,从每条侧链中选择一个锚原子进行融合,在图1C中记为融合锚。通过连接来自不同树的两个融合锚,可以将来自不同目标的核心片段连接在一起。对于尚未选择的生长锚,修饰R基团被认为有助于提高生成分子的多样性。从这些锚点生长的侧链可以在不同的原子上被切割以构建R基团。最终,如图1C所示,叶节点原理是通过在未选择的生长锚点上修饰有效的R-基团(化学上有效的R-基团,不会破坏原始侧链内的环)来构建的。最后的分子是由两个基元在它们的融合锚点融合而产生的。

作者训练了一个多任务GNN作为双目标对接评分预测。在使用GNN编码图之前,原子特征和键特征的提取是必不可少的。作者采用了9个原子特征(原子类型、化学键数、形式电荷数、自由基电子数、杂化类型、芳香性、连接的氢原子数、是否具有手性、手性类别)和4个键特征(键类型、是否共价、是否成环、立体化学类型)的组合。在分子对接主动学习领域,消息传递神经网络(MPNN)的表现优于随机森林和传统神经网络方法。然而,当MPNN应用于分子图的处理时,可能会遇到稀释效应的问题。这是因为它对所有节点进行了统一处理,而不考虑其与目标节点的距离,从而削弱了拓扑相邻节点和官能团的影响。

为了解决这一限制,作者引入了注意力机制,以图注意力网络(GAT)的形式提供改进的邻居聚合。最近,注意力指纹(AttentiveFP)框架被提出,作为一种能够通过节点信息传播捕获局部原子相互作用和通过图注意力机制捕获分子内非局部效应的方法。它是为分子特征提取而定制的,并且在综合基准测试中优于其他架构(包括MPNN)。在作者的研究中,作者将AttentiveFP框架应用于分子对接主动学习领域。构建了两个卷积层来提取原子特征,一个读出层用于生成分子嵌入。随后,通过将分子嵌入到多任务全连接层中来预测对接分数。

AIxFuse采用协同迭代RL和AL学习药效团融合模式,满足分子对接模拟的双靶标结构约束。如图1C所示,RL框架是actor-critic的,涉及两个MCTS演员来产生药物团融合分子和一个通过主动学习训练的双目标对接评分评论家。INIT_GEN函数通过随机采样和融合不同树的基本原理生成药效团融合分子,DOCKING函数将分子生成到目标结合口袋中并估计其双目标结合亲和力,TRAIN函数表示通过多任务AttentiveFP模型主动学习双目标对接分数。其训练参数在SELF_PLAY函数中使用,生成新一批的药效团融合分子。简而言之,AIxFuse在构建树时初始化每个节点的权值,并根据其权值随机采样子节点。从两棵树中随机抽样的基本原理被融合以产生分子。两个MCTS以自我博弈的方式运行,以奖励每次探索。SELECT函数中使用给定节点的奖励期望的上置信区间(UCB)。

作者将AIxFuse与一些具有代表性的方法进行了比较,如表1所示。为了评估该方法的有效性,作者建立了GSK3β|JNK3双靶点抑制剂设计基准任务,开发糖原合成酶激酶3β (GSK3β)和c-Jun N-末端激酶3 (JNK3)的双靶点抑制剂,命名为GSK3β|JNK3基准。值得注意的是,GSK3β和JNK3与阿尔茨海默病(AD)和其他疾病的发病机制有关。设计同时针对GSK3β和JNK3的双重抑制剂的概念有可能为AD引入一种新的多靶点治疗方法。如表1所示,加粗的数字说明表现最好。在有效性、独特性、多样性、成功率、具有独特性和成功率(USR)分子的成药性(QED),可合成性(SA),GSK3β对接比率,JNK3对接比率,Fréchet ChemNet距离(FCD),近邻相似度(SNN)中,FCD越低越好,其余指标越高越好。在这所有十个指标中,AIxFuse在八个指标上取得了最佳结果。

表1 与其他方法对比

作者设计了消融实验来验证模型设计的有效性。作者探讨了运行多次迭代的强化学习RL和主动学习AL的贡献。如图2A和B所示,随着迭代,总体MSE减小,R2增大。这一趋势表明,多次迭代有助于提高双靶点对接评分的准确性。然后,作者在图2C和D中给出了最终双靶点对接评分评论家的准确性。最终Pearson相关系数表明,预测的对接评分与基本真实值之间存在很强的正相关(GSK3β和JNK3分别为0.691和0.704)。这肯定了模型的鲁棒排序能力,这是分子生成中提高分子性质的重要因素。然后作者研究了强化学习优化的贡献。如图2E-H所示,AIxFuse(没有RLAL)的对接得分分布与已知活性分子非常相似。这表明自动提取的药效团可以有效地保留两种靶标的基本构效关系。然而,AIxFuse(没有 RLAL)的QED分布和SA分布并不理想,如图3A-D所示。经过协作RL和AL的迭代,AIxFuse在所有四个属性上都实现了改进。这些现象凸显了协同RL与AL的协同效应,RL为AL优化训练了双目标对接评分"批评家",而AL为RL训练提供了更高质量的分子。

图2 消融实验

作者还进行了案例分析。为了获得对相似性的直观理解,图3E可视化了生成的分子和活性化合物的化学空间。GSK3β抑制剂的化学空间与JNK3抑制剂非常相似。值得注意的是,AIxFuse探索了已知抑制剂主要簇之间的间隙,而其他方法则没有。在两个靶标抑制剂之间的化学空间间隙内产生的分子可能表现出两端的高度相似性。为了更深入地研究生成的分子与活性化合物之间的分子性质相似性,作者绘制了图3F-K中的性质分布。可以发现,AIxFuse生成的分子的QED、SA、logP和重量分布与GSK3β抑制剂和JNK3抑制剂的QED、SA、logP和重量分布非常接近。然而,对于GSK3β和JNK3对接评分,与相应的已知抑制剂相比,AIxFuse产生的分子分布在较小的位置,表明生成的分子对这两个靶点具有更好的结合亲和力,同时保持了与已知抑制剂相似的其他特性。

图3 案例分析

在本文中,作者提出了AIxFuse,通过协同强化学习和主动学习的迭代,使药效团融合和分子对接能用于双靶点药物设计方法,即通过学习药效团融合模式来满足分子对接模拟的双靶点结构约束。作为一种结构感知的双靶点药物设计方法,AIxFuse可以生成潜在的双靶点hit化合物,用于后续的先导物优化。未来,还可以在AIxFuse中引入分子模拟上的主动学习,以提高结合亲和力估计的准确性。随着复杂疾病治疗对双靶点药物的需求越来越大,AIxFuse可以为各种双靶点设计任务提供快速有效的起点。

参考资料:

Chen et al. Structure-aware dual-target drug design through collaborative learning of pharmacophore combination and molecular simulation. Chem Sci. 2024

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-10-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人工智能与机器学习
提供全球领先的人脸识别、文字识别、图像识别、语音技术、NLP、人工智能服务平台等多项人工智能技术,共享 AI 领域应用场景和解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档