前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nat. Commun. | 具有深度交互组学习的未来全新药物设计

Nat. Commun. | 具有深度交互组学习的未来全新药物设计

作者头像
DrugAI
发布2024-05-23 16:42:15
930
发布2024-05-23 16:42:15
举报
文章被收录于专栏:DrugAIDrugAI

今天为大家介绍的是来自Gisbert Schneider团队的一篇论文。从头设计药物旨在从零开始生成具有特定化学和药理性质的分子。作者提出了一种利用基于相互作用组的深度学习的计算方法用于基于配体和结构的药物样分子的生成。这种方法同时利用了图神经网络和化学语言模型的独特优势,无需针对特定应用进行强化学习、迁移学习或少样本学习。它能够实现“零样本”构建定制的化合物库,这些化合物库具有特定的生物活性、可合成性和结构新颖性。为了积极评估基于蛋白质结构的药物设计的深度相互作用学习框架,作者生成了针对人类过氧化物酶体增殖激活受体(PPAR)亚型γ的结合位点的潜在新配体。排名靠前的设计被化学合成,并在计算机上、生物物理上和生物化学上进行了表征。作者识别出了强力的PPAR偏激动剂,它们显示出对核受体和非靶标相互作用的期望活性和选择性特征。对配体-受体复合物的晶体结构测定确认了预期的结合模式。这一成果积极支持了基于相互作用组的从头设计在生物有机化学和医药化学中的应用,使创新的生物活性分子的创建成为可能。

化学语言模型(CLMs)是设计用于处理和学习以序列形式表示的分子结构的机器学习技术。在CLMs的背景下,迁移学习可以被概念化为两步。在第一步中,CLM使用一个庞大的生物活性分子数据集进行预训练,专注于发展对化学的基础理解和获取关于药物化学空间特征的知识。在第二步中,预训练的CLM使用一个更小的包括特别代表所需活性和属性配置文件的分子数据集进行微调,提炼CLM生成具有所需特性的分子的能力。一旦训练完成,CLM可以生成针对特定任务的虚拟分子库。一些CLM方法也整合了强化学习技术,使得可以对生成分子的属性进行额外级别的微调。然而,CLMs中迁移学习和强化学习的使用涉及额外的机器学习步骤,这可能在药物化学的设计-制造-测试-分析周期中带来速度和无缝集成方面的挑战,它还可能在依赖于关于蛋白质结合位点的明确信息的基于结构的设计应用中带来困难。最近的进展集中在研究分子相互作用网络,即互作组,它涵盖了各种类型的相互作用,如蛋白质-蛋白质相互作用、药物-靶标相互作用以及药物-药物关系。分析这些互作组可以预测以前未知的相互作用,并提供对网络拓扑的见解,使得可以全面检查网络内各种组件的相互连通性和依赖性。

模型部分

图 1

为了全面研究药物-靶标互作组,作者提出了一种将化学语言模型(CLM)与基于互作组的深度学习结合的方法(图1a, b)。这种方法采用了一种神经网络架构,包括一个图变换神经网络(GTNN)和一个利用长短期记忆(LSTM)的CLM(图1c, d, e)。这种方法得到的深度学习模型被命名为DRAGONFLY(基于药物-靶标互作组的新生物活性分子生成)。与依赖于个别分子的转移学习的传统CLM不同,该方法利用基于互作组的深度学习,能够整合来自多个节点的目标和配体的信息。DRAGONFLY能够处理小分子配体模板以及三维(3D)蛋白质结合位点信息。它操作多样的化学字母表,不需要针对特定应用进行转移或强化学习的微调。此外,它还能将所需的物理和化学属性整合到输出分子的生成中。本研究介绍了DRAGONFLY在基于结构的从头设计中的潜在应用,特别是用于生成具有针对一个或多个特定的大分子靶标所需生物活性特性的配体(图1f)。

为配体设计考虑理化性质

图 2

如图2a所示,该理论评估侧重于研究如何将特定的物理和化学性质整合到DRAGONFLY模型中。评估显示,所有评估的物理和化学性质的皮尔森相关系数(r)均大于或等于0.95。这些性质包括分子量(r = 0.99)、可旋转键(r = 0.98)、氢键受体(r = 0.97)、氢键供体(r = 0.96)、极性表面积(r = 0.96)和以MolLogP33表示的亲脂性(r = 0.97)。这些高相关系数表明所需属性与生成分子的实际属性之间存在强烈的关系。

此外,为了估计从头设计的靶向生物活性,作者开发了定量结构-活性关系(QSAR)模型。模型使用基于核岭回归(KRR)的机器学习,并训练了三种分子描述符:ECFP4、未缩放的CATS和USRCAT。对于1265个调查的靶标中的大多数,预测的pIC50值的平均绝对误差(MAEs)等于或小于0.6(见图2b)。这些结果表明,开发的模型在预测类似适用领域内的靶标的新分子的抑制常数方面达到了高水平的准确性。此外,ECFP和CATS模型的性能随着训练集大小的增加呈对数减小误差。当数据集大小超过某一点(约100个分子)时,USRCAT模型的性能达到平台期,表明额外的数据未能提高其预测准确性。这些发现强调了在KRR模型的性能中使用结构与模糊特征相结合的描述符组合的有效性。

产生潜在新配体

图 3

为获取候选配体库,利用人类PPARγ蛋白(PDB-ID 3G9E)的配体结合位点作为结构模板(见图3a)。得到的300k个分子根据特定标准进行了过滤,并进一步根据平均预测结合亲和力(pKI 或 pIC50)使用基于 KRR 的 QSAR 评分进行排名,它结合了 ECFP(双重加权贡献)、CATS 和 USRCAT 描述符。如图3b所示,应用这些排名标准导致识别出两倍的前5名分子(1, 2, 6-13)。在排名靠前的设计中以丙酸头基为主,但值得注意的是,在得分最高的100个全新分子中也存在各种其他头基。图3c突出显示了来自这个前100名集合的非羧酸头基和二级酰胺的选择。这一选择包括了多样化的二级酰胺以及嘧啶二酮,即已知促进PPARγ调节的头基。这些替代头基表明了结构多样性以及在设计顶级子集内的新型分子时探索不同化学和生物等效物的潜力。

产生有效分子且选择性地激活PPARγ

图 4

为了测试基于结构的分子设计算法的实用性和实用性,作者选择了两个得分最高的从头生成设计(1和2)来进行化学合成和随后的生物表征。设计1通过10步的收敛合成实现,最长的单条路线为6步,总收率为12%(见图4a)。设计2通过5步合成,总收率为0.6%(见图4b)。此外,在设计2的合成过程中,还分离出了区域异构体3。

图 5

对三种分子(1-3)在细胞基础的报告基因测定中的后续生物学测试证实了其预期的活性特性。化合物1显示了预期和预测的PPARγ和PPARδ的双重活性,其半最大有效浓度EC50(PPARγ) = 1.5 ± 0.2 μM,EC50(PPARδ) = 0.24 ± 0.05 μM(见图5a)。此外,通过等温滴定量热法(ITC),化合物1对PPARγ配体结合域的亲和力进行了表征,得到的解离常数为KD = 0.8 ± 0.1 μM,且配体与蛋白质分子的摩尔比为1 : 1(见图5b)。这个KD值证实了化合物1在功能性报告基因测定中观察到的直接受体调节作用。化合物2展示了对PPARγ的显著选择性活性,其EC50值为2.3 ± 0.7 μM,同时未对PPARα或PPARδ产生明显影响(见图5c)。这一结果与预期设计目标完全一致。化合物3展示了对PPARγ(其EC50为1.8 ± 0.1 μM)和PPARα(其EC50为3.4 ± 0.3 μM)的双重、部分激动剂活性剖面,同时对PPARδ没有明显活性。此外,化合物1-3对其他核激素受体靶点的预测选择性在实验上也得到了证实,包括对视黄酸X受体(RXR)α、肝X受体(LXR)α和视黄酸受体(RAR)α(见图5d)。此外,化合物1和2在不同时间点、细胞数量以及化合物浓度范围内对HEK293T细胞没有任何细胞毒性(见图5e)。总体而言,化合物1和2显示出有希望的类药特性,这表明在进一步的药物开发方面具有巨大的发展潜力。

图 6

为了研究化合物1的结合姿态,对PPARγ的配体-蛋白复合物进行了X射线结构测定(见图6a)。化合物1结合在不对称单元中的两个蛋白分子之一上。化合物1结合在由螺旋H3和H11围成的正交位点,埋藏的丙酸头基参与了四个分子间氢键。其中三个与Tyr473、His323和Ser289的侧链建立,而第四个是通过水介导的氢键与His449的残基形成。在空的PPARγ位点中,TYR477的羧基C末端通过与配体的丙酸头在类似位置的结合来阻塞该位点。配体的尾部部分暴露于溶剂中,丙二醇类的连结器使配体能够进入结合口袋的疏水部分,使得两个芳香环系统与蛋白进行额外的相互作用。

编译 | 于洲

审稿 | 王建民

参考资料

Atz K, Cotos L, Isert C, et al. Prospective de novo drug design with deep interactome learning[J]. Nature Communications, 2024, 15(1): 3408.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档