前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nat. Commun. | AGBT:将图和双向transformers融合的分子性质预测新工具

Nat. Commun. | AGBT:将图和双向transformers融合的分子性质预测新工具

作者头像
DrugAI
发布于 2021-09-17 03:45:58
发布于 2021-09-17 03:45:58
1.5K0
举报
文章被收录于专栏:DrugAIDrugAI

今天介绍的 是北京大学深圳研究生院与密歇根州立大学合作发表在Nature Communications的一篇文章。

分子性质预测对药物开发、人类健康和环境保护具有重要意义,然而各种分子性质的定量预测仍然是一个挑战。本文通过融合代数图和双向Transformer生成的表示,以及各种机器学习算法,包括决策树、多任务学习和深度神经网络,提出了代数图辅助的双向Transformer(AGBT)框架。并在八个涉及定量毒性、物理化学性质和生理性质的分子数据集上验证了该框架。大量的数值实验表明,AGBT是一种先进的分子性质预测框架。实现了基于小样本数据有效地定量预测分子特性。

1

介绍

从2019年新冠肺炎疫情爆发至今已有一年多,而世界还没有研发出针对新冠病毒的特效药物,这一事实提醒我们,药物发现仍然是一个巨大的挑战。合理的药物发现涉及到一系列的分子性质,包括结合亲和力、毒性、分配系数、溶解度、药动学、药效学等。分子性质的实验测定非常耗时和昂贵,因此需要不断地发展省时省钱而又兼具准确性的计算机辅助药物设计。其中最流行的方法之一是定量构效关系分析(QSAR),其思想是假定相似的分子具有相似的生物活性和物理化学性质。

目前包括深度学习(DL)在内的机器学习已经成为分子科学数据驱动发现的一种强有力的方法。例如,图形卷积网络(GCNs)、卷积神经网络(CNNs)和递归神经网络(RNNs)已经广泛应用于药物发现和分子分析。生成对抗网络(GANs)与一些机器学习策略(如监督学习和强化学习)相结合也被应用于新分子的生成和药物设计。然而,DL方法需要较大的数据集来确定其大量的权重,在较小的数据集上它的竞争力就小了。

尽管CNN和GANs等DL方法可以从简单的数据(如图像和/或文本)中自动提取特征,但由于分子(特别是大分子)结构的复杂,方法性能的好坏取决于分子表示。在过去的几十年中已经开发了各种指纹,然而,二维指纹缺乏分子的三维结构信息,尤其是立体化学描述。为此,研究者们开发了基于3D结构的指纹来捕捉分子的3D模式。然而,分子结构的复杂性和高维性是设计高效3D指纹的主要障碍。最近,基于高等数学的各种三维分子表示被提出,这些方法在蛋白质分类、溶解度、毒性、分配系数等上的预测取得了巨大成功。然而,这种方法依赖于可靠的3D分子结构的可用性。

另一种表示方法是用自监督学习(SSL)策略来预训练编码器模型,在没有3D分子结构的情况下,该编码器模型可以产生潜在空间向量作为分子表示。然而,潜在空间表示忽略了许多立体化学信息,例如二面角和手性。此外,潜在空间表征缺乏关于特定任务性质的特定物理和化学知识。例如,在许多药物相关的性质中,范德华相互作用可以发挥比共价相互作用更大的作用,在描述这些性质时需要加以考虑。

本文用AGBT来构造分子表示,结合了3D特定元素的加权彩色代数图和深度双向transformers(DBT)的优点。特定于元素的加权彩色代数图产生低维分子表示(该代数图将互补的三维分子信息嵌入到图的不变量中),称为基于代数图的指纹(AG-FP),它显著降低了分子结构的复杂性,同时基本上保留了物理/化学信息。DBT利用基于SSL的预训练过程从大量未标记的SIMLES数据中学习基本构成原理,并通过微调,使用特定于任务的数据进一步训练模型。由此产生的分子指纹,称为基于双向transformer的指纹(BT-FP),是DBT的潜在空间向量。

2

结果

本文介绍了AGBT模型及其在八个数据集LD50、IGC50、LC50、LC50DM、partition coefficient(分配系数)、FreeSolv、Lipophilicity(亲脂性)和BBBP上的分子预测结果。作者在预训练中使用了CheMBL数据集。

AGBT

如图1所示, AGBT由四个主要模块组成:AG-FP生成器(即蓝色矩形)、BT-FP生成器(即橙色矩形)、基于随机森林(RF)的特征融合模块(即绿色矩形)和下游机器学习模块(即粉红色矩形)。对于图指纹的生成,文章使用特定于元素的多尺度加权彩色代数图,将化学和物理相互作用编码为图不变量,并捕获三维分子结构信息。BT-FP分两个步骤创建:基于SSL的预训练步骤。包含大量未标记的输入数据;基于特定任务的微调步骤。微调步骤可以通过两种方式执行:第一种方法只是采用相同的SSL过程来微调模型。

此外,模型融合了随机森林算法来对的AG-FP和BT-PF特征的重要性进行排序,并选择固定组件数量的最佳AGBT-FP集合。下游的机器学习算法被馈送最优的特征,以在四个基准毒性数据集上获得最佳性能。此外,还使用了梯度增强决策树(GBDT)、随机森林(RF)和深度神经网络(DNN),包括单任务DNN(ST-DNN)和多任务DNN(MT-DNN)来执行最终预测。

用平方皮尔逊相关系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)来评价回归任务的性能,用分类精度和AUC-ROC来评价分类模型的性能。

图1 AGBT模型

毒性预测

毒性是药物先导优化中需要考虑的一个关键问题,它衡量一种化合物对生物体产生不利影响的程度。

LC50DM集是指可导致50%的大型蚤在48小时后死亡的水中的测试化学物质的浓度,它是相关四个数据集里最小的一个。为解决模型规模较小而导致预测模型难以训练的问题(如描述符过多导致过拟合)。本文应用MT-DNN,从具有一定统计分布的数据集中提取信息,有效地提高了模型的预测能力,避免了对小数据集的过度拟合。结果如图2b所示,在LC50DM集上本文模型的性能最好,R2=0.830,均方误差=0.743。

图2 AGBT框架和性质预测结果

口服大鼠LD50集衡量的是口服时可杀死一半大鼠的化学物质的浓度。这个数据集是相关四个集合中最大的一个集合,导致因为集合中值的跨度大使得预测相对困难。如表1所示,所有现有方法的R2值都在0.392到0.643之间,而本文的方法可以达到0.671。

表1 在六个数据集上将最佳表现与发表的已知分数进行比较

FreeSolv和亲脂性预测

该项预测可以了解分子与溶剂相互作用的基本物理化学性质。如表2所示,对于FreeSolv和亲脂性数据集,最好的结果都产生在融合的描述符上,这说明代数图确实对分子性质预测有重要影响。

表2 AGBT 框架在八个数据集上生成的描述符的性能

分配系数预测

分配系数表示为P,是物质在两种相互不溶的溶剂(本文是辛醇和水)中的平衡状态下的浓度之比,可以用于衡量化合物的药物相关性及其对人体的疏水性。该系数的对数表示为logP。用美国食品药品监督局(FDA)批准的一组406个分子作为测试。表1列出了FDA分子数据集在不同预测方法上比较。可以看出,本文的R2达到了最高值0.905。

血脑屏障通透性 (BBBP)二元标记物的分类任务

本文采用化合物通透性的二元标记法。为了更好地进行比较,数据集的训练、验证和测试集划分比例为8:1:1。如表1所示,本文的方法获得了最佳AUC-ROC值0.763。

3

方法

基于代数图的分子指纹 (AG-FPs)

图3a显示的是2-三氟乙酰的分子结构,如图3b所示,分子中原子之间的联系可以用图来表示。元素特定的多尺度加权彩色图表示可以定量地捕捉不同化学方面的模式,例如不同原子之间的范德华相互作用和氢键。图3c显示图通过使用彩色顶点来捕捉元素信息,并且不同的边对应于分子中不同的成对相互作用。对于给定的分子使用所选的原子坐标子集作为顶点来构建元素特定的彩色子图。如图3d所示,将彩色图分解为特定于元素的CC、FO和CH子图的过程,其中元素指的是本研究中的化学元素,例如H、C、N。此外,代数图特征可以从图拉普拉斯和/或邻接矩阵的特征值的统计中获得,如图3e所示。

图3 加权彩色元素特定代数图

双向transformer指纹(BT-FP)

深度双向transformer(DBT)基于注意力机制,在海量数据的情况下能够减少训练时间。BERT是基于DBT体系结构的表示模型,涉及到两个任务,遮盖语言学习和连续句分类。遮盖语言学习使用部分掩蔽的句子(即词)作为输入,并使用其他词来预测掩蔽的词,连续句分类是对两个句子是否连续进行分类。本文的DBT的输入是分子SMILES串。与传统的用于自然语言处理的BERT中的句子不同,不同分子的SMILES串没有逻辑上的联系。本文训练来自transformer的双向编码器来恢复被掩蔽的原子或官能团。

如图2所示,可以得出,AG-FP和BT-FP的融合提高了大多数数据集的预测精度和稳定性。基于数学的分子描述符可以补充数据驱动的潜在空间描述符。

参考资料

Chen, D., Gao, K., Nguyen, D. D., Chen, X., Jiang, Y., Wei, G. W., & Pan, F. (2021). Algebraic graph-assisted bidirectional transformers for molecular property prediction. Nature Communications, 12(1), 1–9. https://doi.org/10.1038/s41467-021-23720-w

论文链接:

https://www.nature.com/articles/s41467-021-23720-w

代码链接:

https://github.com/ChenDdon/AGBTcode52

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-09-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Brief Bioinform|FP-GNN:基于分子指纹和图神经网络的分子性质预测模型
2022年9月17日,华南理工大学王领老师团队[1]在Briefings in Bioinformatics上发表文章。作者提出了FP-GNN,一种基于分子指纹(fingerprint,FP)和图神经网络(graph neural networks,GNN)的分子性质预测模型,结合了分子指纹表示和基于图神经网络的分子图表示。
智药邦
2022/11/16
3.7K0
Brief Bioinform|FP-GNN:基于分子指纹和图神经网络的分子性质预测模型
J. Med. Chem. | 用图形注意机制推进药物发现分子表征的边界
今天给大家介绍的是上海科技大学免疫化学研究所蒋华良院士团队在Journal of Medicinal Chemistry上发表了一篇名为“Pushing the Boundaries of Molecular Representation for Drug Discovery with the Graph Attention Mechanism”的文章。寻找具有良好药理、毒理学和药代动力学特性的化学物质对药物发现来说仍然是一个巨大的挑战。深度学习为药物发现领域提供了强大的工具来建立适合不断增长的数据量的预测模型,但这些神经网络学习的内容与人类能够理解的内容之间的差距正在扩大。此外,这种差距可能会引发不信任,限制深度学习在实践中的应用。在此,作者在文章中介绍了一种新的使用图注意力机制来学习药物发现相关数据集的图神经网络结构——Attentive FP来进行分子表示。通过实验证明,Attentive FP模型不仅在各种数据集上达到了最高水准的预测性能,而且它学习到的是可解释的。通过特征可视化表明,Attentive FP通过从特定任务中学习非局部分子内的交互帮助研究人员发现超出人们预期的潜在的化学信息。
智能生信
2021/02/04
7890
JCIM|逆向药物设计:从目标性质到分子结构
2022年6月2日,来自美国国家转化科学促进中心的Hongmao Sun与Yuhong Wang等人在JCIM上发表文章,作者描述了一种新的策略,即逆向药物设计(RDD),从头开始设计新的小分子药物,满足多个预定义的目标。结果表明,RDD具有显著改善当前药物发现过程的潜力。
智药邦
2022/11/16
6060
JCIM|逆向药物设计:从目标性质到分子结构
Nat Commun|知识引导的分子表示学习预训练框架
2023年11月21日,清华大学曾坚阳教授(西湖大学教授)、赵诞老师团队,在Nature Communications上发表文章A knowledge-guided pre-training framework for improving molecular representation learning。
智药邦
2024/03/05
2460
Nat Commun|知识引导的分子表示学习预训练框架
Nat. Commun. | 具有深度交互组学习的未来全新药物设计
今天为大家介绍的是来自Gisbert Schneider团队的一篇论文。从头设计药物旨在从零开始生成具有特定化学和药理性质的分子。作者提出了一种利用基于相互作用组的深度学习的计算方法用于基于配体和结构的药物样分子的生成。这种方法同时利用了图神经网络和化学语言模型的独特优势,无需针对特定应用进行强化学习、迁移学习或少样本学习。它能够实现“零样本”构建定制的化合物库,这些化合物库具有特定的生物活性、可合成性和结构新颖性。为了积极评估基于蛋白质结构的药物设计的深度相互作用学习框架,作者生成了针对人类过氧化物酶体增殖激活受体(PPAR)亚型γ的结合位点的潜在新配体。排名靠前的设计被化学合成,并在计算机上、生物物理上和生物化学上进行了表征。作者识别出了强力的PPAR偏激动剂,它们显示出对核受体和非靶标相互作用的期望活性和选择性特征。对配体-受体复合物的晶体结构测定确认了预期的结合模式。这一成果积极支持了基于相互作用组的从头设计在生物有机化学和医药化学中的应用,使创新的生物活性分子的创建成为可能。
DrugAI
2024/05/23
1780
Nat. Commun. | 具有深度交互组学习的未来全新药物设计
Patterns | 可解释图神经网络在药物性质预测问题上的定量评估研究
图神经网络因其对图结构数据的强大表达能力而受到越来越多的关注,但它们仍然因为缺乏可解释性而受到质疑。当前可解释性人工智能方法受限于数据集,仅在社交网络等现实世界数据集上进行定性评估,缺少定量评估和比较。同时,可解释性方法生成的解释是否达到预期目的并提供可靠的答案也仍待探索。中山大学杨跃东教授团队联合星药科技研发团队在Cell Press旗下Patterns期刊发表了题为“Quantitative evaluation of explainable graph neural networks for molecular property prediction”的文章,该研究建立了五个分子可解释性基准数据集,定量评估了六种常用的可解释性方法与四种图神经网络模型的组合,并与药物化学家在可解释性任务上进行了直接比较。这是首次将可解释性方法与人类专家在可解释性任务上进行定量实验比较的研究。同时,基于模型学到的解释,研究人员开发了一种数据驱动的分子结构指纹,可作为分子属性预测中经典分子指纹的补充。相关成果[1]已于11月正式发表。
智药邦
2023/02/14
3790
Patterns | 可解释图神经网络在药物性质预测问题上的定量评估研究
JCIM|XGraphBoost:基于图神经网络提取特征的一种更好的分子特性预测模型
今天给大家介绍的是 Journal of Chemical Information and Modeling 上,一篇有关提取图神经网络特征、更好地预测分子特性的方法的文章 "XGraphBoost: Extracting Graph Neural Network-Based Features for a Better Prediction of Molecular Properties"。
智药邦
2021/09/06
2K0
JCIM | 基于图神经网络的深度学习预测溶剂化自由能
溶剂化自由能是影响各种化学和生物学过程的基本属性,例如反应速率、蛋白质折叠、药物结合和药物的生物利用度等等。本工作中,作者提出了一种基于图网络的深度学习方法,可以准确地预测有机小分子的溶剂化自由能。所提出的深度学习模型包括三个阶段,即信息传递、相互作用和预测,能够预测任何通用有机溶剂中的溶剂化自由能,平均绝对误差为0.16 kcal/mol。在准确性方面,当前模型目前优于所有此前提出的基于机器学习的其他模型。此外,作者对基于机器学习的模型的鲁棒性进行了全面测试,并通过几个示例验证了其解释预测的能力。
DrugScience
2021/03/24
8890
JCIM | 基于图神经网络的深度学习预测溶剂化自由能
Nat. Commun. | 靶标感知分子生成模型TamGen
生成式药物设计是一种创新的药物设计方法,它在不依赖现有模板或分子骨架的前提下生成具有特定性质的化合物。与基于筛选的方法(如高通量筛选和虚拟筛选等)相比,该方法突破了现有分子库的局限性,为发现那些尚未被充分研究的化合物类别及全新化合物提供了可能。近年来,越来越多的方法被提出用于指导基于靶蛋白信息的分子生成,包括自回归模型、生成对抗网络(GAN)、变分自编码器(VAE)和扩散模型等。虽然这些方法生成的化合物通常展现出较好的多样性和新颖性,但在物理化学性质方面往往不尽如人意。因此,尽管分子生成模型在理论上具有探索广阔化学空间的潜力,但在生成具有实际应用价值的化合物方面仍面临诸多挑战。
DrugAI
2025/02/05
1400
Nat. Commun. | 靶标感知分子生成模型TamGen
Patterns | 可解释图神经网络在药物性质预测问题上的定量评估研究
图神经网络因其对图结构数据的强大表达能力而受到越来越多的关注,但它们仍然因为缺乏可解释性而受到质疑。当前可解释性人工智能方法受限于数据集,仅在社交网络等现实世界数据集上进行定性评估,缺少定量评估和比较。同时,可解释性方法生成的解释是否达到预期目的并提供可靠的答案也仍待探索。中山大学杨跃东教授团队联合星药科技研发团队在Cell Press旗下Patterns期刊发表了题为“Quantitative evaluation of explainable graph neural networks for molecular property prediction”的文章,该研究建立了五个分子可解释性基准数据集,定量评估了六种常用的可解释性方法与四种图神经网络模型的组合,并与药物化学家在可解释性任务上进行了直接比较。这是首次将可解释性方法与人类专家在可解释性任务上进行定量实验比较的研究。同时,基于模型学到的解释,研究人员开发了一种数据驱动的分子结构指纹,可作为分子属性预测中经典分子指纹的补充。相关成果[1]已于11月正式发表。
DrugAI
2022/11/29
7890
Nat. Commun. | 通过单一分子基础模型实现结构和属性的双向生成
今天为大家介绍的是来自Jong Chul Ye团队的一篇论文。人工智能中基础模型的近期成功促使了大规模化学预训练模型的出现。尽管对于提供下游任务有用信息的大型分子预训练模型的兴趣日增,但在分子领域上对多模态预训练方法的尝试却很有限。为了解决这一问题,作者在此介绍了一个多模态分子预训练模型,该模型结合了结构和生化属性的模态,灵感来自于近期多模态学习技术的进展。作者提出的模型数据处理和训练目标在一个共同的嵌入空间中对齐了结构/属性特征,使得模型能够考虑分子结构和属性之间的双向信息。
DrugAI
2024/04/28
2260
Nat. Commun. | 通过单一分子基础模型实现结构和属性的双向生成
BioRxiv|盘古药物模型:像人类一样学习分子
2022年4月,华为健康智能实验室的乔楠及上海药物所的蒋华良、郑明月等人在BioRxiv发表文章,介绍了一个名为PanGu Drug Model的用于多个药物发现任务的新的深度学习架构。
智药邦
2022/11/16
1K0
BioRxiv|盘古药物模型:像人类一样学习分子
Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法
本文介绍由兰州大学黎育权和腾讯量子实验室谢昌谕博士等人发表在Nature Machine Intelligence期刊上的研究成果,论文通讯作者为姚小军教授。文章中报道了一种自动图学习方法,能够在人工不参与的情况下,在多种不同任务上取得先进的预测性能,超越过去的主流模型。作者还提出一种新的分子鲁棒性实验方法,并发现模型集成能够大幅提升鲁棒性。
DrugAI
2022/11/28
6490
Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法
Nat. Commun. | 当前小分子数据集存在显著覆盖偏差!耶拿大学团队新发现
今天为大家介绍的是来自德国耶拿大学Sebastian Böcker团队的一篇论文。小分子机器学习旨在从分子结构预测化学、生物化学或生物学特性,其应用包括毒性预测、配体结合和药代动力学。最近的一个趋势是开发避免显式领域知识的端到端模型。这些模型假设训练和评估数据中没有覆盖偏差,这意味着数据能代表真实分布。然而,这类模型很少考虑适用性范围。在这项研究中,作者调查了大规模数据集对已知生物分子结构空间的覆盖程度。为此,作者提出了一种基于求解最大公共边子图(MCES)问题的距离度量方法,该方法与化学相似性有很好的一致性。尽管这种方法在计算上很困难,但作者引入了一种结合整数线性规划和启发式边界的高效方法。研究结果表明,许多广泛使用的数据集缺乏对生物分子结构的均匀覆盖,这限制了在这些数据集上训练的模型的预测能力。作者提出了两种额外的方法来评估训练数据集是否偏离已知分子分布,这可能有助于指导未来数据集的创建以提高模型性能。
DrugAI
2025/03/03
980
Nat. Commun. | 当前小分子数据集存在显著覆盖偏差!耶拿大学团队新发现
Nat. Commun. | 知识蒸馏与双线性注意力网络:精准预测分子与蛋白质互作用
今天为大家介绍的是来自曼尼托巴大学计算机科学系的Pingzhao Hu教授与微生物学系的Silvia T. Cardona教授团队发表的一篇论文。在早期药物研发中,了解化合物与蛋白质之间的相互作用至关重要,这有助于我们理解分子作用机制并发现潜在的治疗效果。GraphBAN是一个基于图的框架(Graph-based Framework),该框架采用归纳式方法,能够处理未知节点的链接预测,突破了传统方法只能在已知环境下工作的限制。GraphBAN采用教师-学生模型进行知识蒸馏,其中教师模块利用网络结构信息,学生模块专注于节点属性。该框架还包含领域适应模块(Domain Adaptation Module),提高了跨数据集的效果。在5个基准数据集的实验中,GraphBAN的表现超过了10个基线模型,并在Pin1蛋白质的案例研究中证明了其在实际应用中的有效性。
DrugAI
2025/03/31
1120
Nat. Commun. | 知识蒸馏与双线性注意力网络:精准预测分子与蛋白质互作用
Nat Commun|通过单一基础模型双向生成分子的结构和特性
2024年3月14日,韩国科学技术院Jinho Chang等人在Nature Communications上发表文章Bidirectional generation of structure and properties through a single molecular foundation model。
智药邦
2024/04/01
2090
Nat Commun|通过单一基础模型双向生成分子的结构和特性
Cell Reports Methods | 深度几何分子学习
今天为大家介绍的是来自Jiawei Luo和Kelin Xia团队的一篇论文。分子表征学习在分子性质预测中扮演重要角色。现有的分子性质预测模型基于共价键的分子图,用以在原子层面上表示分子拓扑结构,并且完全忽略了分子内部的非共价相互作用。在这项研究中,作者提出了一种分子几何深度学习模型,旨在预测分子的性质,该模型致力于综合考虑分子的共价和非共价相互作用信息。
DrugAI
2023/12/19
5390
Cell Reports Methods | 深度几何分子学习
Adv. Sci. | 双扩散模型结合多目标优化策略助力3D小分子药物设计
药物发现中,如何精准且高效地设计具有理想物理化学性质的潜在药物分子,对当前的研究水平来说仍然是一项重大挑战。近年来,基于深度学习的全新分子生成(de novo molecular generation)方法取得了显著进展,其中使用去噪扩散模型(denoising diffusion models)为生成框架的工作更是展现出极大潜力。然而,现有3D分子生成的方法往往难以同时优化多个分子性质,并且对于潜在药物分子的关键性质考虑不足,已开发的生成模型的应用能力仍有待提升。同时,直接采用原子距离分布嵌入图神经网络,无法准确捕捉分子的拓扑与几何信息。
DrugAI
2025/04/06
1790
Adv. Sci. | 双扩散模型结合多目标优化策略助力3D小分子药物设计
Nat. Mach. Intell. | 基于图变分编码的多属性预测小分子生成模型
本文介绍的是2023年7月发表在国际知名期刊《Nature Machine Intelligence》上发表的一篇题为《Application of variational graph encoders as an effective generalist algorithm in computer-aided drug design》的研究论文。该论文提出了一种单一的通用模型,利用图卷积变分编码器,可以同时预测小分子的多个属性,如吸收、体内分布、代谢、排泄和毒性、特定靶点的对接打分预测以及药物间的相互作用。使用这种方法可以实现具有高达两个数量级的显著加速优势的最先进虚拟筛选。通过图变分编码器的隐空间最小化,还可以加速开发具有帕累托最优(Pareto optimality)原则的特定药物,并具有可解释性的优势。本文的通讯作者是慕宇光教授(新加坡南洋理工)、郑良振博士(智峪生科和深圳先进院)和李伟峰教授(山东大学)。
DrugAI
2023/09/19
3580
Nat. Mach. Intell. | 基于图变分编码的多属性预测小分子生成模型
Bioinformatics|MolFeSCue:基于小样本对比学习增强有限和不平衡数据下的分子性质预测
2024年2月29日,吉林大学周丰丰教授团队在Bioinformatics上发表文章MolFeSCue: enhancing molecular property prediction in data-limited and imbalanced contexts using few-shot and contrastive learning。
智药邦
2024/04/28
5140
Bioinformatics|MolFeSCue:基于小样本对比学习增强有限和不平衡数据下的分子性质预测
推荐阅读
Brief Bioinform|FP-GNN:基于分子指纹和图神经网络的分子性质预测模型
3.7K0
J. Med. Chem. | 用图形注意机制推进药物发现分子表征的边界
7890
JCIM|逆向药物设计:从目标性质到分子结构
6060
Nat Commun|知识引导的分子表示学习预训练框架
2460
Nat. Commun. | 具有深度交互组学习的未来全新药物设计
1780
Patterns | 可解释图神经网络在药物性质预测问题上的定量评估研究
3790
JCIM|XGraphBoost:基于图神经网络提取特征的一种更好的分子特性预测模型
2K0
JCIM | 基于图神经网络的深度学习预测溶剂化自由能
8890
Nat. Commun. | 靶标感知分子生成模型TamGen
1400
Patterns | 可解释图神经网络在药物性质预测问题上的定量评估研究
7890
Nat. Commun. | 通过单一分子基础模型实现结构和属性的双向生成
2260
BioRxiv|盘古药物模型:像人类一样学习分子
1K0
Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法
6490
Nat. Commun. | 当前小分子数据集存在显著覆盖偏差!耶拿大学团队新发现
980
Nat. Commun. | 知识蒸馏与双线性注意力网络:精准预测分子与蛋白质互作用
1120
Nat Commun|通过单一基础模型双向生成分子的结构和特性
2090
Cell Reports Methods | 深度几何分子学习
5390
Adv. Sci. | 双扩散模型结合多目标优化策略助力3D小分子药物设计
1790
Nat. Mach. Intell. | 基于图变分编码的多属性预测小分子生成模型
3580
Bioinformatics|MolFeSCue:基于小样本对比学习增强有限和不平衡数据下的分子性质预测
5140
相关推荐
Brief Bioinform|FP-GNN:基于分子指纹和图神经网络的分子性质预测模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档