前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >Nat Methods评论|利用人工智能预测一般生物分子的相互作用

Nat Methods评论|利用人工智能预测一般生物分子的相互作用

作者头像
智药邦
发布2025-01-11 15:35:49
发布2025-01-11 15:35:49
1130
举报
文章被收录于专栏:智药邦智药邦

2024年8月9日,来自韩国首尔国立大学生物科学学院的Minkyung Baek在Nature Methods上发表文章Towards the prediction of general biomolecular interactions with AI。

基于人工智能的方法,如AlphaFold和RoseTTAFold,在利用进化信息预测蛋白质三级和四级结构方面取得了显著进展。受这些成功经验的启发,研究人员目前正致力于开发能预测更广泛生物分子相互作用的人工智能模型,包括涉及核酸和小分子的相互作用。

图1 AlphaFold生成高度精确的结构

图2 使用RoseTTAFold进行实验结构测定

近年来,人们开发了专门的人工智能模型来预测特定类型的生物分子结构和相互作用,如RNA结构预测、蛋白质-核酸复合物建模和蛋白质-小分子对接。尽管这些模型在各自的任务中取得了可喜的成果,但由于高质量结构数据的稀缺,它们往往难以捕捉到生物分子相互作用的全部复杂性,也难以做出高精度的预测。例如,通过实验确定的蛋白质-RNA 复合物结构数量有限,因此很难对这些结构进行高精度预测。同样,化学空间的广阔也给蛋白质-小分子对接的人工智能模型带来了巨大挑战,因为现有的结构数据只涵盖了可能配体多样性的一小部分。此外,这些人工智能模型的专业性也限制了它们全面理解生物分子相互作用一般原理的能力。这些模型孤立地关注分子相互作用的特定方面,无法捕捉到更广泛的背景以及不同类型分子之间的相互作用。这种支离破碎的方法阻碍了我们揭示生物分子识别和功能的基本机制,而这对于增进我们对生物系统的了解和开发新的治疗药物至关重要。

最近,RoseTTAFold All-Atom和AlphaFold3展示了利用现有结构数据预测一般分子相互作用的潜力。这些模型扩展了神经网络架构,以处理一般生物分子,并利用大规模蛋白质结构数据库预测蛋白质结构及其与其他生物分子的结合构象。

图3 生物分子组装的预测和设计

为了建立一般生物分子相互作用模型,RoseTTAFold All-Atom和AlphaFold3在残基水平上表示蛋白质和核酸;在原子水平上表示任意小分子、共价修饰和非天然氨基酸。RoseTTAFold All-Atom使用SE(3)等变预测神经网络构建全原子结构,而AlphaFold3则使用生成扩散模块构建全原子结构。通过捕捉不同类型分子间的相互作用,这些模型展示了人工智能在预测不同类型分子间相互作用方面的潜力,并代表着向开发能够全面了解生命分子基础的人工智能系统迈出了重要一步。

图4 AF3准确预测生物分子复合物的结构

然而,尽管取得了令人瞩目的进展,但即使是这些最先进的模型也显示出有限的成功--尤其是在涉及结构数据稀缺的RNA和小分子的相互作用方面。这可能意味着这些模型没有完全捕捉到生物分子相互作用背后的物理原理。生物分子相互作用受各种因素复杂的相互作用所支配,包括静电力、疏水效应、氢键和构象动力学。即使对于最先进的人工智能模型来说,捕捉这些细节及其对相互作用的整体稳定性和特异性的相对贡献也是一项具有挑战性的任务。目前的模型虽然在整体性能上令人印象深刻,但仍难以完全再现这些相互作用的微妙之处和细微差别,从而导致其准确性和适用性受到限制。

为了克服这些挑战,我认为未来的研究应侧重于设计人工智能算法,将对分子相互作用的物理规律的更普遍理解融入其中,并将训练数据扩展到结构数据库之外。将物理和化学领域的知识融入人工智能模型的架构和训练中,可以引导它们学习更具有通用性的分子相互作用表征。这可以通过设计新颖的神经网络架构或明确编码物理约束或基于能量的建模方法的损失函数来实现。整合不同来源的数据并利用蛋白质和核酸语言建模的见解,有可能提高生物分子相互作用预测人工智能模型的通用性。

目前的模型严重依赖蛋白质数据库的数据(该数据库对小分子化学空间的覆盖有限),但蛋白质和核酸语言模型的成功表明,即使没有明确的结构信息,也可以从更广泛的数据集中学习结构信息。通过利用大规模的蛋白质-小分子相互作用数据库(如ChEMBL和PubChem),人工智能模型可以学习识别支配这些相互作用的模式和特征,并有可能扩大其适用性和鲁棒性。

我坚信,要充分发挥人工智能在预测一般生物分子相互作用方面的潜力,需要科学界的共同努力。人工智能专家和领域专家之间的合作对于确保人工智能模型学习基本物理原理至关重要。实验和计算研究人员之间的合作对于生成高质量数据和验证人工智能预测也至关重要。此外,解决数据整合、模型可解释性和伦理方面的挑战,对于确保在生物分子研究中负责任、有效地部署人工智能至关重要。随着我们不断推动人工智能方法在这一领域的应用,我们可以预见,未来人工智能将能准确预测并深入了解生物系统复杂性背后的各种相互作用。这将对药物发现、个性化医疗和基础生物学研究产生变革性影响。通过开发能够真正捕捉生物分子相互作用一般原理的人工智能模型,我们可以在生物科学领域开启新的可能性并加速科学发现。

参考资料:

Baek, M. Towards the prediction of general biomolecular interactions with AI. Nat Methods 21, 1382–1383 (2024).

https://doi.org/10.1038/s41592-024-02350-2

--------- End ---------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档