Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Acta Pharmacol Sin|上海药物所评测AlphaFold3的GPCR-配体复合物预测表现能力

Acta Pharmacol Sin|上海药物所评测AlphaFold3的GPCR-配体复合物预测表现能力

作者头像
智药邦
发布于 2024-12-19 12:14:15
发布于 2024-12-19 12:14:15
1300
举报
文章被收录于专栏:智药邦智药邦

2024年12月6日,中国科学院上海药物研究所徐华强团队在Acta Pharmacologica Sinica 发表了文章“AlphaFold3 versus experimental structures: Assessment of the accuracy in ligand-bound G protein-coupled receptors”。

该文章收集了AlphaFold3(AF3)发布后的GPCR-配体复合物实验结构,并从整体结构的准确性、口袋预测能力、复合物预测能力和可变区预测效果方面全面评估了AF3在GPCR-配体复合物方面的表现,评测结果显示AF3的预测和实验结构仍然存在很多差距, 该研究论文为进一步改进蛋白质结构预测工具提出了建议。

AF3于2024年5月发布,基于扩散模型提供了复合物从头建模的解决方案。在过去的半年中,已有多个相关工作复现了AF3的预测性能(如Protenix、chai-1等),并开源代码供学术界使用。然而,AF3的预测表现尚缺乏在真实应用场景中的评估,特别是其新加入的配体预测模块。为此,考虑到GPCR作为重要的药物靶标,其与配体的相互作用是药物开发的重要方向,且具有高度复杂性,结构生物学也在此领域做出了大量工作,本文使用AF3服务器对其配体预测能力进行了评测,包括整体结构准确度、配体定位、口袋形状和受体结构变化。结果显示,尽管AF3有所进步,并可提供一定参考,但鉴于其在口袋和整体预测方面存在的问题,实验结构解析仍然是必要的。本文还对以AF3为代表的一系列结构预测工具的未来发展方向提出了潜在的有价值的建议。

图1 AF3预测结构和实验结构的整体对比

本文为确保对比结果不受训练数据影响,选取了35个在AF3文章投稿后发布的GPCR结构。整体来看,AF3相比前代AF2在结构预测能力上有所提升,所有GPCR受体部分的Cα均方根偏差(RMSD)从1.04±0.24 Å降低至0.93±0.24 Å。加入可预测的配体后,受体的RMSD为1.11±0.46 Å,表明整体预测能力未因配体的加入而受到影响。图1展示了四类GPCR的预测结果。在A、B、F类单体预测中,AF3仅在一些天生可变的区域,如关键激活螺旋TM6,存在和实验结果不一致的预测,因此对激活机制的准确探究可能仍需进一步提升。然而,对于二聚的C类GPCR,AF3能够准确预测单体的部分结构,但在组合两个单体时出现错误,导致了7.70 Å的RMSD,所以在大蛋白复合体的预测方面,AF3还有待提升。

图2 AF3预测结构和实验结构在多肽类配体上的比较

尽管AF3声称能够预测通用小分子配体,但在本文撰写时该功能尚未开放。因此,本文对比评估了其在离子、多肽和蛋白类配体上的预测性能。

在多肽配体部分,配体的最小重原子RMSD也达到了2.24 Å,未达到实验精度(2 Å)。如图2A所示,即便是APJR中的最佳预测结果,也存在配体与口袋残基侧链构象的不一致,口袋在预测结构中有所收缩,并且预测结构中存在一定程度的受体-配体碰撞。在同一受体的非天然配体中,AF3的表现与实验结构的偏差更大。如图2B所示,配体的重原子RMSD高达5.55 Å,主链的摆放方向明显不同,口袋中的疏水相互作用和侧链构象也未能得到相似的重建,同时仍存在受体-配体碰撞现象。

对于MRGX1中较大且平坦的更具挑战性的口袋,配体的重原子RMSD均超过了7 Å。在图2C中,Conorfamide-Tx2复合物的建模结构与实验结构中的配体方向呈垂直关系,RMSD达到7.95 Å。此外,在BAM8-22复合物的建模中,配体被预测为较为稳定的α螺旋结构,而实验解析的结构却为loop。这可能与AF3训练集中较多的α螺旋结构有关,这一现象也对AI模型的泛化能力提出了挑战。

图3 AF3预测结构和实验结构在离子和蛋白类配体上的比较

图3展示了对离子和蛋白类配体的预测结果。在CASR(图3a、b)中,不同数量的钙离子对应不同的预测表现。当配体中包含6个钙离子时,实验结构中的钙离子位于胞外区中部,而预测模型中的钙离子则分布在上端和下端,位置差异较大(20.73 Å)。相比之下,当配体中包含4个钙离子时,实验结构和预测模型中的钙离子位置均位于上端和下端,表现出较高的一致性。这表明离子数量与预测准确度之间存在相关性。

蛋白类配体的预测整体较为准确,配体的重原子RMSD均小于3.5 Å,且配体在摆放位置和整体构象上与实验结构高度相似,体现了AF3在预测蛋白-蛋白相互作用方面能力的提升。

考虑到抗体分子在药物开发中的重要性,本文特别将抗体作为单独模块进行评估,并纳入了重要药物靶标TSHR。如图4a-d所示,失活态的抗原-抗体复合物预测表现不佳。尽管存在抑制剂形式的抗体,AF3仍将TSHR胞外区预测为激活态构象,且抗体的朝向由指向细胞膜转变为与细胞膜平行,说明AF3预测结构可能受到激活态构象的影响。在CCR8的自主研发抑制剂抗体复合物预测中,AF3预测了与实验结构不同的表位和抗体朝向,导致RMSD超过30 Å,未能成功识别抗体和受体的结合。

图4 AF3预测结构和实验结构在GPCR-抗体复合物上的比较

不过,在激活型抗体的预测中,AF3表现良好。例如,TSHR的M22激动型抗体的表位预测准确,整体结构相似,尽管主链存在轻微错位,导致配体的RMSD为3.71 Å,但胞外区(ECD)的放置基本准确(图4e)。商业抗体REGN7663与CXCR4的复合物结构整体RMSD仅为2.25 Å,显示出非常高的预测准确性。本文推测,AF3在预测较新的抗体复合物时,仍需谨慎验证其预测结果。

考虑到GPCR与G蛋白相互作用的重要性,本文基于AF3提供的蛋白复合体建模功能对其进行了评测。整体而言,加入G蛋白后,受体本身的预测结果得到了提升。对于数据库中有大量结构的A类GPCR(图5a),CXCR4与G蛋白三聚体的复合物呈现出正确的建模结构,包括TM6的开启构象、G蛋白三聚体及大部分界面残基。然而,部分界面残基(如F354、K349等)表现出不同的侧链构象,这些细微的构象差异可能会影响基于结构的药物设计。

图5 AF3预测结构和实验结构在GPCR-G蛋白复合体上的比较

在B类GPCR的建模中,尽管GPCR-G蛋白复合物仍然得到了正确建模,但抗体被错误地建模在胞外区,实际结合位置应该位于G蛋白三聚体附近,这反映了AF3在建模抗体结构时的不确定性。此外,G蛋白与受体的界面残基侧链朝向也存在差异。

对于F类GPCR-G蛋白三聚体的建模,尽管GPCR本身的TM6构象正确,但AF3错误地将G蛋白放置在胞外区,这与生物学原理不符。这一错误提示尽管加入G蛋白确实有助于GPCR的建模,蛋白-蛋白相互作用界面的预测仍然不完全可靠。

最后,本文还评估了AF3在关键可变区域的预测表现,如关键激活螺旋TM6和配体识别激活的loop。我们注意到,这些高可变性区域的预测存在一定的不确定性。图6a和6c中的案例表现较好,而图6b、6d和6e中的预测模型与实验结构之间则存在较大的差异。

图6 AF3预测结构和实验结构在高可变性区域上的比较

此外,本文还对不同类型GPCR上AF3的结构预测表现进行了分类评估。A类和F类GPCR的整体预测较为准确,但可变区域的预测不确定性较大;B类GPCR几乎都被预测为激活态构象,这可能与训练数据集的偏差有关;C类GPCR的预测表现参差不齐,缺乏一致性。值得注意的是,AF3在C类GPCR二聚体的建模中经常出现错误的复合体组装问题,这再次强调了在药物设计中实验结构的必要性。

通过对AF3的评测,本文展示了AF3相较于前代AF2的进步,并证明了AF3在缺乏实验先验知识时依然具有一定的模型价值。然而,侧链构象的预测和四级结构的组装依然是其主要挑战。此外,AF3在不同GPCR家族的泛化能力及动态区域的预测能力也需要进一步提高。尽管AF3取得了重要进展,但目前仍不足以支持可靠的药物开发和应用,仍需依赖实验验证和算法的进一步优化,而非完全替代实验结构生物学。

图7展示了一些可能的算法改进方向。例如,引入物理化学原则的编码信息可能有助于减少配体与受体之间的碰撞;对多肽类配体进行原子级建模可能提升其预测能力;此外,类似于ESM3在结构预测中引入功能信息的做法,在AF3中引入生物学原则的信息可能帮助避免G蛋白位置预测的重大失误,基因测序信息以及突变与表型之间的关联信息也可能提供有价值的参考。在这些改进下,AF3的预测有望为序列-结构-功能关系提供更全面的理解,并为药物设计提供更强有力的支持。

图7 可能的提升AF3预测能力的建议

综上所述,AF3的GPCR结构预测能力有所提升,但依然存在一定的能力限制,仍需要进一步实验验证。通过整合实验与计算方法,研究者对重要靶标GPCR的理解会更深刻,也更有利于药物研发。

上海药物所博士研究生何欣恒、助理研究员李俊睿、博士研究生沈诗怡为本文共同第一作者;上海药物所徐华强研究员为本文通讯作者。本研究得到了国家自然科学基金,中国科学院战略性先导科技专项,上海市科技重大专项和临港实验室的基金资助。

全文链接:

https://www.nature.com/articles/s41401-024-01429-y

--------- End ---------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Rafy 框架 - 使用 SqlTree 查询
本文介绍如何使用 Rafy 框架中的 Sql Tree 查询: 除了开发者常用的 Linq 查询,Rafy 框架还提供了 Sql 语法树的方式来进行查询。 这种查询方式下,开发者不需要直接编写真正的 Sql 语句,而是转而使用一套中间 Sql 语法树对象。这隔离了与具体数据库的耦合,使得开发者编写的查询可以跨越多种不同的数据库运行,甚至可以在非关系型数据库中运行。同时,框架还结合托管属性,提供了方便开发者使用的 API,并尽量保持与传统 Sql 相近的语法,使得开发者可以快速理解并编写。 本文包含以下章节:
用户1172223
2018/01/30
2.5K0
Rafy 领域实体框架设计 - 重构 ORM 中的 Sql 生成
前言 Rafy 领域实体框架作为一个使用领域驱动设计作为指导思想的开发框架,必然要处理领域实体到数据库表之间的映射,即包含了 ORM 的功能。由于在 09 年最初设计时,ORM 部分的设计并不是最重要的部分,那里 Rafy 的核心是产品线工程、模型驱动开发、界面生成等。所以当时,我们简单地采用了一个开源的小型 ORM 框架:《Lite ORM Library》。这个 ORM 框架可以生成比较简单的 Sql 语句,以处理一般性的情况。 随着不断使用,我们也不断对 ORM 的源码做了不少改动,让它在支持简单
用户1172223
2018/01/26
2.2K0
LINQ to SQL集成到应用程序中需考虑的一些问题
1、LINQ to SQL集成到应用程序中需考虑的一个问题, 到底应该返回IQueryable<T>还是IQueryable? 或许这个列表还应该继续扩展为T, List<T>, 对于Business
张善友
2018/01/19
1.3K0
MySQL 之索引类型
MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。
小手冰凉
2020/05/09
1.3K0
MySQL 之索引类型
MySQL中的索引详讲
转载自 https://www.cnblogs.com/whgk/p/6179612.html
allsmallpig
2021/02/25
6070
深入浅出查询优化器
提示:公众号展示代码会自动折行,建议横屏阅读 「第一部分 查询优化器框架」 关系型数据库是一个通用系统软件,SQL作为一种结构化查询语言,用户不需要关注怎么做,只需要描述做什么,然后交由SQL引擎来处理。因为关系代数提供的等价性,同一个查询可以用不同的SQL语句描述。为防止用户所写的"不好的"SQL执行慢,这就需要查询优化器快速而准确地选择出一个效率较高的执行计划。 一般的查询优化器基于代价计算模型,包含SQL形态的变换,确定访问路径和多表连接顺序等几个重要的步骤。这些步骤被统一在一个优化器框架之内,相互
腾讯数据库技术
2021/06/02
2K0
《MySQL核心知识》第8章:索引
今天是《MySQL核心知识》专栏的第8章,今天为大家系统的讲讲MySQL中的索引技术,希望通过本章节的学习,小伙伴们能够举一反三,彻底掌握MySQL中的索引技术。好了,开始今天的正题吧。
冰河
2022/09/23
4950
《MySQL核心知识》第8章:索引
如何写优雅的SQL原生语句?
sql各语句执行顺序概览与讲解 项目实战中的一段sql说明讲解 sql语句中别名的使用 书写sql语句的注意事项 前言
coder_koala
2019/07/30
1.9K0
如何写优雅的SQL原生语句?
[转自JeffreyZhao]在LINQ to SQL中使用Translate方法以及修改查询用SQL
目前LINQ to SQL的资料不多——老赵的意思是,目前能找到的资料都难以摆脱“官方用法”的“阴影”。LINQ to SQL最权威的资料自然是MSDN,但是MSDN中的文档说明和实例总是显得“大开大阖”,依旧有清晰的“官方”烙印——这简直是一定的。不过从按照过往的经验,在某些时候如果不按照微软划定的道道来走,可能就会发现别样的风景。老赵在最近的项目中使用了LINQ to SQL作为数据层的基础,在LINQ to SQL开发方面积累了一定经验,也总结出了一些官方文档上并未提及的有用做法,特此和大家分享。
菩提树下的杨过
2018/01/24
5K0
[转自JeffreyZhao]在LINQ to SQL中使用Translate方法以及修改查询用SQL
都快2020年,你还没听说过SvelteJS?
React, Vue和Angular差不多占据了Web开发的大部分江山,可是最近半年Svelte[1]开始逐渐吸引越来越多人的眼球。这个Svelte框架到底有什么过人之处呢?本文将会为大家分析一下Svelte火起来的原因,并且通过使用Svelte去搭建一个简单的书店应用(bookshop)来帮助大家快速入门这门框架。
进击的大葱
2022/08/22
3.2K0
都快2020年,你还没听说过SvelteJS?
R语言重复测量数据的多重比较
使用的数据来自孙振球,徐勇勇《医学统计学》第4版。课本的电子版已上传到QQ群,加群即可免费获取!
医学和生信笔记
2022/11/15
1.1K0
R语言重复测量数据的多重比较
linq to sql中慎用Where<T>(Func<TSource, bool> predicate),小心被Linq给"骗"了!
近日在一个大型Web项目中,采用Linq to Sql替换原来的sqlcommand/sqldatareader方式来获取数据,上线后刚开始一切正常,但是随着访问量的增加,网站明显慢了很多,监测服务器CPU占用率/内存使用情况等性能指标却发现均在正常范围内,无意中在SqlServer Profier中跟踪数据库执行的sql语句时,发现有大量语句直接将整个表的数据全部提取出来了,而非仅返回分页中的当前页数据! 而这些SQL都是Linq自动翻译并最终提交到数据库的,查看了相关的代码,明明写着Skip(n
菩提树下的杨过
2018/01/24
1.1K0
学习正则表达式 - 提取和替换 XML 标签
        使用 lorem.dita 作为示例 XML 文档,通过正则表达式提取出该文档中的所有 XML 标签,并转换为简单的 XSLT 样式表。可以在 Github 中找到 lorem.dita 文件,地址是https://github.com/michaeljamesfitzgerald/Introducing-Regular-Expressions。为了节省篇幅,节选部分文本作为测试数据。
用户1148526
2023/10/14
8470
数据库查询优化技术(二):子查询优化
对应的是限制条件(格式类似“field<op>consant”, field表示列对象,op是操作符如"="、">"等)。
sunonzj
2022/06/21
3.3K0
数据库查询优化技术(二):子查询优化
深入OceanBase分布式数据库:MySQL 模式下的 SQL 基本操作
在当今的大数据时代,数据库技术的选择对于企业的信息化发展至关重要。OceanBase作为一种高性能、高可用的分布式关系数据库,在与MySQL模式的兼容性方面展现出了显著的优势,为企业数据迁移、整合与升级提供了极大的便利。
公众号:码到三十五
2024/05/06
7680
深入OceanBase分布式数据库:MySQL 模式下的 SQL 基本操作
存储过程和触发器
2.举例 (数据表链接: spj库) ①创建存储过程p1,查询所有信息;运行之。
唔仄lo咚锵
2020/09/15
1.2K0
达观数据文辉:Hadoop和Hive使用经验
近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop的数据仓库解决方案Hive早已是Ha
达观数据
2018/03/30
1.5K0
ORM查询语言(OQL)简介--高级篇(续):庐山真貌
相关文章内容索引: ORM查询语言(OQL)简介--概念篇 ORM查询语言(OQL)简介--实例篇 ORM查询语言(OQL)简介--高级篇:脱胎换骨 ORM查询语言(OQL)简介--高级篇(续):庐山真貌    PDF.NET框架的OQL经过“脱胎换骨”般的重构之后,引来了它华丽丽的新篇章,将“对象化的SQL”特征发挥到极致,与至于我在Q群里面说这应该算是OQL的“收山之作”了。然而,我这么说有什么依据?它的设计哲学是什么?它究竟是何样?由于本文篇幅较长,请听本篇慢慢道来,叙说它的庐山真面目! [有图有真相
用户1177503
2018/02/27
2.3K0
ORM查询语言(OQL)简介--高级篇(续):庐山真貌
Linq to Sql中Single写法不当可能引起的数据库查询性能低下
场景:需要从T_User表中返回指字条件的某条记录的某一个字段 在Linq中有二种理论上都行得通的写法,见下面的代码: Code using (dbUserDataContext db = new dbUserDataContext(Website.ConnStrdbUser))             { try {  //Guid _UserId = db.T_User.Single(c=>c.F_ID==new Guid("00000000-0000-0000-0000-000000000001"
菩提树下的杨过
2018/01/23
1.2K0
Hive性能优化统计每日IP CREATE TABLE ip_2014_12_29 AS SELECT COUNT(DISTINCT ip) AS IP FROM logdfs WHERE logda
Hive性能优化 1.概述   继续《那些年使用Hive踩过的坑》一文中的剩余部分,本篇博客赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍。 2.介绍   首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问题。 jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,耗时很长。原因是map reduce作业初始化的时间是比较长的。 sum,
Albert陈凯
2018/04/04
1.7K0
Hive性能优化统计每日IP CREATE TABLE ip_2014_12_29 AS SELECT COUNT(DISTINCT ip) AS IP FROM logdfs WHERE logda
推荐阅读
相关推荐
Rafy 框架 - 使用 SqlTree 查询
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档