前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >榕树集--AF2在抗体复合物结构预测方面的表现

榕树集--AF2在抗体复合物结构预测方面的表现

作者头像
DrugSci
发布2024-01-09 15:24:52
2010
发布2024-01-09 15:24:52
举报
文章被收录于专栏:FindKeyFindKey

简介

今天介绍一些测评类文章,主要看看AF2在抗体预测方面的表现。先来简要回顾一下Alphafold的历程。在2018年的CASP(Critical Assessment of protein Structure Prediction)竞赛中,DeepMind所属的AlphaFold取得了显著的成功,初步展示了AF对蛋白质结构预测的潜力,拿到了60分左右(百分制)。2020年,DeepMind发布了AlphaFold的升级版本——AlphaFold 2。这个版本在同年的CASP14竞赛中取得了突破性的成绩,准确率大幅提升,拿到了90分。2021年,AF2-multimer版本释放,AF2可以用于预测蛋白--蛋白复合物体系。而2023年说释放的AF-latest信息来看,AF已经可以预测蛋白质-小分子-核酸等等组成的复合物系统,但是遗憾的是这一版目前仍未被公开。

Alphafold-Multimer

先来看一下AF-multimer[3]自己的宣传效果。

作者通过使用一组17个异源二聚体蛋白(没有模版)的基准数据集,13个蛋白的预测结果达到了中等准确性(DockQ≥0.49),7个蛋白的预测结果达到了高准确性(DockQ≥0.8)。此外,作者还使用AF-Multimer对4,446个最近的蛋白质复合物进行了预测。而结果显示,对于heteromeric interfaces,成功率为70%(DockQ ≥ 0.23),其中26%的预测结果达到了高准确度(DockQ ≥ 0.8)。对于homomeric interfaces,成功率为72%,其中36%的预测结果达到了高准确度。

先解释一下DockQ[1]:

DockQ基于已有的对接模型质量评估指标:Fnat、LRMS和iRMS,这些指标已经在CAPRI和其他测试中使用。DockQ这些指标结合在一起,使用Fnat的平均值以及经过缩放的两个RMS值来表示。非线性缩放RMS值的好处在于使得DockQ分数的范围在0到1之间,而且不同的RMS值则具有质量依赖性,即质量越高,分数越好。这有助于更公平地评估不同对接模型的性能,无论其具体的RMS值是多少。

DockQ 将蛋白质-蛋白质复合物结构质量分为了四个等级[9]:

  • 0.00 <= DockQ < 0.23 - Incorrect (Fig D,DockQ < 0.1)
  • 0.23 <= DockQ < 0.49 - Acceptable quality(Fid C,DockQ = 0.3)
  • 0.49 <= DockQ < 0.80 - Medium quality(Fig B,DockQ = 0.5)
  • DockQ >= 0.80 - High quality(Fig A,DockQ = 0.8)

依据AF-mulitimer的描述,其预测蛋白复合物的成功率至少在50%以上,即预测结果达到Medium quality的占比。

抗原--抗体

抗体(Immunoglobulin,Ig)是一种由免疫系统产生的蛋白质分子,其主要作用是识别、结合并中和入侵人体的外来病原体(如病菌、病毒等)或异常细胞。抗体的结构是非常复杂的,它通常由四个蛋白质亚单位组成,这些亚单位称为轻链(light chain)和重链(heavy chain),并且分为不同的类别,如IgG、IgM、IgA、IgD和IgE等。

抗体的结构主要包括以下部分:

  1. 可变区(Variable Region):抗体的可变区是抗体--抗原的结合部分,也称为抗原结合部位(paratope)。可变区由轻链和重链组成,具有高度多样性,可以识别不同的抗原,主要由3个CDR区识别。
  2. 恒定区(Constant Region):抗体的恒定区决定了抗体的类型和功能。它包含了一些特定的结构元件,如Fc区域,它可以与免疫系统的其他细胞互动,如巨噬细胞和自然杀伤细胞,以促使免疫反应。
  3. 链(Chains):抗体通常由两个轻链和两个重链组成,这些链相互连接形成Y型的结构。每个链都包括一个可变区和一个恒定区。 ‍

AF2 在抗原--抗体上的表现

随后,有人对AF2进行了具体的测量,在抗原抗体复合物预测领域,根据Brian G. Pierce[6]的文章来看。他构建了一个400多个抗原--抗体复合物的数据集,并在这些数据集上进行了测试,AF2.2的版本成功率为20%,而AF2.3的版本成功率为30%左右。同时其比较了目前比较流行的fold-and-dock策略,即使用AF预测单独的抗原/抗体结构,随后交由ZDOCK进行对接。ZDOCK预测结果Top 1的得分大概达到Medium or higher accuracy只有1%,可谓不忍直视。同时作者也分析了一些影响因素:MSA,Structure template,抗体类型(nanobody),抗原糖基化,复合物整体尺寸等等。简而言之,MSA和Structure template作为AF2的输入项会显著影响结果。复合物尺寸越小,预测效果越好,也就是nanobody效果会好一些。而抗原糖基化也会显著影响AF2的预测效果。对于一些具有能量偏好的界面,AF2也会表现的好一些。

优化

随后出现了一些策略,用于优化AF2在抗原抗体上的表现。Alexandre M.J.J. Bonvin[5] 构建了一套基于HADDOCK,ML tools以及AF2的流程,用于提高预测成功率,并在71个复合物结构上的benchamrk上进行了测试。其所构建的protocol如table 1所示,而其DDP的流程如下:

  1. Rigid body docking phase:在此阶段生成48个模型。与标准HADDOCK采样中生成的模型数量(通常为1000或10000个模型)相比,这是一个非常低的数量。
  2. Flexible refinement step:最消耗CPU资源的步骤,其中界面残基被视为半灵活的(首先是侧链,然后是侧链和骨架一起柔性),以允许一些与结合有关的构象变化。
  3. Final short energy minimisation
  4. Fraction of Common Contacts clustering:将sharing interface contacts至少60%模型聚类在一起。一个类中至少包含3个model。

而在其中ABBE流程表现最好,即使用ABodyBuilder2和AlphaFold2生成的抗原结构模型的集合作为输入,随后遵循DDP流程。但是由于判断标准不同,仅能说明这个流程要比AF2的效果好,但是好多少,存疑。同时可以明显看到的是,抗原/抗体结构越接近binding时候的构象,表现越好。

讨论

AF2在抗原抗体复合物预测结果上效果并不是很好,而传统的对接手段,在这方面的表现只能说聊胜于无。目前兴起的Fold-and-Dock策略,在单一抗体结构和单一抗原结构对接时,并不会起到很好的作用,而ensemble docking可能会表现好一些。但是好多少,尚不明确。同时MSA,Structure template作为输入,肯定会影响输出结果,如何让其影响偏好抗原抗体结构也是个问题。

参考:

  1. Basu, Sankar, and Björn Wallner. "DockQ: a quality measure for protein-protein docking models." PloS one 11.8 (2016): e0161879.
  2. Jumper, John, et al. "Highly accurate protein structure prediction with AlphaFold." Nature 596.7873 (2021): 583-589.
  3. Evans, Richard, et al. "Protein complex prediction with AlphaFold-Multimer." biorxiv (2021): 2021-10.
  4. Yin, Rui, et al. "Benchmarking AlphaFold for protein complex modeling reveals accuracy determinants." Protein Science31.8 (2022): e4379.
  5. Giulini, Marco, et al. "Towards the accurate modelling of antibody-antigen complexes from sequence using machine learning and information-driven docking." bioRxiv (2023): 2023-11.
  6. Yin, Rui, and Brian G. Pierce. "Evaluation of AlphaFold Antibody‐Antigen Modeling with Implications for Improving Predictive Accuracy." Protein Science (2023): e4865.
  7. https://deepmind.google/discover/blog/a-glimpse-of-the-next-generation-of-alphafold/
  8. https://github.com/bjornwallner/DockQ
  9. Chaves, Beatriz, et al. "Guidelines to predict binding poses of antibody–integrin complexes." ACS omega 5.27 (2020): 16379-16385.
  10. Gao, Kaiyuan, et al. "Incorporating Pre-training Paradigm for Antibody Sequence-Structure Co-design." bioRxiv (2022): 2022-11.
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugSci 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简介
  • Alphafold-Multimer
  • 抗原--抗体
  • AF2 在抗原--抗体上的表现
  • 优化
  • 讨论
  • 参考:
相关产品与服务
腾讯云服务器利旧
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档