Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >[Nature computational science | 论文简读] 基于深度学习和自一致性的无旋转蛋白质序列设计

[Nature computational science | 论文简读] 基于深度学习和自一致性的无旋转蛋白质序列设计

作者头像
智能生信
发布于 2022-12-29 09:18:06
发布于 2022-12-29 09:18:06
3160
举报
文章被收录于专栏:智能生信智能生信

简读分享 | 王汝恒 编辑 | 李仲深

论文题目

Rotamer-free protein sequence design based on deep learning and self-consistency

论文摘要

以前提出的几种设计氨基酸序列的深度学习方法可以自动折叠到给定的蛋白质骨架中,在测试中取得了很好的结果,但在湿实验中没有优于传统的基于能量函数的方法。在此,作者提出了ABACUS-R方法,该方法使用多任务学习策略训练的编码器-解码器网络,从三维局部环境预测中心残留物的侧链类型,其中除了其他特征外,还包括周围侧链的类型,但不包括其构象。这消除了重建和优化侧链结构的需要,并大大简化了序列设计过程。因此,迭代地将编码器-解码器应用于不同的中心残差,能够为目标主干生成自一致的整体序列。湿实验结果(包括X射线晶体学求解的五个结构)表明,ABACUS-R在成功率和设计精度方面优于最先进的基于能量函数的方法。

论文链接

https://www.nature.com/articles/s43588-022-00273-6

代码链接

https://doi.org/10.24433/CO.3351944.v1

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-11-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Science | ProteinMPNN : 基于深度学习的蛋白序列设计
本文介绍华盛顿大学的蛋白质设计科学家D. Baker在2022年9月15发表在Science研究工作Robust deep learning–based protein sequence design using ProteinMPNN。研究团队开发了一种基于深度学习的蛋白质序列设计方法 ProteinMPNN,它在计算机和实验测试中均具有出色的性能。天然蛋白质骨架上,ProteinMPNN 的序列恢复率为 52.4%,而 Rosetta 为 32.9%。不同位置的氨基酸序列可以在单链或多链之间偶联,从而能够应用于当前广泛的蛋白质设计任务。研究团队使用 X-ray晶体学、cryoEM 和功能研究通过挽救以前失败的蛋白质单体设计(使用 Rosetta 或 AlphaFold设计的蛋白质单体、环状同源寡聚体、四面体纳米颗粒和靶结合蛋白)证明了 ProteinMPNN 的广泛实用性和高精度,
DrugAI
2022/11/28
2.4K0
Science | ProteinMPNN : 基于深度学习的蛋白序列设计
Nature | 刘海燕/陈泉:蛋白质从头设计的神经网络能量函数
蛋白质是生命的基础,是生命功能的主要执行者,其结构与功能由氨基酸序列所决定。目前,能够形成稳定三维结构的蛋白质,几乎全部是天然蛋白质,其氨基酸序列是长期自然进化形成。在天然蛋白结构功能不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需要对其结构和序列进行设计。目前,国际上已报道的蛋白质结构从头设计工作使用天然结构片段作为构建模块来拼接产生新结构。这种方法显著限制了人工设计蛋白的结构多样性和可变性。对蛋白质从头设计中最困难的问题,即如何充分地探索蛋白质主链结构空间,从头发现新颖的、“高可设计性”主链结构,还缺乏系统性的方法。
智药邦
2022/03/04
8060
Nature | 刘海燕/陈泉:蛋白质从头设计的神经网络能量函数
Nat. Methods | Baker团队用LigandMPNN玩转原子级蛋白质设计
在小分子、核苷酸和金属离子等配体的环境下进行蛋白质序列设计,对于酶、配体结合蛋白及生物传感器的开发至关重要。然而,现有基于深度学习的方法难以有效建模非蛋白组分。研究人员提出了一种新方法——LigandMPNN,可显式建模生物分子体系中的所有非蛋白组分。在与小分子(63.3% vs. 50.4%/50.5%)、核苷酸(50.5% vs. 35.2%/34.0%)和金属离子(77.5% vs. 36.0%/40.6%)相互作用残基的原序列恢复任务中,LigandMPNN显著优于Rosetta与ProteinMPNN。该方法不仅生成序列,还预测侧链构象,从而实现对结合相互作用的精细评估。研究人员已利用LigandMPNN设计出100余种经实验证实具有高亲和力和高结构准确性的结合蛋白,其中包括4个X射线晶体结构。此外,该方法可显著提升已有设计的结合能力,亲和力提升最高达100倍。LigandMPNN有望广泛应用于新型结合蛋白、传感器和酶的设计中。
DrugAI
2025/03/31
1550
Nat. Methods | Baker团队用LigandMPNN玩转原子级蛋白质设计
Nat.Commun | 具有学习潜力的蛋白质序列设计
本文给大家介绍的是斯坦福大学生物工程系的Namrata Anand发表在nature communications上的文章《Protein sequence design with a learned potential》,在这篇文章中,作者团队提出了一个深度神经网络模型,该模型可以针对蛋白质骨架设计序列,它可以直接从晶体结构数据中学习,不需要任何人类指定的先验知识。该模型可以泛化到训练期间未见过的拓扑,从而产生实验上稳定的设计。通过对TIM-barrel的通用性的评估,作者团队的发现证明了一种完全学习的蛋白质序列设计方法的可操作性。作者团队探索了一种方法,其中神经网络不仅用于设计序列,而且可以明确构建旋转异构体并评估全原子结构模型,这是迄今为止尚未报道的方法。
DrugAI
2022/03/25
3890
Nat.Commun | 具有学习潜力的蛋白质序列设计
韩国版AlphaFold?深度学习模型AlphaPPIMd:用于蛋白质-蛋白质复合物构象集合探索
延世大学王建民博士及其合作者通过将深度学习与生成式人工智能相结合,构建 AlphaPPIMd 模型,通过分子动力学模拟揭示出蛋白质相互作用的奥秘。
HyperAI超神经
2024/06/17
1270
韩国版AlphaFold?深度学习模型AlphaPPIMd:用于蛋白质-蛋白质复合物构象集合探索
蛋白设计中的深度学习方法
今天为大家介绍的是来自耶鲁大学Gregory W.Kyro团队的一篇论文。深度学习已经改变了蛋白质设计领域,实现了精确的结构预测、序列优化和从头开始的蛋白质生成。通过AlphaFold2、RoseTTAFold、ESMFold等在单链蛋白质结构预测方面的进展已经达到接近实验精度的水平,这启发了后续工作通过AlphaFold Multimer、RoseTTAFold All-Atom、AlphaFold 3、Chai-1、Boltz-1等扩展到生物分子复合物。生成模型如ProtGPT2、ProteinMPNN和RFdiffusion已经突破了基于自然进化的限制,实现了序列和主链设计。最近,包括ESM3在内的序列-结构联合共同设计模型,将这两种模式整合到统一框架中,从而提高了可设计性。尽管取得了这些进展,但在建模序列-结构-功能关系以及确保训练数据所涵盖的蛋白质空间区域之外的稳健泛化方面仍然存在挑战。未来的进展可能会集中在序列-结构-功能共同设计框架上,这些框架能够比独立处理这些模式的模型更有效地建模适应度景观。目前的能力,加上令人眩晕的进步速度,表明该领域即将实现快速、合理地设计具有定制结构和功能的蛋白质,超越自然进化所施加的限制。
DrugAI
2025/04/15
1080
蛋白设计中的深度学习方法
Comput Struct Biotech | 深度学习用于蛋白质设计:从结构到序列与功能
2022年11月19日,西班牙赫罗纳大学的Noelia Ferruz等人[1]在Computational and Structural Biotechnology Journal上发表综述From sequence to function through structure: Deep learning for protein design。
智药邦
2023/02/28
1.1K0
Comput Struct Biotech | 深度学习用于蛋白质设计:从结构到序列与功能
PNAS | 一种用于蛋白质侧链装配和逆向折叠的端到端深度学习方法
今天为大家介绍的是来自Jinbo Xu研究团队的一篇关于蛋白质结构预测的论文。蛋白质侧链装配(Protein side-chain packing,PSCP)是指在只给定主链原子位置的情况下确定氨基酸侧链构象的任务,对蛋白质结构预测、精化和设计具有重要应用。了解决这个问题,作者提出了AttnPacker,一种用于直接预测蛋白质侧链坐标的深度学习(DL)方法。与现有方法不同,AttnPacker直接利用主链的三维几何信息,同时计算所有侧链的坐标,而无需借助离散的构象库或进行昂贵的构象搜索和采样步骤。这大大提高了计算效率,相比基于DL的方法DLPacker和基于物理的RosettaPacker,推理时间减少了超过100倍。
DrugAI
2023/09/19
2850
PNAS | 一种用于蛋白质侧链装配和逆向折叠的端到端深度学习方法
​[Nature Communications | 论文简读] ProtGPT2是一个用于蛋白质设计的深度无监督的语言模型
ProtGPT2 is a deep unsupervised language model for protein design
智能生信
2022/12/29
7540
​[Nature Communications | 论文简读] ProtGPT2是一个用于蛋白质设计的深度无监督的语言模型
后AlphaFold时代,AI如何持续赋能蛋白质计算?
2018年12月,DeepMind 推出的 AlphaFold 根据基因序列成功预测蛋白质结构,成为 AI 技术驱动和加速科学发现的重要里程碑,引起业内广泛关注。2020年12月,DeepMind推出升级版本 AlphaFold 2,破解了蛋白质分子折叠问题,并宣称「它将改变一切」。2021年7月,DeepMind 宣布开源 AlphaFold 2 模型代码,并与 EMBL-EBI 合作开放 AlphaFold 蛋白结构数据库。 可以说,AlphaFold 与 AlphaFold 2 的相继推出拉开了人工
机器之心
2022/06/07
7910
后AlphaFold时代,AI如何持续赋能蛋白质计算?
[Nature Computational Science 2021]好文简读:基于深度图神经网络的快速有效蛋白质模型
Fast and effective protein model refinement using deep graph neural networks 论文摘要:
智能生信
2021/11/02
5340
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
2024 年的诺贝尔化学奖颁发给了在结构生物学领域取得重大成就的 David Baker 团队和 AlphaFold 团队,激发了 AI for science 领域新的研究热潮。
机器之心
2025/02/14
950
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
Nat Methods|ScanNet:基于结构的蛋白质结合位点预测深度学习模型
2022年5月30日,以色列特拉维夫大学Blavatnik计算机科学学院的Haim J. Wolfson等人在Nat Methods杂志发表文章,提出了一种可解释的深度学习模型,该模型直接从原始数据中学习具有功能的结构基序 (motifs),从而可以将蛋白质结合位点和抗体表位准确地映射到蛋白质结构上。
智药邦
2022/06/08
4.6K0
Nat Methods|ScanNet:基于结构的蛋白质结合位点预测深度学习模型
Curr Opin Struc Biol|蛋白质设计的深度生成建模
2021年12月25日,来自加拿大多伦多大学的Alexey Strokach和Philip M. Kim在Curr Opin Struc Biol合作发表综述“蛋白质设计的深度生成建模”。
智药邦
2022/03/04
5990
Curr Opin Struc Biol|蛋白质设计的深度生成建模
InstructPLM: 对齐蛋白质语言模型以遵循蛋白结构指令
今天为大家介绍的是来自之江实验室、浙江大学、南京师范大学、香港中文大学、清华大学、阿里巴巴团队的一篇论文。大型语言模型以其在捕捉复杂模式(包括共同进化关系和潜在的蛋白质语言)方面的有效性而著称。然而,当前的方法通常难以展示基因组插入、复制和插入/缺失(indels)的出现,而这些因素占人类致病性突变的约14%。鉴于结构决定功能,结构相似的突变蛋白更有可能在生物进化中保存下来。受此启发,作者利用受大型语言模型启发的跨模态对齐(cross-modality alignment)和指令微调(instruct fine-tuning)技术,将生成式蛋白质语言模型与蛋白质结构指令对齐。具体而言,我们提出了一种生成可变长度和多样化蛋白质的方法,以探索和模拟生命的复杂进化,从而扩大蛋白质工程的选择范围。作者提出的基于蛋白质语言模型的方法InstructPLM在计算机模拟和实验中都表现出显著的性能提升。在天然蛋白质主链上,它实现了2.68的困惑度(perplexity)和57.51的序列恢复率(sequence recovery rate),分别比ProteinMPNN高39.2%和25.1%。此外,作者通过重新设计PETase和L-MDH验证了模型的有效性。对于PETase,所有设计的15个可变长度的PETase都表现出解聚活性,其中11个超过了野生型的活性水平。对于L-MDH,一种缺乏实验确定结构的酶,InstructPLM能够设计出具有AF2预测结构的功能性酶。InstructPLM的代码和模型权重都公开在https://github.com/Eikor/InstructPLM。
DrugAI
2024/06/04
2430
InstructPLM: 对齐蛋白质语言模型以遵循蛋白结构指令
[Nature Biotechnology | 论文简读] 使用语言模型和深度学习进行单序列蛋白质结构预测
Single-sequence protein structure prediction using a language model and deep learning
智能生信
2022/12/29
4650
[Nature Biotechnology | 论文简读] 使用语言模型和深度学习进行单序列蛋白质结构预测
全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题
蛋白质结构和功能的形成,很大程度上取决于侧链原子间的相互作用,因此,精准的蛋白质侧链预测(PSCP)是解决蛋白质结构预测和蛋白质设计难题的关键一环。但此前蛋白质结构预测大多聚焦于主链结构,侧链结构预测始终是一个未被完全解决的难题。
机器之心
2023/08/04
2880
全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题
Nat. Biotechnol. | 通过全新设计的蛋白质激发功能
今天为大家介绍的是来自Po-Ssu Huang团队的一篇论文。蛋白质中的信息流是从序列到结构再到功能,每一步都是由前一步驱动的。蛋白质设计的基础是反转这一过程:指定一个期望的功能,设计执行这个功能的结构,并找到一个能够折叠成这个结构的序列。这个“中心法则”几乎是所有全新蛋白质设计工作的基础。我们完成这些任务的能力依赖于我们对蛋白质折叠和功能的理解,以及我们将这种理解捕捉到计算方法中的能力。近年来,深度学习衍生的方法在高效和准确的结构建模和成功设计的丰富化方面使我们能够超越蛋白质结构的设计,向功能蛋白质的设计前进。
DrugAI
2024/04/12
1230
Nat. Biotechnol. | 通过全新设计的蛋白质激发功能
J. Chem. Theory Comput. | 基于Transformer的生成模型探索蛋白质-蛋白质复合物的构象系综
蛋白质-蛋白质相互作用(PPIs)是许多蛋白质功能的基础,了解蛋白质-蛋白质相互作用的接触和构象变化对于将蛋白质结构与生物功能联系起来至关重要。虽然难以通过实验检测,但分子动力学(MD)模拟被广泛用于研究蛋白质-蛋白质复合物的构象组合和动力学,但在采样效率和计算成本方面存在很大的局限性。近日发表在Journal of Chemical Theory and Computation的论文,“Exploring the conformational ensembles of protein-protein complex with transformer-based generative model”,根据分子动力学模拟获得的蛋白质-蛋白质复合物构象系综训练了一个基于Transformer的生成神经网络,以直接生成具有物理真实性的新蛋白质-蛋白质复合物构象。研究人员展示了如何使用基于Transformer架构的深度学习模型,通过 MD 模拟探索蛋白质-蛋白质复合物的构象系综。结果表明,学习到的潜在空间可用于生成蛋白质-蛋白质复合物的未采样构象,以获得补充原有构象的新构象,可作为分析和增强蛋白质-蛋白质复合物构象的探索工具。
DrugAI
2024/06/04
3610
J. Chem. Theory Comput. | 基于Transformer的生成模型探索蛋白质-蛋白质复合物的构象系综
[NMI | 论文简读] 基于语言模型的可控蛋白质设计
Controllable protein design with language models
智能生信
2022/12/29
2960
[NMI | 论文简读] 基于语言模型的可控蛋白质设计
推荐阅读
Science | ProteinMPNN : 基于深度学习的蛋白序列设计
2.4K0
Nature | 刘海燕/陈泉:蛋白质从头设计的神经网络能量函数
8060
Nat. Methods | Baker团队用LigandMPNN玩转原子级蛋白质设计
1550
Nat.Commun | 具有学习潜力的蛋白质序列设计
3890
韩国版AlphaFold?深度学习模型AlphaPPIMd:用于蛋白质-蛋白质复合物构象集合探索
1270
蛋白设计中的深度学习方法
1080
Comput Struct Biotech | 深度学习用于蛋白质设计:从结构到序列与功能
1.1K0
PNAS | 一种用于蛋白质侧链装配和逆向折叠的端到端深度学习方法
2850
​[Nature Communications | 论文简读] ProtGPT2是一个用于蛋白质设计的深度无监督的语言模型
7540
后AlphaFold时代,AI如何持续赋能蛋白质计算?
7910
[Nature Computational Science 2021]好文简读:基于深度图神经网络的快速有效蛋白质模型
5340
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
950
Nat Methods|ScanNet:基于结构的蛋白质结合位点预测深度学习模型
4.6K0
Curr Opin Struc Biol|蛋白质设计的深度生成建模
5990
InstructPLM: 对齐蛋白质语言模型以遵循蛋白结构指令
2430
[Nature Biotechnology | 论文简读] 使用语言模型和深度学习进行单序列蛋白质结构预测
4650
全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题
2880
Nat. Biotechnol. | 通过全新设计的蛋白质激发功能
1230
J. Chem. Theory Comput. | 基于Transformer的生成模型探索蛋白质-蛋白质复合物的构象系综
3610
[NMI | 论文简读] 基于语言模型的可控蛋白质设计
2960
相关推荐
Science | ProteinMPNN : 基于深度学习的蛋白序列设计
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档