首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat. Methods | Baker团队发布RFdiffusion2: 引领原子级酶活性口袋的重构与设计

Nat. Methods | Baker团队发布RFdiffusion2: 引领原子级酶活性口袋的重构与设计

作者头像
DrugOne
发布2025-12-17 16:42:23
发布2025-12-17 16:42:23
480
举报
文章被收录于专栏:DrugOneDrugOne

DRUGONE

设计全新的酶通常从理想化的催化基团布局开始,然后再寻找能够精准固定这些基团的蛋白结构。以往的 AI 方法虽然能设计出活性酶,却依赖预定义的残基位置,并通过反向构建侧链来生成主链,限制了设计自由度。RFdiffusion2 作为一种新的深度生成模型,突破了这些限制,使研究人员能够仅基于功能基团原子坐标进行酶设计,无需规定残基顺序或进行逆向 rotamer 枚举。

在一个包含 41 个活性位点的新基准测试中,RFdiffusion2 对全部案例成功生成支架,而上一代方法仅成功 16 个。研究人员进一步使用 RFdiffusion2 为三种不同反应机理设计酶,并在每种情况下实验验证少于 96 个序列即能得到具有催化活性的酶。结果显示,基于原子级别的生成模型能够直接从反应机理出发创造全新的酶。

在结构全新的酶设计中,一个关键挑战是构建能够容纳理想化反应位点(theozyme)的蛋白支架。theozyme 通常由量化化学、结构分析或化学经验获得,描述反应过渡态周围关键催化基团的位置。然而,如果要求输入为主链级别的连续残基(含已知序列索引),那么复杂活性位点就难以被准确表达。

早期的基于库搜索或 backbone motif scaffolding 的方法只能处理较为简单的连续残基片段,且在处理未知索引、多残基岛(residue islands)、部分配体结构、金属离子构象时表现有限。基于扩散模型的 RFdiffusion 曾突破了对支架库的依赖,但仍然无法直接处理“无序列索引的原子级催化基团组”。

因此,研究人员提出 RFdiffusion2,能够直接条件化在单个原子、部分侧链、未知索引残基以及部分配体结构上,为原子级活性位点构建蛋白支架提供全新能力。

图1:RFdiffusion2 概览

方法

RFdiffusion2 基于 RoseTTAFold All-Atom 的架构,通过流匹配(flow matching)进行训练,实现稳定且高效的生成。训练时,研究人员随机选择残基进行“原子化”处理,仅提供部分重原子作为 motif,并随机移除其序列索引,使模型学习如何在无索引信息的条件下将这些原子嵌入新蛋白结构中。同时,模型可接受配体部分原子、原子级溶剂可及性标签(RASA)、以及用于控制整体结构排列的 ORI token。最终,RFdiffusion2 可同时推断 rotamer、序列索引与其整体支架结构,实现真正原子级别的 motif scaffolding。

图2:原子级 motif、无索引 motif、RASA、ORI 及部分配体条件化能力

结果

AME 基准测试

研究人员构建了包含 41 个来自多类酶反应的原子级活性位点的新 benchmark,覆盖 EC1–EC5 五大类型。每个催化残基仅输入部分原子坐标,构成高度碎片化的 motif。

RFdiffusion2 可在 41/41 个案例中找到至少一个符合几何约束的支架;而上一代 RFdiffusion 仅能完成 16/41。

此外,RFdiffusion2 生成的蛋白通常与 PDB 中最相近的结构相似度低(TM-score 约 0.5–0.6),显示其具备创造高度新颖结构的能力。

图3:41 个 AME 基准测试的成功率及结构新颖性分析

Rotamer 与序列索引的自动推断

研究人员评估模型在 3–6 个残基岛案例中的表现,发现:

  • RFdiffusion2 自动推断 rotamer + 自动推断序列索引 → 取得最高成功率;
  • 使用本底结构中的真实 rotamer/索引反而次优;
  • 随机枚举(上一代方法)表现最差。

说明深度模型能高效探索超大组合空间,而无需人为枚举。

实验验证:从 5 种化学反应中设计活性酶

研究人员选择了五类反应(retro-aldolase、cysteine hydrolase、三类 zinc hydrolase),其中三类完全基于 DFT 计算生成过渡态几何,不依赖天然酶模板。

(1) Retro-aldolase(逆醛缩)

  • 输入:来自已进化酶体系的最简化原子级 theozymes
  • 测试 96 个设计 → 4 个检测到活性
  • 最佳设计的 kcat/KM 达 6.34 M⁻¹ s⁻¹

(2) Cysteine hydrolase(半胱氨酸水解酶)

  • 输入:Cys–His–Asn 三元催化体系 + 氧阴离子空穴几何
  • 48 个设计中获得具有多轮催化能力的酶
  • 最佳设计 kcat/KM ≈ 250 M⁻¹ s⁻¹

(3) Zinc hydrolases(Zn²⁺ Lewis 酸催化)

研究人员基于 DFT 生成 Zn²⁺ 协调的理想过渡态几何并输入:

  • 4MU-butyrate → 最佳 77 M⁻¹ s⁻¹
  • 4MU-phenylacetate → 最佳 16,000 M⁻¹ s⁻¹
  • 进一步加入一般碱(Glu)后 → 最佳 53,000 M⁻¹ s⁻¹

这些活性比此前设计的人工金属酶高数个数量级。

图4:五种反应体系中的酶设计与实验活性展示

讨论

RFdiffusion2 实现了真正意义上的“原子级酶活性位点支架设计”,不再需预定义残基索引或枚举 rotamer。它在 AME 基准测试上全方位超越现有方法,并在五类实际反应中成功设计出具有催化活性的酶。

然而,与天然酶相比,设计酶的活性仍存在提升空间,可能原因包括:

  • 当前输入的 theozymes 仍不足以完全描述所有有利相互作用;
  • 模型可能能在更丰富的几何约束下找到更高活性的构象;
  • 结合序列–侧链联合优化、下一代架构(例如扩散 Transformer),可进一步提升性能。

RFdiffusion2 为广泛的原子级蛋白设计任务(小分子结合位点、酶工程)提供了平台,并有望推动更大规模、自动化的酶催化机理探索。

整理 | DrugOne团队

参考资料

Ahern, W., Yim, J., Tischer, D. et al. Atom-level enzyme active site scaffolding using RFdiffusion2. Nat Methods (2025).

https://doi.org/10.1038/s41592-025-02975-x

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-12-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档