首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat. Microbiol. | 山东大学团队利用生成式人工智能发现多重耐药菌“克星”抗菌肽

Nat. Microbiol. | 山东大学团队利用生成式人工智能发现多重耐药菌“克星”抗菌肽

作者头像
DrugOne
发布2025-10-14 16:53:20
发布2025-10-14 16:53:20
3680
举报
文章被收录于专栏:DrugOneDrugOne

DRUGONE

为应对不断加剧的抗生素耐药危机,研究人员开发了一种基于生成式人工智能的大规模抗菌肽(AMPs)发现策略。AMPs 具有广谱活性、快速杀菌机制以及较低的耐药风险,是传统抗生素的有前景替代物。本研究构建了一个名为 ProteoGPT 的蛋白质大语言模型(LLM),并通过迁移学习发展出多个子模型(AMPSorter、BioToxiPept、AMPGenix),形成一个串联的智能筛选流程,实现了对上亿肽序列的高通量筛选与生成。所挖掘和生成的 AMPs 在临床来源的碳青霉烯耐药鲍曼不动杆菌(CRAB)和耐甲氧西林金黄色葡萄球菌(MRSA)中表现出低耐药风险;在小鼠感染模型中,治疗效果与临床抗生素相当甚至更优,且无器官损伤或肠道菌群紊乱。机制研究显示,这些 AMPs 通过破坏细胞质膜并引发膜去极化实现杀菌。本研究展示了一种生成式人工智能驱动的抗菌肽发现框架,为多重耐药菌治疗提供了新方向。

世界卫生组织已将多重耐药细菌列入紧急威胁名单,其中碳青霉烯耐药鲍曼不动杆菌(CRAB)居首。碳青霉烯类抗生素是“最后防线”,但极易失效。相比传统药物,抗菌肽具有较低的耐药发生速率,因此被视为理想替代方案。

大语言模型(LLMs)作为自然语言理解的重要突破,凭借庞大的参数和Transformer架构,正在重塑科学研究。然而通用 LLM 对科学数据(如蛋白质、基因、分子)理解有限,因此需要开发面向科学领域的专用模型。研究人员据此构建了一个专为蛋白序列空间设计的 LLM —— ProteoGPT,并通过迁移学习扩展其功能,以实现高通量的抗菌肽挖掘与生成。

方法

研究人员构建了一个含 1.24 亿参数 的蛋白语言模型 ProteoGPT,以 UniProtKB/Swiss-Prot 数据库的 60 万余条高质量蛋白序列为训练基础。随后通过迁移学习建立三个子模型:

  • AMPSorter:用于区分抗菌肽与非抗菌肽;
  • BioToxiPept:用于预测肽的细胞毒性;
  • AMPGenix:用于生成潜在抗菌肽序列。

这三者组成了一个自动化管线 SPEL (Sequential Pipeline Ensembled by LLMs),集成数据挖掘与生成式设计两种策略,并结合湿实验验证以评估候选肽的抗菌活性和安全性。

结果

ProteoGPT 的构建与迁移学习

ProteoGPT 在自监督任务上预训练后,表现出良好的泛化性。其基于高质量 Swiss-Prot 数据构建,与依赖未筛选数据的模型相比,具备更高的生物学合理性。迁移学习后:

  • AMPSorter 在基准测试中取得 AUC = 0.97,显著优于其他 AMP 分类模型;
  • BioToxiPept 对毒性肽识别准确率达 92%;
  • AMPGenix 可生成具有高多样性与高活性的短肽,生成结果更接近真实抗菌肽分布。

高通量抗菌肽挖掘与生成

利用滑动窗口技术,研究人员从 60 万条蛋白序列中提取出 4.1 亿条短肽(8–30 个氨基酸),通过 AMPSorter 与 BioToxiPept 筛选得到 1.21 亿条候选抗菌肽(m_AMPs),其中 8,000 万条被评为无毒肽。

同时,AMPGenix 生成了约 7,798 条全新肽序列(g_AMPs),其中约 76% 被预测为抗菌肽。

在初步实验中,生成的 PT 系列肽 中有 18/20 展现抑菌活性,其中 6 条(PT-1, 4, 12, 15, 18, 20)对多种细菌及真菌表现出广谱效应,最低 MIC 达 1 μg/mL。

体外抗菌与毒性实验

通过抑菌圈、MIC 和细胞毒性测试,共评估了 154 条 m_AMPs 与 42 条 g_AMPs:

  • 约 76% m_AMPs 与 62% g_AMPs 显示抑菌效应;
  • 20 条肽经验证具备强抑菌且低毒性,其中 g_AMP41 与 m_AMP76 对 MRSA 与 CRAB 均表现显著。
  • 7 条代表性肽被选入后续动物实验。

小鼠感染模型验证

在 CRAB 与 MRSA 大腿感染模型中:

  • 五种 AMP(g_AMP14、g_AMP33、g_AMP42、m_AMP46、m_AMP76)使细菌数量减少约 70%;
  • 其中 g_AMP42 与 m_AMP76 的杀菌率分别为 83% 与 87%,与临床药物相当;
  • 这些肽未引起明显器官损伤或肠道菌群紊乱。

耐药实验表明,AMPs 经过 20 代传代后 MIC 变化不显著,而对照抗生素(如多黏菌素B、万古霉素)耐药性显著上升。

作用机制解析

扫描电镜与荧光探针分析显示:

  • AMPs 可导致细胞膜皱缩、破裂,增强 PI 荧光信号,表明膜通透性增加;
  • DiSC3-(5) 检测发现 AMPs 可快速诱导膜去极化;
  • 转录组分析揭示 AMP(m_AMP76,命名为 Arkwillin)显著下调膜相关蛋白基因 slyB、bamD、pagP 等,抑制脂多糖合成与生物膜形成,提升膜通透性。

讨论

本研究提出了一个统一的生成式人工智能框架,能够同时执行抗菌肽的挖掘与生成,显著提升新型抗菌分子的发现效率。

ProteoGPT 及其子模型的优势在于:

  • 融合通用 LLM 的语言理解与蛋白序列知识迁移;
  • 具备可扩展性,可适用于其他生物活性肽领域;
  • 通过实验验证证明生成肽的高效与低毒性。

生成模型(AMPGenix)所产生的 g_AMPs 在活性和多样性上普遍优于数据挖掘获得的 m_AMPs,说明生成式学习能捕获更丰富的抗菌结构模式。

未来,研究人员计划进一步引入量化预测模块,以克服当前 QSAR 偏向带电肽的局限,实现更全面的 AMP 活性预测。

整理 | DrugOne团队

参考资料

Wang, Y., Zhao, L., Li, Z. et al. A generative artificial intelligence approach for the discovery of antimicrobial peptides against multidrug-resistant bacteria. Nat Microbiol (2025).

https://doi.org/10.1038/s41564-025-02114-4

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档