Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ProDMM:跨模态Transformer模型实现蛋白质与DNA互作预测与生成

ProDMM:跨模态Transformer模型实现蛋白质与DNA互作预测与生成

作者头像
实验盒
发布于 2025-03-04 13:14:49
发布于 2025-03-04 13:14:49
2450
举报
文章被收录于专栏:实验盒实验盒

蛋白质与非编码DNA(NCDS)的相互作用是调控基因表达和代谢通路的关键,但其复杂性长期制约着高效生物工程的发展。传统方法依赖实验试错,耗时耗力;而现有深度学习模型大多聚焦单一分子类型(如仅蛋白质或仅DNA),难以捕捉跨模态的协同效应。

近期,上海交通大学与上海人工智能实验室联合团队在《bioRxiv》预印本平台提出ProDMM(Protein-DNA Multi-Modality Language Model),通过统一的多模态序列建模,实现了蛋白质、编码DNA(CDS)与非编码DNA的联合分析与生成,为这一难题提供了全新解决方案。

核心架构

多模态预训练如何实现跨分子协同建模?ProDMM的核心创新在于其多模态Transformer架构

  1. 编码器(ProDMM-Encoder):基于BERT式双向注意力机制,通过掩码语言建模(MLM)预训练,学习蛋白质、CDS及上下游NCDS的联合表征。预训练数据包含1.29亿对序列,覆盖不同物种的基因组信息。
  2. 解码器(ProDMM-Seq2Seq):在编码器基础上增加自回归解码器,支持跨模态生成任务(如根据蛋白质生成CDS,或基于CDS设计启动子)。

研究团队特别设计了四种序列输入格式(如NCDS-CDS-NCDS、NCDS-Protein-NCDS),通过15%的随机掩码策略,迫使模型学习序列间的依赖关系。可视化分析显示,ProDMM能自动聚类具有相似理化性质的氨基酸,并精准映射密码子与氨基酸的对应关系。

零样本预测与生成任务性能

ProDMM在多项基准测试中表现卓越:

1. 零样本预测能力

  • 基因表达预测:CDS序列的困惑度(Perplexity)与实验测得的蛋白表达水平显著相关(平均Spearman r=0.8,p<1e-5),优于Evo、DNABERT2等模型。
  • 突变适应性预测:在E.coli蛋白质突变体适应性预测中,ProDMM使用蛋白质或CDS作为输入均超越ESM、ProtTrans等基线模型。
  • 代谢通路预测:通过整合多个NCDS-Protein复合序列,ProDMM无需标注数据即可预测萘草酮(naringenin)等代谢产物的产量,为通路优化提供全新工具。

2. 生成任务的突破

  • 反向翻译(Protein→CDS):在生成高表达CDS的任务中,ProDMM的准确率显著高于传统n-gram模型及Prot-CDS Transducer,且能跨物种泛化(如从大肠杆菌迁移至人类基因)。
  • 启动子-CDS协同设计:基于CDS生成的启动子与天然启动子相比,显著提升基因表达预测水平,并精准复现关键调控元件(如TATAAT框)。

应用潜力

ProDMM的突破不仅体现在技术层面,更拓展了合成生物学的应用场景:

  • 蛋白质工程:通过CDS输入的监督学习,ProDMM在蛋白熔点、溶解度预测等任务中表现更优,为理性设计提供可靠工具。
  • 代谢通路优化:预训练模型通过微调学习相邻蛋白-NCDS的局部交互,可预测长程代谢网络的全局行为,减少实验试错成本。
  • 基因表达调控:启动子与CDS的协同生成证明,跨模态条件设计能显著提升目标产物的表达效率,为工业酶或药物蛋白生产提供新思路。

挑战与展望

尽管ProDMM已展现强大能力,其局限性仍需关注:

  1. 长程交互建模不足:当前预训练主要聚焦局部序列关系,对跨多个基因的全局代谢网络预测仍有提升空间。
  2. 真核生物适应性:模型预训练数据以原核基因组为主,需进一步扩展至真核系统以增强普适性。

未来,结合更复杂的图神经网络或引入物理化学先验知识,可能进一步提升模型对生物系统的理解深度。

参考文献

Li, M. et al. (2025). bioRxiv preprint. doi: https://doi.org/10.1101/2025.02.26.640480

本文为实验盒作者对论文的学术分析、阐释及个人观点的呈现。原论文的版权归属于原作者,并遵循其版权协议。本文的解读内容由实验盒作者独立撰写,未经许可,请勿转载,侵权必究。如需转载,请提前通过私信联系。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 实验盒 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Vite 学习(二) - 基本使用配置
因为 vite 是使用原生浏览器的模块化功能,内部不能使用 node,也就没有了 require 方法。本小节主要介绍 vite 中常见的使用,包括 css、ts、env 环境变量,import.meta 等功能。
测不准
2022/01/26
2.4K0
【Vite基础】002-Vite 中使用 CSS 的各种功能
CSS 模块是一个CSS 文件,默认情况下,所有类名和动画名都在本地范围内。所有 URL ( url(...))@imports都采用模块请求格式(./xxx并且../xxx表示相对的,xxx表示xxx/yyy在模块文件夹中,即在 中node_modules)。
訾博ZiBo
2025/01/06
2800
【Vite基础】002-Vite 中使用 CSS 的各种功能
WebAssembly入门笔记[1]:与JavaScript的交互
前一阵子利用Balazor开发了一个NuGet站点,对WebAssembly进行了初步的了解,觉得挺有意思。在接下来的一系列文章中,我们将通过实例演示的方式介绍WebAssembly的一些基本概念和编程模式。首先我们先来说说什么是WebAssembly,它主要帮助我们解决什么问题。
蒋金楠
2024/01/26
9000
WebAssembly入门笔记[1]:与JavaScript的交互
如何在Vite中处理各种静态资源?
静态资源处理是前端工程经常遇到的问题,在真实的工程中不仅仅包含了动态执行的代码,也不可避免地要引入各种静态资源,如图片、JSON、Worker 文件、Web Assembly 文件等等。
江拥羡橙
2023/11/18
3.7K0
如何在Vite中处理各种静态资源?
彻底理解 Vite 的热更新主要流程
热更新的英文全称为Hot Module Replacement,简写为 HMR。当修改代码时,HMR 能够在不刷新页面的情况下,把页面中发生变化的模块,替换成新的模块,同时不影响其他模块的正常运作。
CandyTong
2022/07/18
5.4K0
彻底理解 Vite 的热更新主要流程
如何优雅地打包非 JavaScript 静态资源
假设你正在开发一个网络应用程序。在这种情况下,你很可能不仅要处理 JavaScript 模块,还要处理各种其他资源--Web Workers(它也是 JavaScript ,但它拥有一套独立的构建依赖图)、图片、CSS、字体、WebAssembly 模块等等。
coder_koala
2021/11/10
1.4K0
如何优雅地打包非 JavaScript 静态资源
如何开发一个完整的 Vite 插件?
Vite 插件与 Rollup 插件结构类似,为一个name和各种插件 Hook 的对象:
江拥羡橙
2023/11/20
1.4K0
如何开发一个完整的 Vite 插件?
[译] AssemblyScript简介
WebAssembly(或者说Wasm)在相对不久前被加入到了Web浏览器标准之中. 而它对于拓展Web平台的能力具有不可小觑的潜力.
腾讯IVWEB团队
2020/06/28
2K0
让你30分钟快速掌握vue 3
经过了漫长的迭代,Vue 3.0终于在上2020-09-18发布了,带了翻天覆地的变化,使用了Typescript 进行了大规模的重构,带来了Composition API RFC版本,类似React Hook 一样的写Vue,可以自定义自己的hook ,让使用者更加的灵活,接下来总结一下vue 3.0 带来的部分新特性。
前端开发博客
2020/11/04
2.4K0
【Vite基础】001-使用 Vite 创建 vue3 项目
訾博ZiBo
2025/01/06
8730
【Vite基础】001-使用 Vite 创建 vue3 项目
Vue3: 如何以 Vite 创建,以 Vue Router, Vuex, Ant Design 开始应用
详见:Migration Guide, https://v3.vuejs.org/guide/migration/introduction.html
GoCoding
2021/05/06
9580
Vue3: 如何以 Vite 创建,以 Vue Router, Vuex, Ant Design 开始应用
【Vite基础】003-Vite 中使用 TypeScript
訾博ZiBo
2025/01/06
2650
【Vite基础】003-Vite 中使用 TypeScript
网页三维CAD参数化建模开发框架的搭建教程
mxcad3d是基于mxdraw的基础上,使用TypeScript和C++语言开发的一个网页三维CAD参数化建模框架,我们为开发者提供了丰富的参数化建模的开发接口,用户可以高效、便捷的对基本图元进行创建、同时丰富的JS开发接口方便了用户实现复杂的模型创建和CAD二次开发,网页测试DEMO链接如下:https://demo.mxdraw3d.com:3000/mxcad3d/。
梦想云图网页CAD
2024/07/19
1460
网页三维CAD参数化建模开发框架的搭建教程
一文带你走进 Rust 和 WebAssembly 的世界
在进行正式的分享之前,先来说一说为什么,要学习 Rust 这一门在广义上归属于后端的语言,以及它能带给我们什么,未来有什么前景。
童欧巴
2021/08/20
2.2K0
一文带你走进 Rust 和 WebAssembly 的世界
为什么说 WASM 是 Web 的未来?
了解 WebAssembly 的前世今生,这一致力于让 Web 更广泛使用的伟大创造是如何在整个 Web/Node.js 的生命周期起作用的,探讨为什么 WASM 是 Web 的未来?
玖柒的小窝
2021/12/03
1.3K0
为什么说 WASM 是 Web 的未来?
WebAssembly 是 Deno 的好搭档
备受期待的 Deno 项目 终于发布了 1.0 版本!Deno 是由 Node.js 的创始人 Ryan Dahl 创建的,旨在解决他所说的“我为 Node.js 感到遗憾的十件事”。
深度学习与Python
2020/08/28
2.4K0
一口气复习完 Vue3 相关基础知识点
看完你就基本可以上手搞开发了,本文适合Vue初学者,或者Vue2迁移者,当然还是建议Vue3官网完全过一遍。不适合精通原理,源码的大佬们。
前端达人
2021/09/09
2.4K0
一口气复习完 Vue3 相关基础知识点
手把手教你手写一个 Vite Server(一)
之前写过几篇 Vite 的文章,对 Vite 的概念也有一定的理解了,但理解归理解,仍然觉得很虚,也不知怎么的,这几个概念突然就变成一个这么强大的工具。。。
CandyTong
2022/07/18
2.1K0
手把手教你手写一个 Vite Server(一)
在线三维CAD中创建三维建筑墙体(在线建模CAD软件)
1.本文将介绍如何使用mxcad3d来创建建筑墙体模型。该工具提供了丰富的三维建模功能和便捷的API,首先通过npm包管理器来新建测试项目并引入mxcad包,所以需要先安装Node.js,里面自带了npm包管理器 以及包含在npm包管理器中的npx工具 (用于启动运行我们的测试项目),Node.js下载和安装教程。
梦想云图网页CAD
2024/10/09
1820
在线三维CAD中创建三维建筑墙体(在线建模CAD软件)
为什么WebAssembly不是JavaScript的终结者,而是它的“助推器”?
导语 | 自从JavaScript创建到现在,每10年都会有新的变化,下一个10年的爆点在哪,可能就是WebAssembly!但WebAssembly绝不是JavaScript的终结者,反而是它的“助推器”!这是为什么呢?接下来我将带你揭晓答案,让你10分钟快速掌握WebAssembly! 一、了解WebAssembly (一)什么是WebAssembly? 官网定义:WebAssembly/wasm WebAssembly或者wasm是一个可移植、体积小、加载快并且兼容Web的全新格式(二进制),
腾讯云开发者
2021/09/18
1.1K0
相关推荐
Vite 学习(二) - 基本使用配置
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档