Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nat. Commun. | 准确理解RNA翻译,RiboTIE直接处理核糖体信号

Nat. Commun. | 准确理解RNA翻译,RiboTIE直接处理核糖体信号

作者头像
DrugAI
发布于 2025-04-18 08:54:10
发布于 2025-04-18 08:54:10
960
举报
文章被收录于专栏:DrugAIDrugAI

DRUGAI

今天为大家介绍的是来自美国密歇根大学的John R. Prensner与Jim Clauwaert团队以及比利时根特大学的Gerben Menschaert联合的一篇论文。RNA翻译是细胞生命活动中的一个基础过程,对人类疾病的发生和发展有着深远影响。然而,由于这个过程极其复杂,加上现有技术的限制,准确研究RNA翻译的变化一直是科学界面临的重大挑战。为了解决这个问题,研究团队开发了一个名为RiboTIE的新工具。这个工具基于人工智能中的Transformer模型,专门用来分析核糖体测序(RiboSeq)数据。与其他现有方法相比,RiboTIE的独特之处在于它能直接处理原始的核糖体信号数据,准确识别出基因组中可能被翻译的DNA片段(ORFs)。通过在多个不同数据集上的测试,这个工具展现出了极高的准确性和灵敏度。研究发现,RiboTIE不仅能够验证已知的科学发现,还能在正常脑组织和脑癌(髓母细胞瘤)样本中发现RNA翻译调控的新特征。这些结果表明,RiboTIE是一个功能强大的分析工具,能够显著提高核糖体测序数据分析的准确度和深度,有助于我们更好地理解蛋白质的合成过程及其在疾病中的作用。

RNA翻译是一个复杂的生物过程。在这个过程中,核糖体的两个组成部分(40S和60S亚基)会依次与RNA结合,同时还需要多种起始因子和辅助因子的参与,最终形成能够进行蛋白质合成的活性核糖体。这个过程直接决定了细胞内蛋白质的数量,在包括癌症在内的多种疾病中扮演着关键角色。在疾病状态下,多种遗传和非遗传因素都可能改变核糖体的组成、翻译效率和准确性。为了全面了解核糖体的活动,科研人员开发了核糖体测序(Ribo-Seq)技术。这项技术可以测定信使RNA的翻译效率,还能发现传统分析方法难以识别的非常规基因片段(ORFs)和新型蛋白质形式。因此,Ribo-Seq数据分析已成为多个研究领域的重要工具,包括新基因发现、RNA调控研究、蛋白质组学、微型蛋白质研究,以及针对RNA翻译的药物开发研究。

然而,Ribo-Seq数据分析面临着多重挑战。比如,在检测小型基因片段时缺乏统计可靠性,以及核糖体读数模式与实际翻译情况之间存在差异。这些差异可能来自生物因素(如组织类型的不同)或技术因素(如实验方法的差异)。现有的分析工具(如ORFquant、RpBp等)往往依赖人工筛选的特征来判断基因片段是否被翻译,这导致不同工具之间的结果差异较大,且常出现错误预测。

模型框架

图 1

针对这些问题,研究团队开发了RiboTIE工具(如图1a所示)。这个工具采用了最新的机器学习技术,专门用于处理大规模生物数据。它可以利用预先训练好的模型,在识别小型翻译基因片段时表现出色。更重要的是,RiboTIE能够根据每个数据集的特点,准确识别核糖体保护的RNA片段与实际翻译基因之间的关系,这使得它能在不同类型的数据中都保持稳定的表现。在对脑癌(髓母细胞瘤)患者的样本和细胞系的分析中,RiboTIE不仅验证了已知的研究发现,还展示了其在不同样本质量条件下的稳定性。因此,RiboTIE为生物学家和生物信息学家提供了一个强大的工具,有助于深入了解人类细胞功能和疾病状态。

RiboTIE工具具有四个突出特点:首先,它简化了数据预处理步骤,直接处理所有位置和长度的读数,提高了整体性能。其次,它采用创新的方法,先预测后构建基因片段,这使得工具能够评估转录组中所有可能的翻译起始位点。第三,工具只处理核糖体保护片段的计数数据,避免了其他因素带来的偏差。第四,采用了先进的机器学习技术(Transformer网络),能够自动提取特征并处理不同长度的输入数据。

实验结果

研究团队在八个不同实验数据集上评估了RiboTIE的性能。如图1b所示,与其他工具相比,RiboTIE在准确性和灵敏度方面都表现出色。在胰腺前体细胞的测试中(图1c),RiboTIE识别出的编码序列(CDS)数量比第二名多出64.9%,在识别小于300bp的编码序列时,其效果更是其他工具的3倍。图1d显示,RiboTIE在识别非常规基因片段方面也具有独特优势。

图 2

为了验证工具在实际医学研究中的应用价值,研究人员分析了73个人类脑组织样本(包括30个胎儿样本和43个成年样本)以及15个髓母细胞瘤患者的组织样本(图2a)。即使在部分样本质量不佳的情况下,RiboTIE仍然表现稳定。如图2b-e所示,该工具在识别编码序列和非编码ORFs方面都优于现有方法。

在髓母细胞瘤研究中(图2h-j),RiboTIE帮助研究人员发现了201个与疾病相关的非编码ORFs。这些发现与已知的髓母细胞瘤生物学特征相符,特别是在神经系统发育和分化相关基因中的表现。通过与另一个工具(TIS Transformer)的结果对比,研究人员确定了22个高置信度的候选非编码ORFs,这些基因片段的翻译水平能够准确区分不同类型的髓母细胞瘤。这些发现为理解疾病机制和开发潜在治疗方法提供了新的视角。

为了进一步验证RiboTIE的预测准确性,研究团队对三对高MYC表达和低MYC表达的髓母细胞瘤细胞系进行了深度蛋白质组学分析。通过严格的数据筛选标准,研究人员发现了44个能够证实非编码ORFs或蛋白质新形式存在的肽段,这个数量与其他工具(如ORFquant)的预测结果相当。

图 3

特别值得注意的是,研究发现了几个在高MYC和低MYC表达细胞中表现不同的新型蛋白质(如图3所示):

  • 在SCRIB基因中发现了一个特殊的内嵌型基因片段,虽然SCRIB基因本身的表达没有明显变化,但这个新发现的片段在不同类型的髓母细胞瘤中表现不同(图3a)。
  • 在RBMS1基因中,研究者发现了一个延长的蛋白质形式。这个新形式与原有的基因产物一样,在高MYC表达的样本中都显示出降低的表达水平(图3b)。
  • 在ZNF717基因中,发现了一个位于基因上游的新片段。有趣的是,虽然ZNF717基因本身在不同类型的髓母细胞瘤中表达存在差异,但这个新发现的片段的表达却保持稳定(图3c)。

这些发现表明,非编码基因片段在疾病中可能发挥着独特的作用,它们的表现模式可能与传统认知的基因产物完全不同。这为理解髓母细胞瘤的发病机制提供了新的视角,也为未来的治疗策略开发提供了潜在的新靶点。

讨论

RiboTIE是一款创新的人工智能工具,专门用于分析细胞中的蛋白质合成过程。它不仅能准确识别基因组中的功能片段,还能在数据质量不理想的情况下保持稳定表现。研究人员已在166个不同类型的数据集上验证了它的可靠性,特别是在研究儿童脑癌等疾病时,这个工具帮助发现了许多新的生物学特征,为疾病研究开辟了新途径。

编译|于洲

审稿|王梓旭

参考资料

Clauwaert J, McVey Z, Gupta R, et al. Deep learning to decode sites of RNA translation in normal and cancerous tissues[J]. Nature Communications, 2025, 16(1): 1275.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
GPB | 陈润生/何顺民团队发布新版SmProt数据库,提供小蛋白丰富、可靠的系统性注释
小蛋白是翻译自小开放阅读框(small open reading frame, sORF)、长度低于100个氨基酸的蛋白质,在此前的基因组注释中通常被忽略。sORF广泛存在于人类等多种生物的基因组中,包括mRNA的非翻译区(untranslated regions, UTR)以及多种非编码RNA (non-coding RNA, ncRNA)区域,部分能够翻译成小蛋白。近年来,越来越多的研究发现小蛋白在胚胎发育、细胞凋亡、肌肉收缩等多种生物学过程中行使功能,并在肿瘤等疾病进展中发挥作用。
生信宝典
2021/10/21
1.2K0
RNA-seq这十年(3万字长文综述)
我们在生信菜鸟团公众号举办的每周文献精选活动,菜鸟团一周文献推荐(No.20)广受好评的是大神级的RNA-Seq综述,题目:RNA sequencing: the teenage years ,所以在我们生信技能树VIP交流群也得到了关注。
生信技能树
2019/08/08
13.8K0
RNA-seq这十年(3万字长文综述)
Barrnap:迅速完成核糖体RNA预测
Barrnap(BAsic Rapid Ribosomal RNA Predictor),一款专门用于微生物基因组注释的工具,它的主要功能是预测细菌、古菌、真核生物以及线粒体中的核糖体RNA(rRNA)基因位置。这些rRNA基因在微生物分类学和系统发育研究中具有重要意义,因为它们是构建系统发育树和进行物种鉴定的重要依据,且准确预测rRNA基因对于理解基因组结构和功能至关重要。
简说基因
2024/12/23
1500
Barrnap:迅速完成核糖体RNA预测
解码生命语言:深度学习模型TranslationAI揭示RNA翻译新规则
RNA翻译是基因表达的核心环节,其精确调控依赖于翻译起始位点(TIS)和终止位点(TTS)的准确识别。传统方法依赖于简单的经验规则(如Kozak序列或最长开放阅读框ORF),但忽略了RNA结构、顺式调控元件等复杂因素,导致预测准确性有限。近年来,深度学习技术在生物学领域的应用为解决此类复杂问题提供了新思路。近日,《Nucleic Acids Research》发表了一项突破性研究——TranslationAI,一个基于深度学习的模型,能够直接从全长度mRNA序列预测翻译起始位点(TIS)和终止位点(TTS),并揭示了翻译调控的新规律!
阔跃生物
2025/05/15
830
Cell 综述,核糖体结构的出现以及涉及核糖体与其底物 tRNA 之间相互作用的核心过程机制
生信菜鸟团
2024/12/20
5910
Cell 综述,核糖体结构的出现以及涉及核糖体与其底物 tRNA 之间相互作用的核心过程机制
Nat. Rev. Drug. Discov. | 以小分子靶向RNA结构
今天为大家介绍的是来Robert T. Batey 和Matthew D. Disney的一篇关于靶向RNA小分子的论文。RNA在人类生物学中是3D形态,赋予不同的功能角色,并在疾病中导致功能障碍。目前正在积极追求利用小分子治疗性地靶向RNA结构的方法,其中包括预测进化保守的RNA结构的计算工具的发展,以及扩展作用方式并促进与细胞机制的相互作用的策略。现有的RNA靶向小分子使用一系列机制,包括通过与细胞蛋白作为分子黏合剂来定向剪接,抑制难以药物化的蛋白质的翻译和停用非编码RNA中的功能结构。在这里,作者描述了识别、验证和优化靶向功能转录组的小分子的策略,为将这些药物推进到未来十年制定了路线图。
DrugAI
2023/09/09
5200
Nat. Rev. Drug. Discov. | 以小分子靶向RNA结构
Nat. Rev. Chem. | 小分子与RNA的碰撞
今天为大家介绍的是来自Maria Duca团队的一篇论文。在化学生物学和药物发现领域,开发创新方法以识别RNA结合物引起了巨大关注。尽管针对细菌核糖体RNA的抗生素已经上市数十年,但对RNA靶向的重新关注反映了人们对更好地理解涉及RNA的复杂细胞内过程的需求。在这个背景下,小分子是用来探索RNA的生物学功能、验证RNA作为治疗靶点的工具,它们最终有可能成为新药。尽管近期取得了进展,但理性设计特定的RNA结合物需要更好地理解与RNA靶标发生的相互作用,以达到期望的生物学响应。在这篇综述中,作者讨论了接近这一未充分探索的化学空间的挑战。
DrugAI
2024/02/23
3250
Nat. Rev. Chem. | 小分子与RNA的碰撞
Cell | 都知道 DNA 损伤修复,那细胞是如何应对 RNA 损伤的呢? | 综述
◉ RNA 化学多样性 RNA 易受环境和内源性损伤的影响,并且缺乏核隔离、碱基配对和染色质化所提供的三重保护。而DNA具有这三种保护。◉ 尽管 RNA 也会被 RNA 结合蛋白(RBPs)结合,但由于涉及的相互作用是动态的,因此提供的保护可能不那么显著。
生信菜鸟团
2025/02/27
4370
Cell | 都知道 DNA 损伤修复,那细胞是如何应对 RNA 损伤的呢? | 综述
Cell 关于 小和长非编码RNA 的最新综述,万字精读
生信菜鸟团
2024/11/28
5620
Cell 关于 小和长非编码RNA 的最新综述,万字精读
生信爱好者周刊(第 20 期):科研苦行
1、Briefings in Bioinformatics | 高歌课题组建立人类RNA转录本编码能力定量
王诗翔呀
2022/03/30
5290
生信爱好者周刊(第 20 期):科研苦行
Nat. Commun. | 理解RNA序列、结构与功能关系,IGI构建最新数据库进行分析
今天为大家介绍的是来自加州大学伯克利分校IGI机构Jamie H. D. Cate团队的一篇论文。结构化RNA是许多核心生物过程的关键,包括基因表达和催化反应。由于缺乏与生物体表型相关的高质量参考数据,尚无法预测RNA的结构,这些数据本可用于指导RNA的功能。作者介绍了GARNET,这是一个新的RNA结构和功能分析数据库,它基于基因组分类数据库(GTDB)。GARNET将RNA序列与GTDB参考生物的实验和预测最适生长温度相连接。利用GARNET,作者开发了考虑序列和结构的RNA生成模型,采用重叠三联体标记法为类似GPT的模型提供了最佳编码。通过利用GARNET中的高温菌RNA及这些RNA生成模型,作者识别出了核糖体RNA中的突变,这些突变使大肠杆菌核糖体具有更高的热稳定性。本文介绍的基于GTDB的数据和深度学习模型为理解RNA序列、结构与功能之间的关系提供了基础。
DrugAI
2025/01/03
2120
Nat. Commun. | 理解RNA序列、结构与功能关系,IGI构建最新数据库进行分析
癌症中的长非编码RNA与RNA结合蛋白的相互作用
今天为大家介绍的是来自Nehad M. Alajez团队的一篇综述。了解非编码RNA(ncRNA)在我们的DNA中扮演的重要角色对于理解癌症的许多方面至关重要。这些ncRNA是一大类分子,它们不参与制造蛋白质,但在控制我们细胞的各种过程中有着重要的作用。这些过程就像规定我们细胞如何运作的规则。这些ncRNA的工作方式之一是与另一种分子,称为RNA结合蛋白(RBP),进行互动,这种互动在不同类型的癌症中都有详细的了解。它们一起可以影响ncRNA和RBP的稳定性,RNA分子的修改方式,它们在细胞中的位置,以及在癌症中发挥作用的许多其他机制。
DrugAI
2023/12/04
4890
癌症中的长非编码RNA与RNA结合蛋白的相互作用
基因日签【20210910】当亚基聚集在一起时核糖体结构发生改变(内含第24章翻译小结)
他们氨酰tRNA能识别与mRNA中的密码子,它有互补于密码子的反密码子,并带有对应此密码子的氨基酸。一个特殊的tRNA起始子(在原核生物中,它是fMet-tRNAf;在真核生物中,它是Met-tRNAi)识别启动所有编码序列的密码子AUG。
尐尐呅
2022/03/31
6440
Cell Death Discov. | snoRNAs在生物过程中的功能和机制以及在肿瘤病理生理中的作用
今天为大家介绍的是来自Yang Zhao团队的一篇论文。snoRNAs是一种在细胞核中常见的小分子RNA,主要帮助修饰细胞内的rRNA。最近,科学家们发现,snoRNAs不仅参与rRNA的修饰,还参与其他RNA,如tRNA和mRNA的修饰。有些snoRNAs与肿瘤的形成和发展有关,它们在肿瘤中的表现也可能与患者的预后相关。这篇综述主要总结了snoRNAs的功能,它们如何影响肿瘤的形成,以及如何将这些知识应用于未来的肿瘤诊断和治疗。
DrugAI
2023/12/04
4660
Cell Death Discov. | snoRNAs在生物过程中的功能和机制以及在肿瘤病理生理中的作用
【Cancer Cell】生物分子凝聚体与肿瘤(完整版)
癌变的特征是多种细胞过程的失调,这些过程一直是详细的遗传学、生物化学和结构学研究的主题,但直到最近,才有证据显示许多这些过程发生在生物分子凝结体的背景下。凝结体是无膜的团体,通常由液液相分离形成,将具有相关功能的蛋白质和RNA分子隔离开来。来自凝结体研究的新见解预示着我们对癌症细胞失调机制的理解将发生深刻的变化。在这里,我们总结生物分子凝结体的关键特征,指出它们已经被暗示(或很可能被暗示)在致癌发生中的作用,描述癌症治疗药物的药动学可能会受到凝结体的极大影响,并讨论一些必须解决的问题,以进一步提高我们对癌症的理解和治疗。
Chris生命科学小站
2023/08/29
5600
【Cancer Cell】生物分子凝聚体与肿瘤(完整版)
基因功能简介
1、基因、DNA、染色体之间的关系:染色体由DNA和蛋白质构成,基因是DNA上具有遗传效应的片段。
生信real
2020/08/26
1.1K0
基因功能简介
Nat. Mach. Intell. | 5′ UTR语言模型:开辟蛋白质表达预测与优化的新途径
近日,来自普林斯顿大学电气和计算机工程系、斯坦福大学病理系与RVAC Medicines和Zipcode Bio等单位联合开发了一种5′ UTR语言模型(UTR-LM),由王梦迪教授担任通讯作者,褚晏伊博士和于丹博士共同担任第一作者。该模型旨在解码信使RNA(mRNA)分子起始部位的调控区,以预测和改进基因的翻译表达水平。
DrugAI
2024/04/12
7210
Nat. Mach. Intell. | 5′ UTR语言模型:开辟蛋白质表达预测与优化的新途径
曾与诺奖失之交臂的这项发现,今年还会继续陪跑么?
miRNA 的发现,与一位祖籍波兰的生物学家维克托·安博斯(Victor Ambros)的工作有关——他在线虫中发现了第一个 miRNA lin-4。
生信交流平台
2020/10/23
8240
曾与诺奖失之交臂的这项发现,今年还会继续陪跑么?
Nat. Commun. | 深度学习探索可编程RNA开关
今天给大家介绍的是一篇发表在Nature Communications 的文章“A deep learning approach to programmable RNA switches”,工程RNA元件是能够检测小分子、蛋白质和核酸(合成生物学成分)的可编程工具。增强深度学习的模式识别可以用于预测合成生物学成分。本文用深度神经网络(DNN)来预测合成生物学中的经典核糖开关模型——toehold开关。为了促进DNN训练,作者在体内合成并表征了涵盖23个病毒基因组和906个人类转录因子的91,534个toehold开关的数据集。经过核苷酸序列训练的DNN表现(R 2  = 0.43–0.70)优于前沿的热力学和动力学模型(R 2 = 0.04–0.15),且允许实行人类可理解的注意力可视化(VIS4Map)识别成功和失败的模式。本文研究表明深度学习方法可用于RNA合成生物学中的功能预测。
DrugAI
2021/02/02
5480
Nat. Commun. | 深度学习探索可编程RNA开关
【RNA】万字综述:生命的起源于RNA?
达尔文的断言:“目前关于生命起源的思考纯粹是废话”,现在已经不再成立。通过综合生命起源(OoL)研究,从其开始到最近的发现,重点关注(i)原生物化学合成的原理证明和(ii)古代RNA世界的分子遗迹,我们提供了科学对OoL和RNA世界假说的全面最新描述。基于这些观察,我们巩固了这样的共识:RNA在编码蛋白质和DNA基因组之前演化,因此生物圈从一个RNA核心开始,在RNA转录和DNA复制之前产生了大部分的翻译装置和相关RNA结构。这支持了这样的结论:OoL是一个渐进的化学演化过程,涉及一系列介于原生物化学和最后的普遍共同祖先(LUCA)之间的过渡形式,其中RNA起到了核心作用,沿着这条路径的许多事件及其相对发生顺序是已知的。这一综合性合成的本质还扩展了以前的描述和概念,并应有助于提出关于古代RNA世界和OoL的未来问题和实验。
Chris生命科学小站
2023/08/29
5090
【RNA】万字综述:生命的起源于RNA?
推荐阅读
相关推荐
GPB | 陈润生/何顺民团队发布新版SmProt数据库,提供小蛋白丰富、可靠的系统性注释
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档