首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >三代测序100问(19):纳米孔直接RNA测序分析流程(下)——从序列到生物学洞见

三代测序100问(19):纳米孔直接RNA测序分析流程(下)——从序列到生物学洞见

作者头像
天意生信云
发布2025-11-20 16:30:10
发布2025-11-20 16:30:10
70
举报

在上一期节目中,我们一同梳理了纳米孔直接RNA测序(DRS)数据从原始信号到高质量碱基序列的预处理流程。今天,我们将接续上期内容,深入探讨如何从这些信息丰富的序列数据中,挖掘出有价值的生物学发现。废话不多说,让我们直接进入核心分析环节。

核心分析一:表达量定量、差异分析与功能富集

这是转录组学研究中最基础也是最核心的分析模块。

  • 表达量定量: 我们可以使用在长读长转录组分析中综合测评表现优异的IsoQuant工具,直接对DRS数据进行处理。IsoQuant能够在有参考基因组注释的情况下,准确地将reads比对到已知的基因和转录本上,并输出基因水平和转录本水平的表达矩阵(通常以counts或TPM形式呈现)。
  • 差异表达分析: 在获得表达矩阵后,我们便可以利用成熟的统计分析工具进行组间比较。经典的R包如DESeq2edgeR,都能够基于负二项分布模型,对不同实验条件下的基因或转录本表达水平进行统计检验,识别出显著差异表达的分子。
  • 功能富集分析: 为了理解这些差异表达基因或转录本的生物学意义,我们可以使用clusterProfiler R包,对其进行KEGG通路富集分析和GO(Gene Ontology)功能富集分析,从而揭示它们所参与的生物学过程、分子功能以及细胞组分。

核心分析二:转录本重构与新转录本鉴定

DRS技术的长读长特性,使其在发现新型转录本(novel isoforms)方面具有天然优势。

  • 转录本信息的获取: IsoQuant在分析过程中,会输出一个名为~_extended_annotation.gtf的文件。这个文件包含了样本中所有已知转录本以及新鉴定出的转录本的完整注释信息。
  • 转录本分类与提取: 为了进一步对这些转录本进行系统性分类(如已知、新异构体、新基因座等),我们可以利用SQANTI3工具。SQANTI3会将IsoQuant输出的GTF文件与参考基因组注释进行详细比对,为每个转录本打上精确的分类标签。随后,我们便可以提取出那些新鉴定的转录本序列,进行后续的功能预测、结构域分析或实验验证等深入研究。

核心分析三:可变剪接(Alternative Splicing, AS)分析

可变剪接是真核生物转录调控的重要机制,DRS能够直接观察到完整的剪接模式。

  • 工具选择: 我们可以使用经典的SUPPA2工具来进行可变剪接分析。SUPPA2根据其定义的多种可变剪接事件类型(如外显子跳跃、可变5'/3'剪接位点、内含子保留等),对转录本进行系统性划分。
  • 差异剪接分析: 在此基础上,SUPPA2能够进行两组样本间的差异可变剪接分析,识别出在不同条件下发生显著变化的剪接事件,为理解疾病机制或发育调控提供重要线索。

核心分析四:Poly(A)尾分析——长度与位点的双重解析

Poly(A)尾的长度和可变聚腺苷酸化(Alternative Polyadenylation, APA)位点的选择,是转录后调控的关键环节。

  • Poly(A)位点注释与APA分析: 我们可以使用QuantifyPolyA工具,对DRS数据中检测到的poly(A)位点进行精确注释,并识别不同样本或条件下的差异APA位点使用情况。
  • Poly(A)尾长度分析: 在使用Dorado进行basecalling时,如果加上了--estimate-poly-a选项,输出的序列文件(BAM格式)中会包含每条read的poly(A)尾长度信息,通常以标签形式记录(如pt:i:96表示该转录本的poly(A)尾长度为96个核苷酸)。通过提取这些信息,我们可以进行poly(A)尾长度的统计分析和组间差异比较,探索其与mRNA稳定性、翻译效率之间的关联。

核心分析五:RNA碱基修饰分析——表观转录组的直接解码

这是DRS技术最独特、最具革命性的应用之一。

  • 修饰信息的提取: 在最初使用Dorado进行basecalling并启用--modified-bases选项后,识别出的碱基修饰信息(如m6A)已经被编码在输出的BAM文件中。
  • 修饰分析工具: 通过ONT官方提供的modkit工具,我们可以高效地提取每个样本中每个碱基位点的修饰状态和修饰频率,并进行组间的差异修饰分析。这使得我们能够在全转录组水平上,绘制RNA修饰的动态图谱,揭示其在基因表达调控、疾病发生发展中的作用。

总结与展望

通过这两期节目,我们带领大家系统地梳理了纳米孔直接RNA测序从原始数据到生物学结论的完整分析内容和流程,并为每个关键步骤推荐了相应的常用软件工具。值得强调的是,生物信息学分析是一个灵活且不断发展的领域,每一个分析板块都有众多其他优秀的软件工具可供选择。这里提供的,更多是一个分析框架和思路的指引,具体的参数优化、结果解读以及工具组合,还需要各位老师和同学根据自己的研究问题和数据特性,进行深入的摸索和思考。

希望这两期内容能为大家开展DRS研究提供有益的参考。好了,我们下期再见!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 BioOmics 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 核心分析一:表达量定量、差异分析与功能富集
  • 核心分析二:转录本重构与新转录本鉴定
  • 核心分析三:可变剪接(Alternative Splicing, AS)分析
  • 核心分析四:Poly(A)尾分析——长度与位点的双重解析
  • 核心分析五:RNA碱基修饰分析——表观转录组的直接解码
  • 总结与展望
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档