前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >RNA-seq 详细教程:结果汇总与提取(11)

RNA-seq 详细教程:结果汇总与提取(11)

原创
作者头像
数据科学工厂
发布2023-01-29 11:02:40
发布2023-01-29 11:02:40
4900
举报

学习目标

  1. 评估每次比较产生的差异表达基因的数量
  2. 从每次比较中构建包含重要基因的 R 对象

1. 汇总

为了汇总结果,DESeq2 中一个方便的函数是 summary()。它与用于检查数据帧的函数同名。当使用 DESeq 结果表作为输入调用此函数时,将使用默认阈值 padj < 0.1 汇总结果。但是,由于我们在创建结果表阈值时将 alpha 参数设置为 0.05:FDR < 0.05(即使输出显示 p 值 < 0.05,也使用 padj/FDR)。让我们从 OE 与对照结果开始:

代码语言:text
复制
summary(res_tableOE, alpha = 0.05)

除了在默认阈值下上调和下调的基因数量外,该函数还报告了被测试的基因数量(总读数非零的基因),以及未包括在多重测试中的基因数量由于平均计数较低而进行的校正。

2. 提取

  • 提取显著差异表达基因

让我们首先创建包含我们的阈值标准的变量。我们只会在我们的标准中使用调整后的 p 值:

代码语言:text
复制
padj.cutoff <- 0.05

我们可以使用 filter() 函数轻松地对结果表进行子集化以仅包括那些重要的,但首先我们会将结果表转换为小标题:

代码语言:text
复制
res_tableOE_tb <- res_tableOE %>%
  data.frame() %>%
  rownames_to_column(var="gene") %>% 
  as_tibble()

现在我们可以对该表进行子集化,以仅使用我们预定义的阈值保留重要基因:

代码语言:text
复制
sigOE <- res_tableOE_tb %>%
        filter(padj < padj.cutoff)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 学习目标
  • 1. 汇总
  • 2. 提取
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档