首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R:来自p.adjust(FDR)的意外结果

R: 来自p.adjust(FDR)的意外结果

在处理数据时,我们通常使用统计方法来评估数据集的质量和一致性。其中,FDR(False Discovery Rate)是一种广泛应用于假设检验中的方法,用于评估多组数据之间的差异。然而,在某些情况下,FDR可能会产生意外的结果,例如:

  1. 数据集中存在显著的偏差或方差,但FDR方法未能检测到。
  2. 数据集中存在一些异常值或离群值,导致FDR方法出现误判。
  3. 数据集中存在多个相关性较强的变量,导致FDR方法无法准确评估变量之间的关系。

为了解决这些问题,我们可以采用其他统计方法,如Bonferroni校正或Sidak校正,以更好地适应数据集的特点。此外,我们还可以使用数据可视化方法,如箱线图或散点图,来直观地观察数据集的特征和分布。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

数据科学23 | 统计推断-多重检验

FDR (False Discovery Rate) :所有主张“阳性”次数中,错误主张(假阳性)所占比例E[V/R]。 目的:控制假阳性率FPR 如果正确计算了P值,所有P值小于?...常用方法为BH(Benjaminiand Hochberg)校正。 基本思路 假设进行?次检验,希望控制FDR使E[V/R]<?。计算每次检验P值,结果按由小到大进行排序P(1),…,P(?)...时,认为是阳性,此时第1到第?个P值对应检验都认为是阳性。 进行10000次检验,控制E[V/R]<0.05,如果得到500个阳性结果,其中假阳性结果小于500×0.05=25个。...控制FDR: 假设进行?次检验,计算每次检验P值,结果按由小到大进行排序P(1),…,P(?),校正P值=P(?)×(?/?),此时校正P值又称为Q值。回顾BH校正,?fdr=?×?/?。当Q?...Bonferroni校正控制FWER: sum(p.adjust(pValues, method = "bonferroni") < 0.05) [1] 0 BH校正控制FDR: sum(p.adjust

1.9K21
  • 使用Clipper控制FDR应对高通量数据分析p值失真问题

    FDR 首先我们需亚了解差异表达分析基本假设: H0:差别是由抽样误差所致; H1:差别不是由抽样误差所致,即并不来自同一总体 ###这里我用到哈佛大学统计一个数据集 library(devtools...是原始第 i 个 p 值,m 是的检验个数 sum( p.adjust(pvals, method="fdr") < 0.05 ) # 13 sum( p.adjust(pvals, method...="BH") < 0.05 ) # 13 从图中看到一样 adj.pvals <- p.adjust(pvals, method="fdr") compare_list <- data.frame...,而是作为实验设计design一部分),筛选出DEGs以及计算FDR和power 使用这些函数处理数据集获得相关结果 接下来,介绍了两种不同方法创建null dataset,并在此基础上开始引入Clipper...结合original和null数据集来控制FDR,在使用Clipper前还需考虑其前提假设是否成立:来自两个数据集(original和null)输入数据(这里指,-log转换后p值)对所有非DEGs

    32310

    多重假设检验三种常见方法计算

    但是假如我们做了很多次实验,比如10000次,那么犯错误次数可能能达到500次,我们要规避这么多假阳性结果,就需要考虑多重假设检验。 1....Bonferroni法 Bonferroni是最粗暴简单方法,当 P value ≤ α/N时,拒绝H0。理念是将阈值降低,尽量杜绝假阳性存在,弊端就是可能会由于阈值太严格而导致阳性结果太少。...在R中调用Holm方法: p.adjust(c(0.003, 0.005, 0.012, 0.04, 0.058), method = 'holm') 输出:0.015 0.020 0.036 0.080...0.080 R结果是由于要直观与0.05 (alpha) 比较,所以输出值其实就是 p * (m - k + 1);当出现第一个不显著p值时(0.080),则后边结果都是这个值了。...另外有时候会出现相同p值情况,比如: p.adjust(c(0.003, 0.005, 0.012, 0.04, 0.058, 0.06), method = 'fdr') 输出: 0.015 0.015

    2.2K20

    组间差异分析:Metastats

    这时候我们能想到最简单办法就是对所有物种按照分组进行显著性检验,这时候我们对于一个数据集进行了多重检验,则需要p值校正来获得更准确结果。...当我们明白了他们原理,实际上可以不用拘泥于两个工具本身,可以自己在R中选择合适方法来进行分析。 p值校正 假设检验是一种概率判断,因为小概率事件发生了所以我们拒绝假设。...若要使所有检验结果正确概率大于0.95,则需要调整显著水平或更常用p值校正,一个常见方法是Bonferroni校正,其原理为在同一数据集做n个独立假设检验,那么每一个检验显著水平应该为只有一个检验时...在R中p值校正可以使用p.adjust()函数,其使用方法如下所示: p.adjust(p, method=p.adjust.methods, n=length(p)) 其中p为显著性检验结果(为数值向量...校正后p值常称为q值,使用Benjamini-Hochberg(BH)方法校正p值也称为错误发现率(false discovery rate,FDR)。

    1.3K10

    ggplot2画KEGG富集柱形图

    在做项目分析时候遇到过一个问题,就是有个老师想将好几张功能富集结果柱状图横坐标的范围全部调整为一样,一般画这个柱状图都是用Y叔clusterprofiler包中barplot函数对使用这个包功能富集结果进行一键绘图...但是当我去查找这个函数调整坐标的参数时: barplot.enrichResult {enrichplot} R Documentation barplot Description barplot...这个图与一般函数barplot画出来不一样地方在于它颜色,这张图里面的颜色反应fdr大小,是一个连续值,ggplot2可以将连续值映射到到颜色上,横坐标是通路中感兴趣基因个数。...下面用一套KEGG富集分析结果来展示绘图过程,下表展示KEGG富集分析结果也是利用Y叔clusterprofiler包得到。 ?...p.adjust进行从小到大排序,保证最显著通路在前 kegg <- kegg[order(kegg$p.adjust),] #这里画图只展示top10通路 kegg <- kegg[1:10,]

    5.8K30

    评估细胞因子活性、免疫细胞极化和细胞间通讯利器:IREA 分析(二)

    R来实现更快捷分析呢—— 我们主要关注原文方法学部分: IREA for cytokine response analysis User data are then compared with the...借助于ChatGPT,我来尝试画一下极化雷达图看看,用数据来自于➡慢性病毒性肝炎(二)中性粒细胞亚群细分策略 导入我数据 现在我有一个seurat对象 load("....} else { return(wilcox.test(post_treated, pre_treated)$p.value) } }) # 处理 NA 值以避免 p.adjust...出错 p_values[is.na(p_values)] <- 1 fdr_p_values <- p.adjust(p_values, method = "fdr") return...祈祷IREA作者放一个更友好使用渠道,R包之类,让普罗大众更好地利用这个工具~(●ˇ∀ˇ●)

    22910

    挖掘数据内部联系:相关性分析

    当x为矩阵或数据框,计算结果为元素之间相关性矩阵。相关性矩阵对角线为1(自相关)。...相关系数检验 与距离不同,相关性需要进行统计检验,假如两个变量独立,那么相关系数R应该是很接近0,那么我们认为R是服从均值为0正态分布,那么对于实际观测值r可以构造统计量使用t检验进行分析。...在R中p值校正可以使用p.adjust()函数,其使用方法如下所示: p.adjust(p, method=p.adjust.methods, n=length(p)) 其中p为相关检验结果(数值向量...校正后p值常称为q值,使用Benjamini-Hochberg(BH)方法校正p值也称为错误发现率(false discovery rate,FDR)。...ltm包中rcor.test()函数在计算相关系数检验同时还提供p值校正,其校正方法与p.adjust()函数相同,用法如下所示: rcor.test(mat,p.adjust=FALSE, p.adjust.method

    1.3K20

    多分组差异分析解决方案(2)分批次差异基因后取交集

    主要方法:如果不同分组代表着一定趋势,例如group1,group2,group3样本严重程度越来越重。...那么就可以求group1和group2差异基因,group2和group3差异基因,group1和group3差异基因,最后把三次得到上调差异基因和下调差异基因求交集。...校正 fdr=p.adjust(Pvalue, "BH") # 在原文件后面加入log2FC,p value和FDR,共3列; out<- as.data.frame(cbind(log2_FC,Pvalue...校正 fdr=p.adjust(Pvalue, "BH") # 在原文件后面加入log2FC,p value和FDR,共3列; out<- as.data.frame(cbind(log2_FC,Pvalue...校正 fdr=p.adjust(Pvalue, "BH") # 在原文件后面加入log2FC,p value和FDR,共3列; out<- as.data.frame(cbind(log2_FC,Pvalue

    2.6K30

    RNA-seq入门实战(七):GSEA——基因集富集分析

    官网地址:GSEA (gsea-msigdb.org) 基本原理: 使用预定义基因集(通常来自功能注释或先前实验结果),将基因按照在两类样本中差异表达程度排序,然后检验预先设定基因集合是否在这个排序表顶端或者底端富集...随后会针对NES计算假阳性率FDR。...Leading-edge subset:领头基因亚集对富集贡献最大基因成员 一般认为|NES|>1,p-value<0.05,FDR<0.25通路是显著富集。...|NES|值越大,FDR值就越小,说明分析结果可信度越高。 ---- 2....下面选取KEGG通路富集结果进行gseaplot绘图示范 首先对富集结果进行条件筛选,一般认为|NES|>1,NOM pvalue<0.05,FDR(padj)<0.25通路是显著富集;还可以从结果中细分出上下调通路单独绘图

    10.6K84

    数据分析:宏基因组数据荟萃分析

    以下是该函数进行荟萃分析一般原理:数据整合:将不同研究数据集整合在一起。这些数据集可能来自不同样本、人群或环境条件,但都关注相似的生物学问题。...异质性评估:评估不同研究结果之间异质性,即研究结果差异是否超出了随机误差预期。这可以通过I²统计量或Q统计量来完成。...可视化结果采用森林图展示荟萃分析结果,该结果包含效应值RE95%置信区间和对应P值。...数据分析:宏基因组数据荟萃分析​可视化结果采用森林图展示结果,该结果包含效应值RE95%置信区间和对应P值。...= p.adjust(as.numeric(`p-value`, method = "BH"))) %>% dplyr::select(Species, RE, SE_RE, CI_RE, FDR_Qvalue

    8610
    领券