首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

将具有p值的列转换为fdr "BH方法“

将具有p值的列转换为fdr "BH方法"是一种统计学中常用的方法,用于校正多重假设检验中的p值。FDR(False Discovery Rate)是指在进行多重假设检验时,错误地拒绝原假设的比例。

BH方法(Benjamini-Hochberg方法)是一种常用的FDR校正方法,它基于对p值进行排序,并计算每个p值对应的FDR阈值。具体步骤如下:

  1. 将原始数据中的p值按照从小到大的顺序进行排序。
  2. 对于每个p值,计算FDR阈值,公式为:FDR阈值 = (p值的排序序号 / 总数) * 预设的FDR水平。
  3. 从排序后的p值列表中,找到第一个小于等于对应FDR阈值的p值。
  4. 将该p值及其之前的所有p值都标记为通过FDR校正的显著性水平。
  5. 对通过FDR校正的显著性水平进行进一步的统计分析或结果展示。

BH方法的优势在于控制了错误发现率,并且相对简单易用。它适用于大规模的多重假设检验,例如基因表达数据分析、蛋白质组学研究等领域。

腾讯云提供了一系列与云计算相关的产品,其中包括云服务器、云数据库、云存储、人工智能服务等。具体推荐的产品和产品介绍链接地址如下:

  1. 云服务器(ECS):提供弹性计算能力,支持多种操作系统和应用场景。详情请参考:https://cloud.tencent.com/product/cvm
  2. 云数据库(CDB):提供高可用、可扩展的数据库服务,支持MySQL、SQL Server等。详情请参考:https://cloud.tencent.com/product/cdb
  3. 云存储(COS):提供安全可靠的对象存储服务,适用于图片、视频、文档等数据的存储和管理。详情请参考:https://cloud.tencent.com/product/cos
  4. 人工智能服务(AI):提供图像识别、语音识别、自然语言处理等人工智能能力。详情请参考:https://cloud.tencent.com/product/ai

以上是腾讯云提供的一些与云计算相关的产品,可以根据具体需求选择适合的产品来支持云计算领域的开发和运维工作。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 数据科学22 | 统计推断-多重检验

    每次检验I型错误率控制在?/?之内。经过Bonferroni校正, =?/?,每次检验P小于 时认为结果是阳性。...控制FDR——BH校正‍‍‍‍ FDR校正没有FWER法那么保守严苛,但又不像未经校正t检验有很高假阳性率FPR。常用方法BH(Benjaminiand Hochberg)校正。...时,认为结果是阳性,即把FWER控制在?水平。 控制FDR 假设进行?次检验,计算每次检验P,结果按由小到大进行排序 ,…, ,校正P = × ,此时校正P又称为Q。...建立变量x和y之间线性相关模型,并得到它们相关系数矩阵,矩阵第二行第四元素即为P。...×P?不大于1,故图上方可以看到一条水平为1线。 BH校正(图右),校正P是关于P递增函数,校正P比实际P本身稍大,但并没有特别大,因为需要得到较多阳性结果。

    99611

    谈一谈两种常用多重比较校正方法(附Matlab程序)

    Bonferroni 校正方法应该属于最严格一种校正方法,当统计比较次数比较多时,Bonferroni 校正后p会非常小,此时不推荐使用这种校正方法。...其实,FDR具体算法也有多种,如Storey法(由Storey等人提出)、Benjamini-Hochberg法(简称BH法)等。其中BH法目前应用最广,这里主要介绍这种方法基本原理。...基于BHFDR校正过程: 第一步:将我们单独统计得到一系列p=[p1,p2,…,pn]从大到小进行重新排序,计为P=[P1,P2,…,Pn]; 第二步:按照以下公式计算每个P所对应校正前FDR...最终得到Q称之为校正后FDR。 第四步:按照重排序之前顺序返回各个p对应校正后FDR。...对于本例来说,如果总体显著性水平设置为0.05,那么从得到最后FDR来说,这几个p具有显著性差异。

    6.6K21

    Volcano plot | 别再问我这为什么是火山图

    封面来源于:Pixabay+易生信 火山图是散点图一种,它将统计测试中统计显著性量度(如p value)和变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义数据点(基因等)...翻译成中文是差异倍数,简单来说就是基因在一组样品中表达均值除以其在另一组样品中表达均值。所以火山图只适合展示两组样品之间比较。 为什么要做Log 2换?...但这样操作太严苛了,很容易降低统计检出力,找不到有差异基因。后续又有统计学家提出相对不这么严苛计算方法,如holm, hochberg, hommel, BH, BY, fdr等。...BH是我们比较常用一个校正方法,获得是假阳性率 FDR (false discovery rate)。 FDR筛选时就可以不用遵循0.05这个标准了。...当然如果说我们设置FDR<0.5,即数据中最多可能有一半是假阳性就说不过去了。 同样为什么做-Log 10换呢? 因为FDR是0-1之间,数值越小越是统计显著,也越是我们关注

    3.6K30

    还在为基因通路富集担心你发际线么?ClusterProfiler通路富集-让你发际线无忧!

    所有文件存放于本地路径中(如D:/Bioming)。 2. 感兴趣基因集合文件,每个基因为一行。(感兴趣基因集合可以是差异表达基因、差异甲基化基因、突变基因集合等)。文件格式如图2。 3...."kegg", 'ncbi-geneid', 'ncib-proteinid' and 'uniprot' #pvalueCutoff:设置p阈值 #qvalueCutoff:设置q阈值(既校正后阈值...) # pAdjustMethod:对p进行校正方法,可选方法有"holm", "hochberg", "hommel", "bonferroni", "BH", "BY", "fdr", "none...,若pathways之间有重叠感兴趣基因,则自动这两个通路用线连接。...默认画top30个富集到pathways, 节点大小对应该pathway下富集到感兴趣基因个数,节点颜色对应p.adjust,从小到大,对应蓝色到红色。

    94030

    多重假设检验三种常见方法计算

    Bonferroni法 Bonferroni是最粗暴简单方法,当 P value ≤ α/N时,拒绝H0。理念是阈值降低,尽量杜绝假阳性存在,弊端就是可能会由于阈值太严格而导致阳性结果太少。...图中k就是排名,当原始p < alpha / (m - k + 1) 时,我们认为Holm校正之后仍然显著。即原始p为0.003,0.005,0.012时显著。...0.080 R中结果是由于要直观与0.05 (alpha) 比较,所以输出其实就是 p * (m - k + 1);当出现第一个不显著p时(0.080),则后边结果都是这个值了。...BH法 公式为:p * (n/i)。n是总数,i是从小到大排序名次。 ?...另外有时候会出现相同p情况,比如: p.adjust(c(0.003, 0.005, 0.012, 0.04, 0.058, 0.06), method = 'fdr') 输出: 0.015 0.015

    2.5K20

    多分组差异分析解决方案(2)分批次差异基因后取交集

    主要方法:如果不同分组代表着一定趋势,例如group1,group2,group3样本严重程度越来越重。...那么就可以求group1和group2差异基因,group2和group3差异基因,group1和group3差异基因,最后把三次得到上调差异基因和下调差异基因求交集。...value进行FDR校正 fdr=p.adjust(Pvalue, "BH") # 在原文件后面加入log2FC,p value和FDR,共3; out<- as.data.frame(cbind(...value进行FDR校正 fdr=p.adjust(Pvalue, "BH") # 在原文件后面加入log2FC,p value和FDR,共3; out<- as.data.frame(cbind(...value进行FDR校正 fdr=p.adjust(Pvalue, "BH") # 在原文件后面加入log2FC,p value和FDR,共3; out<- as.data.frame(cbind(

    2.6K30

    使用Clipper控制FDR应对高通量数据分析p失真问题

    FDR 我们往期有许多推文介绍了各种进行多重检验矫正方法,其中就包括了如何计算FDR 一文了解P-value,多重比较,FDR和Q value差别 转录组差异分析PFDR区别有多大 p.value...所以,控制多重比较假阳性是十分必要 常见方法: Bonferroni 校正 直接用p除以进行比较次数就得到校正后p,但这种方法非常保守,一般用于全基因组关联研究 (GWAS) FDR (Benjamini...并提出了一种新计算方法,使用户能在无需计算p情况下直接控制高通量数据分析中假阳性率。...Clipper优势在于无需对数据分布进行参数化假设,从而适用于样本量小情况,避免了p计算难点,并节省了p计算时间 根据文章描述,Clipper可以应用于多个高通量数据分析场景 这里我们挑转录组常用...绝对和clipper打分相关系数比edgeRP高一点,可能因为我们这里基因很少,只有21个所以差别很小 下面是作者文章相关结果: 作者clipper方法和我们常用方法在不同方面做了比较

    35410

    挖掘数据内部联系:相关性分析

    然而对于样本总体分布未知时候我们计算秩相关系数,这时候最常用方法是秩相关检验。与相关系数计算方法对应具有相应检验方法。...),n为独立检验次数,一般为length(p),method为矫正方法,常用方法有"bonferroni"、"holm"、"hochberg"、"hommel"、"BH"、"fdr"、"BY"、"none...校正后p常称为q,使用Benjamini-Hochberg(BH方法校正p也称为错误发现率(false discovery rate,FDR)。...其中mat为数值矩阵,p.adjust为是否需要p校正,p.adjust.method为矫正方法。在某些很重要多重或者多元显著性检验(例如差异基因和物种筛查)中,p校正是必不可少。...n+1):(n+m)]) ecocop=as.matrix(pcorr[1:n, (n+1):(n+m)]) #接下来p用显著性符号表示 sigcor=ecocop sigcor[which(sigcor

    1.3K20

    跟着存档教程动手学RNAseq分析(五):DESeq2基因水平差异表达分析

    z统计量与标准正态分布进行比较,并计算p,报告随机选择出极端至少为观测概率。 如果p很小,我们拒绝零假设,并声明有证据反对零假设(即基因有差异表达)。...FDR/Benjamini-Hochberg: Benjamini和Hochberg(1995)定义了FDR概念,并创建了一种算法,在给定一组独立p情况下,预期FDR控制在指定水平以下。...在DESeq2中,我们对控制FDRBH方法进行了解释,我们基因按p排序,然后每个排序后p乘以m/rank。 q/ Storey法:当该显著时,可以达到最小FDR。...通过FDR截断设置为< 0.05,我们表示,我们预期差异表达基因假阳性比例为5%。例如,如果您将500个基因称为差异表达,FDR截断为0.05,那么预计其中25个是假阳性。...注意:p设置为NA 如果在一行中,所有样本计数为零,则baseMean将为零,log2倍变化估计p-value和调整后p-value都将设置为NA。

    2.2K20

    R语言多重比较示例:Bonferroni校正法和Benjamini & Hochberg法

    P=P×n Bonferroni法非常简单,它缺点在于非常保守(大概是各种方法中最保守了),尤其当n很大时,经过Bonferroni法矫正后总一类错误可能会远远小于既定α。...控制错误发现率:Benjamini & Hochberg法 简称BH法。首先将各P从小到大排序,生成顺序数 排第k矫正P=P×n/k 另外要保证矫正后各检验P大小顺序不发生变化。...方法BH(Benjamini-Hochberg,与R中FDR相同)和BY(Benjamini & Yekutieli)控制错误发现率,这些方法试图控制错误发现期望比例。...请注意,这些方法只需要调整p和要比较p数量。这与Tukey或Dunnett等方法不同,Tukey和Dunnett也需要基础数据变异性。...具有25个p多重比较示例 ### -------------------------------------------------------------- ### 多重比较示例 ### ----

    10.3K40

    用 FastQTL 进行 cis-eQTL 分析

    最简单方案就是用 Bonferroni 法校正 P 。然而由于不同基因组区域特异性以及不同位点等位基因频率和 LD,Bonferroni 方法通常都会过于严格,导致许多假阴性。...为了解决这个问题,一般我们可以分析每种表型数千个置换数据集,以得到这些关联零分布。接着就可以得到这些观察来自零分布可能性,从而得到一个调整后 P 。...p)7.突变与基因之间距离8.p 9.斜率10.用 direct method 得到 permutation p-value11.通过 beta 近似获得 permutation p-value...校正 P 这部分主要涉及从严格到宽松 3 种校正方法。...= p.adjust(d$bpval, method="fdr") # 取 FDR <= 0.1 R> write.table(d[which(d$bh <= 0.10), c(1,6)], "permutations.all.chunks.benjamini.txt

    6.5K21

    热图pheatmap()函数

    数据准备: 此次例子,我们选择了一套GEO数据库肺癌数据,数据编号为GSE19804,120个样本,其中包含60个癌症样本和60个癌旁正常样本,前面我们使用t检验,并对p进行BH校正,筛选fdr小于...clustering_method 表示聚类方法可以是hclust任何一种,如”ward.D”,”single”, “complete”, “average”, “mcquitty”, “median...cluster_rows 表示行是否聚类,可以是FALSE或TRUE clustering_distance_rows 行距离度量方法,如欧氏距离 cutree_rows 行聚类数 treeheight_row...距离度量方法 cutree_cols 聚类数 treeheight_col 聚类树高度,默认为50 gaps_col 对进行分割,就不应对相应进行聚类 #色度条参数 就是热图右上角那个小小长方条...设置小格子为缺失颜色 cellwidth 表示每个小格子宽度 cellheight 表示每个小格子高度 #输出文件参数设置 一般可以直接画好热图以png格式或者pdf格式进行写出 filename

    3.5K30
    领券