大家好,我是邓飞。
在GWAS项目分析时,我们会得到所有位点的P值,那么如何确定显著性阈值呢?确定阈值分为了不同的流派。
1,Bonferroni矫正
这种方法应用最多,一般是N表示参与分析的SNP的个数,阈值可以是:
* 1/N
* 0.05/N
* 0.01/N
文章中前两种用得较多,这种方法比较严格,有时候1/N也没有显著性位点,这时候,可以考虑降低N的个数。
2,降低N的个数
由于SNP之间有连锁,可以通过LD筛选,用剩余SNP作为N,从而达到降低阈值的目的,比如使用plink命令 --indep-pairwise 50 10 0.2筛选LD,用剩余的位点作为N,来计算阈值。
3,置换检验(permutation)
该方法通过置换检验,比如1000次置换检验,然后将最小值排序,选择5%的值作为阈值,该方法从数学角度应该是更合理的方法,具体操作:
a1 正常进行GWAS分析,得到P值结果
a2 将表型数据随机排列,比如排列1000次,得到1000个数据集
a3 对1000个数据集进行gwas分析,得到P值
a4 对P值提取最小的值,得到1000个值,选择5%的值作为阈值
注意:上面的这些方法,不会改变原始P值的排名,如果你是要挖掘数据,直接根据原始的P值筛选,进行后面的验证也可以,但是没有显著性的话,可靠性较差。