小编之前写过一篇推送 使用clusterProfiler对非模式生物进行富集分析,教大家使用clusterProfiler中的enricher函数进行富集分析。
专属于六倍体小麦的注释包。
此注释包是基于iwgsc_refseqv1.1版本的基因号制作的,GO注释来源于
https://doi.org/10.5281/zenodo.2541477。
制作好的注释包已上传至github,可以使用下面的代码安装。
## 安装注释包
install.packages("https://media.githubusercontent.com/media/biozhp/org.Ta.eg.db/master/org.Ta.eg.db.tar.gz", repos=NULL, type="source")
由于我还是个新手,所以还不太了解怎么压缩R包的大小,导致目前版本的R包有些大,下载需要一些时间,后续我会继续改进的~
一系列的操作后,R包就安装好啦~
接下来试着用注释包做富集分析。
## 加载R包
library("clusterProfiler")
library("org.Ta.eg.db")
## 输入基因
gene <- read.table("gene.txt",header=F,sep="\t")
gene <- as.factor(gene$V1)
## 进行富集分析
org <- org.Ta.eg.db
enrich.go.BP <- enrichGO(gene=gene, OrgDb=org, keyType="GID",ont="BP", pvalueCutoff = 0.01, qvalueCutoff = 0.05)
## 对 GO term进行去冗余
simply <- simplify(enrich.go.BP)
## 输出结果
ouf <- paste("output.txt",sep ="\t")
write.table(simply,ouf)
测试后发现可以正常使用,没有问题~
目前这个R包还只是一个测试版本,大家完成自己的分析后还是要仔细检查一下自己的结果有没有问题。
如果在使用过程中出现任何问题或者有任何建议,都可以写在https://github.com/biozhp/org.Ta.eg.db/issues 上,或者给我发邮件。
做小麦的同学赶快下载下来试一下吧~
参考资料:
https://www.jianshu.com/p/77246ff36214