Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >QIIME2得到PICRUSt2结果后如何分析

QIIME2得到PICRUSt2结果后如何分析

作者头像
Listenlii-生物信息知识分享
发布于 2022-07-30 06:04:39
发布于 2022-07-30 06:04:39
1.3K20
代码可运行
举报
运行总次数:0
代码可运行

作者:聋言瞎面

审核:Listenlii


本文主要解决的问题:

1、QIIME2做完PICRUSt2后,只输出pathway id,如何比对得到pathway description?

2、PICRUSt2得到结果后,再怎么分析?


1. pathway ID --- pathway description

PICRUSt2结果输出后,会得到基于KEGG及MetaCyc的通路预测。KEGG是2011年的版本了,就建议不要用了。

所以以下介绍MetaCyc:直接用PICRUSt2软件做的话会直接输出pathway description,而在QIIME2里做则需要下面的方法。

读入metacyc官网下载的pathway id及描述文件

下载地址:

https://metacyc.org/group?id=biocyc17-61025-3865826896

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
id <- read_csv("All-pathways-of-MetaCyc.txt",col_names = T)
dsct <- read_delim("All-pathways-of-MetaCyc-2.txt",col_names = T,delim = "\t") #注意使用read_csv读取的行数有错误!
id_dsct <- cbind(id,dsct = dsct$Pathways)
保存所有的metacyc数据库的pathway id及通路描述
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
write.table(id_dsct,file = "all_metacyc_id_dsct.tsv",row.names = F,col.names = T,quote = F,sep ="\t")
导入pcirust2的输出结果:
1、导出所有的id,输入到metacyc数据库;
2、把id替换成描述,输出STAMP的输入文件
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pic_output <- read_tsv("feature-table.biom.tsv",col_names = T)
metacyc_input <- pic_output$`OTU-ID`
write.table(metacyc_input,file = "metacyc_input.tsv",row.names = F,col.names = F,quote = F,sep ="\t")

stamp_input <- merge(pic_output,id_dsct,all.x = T,by.x = "OTU-ID",by.y = "Pathways")
write.table(stamp_input,file = "stamp_input.tsv",row.names = F,col.names = F,quote = F,sep ="\t")

2. PICRUSt2得到结果后,再怎么办?

最后的输出结果也是组成型数据,所以。。。首先我们知道没有最好的统计模型了;其次,各种多元统计分析是不是可以搞一搞了?差异通路是不是可以STAMP、ANCOM、ALDEx2都试试?

怎么解释就看你自己了。可以结合下面的层级树逐一层级查看你所关注的通路。

同时也可以创建自己筛选出的差异通路表。

链接如下:https://metacyc.org/smarttables

(花10s注册账号后,把上面生成的metacyc_input.tsv导入后,可以生成mysmarttables,然后你就可以点点点点点。。。

因为本人只是瞎点,也没有完全会用这个smarttable,就不班门弄斧了,我觉得参照上面的层级树就行。想深入学习见这个视频教程:

https://biocyc.org/webinar.shtml)

下图展示如何导入metacyc_input.tsv

最后,本周大半时间搭在这上面踩坑,希望本文能给大家科研路上以帮助;

感谢“需要鼓励的小昱”的指导。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Listenlii 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
2 条评论
热度
最新
非常感谢你分享了这篇有用的文章!不过,如果你正在使用PICRUSt2做功能预测分析,我想向你介绍一个非常好用的R包——ggpicrust2。ggpicrust2整合了通路名称/描述注释、十种最先进的差异丰度(DA)方法以及DA结果的可视化。它可以帮助你更好地理解和处理PICRUSt2输出的数据,而且它还提供了多种可视化选项,包括热图和条形图等。如果你正在使用PICRUSt2,并想要更好地理解和处理输出的数据,那么ggpicrust2绝对值得一试!你可以在Github和CRAN上找到它,链接分别为 https://github.com/cafferychen777/ggpicrust2
非常感谢你分享了这篇有用的文章!不过,如果你正在使用PICRUSt2做功能预测分析,我想向你介绍一个非常好用的R包——ggpicrust2。ggpicrust2整合了通路名称/描述注释、十种最先进的差异丰度(DA)方法以及DA结果的可视化。它可以帮助你更好地理解和处理PICRUSt2输出的数据,而且它还提供了多种可视化选项,包括热图和条形图等。如果你正在使用PICRUSt2,并想要更好地理解和处理输出的数据,那么ggpicrust2绝对值得一试!你可以在Github和CRAN上找到它,链接分别为 https://github.com/cafferychen777/ggpicrust2
11点赞举报
你好,我是最近也在做PICRUSt2功能预测分析,利用了R包:ggpicrust2,过程中遇到了一些问题,可以向您请教吗
你好,我是最近也在做PICRUSt2功能预测分析,利用了R包:ggpicrust2,过程中遇到了一些问题,可以向您请教吗
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
qiime2+picrust1学习笔记
一直迷惑于如何把qiime2和picrust结合起来用来分析16S的数据,直到这两天,看到了微生太公众号的视频教程,才有了眉目,原来如此。详细视频教程可以查找相关公众号获得。前面看到picrust2已经处于beta状态了,其可以嵌入于qiime2中,使用更方便,可是我的试用结果却差强人意,或许是我的使用过程有问题,16G内存的要求一般的电脑也难以实现。之前使用picrust1网页版(Galaxy平台,不是三星的那个,是个生物信息云平台软件系统)分析的效果还可以,于是决定用picrust1再试试。发现pcirust在今年6月份更新了1.1.4版。
用户1075469
2020/03/03
1.3K0
[翻译]q2 picrust2 教程
picrust2 beta既可以单独安装,也可以以qiime2-PICRUST2插件方式安装和使用,两者都可以在linux和Mac上运行,windows请使用虚拟机。
用户1075469
2020/03/03
3.4K0
RNA-seq 保姆教程:差异表达分析(二)
工作流程完成后,您现在可以使用基因计数表作为 DESeq2 的输入,使用 R 语言进行统计分析。
数据科学工厂
2023/02/27
1.1K0
RNA-seq 保姆教程:差异表达分析(二)
基因集富集分析(GSEA)及其可视化
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是是一种计算方法,用于确定事先定义的一组基因是否在不同的样品中差异表达。
青青青山
2022/07/04
7.1K0
基因集富集分析(GSEA)及其可视化
数据分析:基于STAR+FeatureCounts的RNA-seq分析全流程流程
分析流程涉及到众多的软件以及R包等,为了更方便配置该环境,建议使用anaconda软件安装。anaconda是包管理工具,可以将软件作为其包进行安装管理,并且可以设置多个环境,方便不同依赖环境的软件在同一台机器安装。安装anaconda方法见网上教程。
生信学习者
2024/07/05
6180
如何读取单细胞数据
注:同方法二,如果没有 “all.datatable.txt” 的文件,也可忽略此步骤。这里只是提供多种情况下的读入方法。(想尝试的话,方法一有生成 “all.datatable.txt” 的代码,不过要注意路径。)
生信技能树jimmy
2020/06/23
5.5K0
Picrust2预测真菌群落功能
place_seqs.py -s ITS.fasta -o placed_seqs.tre -p 20 --intermediate placement_working --ref_dir /softwares/miniconda3/envs/picrust2/lib/python3.6/site-packages/picrust2/default_files/fungi/fungi_ITS/
Listenlii-生物信息知识分享
2021/08/27
1.9K0
Picrust2预测真菌群落功能
转换OTU表和序列文件为PICRUST2需要的格式
一个问题,如果想分别分析稀有种和优势种得功能,是整个跑Picrust之后再挑出不同类型的物种,还是先挑出不同类型物种再做分析?
Listenlii-生物信息知识分享
2022/07/30
1.1K0
转换OTU表和序列文件为PICRUST2需要的格式
QIIME2学习笔记(二)
这次不用测试数据了,用实际数据跑一下,所以同样重复之前的步骤,把fastq文件压缩下,然后,生成样本数据列表(ps.不知道fastq文件不压缩可不可以用,有空试下)。依然参考自上篇的统计咨询公众号的文章代码如下:
用户1075469
2020/03/03
9040
巧用R语言实现各种常用的数据输入与输出
将数据输入或加载到R工作空间中,是使用R进行数据分析的第一步。R语言支持读取众多格式的数据文件,excel文件,csv文件,txt文件和数据库(MYSQL数据库)等;其中,excel和csv是我们最常遇到的数据文件格式。
1480
2019/06/19
7.8K2
巧用R语言实现各种常用的数据输入与输出
新技能Get!宏基因组分析结果导入qiime2分析和可视化
最近读微生态公众号中宏基因组的文章,发现阿童木写的教程,宏基因组的数据可以导入qiime2分析。于是有了发现新大陆的感觉,qiime2是一个优秀的可视化工具,有它在手,分析不愁呀,可是作者并没有给出怎样导入数据的教程,我摸索了一番,基本解决了问题,欢迎交流呀!数据是使用biobakery的流程得到的metaphlan3的结果,如下图所示:
用户1075469
2021/05/20
1.5K0
超大文本文件如何快速读取以及写入到硬盘
这样的话, 我们就不得不把在R里面的变量,写出到硬盘,成为文件。感觉是在使用一个独立的网页工具。。。。
生信技能树
2023/09/25
4030
超大文本文件如何快速读取以及写入到硬盘
R语言的数据导入与导出(write.table,CAT)
福尔·摩斯曾说过:“数据,数据,没有数据的推理是罪恶!”不过比起有意思的统计分析,数据的导入与导出显得十分的无趣,但是不得不说统计分析的数据导入与导出是个让人沮丧的任务,而且耗时巨大。 今天分享的是R中数据的输出与一些特定格式的数据读入。 一、数据的输出 R中提供了write.table(),cat()等函数来导出数据。不过值得指出的是R语言能够导出的数据格式是有限的,比如在基本包中,我们能够导出数据的格式只有txt,csv。 现在介绍一下两个函数的用法: write.table(x, file = “”
学到老
2018/03/16
4.2K0
识别差异微生物的方法汇总
现在 Nearing, Douglas et al. Nature Comm. Microbiome differential abundance methods produce different results across 38 datasets.文章对常用的差异分析方法做了基准测试,本文将不同方法的核心代码记录下来。
生信学习者
2024/06/17
3090
识别差异微生物的方法汇总
CNS图表复现15—inferCNV流程输入数据差异大揭秘
CNS图表复现之旅前面我们已经进行了14讲,你可以点击图表复现话题回顾。如果你感兴趣也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。
生信技能树jimmy
2020/11/02
2.7K0
CNS图表复现15—inferCNV流程输入数据差异大揭秘
R优雅的进行代谢组KEGG富集分析
安装R包 library(tidyverse) library(magrittr) library(clusterProfiler) 导入KEGG数据库注释文件 keggannotation <- read_tsv("pathway",col_names = F) %>% left_join(.,read_tsv('map.txt',col_names = F),by="X1") %>% select(-1) %>% set_colnames(c("pathway","ID")) %>%
R语言数据分析指南
2022/09/21
6.5K3
R优雅的进行代谢组KEGG富集分析
ChIP-Seq 分析流程-下游(2)
https://mp.weixin.qq.com/s/7gADGKEthliI-1viN1FC7w
生信菜鸟团
2025/02/25
2550
ChIP-Seq 分析流程-下游(2)
数据分析-cuttag分析流程分享3-个性化分析内容
在进行了前面两次的流程分析,目前已经得到了bedgarph文件和peak文件,需要在后面对peak文件进行相关的分析,主要有差异peak分析、peak的注释、注释基因的富集分析以及motif分析,我做了几次,发现里面的坑还是很多的。
小胡子刺猬的生信学习123
2022/04/06
5.7K6
数据分析-cuttag分析流程分享3-个性化分析内容
cytoscape的cytohubba及MCODE插件寻找子网络hub基因
不过,好在我有一千多学员,一百多个学徒,给他们安排的作业就是写这些简单软件操作指南,这样就弥补了我写不来太基础教程的弱点。
生信技能树
2020/02/20
24.3K1
跟着Nature学数据分析:R语言peer包处理RNAseq分析的批次效应
https://www.nature.com/articles/s41586-022-04808-9
用户7010445
2023/08/23
1.6K0
跟着Nature学数据分析:R语言peer包处理RNAseq分析的批次效应
相关推荐
qiime2+picrust1学习笔记
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验