最近看到一个发表在Bioinformatics期刊的R包ggpicrust2,可以对picrust2结果进行可视化。 文章网址:https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btad470/7234609
ggpicrust2建议采用PICRUSt2原始输出pred_metagenome_unstrat.tsv的数据格式,无需重新格式化。csv和txt也是可以接受的。 此外,它能够支持已转换为PICRUSt2输出格式的文件,保证了对各种数据源的兼容性和灵活性。
直系同源分类(KO)是由KEGG数据库开发的分类系统。它采用分层结构,根据酶催化的反应对酶进行分类。 为了更好地理解通路在不同分组中的作用并对通路进行分类,可以将KO丰度表转换为KEGG通路丰度。 ko2kegg_abundance()可以进行转换。
差异丰度(DA)分析在PICRUSt2下游分析中起主要作用,pathway_daa()整合了几乎所有适用于预测功能谱的DA方法。 包括ALDEx2、DEseq2、Maaslin2、LinDA、edgeR、limma voom、metagenomeSeq、lefser。 pathway_daa()提供了一种便捷的方式来运行这些方法并比较结果。 compare_daa_results()可以用来比较使用不同方法得到的具有统计学意义的特征的一致性。有助于研究人员选择最适合他们的数据集和研究问题的方法。
文章附表S1提供了各种DA方法的简要比较和描述,我进行了简单翻译:
pathway_annotation()可以从注释表中对KO、EC、MetaCyc通路描述进行注释。该函数可用于注释PICRUSt2的输出文件或pathway_daa()的输出表。
PICRUSt2主流的可视化方式有bar_plot、error_bar_plot、pca_plot、heatmap_plot。 pathway_errorbar可以显示组间的相对丰度差异以及由DA结果得到的log2倍变化和p值,pathway_pca()可以通过主成分分析显示降维后的差异。 pathway_heatmap()可以将PICRUSt2输出数据中的模式可视化。
ggpicrust()是pathway_daa()、pathway_annotation()、pathway_errorbar()、ko2kegg_abundance()的整合函数。一步到位出结果。
compare_metagenome_results()分析和比较来自不同方法和测序宏基因组的功能预测。它接受宏基因组计数矩阵的列表。该功能串联了所有的宏基因组计数矩阵,创建新的样本元数据,执行DA,并计算每对宏基因组之间的Spearman相关系数和相应的p值。
https://github.com/cafferychen777/ggpicrust2
需要安装的包太多了,我就没有全部跑一遍。感兴趣可以自行探索。