前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >组间差异分析:Anosim

组间差异分析:Anosim

作者头像
SYSU星空
发布于 2022-05-05 05:51:20
发布于 2022-05-05 05:51:20
2.3K015
代码可运行
举报
运行总次数:15
代码可运行
无论是野外环境样品,还是室内试验样品,一般我们都会设置样方或平行样来增强分析的准确性,必要时还会进行区组设计,因此在数据分析中需要进行组间差异的比较判别。然而对于微生物群落数据,由于物种繁多,而且不同物种的敏感环境因子不同,因此基于正态分布的参数检验难以满足分析需要,要进行多元非参数检验(non-parametric multivariate statistical tests)来计算显著性,R语言vegan包含有多种非参数检验方法,包括Anosim、Adonis、MRPP等,不同方法在统计量的选择、零模型等方面存在差异。

Anosim分析(Analysis of similarities)是一种基于置换检验和秩和检验的非参数检验方法,用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义。Anosim分析使用距离进行分析,默认为method="bray",可以选择其他距离(和vegdist()函数相同),也可以直接使用距离矩阵进行分析。在R中我们可以使用vegan包中的anosim()函数进行分析,这里我们微生物群落数据为例进行分析:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#读取抽平后的OTU_table和环境因子信息
data=read.csv("otu_table.csv", header=TRUE, row.names=1)
envir=read.table("environment.txt", header=TRUE)
rownames(envir)=envir[,1]
env=envir[,-1]
#筛选高丰度物种并将物种数据标准化
means=apply(data, 1, mean)
otu=data[names(means[means>10]),]
otu=t(otu)
#根据地理距离聚类
kms=kmeans(env, centers=3, nstart=22)
Position=factor(kms$cluster)
#进行Anosim分析
library(vegan)
anosim=anosim(otu, Position, permutations=999)
summary(anosim)

上图中的ANOSIM statistic R为Anosim检验的统计量,他的分布衡量的就是零模型的分布,Upper quantiles of permutations就是通过999次置换获得的统计量的分位数。具体说来,Anosim分析的原理是先计算样品两两之间的距离,将样品两两之间的距离按照从小到大进行排序并计算排名(秩,r),并根据距离的归类(属于组间距离还是组内距离)来计算组间距离秩的均值rb与组内距离秩的均值rw之差作为统计量:

假如R>0,说明组内距离小于组间距离,也即分组是有效的,这与方差分析中比较组内方差与组间方差来判断的原理是类似的。由上面分析结果可以看到R=0.4613,大于零模型99%分位数0.290,因此p值为0.001,结果是显著的。我们可以提取分析结果,如下为距离的秩:

因为有22个样品,所以应该有C(22, 2)=231个距离。如下为上述距离对应的归属:

现在我们根据这个排序归类进行可视化:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mycol=c(52,619,453,71,134,448,548,655,574,36,544,89,120,131,596,147,576)
mycol=colors()[mycol]
par(mar=c(5,5,5,5))
result=paste("R=",anosim$statistic,"p=", anosim$signif)
boxplot(anosim$dis.rank~anosim$class.vec, pch="+", col=mycol, range=1, boxwex=0.5, notch=TRUE, ylab="Bray-Curtis Rank", main="Bray-Curtis Anosim", sub=result)

作图结果如下所示:

设置参数notch=TRUE后会在箱子的两边绘制凹槽来显示中位数的置信区间,从而便于对中位数进行比较。可以看出第二组分组效果较差,但总体来说分组是有效的。

示例数据下载链接:

链接:https://pan.baidu.com/s/1X0W-ns8kSdwzyliycYwV8A

提取码:65pc

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 微生态与微进化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!
了解了基本概念 方差分析中的“元”和“因素”是什么? 下面我们看下PERMANOVA。
生信宝典
2022/01/18
1.7K0
这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!
组间差异分析:Adonis
通常我们在做假设检验的时候,是看一个分组变量(也即因子型变量)对某个数值变量的影响,这时候我们针对数据特征可以选择合适的检验方法(详见往期文章R中的假设检验方法),如下所示:
SYSU星空
2022/05/05
6.3K0
组间差异分析:Adonis
Mantel Test
在一次课题组师兄汇报的时候,我第一听说了Mantel Test,当时第一眼就被这个漂亮的图形所吸引,所以就想着以后也能用到自己的文章里,便自己花时间了解了下。
曼亚灿
2023/05/18
5.7K0
Mantel Test
组间差异分析:MRPP
MRPP分析即多重响应排列程序(Multiple ResponsePermutation Procedure),使用方法与Anosim类似,用于分析组间微生物群落结构的差异是否显著,通常可以配合PCA、PCoA、NMDS等降维图使用。MRPP的研究原理是通过置换把所有观察对象统一分成各种可能的组合情况,构造统计量δ:
SYSU星空
2022/05/05
2.3K0
组间差异分析:MRPP
Mantel test 对两个矩阵相关关系的检验
Mantel test 是对两个矩阵相关关系的检验,由Nathan Mantel在1976年提出。之所以抛开相关系数发展这样一种方法,是因为相关系数只能处理两列数据之间的相关性,而在面对两个矩阵之间的相关性时就束手无策。Mantel检验专治这种不服。
拴小林
2021/07/30
3.6K0
Mantel test 对两个矩阵相关关系的检验
分析样本差异:β多样性距离
β多样性是指在一个梯度上从一个生境到另一个生境所发生的多样性变化的速率和范围,它是研究群落之间的种多度关系。不同群落或某环境梯度上不同点之间的共有种越少,β多样性越大。精确地测定β多样性具有重要的意义。这是因为:①可以用来指示物种被生境隔离的程度;②可以用来度量生物多样性沿生境变化范围;③β多样性与α多样性一起构成了总体多样性或一定地段的生物异质性。
SYSU星空
2022/05/05
4.2K0
分析样本差异:β多样性距离
R语言实现PCOA分析
大家对主成分分析(principal components analysis, PCA) 都很熟悉,但是今天我们来介绍下主坐标分析(principal coordinate analysis, PCoA)。那么这两个差了个o字母具体有什么区别?首先PCA是常用的降维算法;利用线性变换,将数据变换到一个新的坐标系统中;然后再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上。这种降维的思想首先减少数据集的维数,同时还保持数据集的对方差贡献最大的特征,最终使数据直观呈现在二维坐标系。PCoA主要是探索数据相似度或者相异度可视化方法。可呈现研究数据相似性或差异性的可视化坐标,是一种非约束性的数据降维分析方法,可用来研究样本群落组成的相似性或相异性。其实通俗的讲,PCA主要是基于原始数据矩阵的降维;PCoA主要是基于样本的原始数据计算出来的距离矩阵的降维。如果样本数目比较多,而物种数目比较少,那肯定首选PCA;如果样本数目比较少,而物种数目比较多,那肯定首选PCoA。
一粒沙
2019/12/19
11K1
Stegen(基于βNTI和RCbray)的群落构建方法
相信只要是做过群落构建(community assembly processes)对这张图都不会陌生。
Listenlii-生物信息知识分享
2020/11/19
15.5K0
Stegen(基于βNTI和RCbray)的群落构建方法
解密微生物群中的相互作用
我们的世界由复杂的微生物群落构成,这些微生物群落不仅仅是独立个体的集合,更是相互连接的生态群落复合体,这些生态群落会互相交流、共同生存和进化。微生物群的相互作用不仅限于微生物群落之间,还存在于微生物和它们的宿主之间,已有许多研究表明他们在宿主的发育、代谢、体内平衡和免疫中起着关键作用。虽然健康人的微生物组也十分多变,但研究发现微生物群落组成的失衡与不良的宿主反应有关,有时还与严重的病理反应有关,例如,腹泻、糖尿病、结肠直肠癌、炎症性肠病、肠易激综合征和肥胖症等等。
生信菜鸟团
2020/10/23
2K0
解密微生物群中的相互作用
画一个带统计检验的PCoA分析结果
PERMANOVA原理解释:这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!
生信宝典
2022/01/18
1.2K0
画一个带统计检验的PCoA分析结果
组间差异分析:Metastats
在不同区组中寻找差异物种常用的两个工具是Metastats和LEfSe。抛开这两个工具本身,从算法原理上来说,Metastats实际上是非参数多重检验和p值校正的整合,而LEfSe则是Metastats和LDA判别的整合。当然,由于Metastats采用的非参数t检验,只能分析两个分组;而LEfSe则因为使用的Kruskal-Wallis秩和检验可以分析两个以上的分组。当我们明白了他们的原理,实际上可以不用拘泥于两个工具本身,可以自己在R中选择合适的方法来进行分析。
SYSU星空
2022/05/05
1.5K0
组间差异分析:Metastats
层次聚类与聚类树
在生态学研究当中,有些环境中的对象是连续(或者离散)的,而有些对象是不连续的,聚类的目的是识别在环境中不连续的对象子集,从而探索隐藏在数据背后的属性特征。聚类分析主要处理那些对象有足够的相似性被归于一组,并且确定组与组之间的差异或分离程度。聚类可以分为特征聚类(Vector Clustering)和图聚类(Graph Clustering)。特征聚类是指根据对象的特征向量矩阵来计算距离或者相关性来实现聚类,例如各种层次聚类和非层次聚类。而图聚类则针对的是复杂网络数据,有随机游走、贪心策略、标签传播等算法等。
SYSU星空
2022/05/05
1.5K0
层次聚类与聚类树
一文学会PCA/PCoA相关统计检验(PERMANOVA)和可视化
试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平 (通常用于3个或更多水平时;如果只有2个水平考虑T-test);若试验中只有一个因素改变则称为单因素试验,若有两个因素改变则称为双因素试验,若有多个因素改变则称为多因素试验。
生信宝典
2021/10/11
10.6K0
物种Beta多样性PCoA分析
前面我们已经给大家介绍过来自 nature communications 杂志的高颜值小提琴图:《NC杂志同款高颜值小提琴图》以及《nature communications 杂志同款三元图:Ternary plots》,今天来学习PCoA分析,文献还是《A highly conserved core bacterial microbiota with nitrogen-fixation capacity inhabits the xylem sap in maize plants》,图片如下:
生信技能树
2025/02/05
2970
物种Beta多样性PCoA分析
聚类树的合并展示
层次聚类(hierarchical clustering)就是通过对数据集按照某种方法进行层次分解,直到满足某种条件为止,常用的方法有UPGMA、ward.D2等。聚类树是层次聚类最常用的可视化方法,我们可通过比较聚类来确定最佳分类,详见往期文章层次聚类与聚类树和比较聚类。
SYSU星空
2022/05/05
5440
聚类树的合并展示
Microbiome: 标准化和微生物差异丰度策略取决于数据特征
https://link.springer.com/article/10.1186/s40168-017-0237-y
Listenlii-生物信息知识分享
2021/07/30
2.6K0
非度量多维排列 NMDS (Non-metric multidimensional scaling)分析
多维排列 (Multidimensional scaling,MDS)是可视化多变量样品(如多个物种丰度、多个基因表达)相似性水平的一种方法。其基于距离矩阵进行一系列的排序分析。
生信宝典
2022/01/18
6K0
非度量多维排列 NMDS (Non-metric multidimensional scaling)分析
一些R代码学习笔记
可用rarefy得到结果后在ggplot里自己画。核心是设定一个步长,这些步长都用rarefy函数进行重抽,再组合到一起即可。
Listenlii-生物信息知识分享
2020/06/01
2.8K0
一些R代码学习笔记
扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
作者: 刘永鑫 日期:2017-6-29 阅读时长:10 min 背景介绍(Introduction) 宏基因组学 宏基因组学目前的主要研究方法包括:16S/ITS/18S扩增子、宏基因组、宏转录组和代谢组,其中以扩增子研究最为广泛。 目的意义 本系列文章将带领大家结合较新的16S扩增子相关文献,来理解宏基因组16S扩增子文章中常用图表种类、图中包括的基本信息,以及作者想表达的结果。 主要内容 本系列文章内容包括:箱线图、散点图、热图、曼哈顿图、维恩图、三元图和网络图等。 学习思路 罗列知识点,熟悉专业
生信宝典
2018/02/05
3.5K0
扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
你的adonis用对了吗?不同因素的顺序竟然对结果有很大影响
PERMANOVA原理解释:这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!
生信宝典
2022/01/18
2.6K0
相关推荐
这个统计检验可用于判断PCA/PCoA等的分群效果是否显著!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验