首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >SpadeR:多样性指数计算的全家桶

SpadeR:多样性指数计算的全家桶

作者头像
Listenlii-生物信息知识分享
发布于 2020-05-31 08:40:37
发布于 2020-05-31 08:40:37
2.1K00
代码可运行
举报
运行总次数:0
代码可运行

之前也介绍过几个计算多样性的包,包括vegan,iNEXT,fossil等。见

物种数量及多样性的外推

SpadeR是2016年发表的较新的R包,汇集了几乎所有常见的多样性计算和估计的方法,计算基于个体(丰度)数据或基于采样单元(发生率)数据的各种生物多样性指数和相关相似性指标。 里面有很多对原始方法的改进值得注意。如仅chao2就补充了Chao2-bc和ichao2两种更新的改进方法。

安装

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
1install.packages("SpadeR")
2library(SpadeR)

包含6个主要函数

1.ChaoSpecies,估计群落物种多样性

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 1data(ChaoSpeciesData)
 2ChaoSpecies(ChaoSpeciesData$Abu,"abundance",k=10,conf=0.95)
 3#k为稀有物种的丰度阈值,用于计算ACEICE。conf为置信区间。
 4#结果包括三部分。(1)是基本信息,(2)为各种多样性指标,(3)为各种指标的说明。
 5(1) BASIC DATA INFORMATION:
 6
 7                                         Variable Value
 8    Sample size                                 n  1996
 9    Number of observed species                  D    25
10    Coverage estimate for entire dataset        C 0.998
11    CV for entire dataset                      CV 1.916
12    Cut-off point                               k    10
13
14                                                      Variable Value
15    Number of observed individuals for rare group       n_rare    53
16    Number of observed species for rare group           D_rare    11
17    Estimate of the sample coverage for rare group      C_rare 0.943
18    Estimate of CV for rare group in ACE               CV_rare 0.629
19    Estimate of CV1 for rare group in ACE-1           CV1_rare  0.74
20    Number of observed individuals for abundant group   n_abun  1943
21    Number of observed species for abundant group       D_abun    14
22
23NULL
24
25
26(2) SPECIES RICHNESS ESTIMATORS TABLE:
27
28                              Estimate  s.e. 95%Lower 95%Upper
29    Homogeneous Model           25.660 0.954   25.082   30.295
30    Homogeneous (MLE)           25.000 0.975   25.000   28.500
31    Chao1 (Chao, 1984)          27.249 3.394   25.266   44.030
32    Chao1-bc                    25.999 1.817   25.094   35.673
33    iChao1 (Chiu et al. 2014)   27.249 3.394   25.266   44.030
34    ACE (Chao & Lee, 1992)      26.920 2.367   25.292   37.639
35    ACE-1 (Chao & Lee, 1992)    27.399 3.163   25.336   42.153
36    1st order jackknife         27.998 2.449   25.739   37.171
37    2nd order jackknife         28.998 4.240   25.730   46.915
38
39
40(3) DESCRIPTION OF ESTIMATORS/MODELS:
41
42Homogeneous Model: This model assumes that all species have the same incidence or detection probabilities. See Eq. (3.2) of Lee and Chao (1994) or Eq. (12a) in Chao and Chiu (2016b).
43
44Chao2 (Chao, 1987): This approach uses the frequencies of uniques and duplicates to estimate the number of undetected species; see Chao (1987) or Eq. (11a) in Chao and Chiu (2016b).
45
46Chao2-bc: A bias-corrected form for the Chao2 estimator; see Chao (2005).
47
48iChao2: An improved Chao2 estimator; see Chiu et al. (2014).
49
50ICE (Incidence-based Coverage Estimator): A non-parametric estimator originally proposed by Lee and Chao (1994) in the context of capture-recapture data analysis. The observed species are separated as frequent and infrequent species groups;>in the infrequent group are used to estimate the number of undetected species. The estimated CV for species in the infrequent group characterizes the degree of heterogeneity among species incidence probabilities. See Eq. (12b) of Chao and Chiu (2016b), which is an improved version of Eq. (3.18) in Lee and Chao (1994). This model is also called Model(h) in capture-recapture literature where h denotes "heterogeneity".
51
52ICE-1: A modified ICE for highly-heterogeneous cases.
53
541st order jackknife: It uses the frequency of uniques to estimate the number of undetected species; see Burnham and Overton (1978).
55
562nd order jackknife: It uses the frequencies of uniques and duplicates to estimate the number of undetected species; see Burnham and Overton (1978).
57
5895% Confidence interval: A log-transformation is used for all estimators so that the lower bound of the resulting interval is at least the number of observed species. See Chao (1987).

2.Diversity,计算richness, Shannon diversity and Simpson diversity

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 1data(DiversityData)
 2Diversity(DiversityData$Abu,"abundance",q=c(0,0.5,1,1.5,2))
 3#q为多样性阶数
 4#结果分5部分
 5(1) BASIC DATA INFORMATION:
 6                               Variable Value
 7    Sample size                       n   557
 8    Number of observed species        D    69
 9    Estimated sample coverage         C 0.957
10    Estimated CV                     CV 2.237
11
12(2) ESTIMATION OF SPECIES RICHNESS (DIVERSITY OF ORDER 0):
13
14                             Estimate s.e. 95%Lower 95%Upper
15    Chao1 (Chao, 1984)          104.9 20.3     81.8    169.9
16    Chao1-bc                     99.6 16.9     80.1    153.2
17    iChao1                      113.9 12.7     95.1    146.4
18    ACE (Chao & Lee, 1992)       92.1 10.2     79.1    121.8
19    ACE-1 (Chao & Lee, 1992)    100.4 15.7     81.4    148.1
20
21        Descriptions of richness estimators (See Species Part)
22
23(3a) SHANNON ENTROPY:
24
25                        Estimate  s.e. 95%Lower 95%Upper
26     MLE                   3.193 0.065    3.067    3.320
27     Jackknife             3.280 0.070    3.143    3.417
28     Chao & Shen           3.308 0.071    3.168    3.447
29     Chao et al. (2013)    3.293 0.072    3.152    3.433
30
31        MLE: empirical or observed entropy.
32        Jackknife: see Zahl (1977).
33        Chao & Shen: based>2003).
34        see Chao and Shen (2003).
35          Chao et al. (2013): A nearly optimal estimator of Shannon entropy; see Chao et al. (2013).
36          Estimated standard error is computed based>37
38(3b) SHANNON DIVERSITY (EXPONENTIAL OF SHANNON ENTROPY):
39
40                        Estimate  s.e. 95%Lower 95%Upper
41     MLE                  24.372 1.539   21.355   27.388
42     Jackknife            26.573 1.805   23.035   30.111
43     Chao & Shen          27.320 1.895   23.606   31.034
44     Chao et al. (2013)   26.917 1.870   23.251   30.583
45
46(4a) SIMPSON CONCENTRATION INDEX:
47
48          Estimate    s.e. 95%Lower 95%Upper
49     MVUE  0.08328 0.00714  0.06929  0.09728
50     MLE   0.08493 0.00713  0.07096  0.09890
51
52        MVUE: minimum variance unbiased estimator; see Eq. (2.27) of Magurran (1988).
53        MLE: maximum likelihood estimator or empirical index; see Eq. (2.26) of Magurran (1988).
54
55(4b) SIMPSON DIVERSITY (INVERSE OF SIMPSON CONCENTRATION):
56
57          Estimate    s.e. 95%Lower 95%Upper
58     MVUE 12.00729 0.96804 10.10992 13.90465
59     MLE  11.77460 0.92959  9.95262 13.59659
60
61(5) CHAO AND JOST (2015) ESTIMATES OF HILL NUMBERS 
62
63         q ChaoJost 95%Lower 95%Upper Empirical 95%Lower 95%Upper
64     1 0.0  104.935    7.476  202.394    69.000   61.625   76.375
65     2 0.5   53.093   38.499   67.687    41.565   37.267   45.863
66     3 1.0   26.917   23.475   30.359    24.372   21.420   27.324
67     4 1.5   16.411   13.936   18.886    15.806   13.481   18.131
68     5 2.0   12.007   10.006   14.008    11.775    9.854   13.696
69
70        ChaoJost: diversity profile estimator derived by Chao and Jost (2015).
71          Empirical: maximum likelihood estimator (observed index).

3.ChaoShared,计算两群落共有的物种

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
1data(ChaoSharedData)
2ChaoShared(ChaoSharedData$Abu,"abundance",se=TRUE,nboot=200,conf=0.95)
3#结果太多不放了

4.SimilartyPair,计算两群落的相似性指数

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
1data(SimilarityPairData)
2SimilarityPair(SimilarityPairData$Abu,"abundance",nboot=200)
3#结果也很丰富,包括了除Jaccard and Sorensen以外其他多种指标

5.SimilarityMult,计算多个群落的相似性指数

6.Genetics,计算基因数据的等位基因不相似性

感兴趣可以自己试用一下~

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Listenlii 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
5亿百度地图大数据:揭秘北上广深真相
作为一线城市,北上广深人口吸引力分列前四,虽然最近逃离北上广的呼声很高,但大城市毕竟拥有更多的机遇和空间,安放得下年轻人的梦想和野心。紧随其后的是东莞、苏州、成都、重庆、杭州、佛山等城市,这些城市没有北上广的压力,宜居宜业,同样有很大吸引力。此外类似无锡、厦门等一些二三线城市也颇受青睐。 2017年主要城市年度新流入人口数量与城市常驻人口数量呈正相关,相关系数达0.92,即城市常驻人口越多,吸引到的新流入人口也越多;同时通过城市常驻人口。 与新流入人口排名折线图来看,惠州、中山、金华、合肥、嘉兴
钱塘数据
2018/02/28
8260
5亿百度地图大数据:揭秘北上广深真相
大数据迁徙图:逃离北上广,下一站何方?
“做出这个决定,我们考虑了很久。”不久前,高铭离开了工作生活12年的北京,举家回到故乡重庆。“重庆房价比北京便宜得多,孩子上学的问题也好解决。” 高铭的经历并非个案。最近几年,“逃离北上广”成为经久不衰的热门话题。除了高房价和子女教育问题,逃离理由还有雾霾引发的健康问题、户籍门槛带来的不公平感等等。 实际上,长期以来作为“人口抽水机”的一线城市,已隐现人口拐点迹象。据官方统计数据,2015年北京城六区、上海城区常住人口均由正转负,去年北京城六区常住人口再度同比下降3%。 随着一线城市人口疏解工作步入深水区,
钱塘数据
2018/03/06
1.1K0
大数据迁徙图:逃离北上广,下一站何方?
百度地图大数据告诉你一线城市真相
1、第三列里的省会城市南昌、长春、乌鲁木齐、兰州、海口、呼和浩特、西宁是对人口的吸引力较弱。
IT阅读排行榜
2018/08/17
3940
百度地图大数据告诉你一线城市真相
投稿 | 逃离北上广后,程序员都去哪儿了?
根据数据显示,自2007年起,程序员的就业城市选择已经开始从北上广深向新一线城市转移。从2016年第二季度的用工需求来看,二三线城市和新一线城市的同比增长情况均优于一线城市。北上广压力大,程序员选择“
数据猿
2018/04/19
1.3K0
投稿 | 逃离北上广后,程序员都去哪儿了?
深度|猎聘大数据​:北京人才供需及流动全景分析
2017年5月2日,国内领先的中高端人才职业发展平台猎聘发布了《2017年一季度北京人才供需及流动全景报告》。本次报告主要基于猎聘大数据 ,结果显示,在2017年一季度,河北、山东成为北京非京籍人才两大输送地;北京职场人流向上海的比例最多,流向环京城市相对较少,这表明从北京离开的职场人最倾向于选择进入国内其他一线城市。 本次报告大数据证明,在2017年一季度,北京是全国人才需求占比、供给占比最多的城市,也是平均年薪最高的城市。 北京在过去五个季度中人才流动平稳,人才流入率大于流出率,这也从另一方面印证了为什
灯塔大数据
2018/04/08
1.3K0
深度|猎聘大数据​:北京人才供需及流动全景分析
你的城市能否在资本游戏中逆袭?5年投融资数据告诉你答案
关于第一个问题,实际上是城市间人口迁徙问题,有关这个问题数据团已经写过很多篇文章了(例如:一线城市严控人口,我们还能去哪?)。今天让我们换个角度,从钱的视角再来盘点一下全国城市的发展机遇。
DT数据侠
2018/08/08
4060
你的城市能否在资本游戏中逆袭?5年投融资数据告诉你答案
人才流动大数据报告:这个行业最缺人
而在行业和地区的人才流动方面,报告显示,金融行业最能留住人,交通贸易人才流失最严重;杭州最能吸引人才,深圳成都上海留人魅力旗鼓相当。
IT阅读排行榜
2018/08/17
7350
人才流动大数据报告:这个行业最缺人
大数据告诉你哪个城市最幸福,看看你的家乡在第几!
近日,支付宝、知乎、墨迹天气、36氪、高德地图、阿里旅行—去啊、陌陌八个互联网品牌发布城市生活“蓝色幸福”程度报告。报告显示,在150个城市中,上 海、深圳、杭州、广州包揽了“蓝色幸福”的前四名,北京创业、好奇心指数全国第一。“我们认为,城市生活幸福感的一个重要指标是生活的便利和舒适度,因此 空气质量、交通状况、城市智能化程度等权重会相对比较高,这也可能是南方城市幸福感更高的主要因素。”出具这份报告的蚂蚁金服商学院表示。 报告摘要 “蓝色幸福城市排名”TOP5:上海、深圳、杭州、广州、武汉。北京位列第七,交
CDA数据分析师
2018/02/23
7610
大数据告诉你哪个城市最幸福,看看你的家乡在第几!
时空位置与大数据
在这个人人都谈大数据,处处皆用大数据的时代,我们身边的这些大数据究竟如何产生,又有多大的体量了呢?根据一份2013年的报告显示,2013 年中国产生的数据总量超过0.8ZB(相当于8亿TB),2 倍于2012 年,相当于2009 年全球的数据总量。预计到2020 年,中国产生的数据总量将是2013年的10倍,超过8.5ZB。(来源,ZDNET《数据中心2013:硬件重构与软件定义》年度技术报告)
宋天伦
2020/07/16
1.2K0
时空位置与大数据
第一轮返工潮,哪些城市疫情传播压力最大
内容提要:从 2 月 10 日起,多个省份开始正式复工。但在疫情尚未解除警报之时,返工潮带来的人员流动,未免给人口迁入大省造成病毒输入压力。对此,利用大数据分析,有针对性地做好防控,成为各地疫情阻击战中的有力武器。
HyperAI超神经
2020/02/19
6660
第一轮返工潮,哪些城市疫情传播压力最大
国庆如何精准避堵?让大数据报告告诉你!
随着十一黄金周出行高峰的到来,“未堵先知”提前规划路线成为用户的最强“痛点”。9月27日,人民网舆情监测室联合百度共同举办《2016十一出行预测大数据报告》发布会。人民网副总编辑董盟君、百度地图开放平
钱塘数据
2018/03/01
9190
国庆如何精准避堵?让大数据报告告诉你!
数据告诉你:中国城市谁在腾飞?谁在衰落?
2010年的时候,中国人均GDP最高的城市是克拉玛依。这个西北石油小城,那一年的人均GDP是深圳的1.98倍,北京的2.58倍。
IT阅读排行榜
2018/08/17
5910
数据告诉你:中国城市谁在腾飞?谁在衰落?
2021全国青年终身学习指数报告:广东排名第一!
东莞工人爱学“编程”,深圳打工人热衷于精进“PPT画术”,莆田跨境电商学习人数飙升,东北城建水平第一的沈阳“建造工程”课程人气居高不下……11月9日,腾讯课堂发布《2021全国青年终身学习指数报告》(以下简称“报告”),报告展现了全国各地青年热衷学习的职业技能。报告还指出,报告期内全国学习人数持续提升,达到疫情前的2.17倍,尤其是中西部地区增速领先全国,“小镇青年”访问在线终身学习平台占比提升至41.7%,直追一线。 长三角学习人数全国第一 四川学习人数增速全国第一 长三角与粤港澳大湾区是目前我国开
鹅老师
2021/11/10
4150
数据解读 | 压垮我的不是加班,而是通勤
通勤是上班族每个工作日都要经历的过程。它可以影响你以怎样的心情开始一天的工作,也可以影响你带着什么感受踏入家门。
CDA数据分析师
2019/05/15
4030
数据解读 | 压垮我的不是加班,而是通勤
清华发布全国城市AI实力榜,你那里排名第几?
李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI AI哪里搞得好? 经济基础不能忽略,群众基础也很重要。 有人说首都北京永远第一,有人觉得深圳才是王者,也有人举出上海、杭州和广州……抑或认
量子位
2018/03/21
1.1K0
清华发布全国城市AI实力榜,你那里排名第几?
大数据是否开放,将决定你住的城市“聪不聪明”
你住的城市称得上“智慧城市”吗?大数据的开放和智慧城市有怎样的关系?5月19日举办的数据侠实验室第14期活动,DT君带你一起走进第一财经技术与创新大会“开放数据与中国最智慧城市”圆桌论坛,看看业界的数据大牛如何看待数据开放在智慧城市建设中的角色。
DT数据侠
2018/08/08
4970
大数据是否开放,将决定你住的城市“聪不聪明”
钱都去了哪些城市?——资本也用脚投票
关于第一个问题,实际上是城市间人口迁徙问题,有关这个问题数据团已经写过很多篇文章了(例如:一线城市严控人口,我们还能去哪?)。今天让我们换个角度,从钱的视角再来盘点一下全国城市的发展机遇。
IT阅读排行榜
2018/08/17
5470
钱都去了哪些城市?——资本也用脚投票
荐读|百度地图大数据拯救危在旦夕的小长假
世界那么大,我想去看看;路上那么堵,想想都痛苦!说好的看遍祖国的大好河山,结果不过是堵在路上看窗外车海一片。没错,五一小长假妥妥地成了五一堵车节。 景区人多拍照难、看三分钟堵三小时、高速变慢速路,甚至
灯塔大数据
2018/04/08
7570
荐读|百度地图大数据拯救危在旦夕的小长假
百度和长沙合作背后 :智能城市轮廓初现
10月29日,百度与长沙市人民政府、湖南湘江新区管委会达成全面合作,双方将依托百度Apollo平台生态资源和长沙智能网联产业基础,共建“自动驾驶与车路协同创新示范城市”,将长沙打造为自动驾驶之城。
罗超频道
2018/12/05
6120
2018年新零售城市发展指数报告,效率决定城市未来!
在消费升级的大趋势下,新零售通过人-货-场的重构,成为城市进行消费升级的重要着力点,也逐渐成为衡量城市竞争力的一个重要指标。
场景录小程序
2018/08/06
5570
2018年新零售城市发展指数报告,效率决定城市未来!
推荐阅读
相关推荐
5亿百度地图大数据:揭秘北上广深真相
更多 >
交个朋友
加入腾讯云官网粉丝站
蹲全网底价单品 享第一手活动信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档