Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >白话空间统计之:Moran’s I(莫兰指数)

白话空间统计之:Moran’s I(莫兰指数)

作者头像
全栈程序员站长
发布于 2022-09-12 09:33:57
发布于 2022-09-12 09:33:57
12.6K0
举报

大家好,又见面了,我是你们的朋友全栈君。前两天聊了空间统计学里面的两个经典概念,今天来说说第一篇文章留下的大坑: Moran’s I 。

首先,Moran’s I这个东西,官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰(Patrick Alfred PierceMoran)(好长的名字,不过一般都简称为:帕克·莫兰,就是下图这位中年帅哥了),在1950年提出的。这一年,朝鲜战争爆发。

莫兰同学1917年出生在澳大利亚的悉尼,后来考入了剑桥大学,第二次世界大战的时候,加入了盟军,并且因为在数学和物理学上面的特长,被安排在剑桥大学的外弹道学实验室(External Ballistics Laboratory)负责火箭的研究工作。战争结束后,任教于牛津大学,并且就在牛津任教期间,提出了关于莫兰指数的问题。

另外再加一点点小花絮,莫兰同学终生未获得博士学位,但是据他晚年回忆,他似乎对这个事情一直感到骄傲(自己并非博士,但是带出了无数的博士生)。

那么莫兰指数到底是个啥东西呢?莫兰指数一般是用来度量空间相关性的一个重要指标。

一般说来,莫兰指数分为全局莫兰指数(GlobalMoran’s I)和安瑟伦局部莫兰指数(AnselinLocal Moran’s I)后者是美国亚利桑那州立大学地理与规划学院院长Luc Anselin教授在1995年提出的,后面我们会说到。

今天就简单说说全局莫兰指数,也是狭义上的莫兰指数。

莫兰指数是一个有理数,经过方差归一化之后,它的值会被归一化到–1.0——1.0之间。(如果有喜欢看数学公式的,我最后贴出了全局莫兰指数的计算公式,这里是科普性质的,我就不贴数学公式来虐待大家的大脑了。

当然,这个归一化是一般的情况,根据某些特殊的情况,也会计算出一些不在这个范围内的值,最后来讨论为什么会超出这个范围。

全局莫兰指数计算完成之后,全部的要素,就会给出你一个关于全部数据的相关性的数值(反之,局部莫兰指数,就每个要素都会给你一个相关性数值了,这个以后在说)。所以我们可以根据他给出的值,来看当前你需要计算的数据结果了。

Moran’s I >0表示空间正相关性,其值越大,空间相关性越明显,Moran’s I <0表示空间负相关性,其值越小,空间差异越大,否则,Moran’s I = 0,空间呈随机性。

这里需要注意一下啊,空间差异和空间异质性是不同的概念。

空间差异(spatialdisparity)是指不同地域范畴因为(社会、经济等)发展水平及其结构不同,而产生的差异。

而空间异质性(spatialheterogeneity)是指因为空间位置的不同而引发的获取到不同的数据。

所以二者切不可混为一谈。

最后,我们们来看看,什么叫做正相关,什么叫做负相关。

所谓的相关,就是指相互关系,正相关,就是随着自变量的增长,应变量也随着增长,比如虾神的年纪和血压,就是标准的正相关……。而负相关当然就是相反了,随着自变量的增长而减少,比如虾神的年纪和体力……

那么空间上面的正相关,就是指随着空间分布位置(距离)的聚集,相关性就也就越发显著。空间上的负相关就正好相反了,随着空间分布位置的离散,反而相关性变得显著了。

像如下我采用中国行政区划计算出来的结果:

整个图表可以看出来,人口数和患病的人数,都与空间信息成正相关,就是说,空间分布聚集度大的地方,人口数和患病人数也相应多。

但是可以看见的,患病人数,随着时间推移,他的莫兰指数在上升,而人口数随着年份,莫兰指数在下降,这说明了中国人口的数量慢慢的与空间分布的相关性在减弱,而患病人数与空间分布的相关性在增加。

当然,莫兰指数只是在衡量空间相关性时候的一个重要指标,并不完全能够代表空间相关性,还需要有其他的数据进行验证和综合考量。

下面部分部分仅供不怕死脑细胞的同学参考:(来源于ArcGIS for Destkop的帮助文档)

1、全局莫兰指数的公式:

2、刚才讨论了,莫兰指数一般是在 –1——1之间,那么有时候突然算出来超出这个区间的数据,是怎么回事呢?是不是软件出了bug?

答案是和软件bug无关。

通常,Global Moran’s I 指数介于 -1.0 到 1.0 之间。是只有对我们权重进行了行标准化(行标准化的意思,就是在做空间距离矩阵的时候,对矩阵中的每一行,求和后,每个元素除以所在行元素之和这种标准化操作)时才会这样。如果没有对权重进行行标准化处理,则指数值可能会落在-1.0 到 1.0 的范围之外,这表示参数设置有问题。最常见的问题如下:

  1. 输入的数据严重偏斜(创建数据值的直方图可了解此情况),空间关系的概念化或距离范围的设置使得某些要素的相邻要素非常少。Global Moran’s I 统计量是渐进正态的,这意味着,对于偏斜数据,每个要素至少需要具有 8 个相邻要素。为距离范围或距离阈值参数计算的默认值可确保每个要素至少具有 1 个相邻要素,但这可能不够,尤其是在输入数据中的有的值出现严重偏斜时。
  2. 使用反距离空间关系的概念化,并且反距离非常小。

关于反距离过小的问题,是因为在选择反距离的幂的时候,为了突出拉伸,选择了一个过高的幂,这样就会把反距离(距离的倒数)变得非常的小。看下面关于反距离中幂的说明:

3.未选择行标准化,但应选择。除非聚合方案与所分析的字段直接相关,否则,只要对数据进行了聚合处理,就应选择行标准化。

好,关于全局莫兰值的介绍今天先到这里,下次我们来看看在ArcGIS里面如何使用这个工具来进行计算。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/153049.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
莫兰指数(Moran’s I)的小总结
莫兰指数分为全局莫兰指数(Global Moran’s I)和局部莫兰指数(Local Moran’s I),前者是Patrick Alfred Pierce Moran开发的空间自相关的度量;后者是美国亚利桑那州立大学地理与规划学院院长 Luc Anselin 教授在1995年提出的。
全栈程序员站长
2022/09/12
5.8K0
莫兰指数(Moran’s I)的小总结
白话空间统计番外:再谈莫兰指数(Moran’s I)
大家好,又见面了,我是你们的朋友全栈君。以前写文章的时候,有些过于草率,本来以为作为科普,把这个名词告诉大家就可以了,结果应该是这个东西国内的科普性文章太少,很多同学都拿来做入门读物了,而且还多次阅读,读着读着,就发现,虾神你文章里面好多坑啊……该说的没有说清楚,关键还有很多说错的地方…… 每次遇见这种情况,我都想这样:
全栈程序员站长
2022/09/12
1.9K0
白话空间统计番外:再谈莫兰指数(Moran’s I)
空间分析 | 莫兰指数的计算
根据百度百科的定义是“空间自相关系数的一种,其值分布在[-1,1],用于判别空间是否存在自相关。”
全栈程序员站长
2022/09/12
5.9K0
空间分析 | 莫兰指数的计算
【ArcGIS】基础教程:全域莫兰指数与局域莫兰指数的计算
莫兰指数(Moran’s I)是研究变量在同一个分布区内的观测数据之间潜在的相互依赖性的一个重要研究指标,在本文中,我们将探讨局域(Anselin Local Moran I)与全域两种莫兰指数(Moran I)计算在Arcgis中的实现。 作者才疏学浅,如有任何错误欢迎指正。
全栈程序员站长
2022/09/07
10.9K1
【ArcGIS】基础教程:全域莫兰指数与局域莫兰指数的计算
全局莫兰指数_空间自相关 | 莫兰指数
空间自相关:是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性。其中,自相关中的“自”表示当你进行相关性观察统计量,是来源于不同对象的同一属性。Tobler(1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”。
全栈程序员站长
2022/09/12
1.8K0
白话空间统计二十四:地理加权回归(一)
大家好,又见面了,我是你们的朋友全栈君。 二十四在人的生活中有举足轻重的地位,一年有二十四个节气,一天有二十四个小时。中国的正史称之为“二十四史”(有人说加清史就二十五了……但是正史这个词,出自清乾隆钦定二十四史,所以一直“正史”这个词,专指二十四史),白话空间统计写到现在,历时18个月,终于写到这个一元复始的二十四章了。
全栈程序员站长
2022/11/08
1.6K0
白话空间统计二十四:地理加权回归(一)
Mantel Test
在一次课题组师兄汇报的时候,我第一听说了Mantel Test,当时第一眼就被这个漂亮的图形所吸引,所以就想着以后也能用到自己的文章里,便自己花时间了解了下。
曼亚灿
2023/05/18
6K0
Mantel Test
Stata计算莫兰指数基本步骤
之前的博客有介绍过R和Geoda计算莫兰指数的方法,考虑到有时候我们需要自定义空间权重矩阵来计算莫兰指数,那以上两种方法显得有点复杂。所以,今天来分享Stata计算莫兰指数的方法~
全栈程序员站长
2022/09/12
7K1
Stata计算莫兰指数基本步骤
Andrew Ng机器学习课程笔记--week6(精度&召回率)
Advice for applying machine learning 本周主要学习如何提升算法效率,以及如何判断学习算法在什么时候表现的很糟糕和如何debug我们的学习算法。为了让学习算法表现更好,我们还会学习如何解决处理偏态数据(skewed data)。 以下内容部分参考我爱公开课-Advice for applying machine learning 一、内容概要 Evaluating a learning algorithm Deciding what to try next(决定接下
marsggbo
2018/01/23
1.2K0
Andrew Ng机器学习课程笔记--week6(精度&召回率)
空间多组 | NG | 使用多组学和生态空间分析对组织状态进行量化表征
◉ 多组学空间分析整合了空间组学数据(例如,CODEX、MIBI、IMC和MERFISH)与单细胞数据集(例如,scRNA-seq和scATAC-seq),使用算法如MaxFuse22。◉ 该框架设计得非常通用,允许利用各种其他数据整合方法以适应不同的分析需求。◉ 这种整合丰富了空间组学数据,并创建了用于下游分析的虚拟多组学空间剖面。◉ 接下来是邻域识别,通过将每个细胞的k最近邻(k-NN)中的多组学信息聚合成邻域特征向量(NFV),捕捉局部细胞环境。◉ k-NN基于空间距离确定。◉ 计算不同类型的NFV,包括细胞组成、局部平均蛋白质表达和局部平均RNA表达(通过scRNA-seq数据的虚拟匹配)。◉ 这些NFV作为聚类的基础,以识别不同的、保守的细胞邻域。◉ MESA进行差异表达分析和GSEA以获得对识别出的细胞邻域的功能性见解。◉ 生态学启发的空间分析使用MDI量化不同空间尺度上的多样性变化。◉ 它的工作原理是将组织样本划分为不同大小的斑块,评估每个斑块内的多样性,并随后计算对应于每个尺度的平均多样性得分。◉ MDI测量跨尺度的多样性变化率:低MDI值表示跨尺度的细胞多样性一致,较高的值表明更多样性的变化,这可能意味着某些细胞类型在组织中的分布不均。◉ 为了表示这一点,MESA通过计算局部斑块的熵生成一个多样性热图。◉ 基于多样性热图,GDI评估具有相似多样性的斑块之间的空间相邻性,而LDI则识别多样性热点(由高多样性定义的区域)和冷点(由低多样性定义的区域)。◉ MESA通过检查这些区域内的细胞类型盛行度和共存情况来分析热点和冷点,有可能揭示在整个组织中考虑时可能不明显的模式。◉ DPI衡量热点和冷点之间的空间接近性和大小关系,较高值表示较大的且更接近的多样性斑块。◉ 由BioRender创建。
生信菜鸟团
2025/05/09
810
空间多组 | NG | 使用多组学和生态空间分析对组织状态进行量化表征
独家 | 每个数据科学家都应该熟悉的 5 个统计学悖论
摘要:统计是数据科学的一个重要部分,它为我们分析和理解数据提供了各种工具和技术。然而,有时通过统计得出的结果会违背我们的直觉,甚至自相矛盾,从而引起人们的困惑与误解。在这篇博客里,我们将探讨每个数据科学工作者都应该熟悉的5个统计学悖论。我们也将解释每个悖论是什么,为什么会发生,以及如何避免落入它的常见陷阱。读完本博客,你将对统计分析中可能出现的一些奇怪和预想之外的结果有更好的理解,从而能更好地在项目中处理它们。
数据派THU
2023/09/07
6490
独家 | 每个数据科学家都应该熟悉的 5 个统计学悖论
Nature子刊:大脑在局部区域的结构-功能耦合的遗传度与个体差异
白质结构连接支持了功能激活或功能连接的底层基础。结构和功能连接分布之间的关系,被称为SC-FC耦合,目前已经在全脑、全连接组水平上进行了研究,但很少有研究在区域尺度上研究这种关系。在本文中使用来自人类连接组计划的扩散加权MRI和静息态功能MRI数据量化了健康年轻成人在局部脑区水平的SC-FC耦合,并研究了SC-FC耦合是否可遗传以及SC-FC耦合的个体差异。
用户1279583
2022/02/28
9560
Nature子刊:大脑在局部区域的结构-功能耦合的遗传度与个体差异
Stata做空间杜宾模型、莫兰指数等操作
以下内容完全由本人在实际操作中搜集整理总结得到,很细致的介绍:从如何在stata中导入数据,怎么定义面板数据,再到如何做局部和全局空间相关性检验(莫兰指数)和空间杜宾模型等。
全栈程序员站长
2022/09/07
1.6K0
Stata做空间杜宾模型、莫兰指数等操作
数据分析实战:利用python对心脏病数据集进行分析
今天在kaggle上看到一个心脏病数据(数据集下载地址和源码见文末),那么借此深入分析一下。
Python进阶者
2020/06/19
2.8K0
数据分析实战:利用python对心脏病数据集进行分析
Python Monte Carlo K-Means聚类实战研究|附代码数据
在本文中,188个国家基于这19个社会经济指标聚集在一起,使用Python实现的蒙特卡罗K-Means聚类算法。通过将类似国家分组在一起并对其进行概括,聚类可以减少发现有吸引力投资机会所需的工作量
拓端
2023/07/03
3160
地理加权回归简易总结
空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。
全栈程序员站长
2022/11/10
3.3K0
地理加权回归简易总结
空间回归与地理加权_地理加权回归处理点数据
大家好,又见面了,我是你们的朋友全栈君。 本章有数学公式……对数学过敏者慎入……
全栈程序员站长
2022/11/08
1.8K0
空间回归与地理加权_地理加权回归处理点数据
Nat. Med. | 成年人的城市生活环境对心理健康的影响
今天为大家介绍的是来自Jiayuan Xu和Gunter Schumann团队的一篇论文。城市居民暴露于许多可能相互结合和相互作用的环境因素,这些因素可能影响心理健康。目前尚未有工作尝试建模城市生活的复杂实际暴露与大脑和心理健康之间的关系,以及这如何受遗传因素调节。利用来自英国生物库(UK Biobank)的156,075名参与者的数据,作者研究了研究城市环境与精神病症状之间的关系。
DrugAI
2023/11/13
3170
Nat. Med. | 成年人的城市生活环境对心理健康的影响
Neurology:早期、未用药帕金森病存在特异的白质连接
神经影像研究认为PD(帕金森症)是一种网络失连接综合征,并可通过网络神经科学方法进行研究。网络神经科学将大脑从结构与功能上看作大尺度神经网络。该方法假设脑区之间的解剖连接与功能交互的异常,会引起网络功能的障碍。近期基于图论的研究发现,早期PD的功能连接组受到模块化破坏,虽然白质连接发生微小改变,但结构组织仍旧相对保留。因此,重要的是我们需要了解众所周知的解剖网络的固有变异性是否构成了早期PD中未检测到的结构异常的基础。此外,PD的病理和症状异质性可能影响发现一致的疾病相关结构变化的能力,尤其是在PD疾病的早期阶段。
用户1279583
2020/02/24
1.1K0
人口统计
《“十四五”新型城镇化实施方案》提出围绕提升城市治理能力智慧化水平提高数字政府服务能力。推行城市数据一网通用、城市运行一网统管、政务服务一网通办、公共服务一网通享,增强城市运行管理、决策辅助和应急处置能力。构建“人、企、地、物、政”五张城市基础要素全景图。
HT for Web
2022/10/28
6140
相关推荐
莫兰指数(Moran’s I)的小总结
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档