Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >地理加权回归模型_arcgis栅格数据归一化0到1

地理加权回归模型_arcgis栅格数据归一化0到1

作者头像
全栈程序员站长
发布于 2022-11-10 07:44:51
发布于 2022-11-10 07:44:51
1.6K0
举报

从这一章开始进入实际操作环节……首先还是用ArcGIS,毕竟这个东西比较容易。

实际上要说起来,GWR有专门的软件,叫做GWR,但是这个软件暂时我还没有用过,所以等我先学习一下,把他放到最后才说了,先用比较熟悉的,比如ArcGIS、比如R语言,这些来讲讲(还有一个我非常熟悉的软件是GEODA,可惜GEODA仅支持回归分析,不支持地理加权回归)。

数据还是用上次山东的那一份,在番外篇中,用财政收入作为因变量,自变量选择工业总产值,消费品零售额,总出口以及固定资产投资作为自变量,完成了OLS回归分析,然后进行了残差可视化,有兴趣的同学去翻翻以前的文章:

白话空间统计二十三回归分析番外:残差可视化

看看要进行分析的数据:

下面先来解释一下ArcGIS提供给我们的GWR工具的各个参数设置:

地理加权回归分析工具的位置,在空间统计工具箱——空间关系建模工具集——地理加权回归工具(如下所示:)

下面是各个参数的意义(话说这一部分在ArcGIS帮助文档里面都有的,但是我知道要让大家像虾神这样(变态)无聊,把ArcGIS帮助文档放到手机上,还是有点勉为其难,所以这这里写了)

虾神私人推介……有兴趣做空间统计的,可以把ArcGIS的帮助文档拷贝到手机上……很多APP都直接直接打开chm格式的。

工具界面如下:

1、输入要素: ArcGIS的空间统计工具箱,主要针对的是矢量数据,所以这里的输入一定是矢量图层,可以是点线面,但是不能是多点(但是可以是多部分要素,因为对面状空间要素处理的时候,通常采用的是质心来进行计算,多部分面状要素不会影响GWR的处理)。 在要素类的设定上,应该避免有空间错误的数据:比如有属性无空间要素,如果出现这样的数据,可能会发生错误。 在制作数据的时候,尽量把需要使用的数据都合并到一个要素类中,每一个变量(应、自)都应该是一列独立的数据,而且一定不能出现空值(如果出现了空值,或者表示空值的0值,首先就要将这行数据从分析样本中移除,或者补全之后在使用。 使用的变量中,尽量不要使用哑元(dummy,ArcGIS的官方翻译中,把这个词翻译成“哑元”,实际上在实际上在计量经济学里面,把它称为:虚拟变量(dummy variable),意思是表示该变量只能表示“有”和“无”这两种情况,在计算机里面常备称为二值化变量,即放到模型中就只有1和0两个值,比如该时间发生了,就记为1,没发生就记为0。在计量经济学里面,dummy variable是很重要的一个概念,大家有兴趣自己去查询相关资料,这里为了保持上下文一致,我使用ArcGIS的翻译方法,把这个东东继续叫做“哑元”) 因为在使用二值化的时候,到底哪个类别为0,那个类别为1,是可以任意设置的(比如前进和后退,可以认为前进设置为1,后退设置为0,也可以反向设置,后退为1,前进为0)不管如何设置,都不会影响检验的结果。在GWR中,如果使用哑元作为某个变量的值,会导致分析中出现严重的多重共线性。 空间统计分析里面,空间关系概念一旦涉及“距离”的时候,尽量使用投影坐标系,当然,如果使用经纬度,对分析的过程不会产生多大影响,但是对分析的结果会有一些影响(特别是对核带宽进行设置的时候)。 (关于输入要素的其他情况,有兴趣的时候专门开一篇数据处理来讲……这里先直接略过了)

2、因变量字段。 这个字段包含因变量的值,一个回归方程只能有一个因变量,没啥好说的。注意别使用哑元就好了。

3、解释变量(自变量)字段。 包含了解释变量的字段,最少一个。系统会自动筛选掉文本型的数据,只保留数值型。但是不筛选哑元值,所以需要自行设置。 另外,自变量的顺序和分析的结果没有任何关系。

4、输出结果 用户承载分析结果的要素图层,分析结果的解读后面会详细说。

5、核的类型 此参数并非是让我们选择核函数(ArcGIS只提供了高斯核函数,没得选),这参数是让我们决定核函数如何构成?分析的数据用什么方式来参与。 工具提供两种核函数: FIXED :固定距离法,也就是按照一定的距离来选择带宽,创建核表面 ADAPTIVE :自适应法。按照要素样本分布的疏密,来创建核表面,如果要素分布紧密,则核表面覆盖的范围小,反之则大。 默认会使用固定方式,因为固定方式能够生成更加平滑的核表面。 6、核带宽 此参数用于设定GWR的带宽,通过以前的文章,我们知道带宽的选择非常关键,而且GWR专门用两种方式来选择更好的带宽,但是也留出了自定义的模式,所以这个参数有三个选项: CV:通过交叉验证法来决定最佳带宽。 AIC:通过最小信息准则来决定最佳带宽。 BANDWIDTH_PARAMETER :指定宽度或者临近要素数目的方法。如果选择这种方法,后面的7\8两个参数,才变为可用状态。如果选择CV或者AIC法,带宽是通过计算来决定的,所以距离参数将不可用。而采用指定的方法,我们可以通过自定义的方式,来决定带宽 为什么需要留出这样一个可以自定义带宽的参数呢?因为CV法和AIC法,都是系统计算出来的带宽,特别是AIC法,可能能够达到很好的拟合度,但是回归是不是拟合度越高越好呢?这就不一定了,特别很多时候选择不同的带宽,可以揭示更多的细节的时候。 关于这个问题,可以参考下面的文章: 白话空间统计二十一:密度分析(五) 7、距离(可选) 如果在参数6中,选择了自定义带宽模式,那么这个参数就变为可用了。注意,这里设定的带宽距离单位,是要素类的空间参考中的单位,如果你是经纬度的话,这里设定的也是经纬度(设置为1,就是1度,在中国范围内,约为108公里左右),所以如果要更精确,最好把数据投影为投影坐标系。

8、临近要素的数目(可选) 如果核类型为自适应(ADAPTIVE),以及核带宽为BANDWIDTH_PARAMETER的时候,此参数才为可用,默认是30,表示选择回归点周边的30个点作为核局部带宽中作为临近要素的点。

9:权重字段(可选): 本工具可以对每个要素设置独立的权重,把这个将要设定的权重写入一个字段,然后设置到此就行。 一旦设置了权重,就说明这个(些)要素在进行校验的时候,会比其他要素更加重要。 在很多时候,独立设置的权重有着很重大的意义。如下图所示:

要用4个区域的钾含量要进行计算,那么就从四个区域布点进行采样,用采样的平均值来作为每个区域的含量值,可以看见A区域足足布置了20个采样点,D区域3个,BC分别都是2个,这样来说,A区域的钾含量是20个点的平均值,在四个区域里面,A区域的钾含量最接近平稳值,所以在计算的时候,我们可以把每个区域的采样点数放到一个字段里面,作为这个区域的权重——这样来说,在计算的时候A区域的数据,比其他几个区域的数据具有更大的影响力。

具体的参数就先说到这里,GWR后面还有一系列的扩展参数,下一节我们再继续说。

待续未完。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/184894.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月7日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
gis地理加权回归步骤_地理加权回归权重
上一节我们讲了GLR广义线性回归,它是一种全局模型,可以构造出最佳描述研究区域中整体数据关系的方程。如果这些关系在研究区域中是一致的,则 GLR 回归方程可以对这些关系进行很好的建模。不过,当这些关系在研究区域的不同位置具有不同的表现形式时,回归方程在很大程度上为现有关系混合的平均值;如果这些关系表示两个极值,那么全局平均值将不能为任何一个极值构建出很好的模型。当解释变量表现出不稳定的关系(例如人口变量可能是研究中某些地区911呼叫量的重要影响因子,但在其他地区可能是较弱的影响因子,这就是不平稳的表现)时,全局模型通常会失效。
全栈程序员站长
2022/11/08
3.2K0
gis地理加权回归步骤_地理加权回归权重
地理加权分析_地理加权回归中的拟合度
地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的:
全栈程序员站长
2022/11/08
1.6K0
地理加权分析_地理加权回归中的拟合度
地理加权回归简易总结
空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。
全栈程序员站长
2022/11/10
3.3K0
地理加权回归简易总结
arcgis多因子加权叠加分析_arcgis栅格数据矢量化
近期无论是开发者大会,还是个人工作,相当的忙,所以停了一段时间……不过地理加权回归写到第七章,自我感觉也差不多了,无论是基础理论还是来历,包括基础参数的意义,都应该介绍得比较清楚了,当然,后面可能是大家更关心的内容,也就是在ArcGIS(或者其他软件里面),怎么去执行地理加权回归,执行完成之后,生成的结果又如何解读?
全栈程序员站长
2022/11/08
2.6K0
arcgis多因子加权叠加分析_arcgis栅格数据矢量化
ArcGIS与地理加权回归GWR【一】「建议收藏」
https://mp.weixin.qq.com/s/fMPYxO3G7ff2192ZQICN-A
全栈程序员站长
2022/11/08
1.4K0
ArcGIS与地理加权回归GWR【一】「建议收藏」
空间回归与地理加权_地理加权回归处理点数据
大家好,又见面了,我是你们的朋友全栈君。 本章有数学公式……对数学过敏者慎入……
全栈程序员站长
2022/11/08
1.8K0
空间回归与地理加权_地理加权回归处理点数据
初步了解MGWR:多尺度地理加权回归的Python实现
在探索空间数据时,我们经常会遇到空间异质性这一概念。简而言之,空间异质性描述了某一属性或过程在空间上的不均匀分布。为了理解和建模这种异质性,地理加权回归(GWR)成为了一个强大的工具。但GWR有一个基本假设:所有被建模的过程都在同一空间尺度上运行。这在现实中并不总是成立,因此,多尺度GWR(MGWR)应运而生,放宽了这一假设。Python中的mgwr库为我们提供了实现这两种方法的工具。
renhai
2024/06/03
2.8K0
初步了解MGWR:多尺度地理加权回归的Python实现
空间回归与地理加权_地理加权显著性
本来这一章准备直接写(照抄)ArcGIS的帮助文档,写地理加权回归工具的使用……,然后就直接结束地理加权回归的,但是近来收到不少同学的邮件,很多都是掉在了当年虾神挖出的大坑里面,比如写了方法,没有列出公式,又比如写了公式木有推导过程(……作为高数战五渣的虾神,推导这种事,他认识我,我不认识他……)
全栈程序员站长
2022/11/08
1.6K0
空间回归与地理加权_地理加权显著性
空间回归与地理加权_时空地理加权回归对样本量要求
大家好,又见面了,我是你们的朋友全栈君。 实际上,除了辅助表以外,GWR还会生成一份全要素的表。对回归的每一个样本都给出相应的信息,今天就来看看这些信息代表了什么内容。
全栈程序员站长
2022/11/09
1.2K0
空间回归与地理加权_时空地理加权回归对样本量要求
白话空间统计二十四:地理加权回归(一)
大家好,又见面了,我是你们的朋友全栈君。 二十四在人的生活中有举足轻重的地位,一年有二十四个节气,一天有二十四个小时。中国的正史称之为“二十四史”(有人说加清史就二十五了……但是正史这个词,出自清乾隆钦定二十四史,所以一直“正史”这个词,专指二十四史),白话空间统计写到现在,历时18个月,终于写到这个一元复始的二十四章了。
全栈程序员站长
2022/11/08
1.7K0
白话空间统计二十四:地理加权回归(一)
利用python实现地理加权回归(GWR)与网约车订单数据挖掘
说到地理加权回归,相信大家肯定不会陌生。作为一种先进的空间数据分析技术,地理加权回归能够充分捕捉空间关系的非平稳性。举个简单的不恰当的例子,我们要对中国各个城市的奢侈品消费量与人均收入进行建模。正常的的理解是人均收入越高,奢侈品消费量就越大,在全国各个城市都应该是这种关系(这也正是全局模型的前提假设)。但事实真的是这样吗?现实情况可能是在一些比较张扬的地方(比如我们大东百
DataCharm
2021/02/22
5.1K5
利用python实现地理加权回归(GWR)与网约车订单数据挖掘
python怎么读取xlsx文件_arcgis地理加权回归
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/185297.html原文链接:https://javaforall.cn
全栈程序员站长
2022/09/27
6680
详解:7大经典回归模型
来源:csdn 深度学习爱好者本文约2900字,建议阅读5分钟本文给大家介绍机器学习建模中7大经典的回归分析模型。 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下来的部分详细
数据派THU
2023/04/18
1.3K0
详解:7大经典回归模型
你应该掌握的七种回归技术
【编者按】回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种最常用的回归技术及其关键要素,最后介绍了选择正确的回归模型的关键因素。 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归
用户1737318
2018/06/05
8030
【临床研究】一个你无法逃避的问题:多元回归分析中的变量筛选
临床模型研究,说到底是做一个模型,那么模型应该如何纳入自变量,纳入哪些自变量,这都是至关重要的问题。线性回归,逻辑回归和Cox比例风险回归模型是被广泛使用的多元回归分析方法。我们在前面的几篇文章中解释过他们的统计学意义、应用及结果释义。但是我们很少讨论自变量筛选的方法,这些方法在数据分析和撰写论文时应用较为混乱,却十分重要。本集整理并总结了前沿的自变量筛选方法,我们来一观究竟。
用户6317549
2020/05/15
11.7K1
ArcGIS空间插值:回归克里格与普通克里格方法
  本文介绍基于ArcMap软件,实现普通克里格、回归克里格方法的空间插值的具体操作。
疯狂学习GIS
2023/09/27
2K0
ArcGIS空间插值:回归克里格与普通克里格方法
数据分析之回归分析
回归,最初是遗传学中的一个名词,是由生物学家兼统计学家高尔顿首先提出来的。他在研究人类的身高时,发现高个子回归于人口的平均身高,而矮个子则从另一个方向回归于人口的平均身高。
黄成甲
2018/09/12
3.7K0
数据分析之回归分析
【学习】让你欲罢不能的回归分析
本文解释了回归分析及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种最常用的回归技术及其关键要素,最后介绍了选择正确的回归模型的关键因素 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/
小莹莹
2018/04/20
1.2K0
【学习】让你欲罢不能的回归分析
spgwr | R语言与地理加权回归(Ⅰ-1):线性地理加权回归[通俗易懂]
地理加权回归(Geographically Weighted Regression, GWR)经过多年发展,已经具备了多种形式,在R语言中也对应着多个工具包,其中spgwr是一个开发较早、比较经典的工具包,功能也相对基础。
全栈程序员站长
2022/11/10
1.1K0
spgwr | R语言与地理加权回归(Ⅰ-1):线性地理加权回归[通俗易懂]
【独家】一文读懂回归分析
本文字数为10000字,阅读全文约需25分钟 本文为回归分析学习笔记。 前言 1.“回归”一词的由来 我们不必在“回归”一词上费太多脑筋。英国著名统计学家弗朗西斯·高尔顿(Francis Galton,1822—1911)是最先应用统计方法研究两个变量之间关系问题的人。“回归”一词就是由他引入的。他对父母身高与儿女身高之间的关系很感兴趣,并致力于此方面的研究。高尔顿发现,虽然有一个趋势:父母高,儿女也高;父母矮,儿女也矮,但从平均意义上说,给定父母的身高,儿女的身高却趋同于或者说回归于总人口的平均身
数据派THU
2018/01/29
3.7K0
推荐阅读
相关推荐
gis地理加权回归步骤_地理加权回归权重
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档