Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >地理加权回归模型_arcgis栅格数据归一化0到1

地理加权回归模型_arcgis栅格数据归一化0到1

作者头像
全栈程序员站长
发布于 2022-11-10 07:44:51
发布于 2022-11-10 07:44:51
1.6K0
举报

从这一章开始进入实际操作环节……首先还是用ArcGIS,毕竟这个东西比较容易。

实际上要说起来,GWR有专门的软件,叫做GWR,但是这个软件暂时我还没有用过,所以等我先学习一下,把他放到最后才说了,先用比较熟悉的,比如ArcGIS、比如R语言,这些来讲讲(还有一个我非常熟悉的软件是GEODA,可惜GEODA仅支持回归分析,不支持地理加权回归)。

数据还是用上次山东的那一份,在番外篇中,用财政收入作为因变量,自变量选择工业总产值,消费品零售额,总出口以及固定资产投资作为自变量,完成了OLS回归分析,然后进行了残差可视化,有兴趣的同学去翻翻以前的文章:

白话空间统计二十三回归分析番外:残差可视化

看看要进行分析的数据:

下面先来解释一下ArcGIS提供给我们的GWR工具的各个参数设置:

地理加权回归分析工具的位置,在空间统计工具箱——空间关系建模工具集——地理加权回归工具(如下所示:)

下面是各个参数的意义(话说这一部分在ArcGIS帮助文档里面都有的,但是我知道要让大家像虾神这样(变态)无聊,把ArcGIS帮助文档放到手机上,还是有点勉为其难,所以这这里写了)

虾神私人推介……有兴趣做空间统计的,可以把ArcGIS的帮助文档拷贝到手机上……很多APP都直接直接打开chm格式的。

工具界面如下:

1、输入要素: ArcGIS的空间统计工具箱,主要针对的是矢量数据,所以这里的输入一定是矢量图层,可以是点线面,但是不能是多点(但是可以是多部分要素,因为对面状空间要素处理的时候,通常采用的是质心来进行计算,多部分面状要素不会影响GWR的处理)。 在要素类的设定上,应该避免有空间错误的数据:比如有属性无空间要素,如果出现这样的数据,可能会发生错误。 在制作数据的时候,尽量把需要使用的数据都合并到一个要素类中,每一个变量(应、自)都应该是一列独立的数据,而且一定不能出现空值(如果出现了空值,或者表示空值的0值,首先就要将这行数据从分析样本中移除,或者补全之后在使用。 使用的变量中,尽量不要使用哑元(dummy,ArcGIS的官方翻译中,把这个词翻译成“哑元”,实际上在实际上在计量经济学里面,把它称为:虚拟变量(dummy variable),意思是表示该变量只能表示“有”和“无”这两种情况,在计算机里面常备称为二值化变量,即放到模型中就只有1和0两个值,比如该时间发生了,就记为1,没发生就记为0。在计量经济学里面,dummy variable是很重要的一个概念,大家有兴趣自己去查询相关资料,这里为了保持上下文一致,我使用ArcGIS的翻译方法,把这个东东继续叫做“哑元”) 因为在使用二值化的时候,到底哪个类别为0,那个类别为1,是可以任意设置的(比如前进和后退,可以认为前进设置为1,后退设置为0,也可以反向设置,后退为1,前进为0)不管如何设置,都不会影响检验的结果。在GWR中,如果使用哑元作为某个变量的值,会导致分析中出现严重的多重共线性。 空间统计分析里面,空间关系概念一旦涉及“距离”的时候,尽量使用投影坐标系,当然,如果使用经纬度,对分析的过程不会产生多大影响,但是对分析的结果会有一些影响(特别是对核带宽进行设置的时候)。 (关于输入要素的其他情况,有兴趣的时候专门开一篇数据处理来讲……这里先直接略过了)

2、因变量字段。 这个字段包含因变量的值,一个回归方程只能有一个因变量,没啥好说的。注意别使用哑元就好了。

3、解释变量(自变量)字段。 包含了解释变量的字段,最少一个。系统会自动筛选掉文本型的数据,只保留数值型。但是不筛选哑元值,所以需要自行设置。 另外,自变量的顺序和分析的结果没有任何关系。

4、输出结果 用户承载分析结果的要素图层,分析结果的解读后面会详细说。

5、核的类型 此参数并非是让我们选择核函数(ArcGIS只提供了高斯核函数,没得选),这参数是让我们决定核函数如何构成?分析的数据用什么方式来参与。 工具提供两种核函数: FIXED :固定距离法,也就是按照一定的距离来选择带宽,创建核表面 ADAPTIVE :自适应法。按照要素样本分布的疏密,来创建核表面,如果要素分布紧密,则核表面覆盖的范围小,反之则大。 默认会使用固定方式,因为固定方式能够生成更加平滑的核表面。 6、核带宽 此参数用于设定GWR的带宽,通过以前的文章,我们知道带宽的选择非常关键,而且GWR专门用两种方式来选择更好的带宽,但是也留出了自定义的模式,所以这个参数有三个选项: CV:通过交叉验证法来决定最佳带宽。 AIC:通过最小信息准则来决定最佳带宽。 BANDWIDTH_PARAMETER :指定宽度或者临近要素数目的方法。如果选择这种方法,后面的7\8两个参数,才变为可用状态。如果选择CV或者AIC法,带宽是通过计算来决定的,所以距离参数将不可用。而采用指定的方法,我们可以通过自定义的方式,来决定带宽 为什么需要留出这样一个可以自定义带宽的参数呢?因为CV法和AIC法,都是系统计算出来的带宽,特别是AIC法,可能能够达到很好的拟合度,但是回归是不是拟合度越高越好呢?这就不一定了,特别很多时候选择不同的带宽,可以揭示更多的细节的时候。 关于这个问题,可以参考下面的文章: 白话空间统计二十一:密度分析(五) 7、距离(可选) 如果在参数6中,选择了自定义带宽模式,那么这个参数就变为可用了。注意,这里设定的带宽距离单位,是要素类的空间参考中的单位,如果你是经纬度的话,这里设定的也是经纬度(设置为1,就是1度,在中国范围内,约为108公里左右),所以如果要更精确,最好把数据投影为投影坐标系。

8、临近要素的数目(可选) 如果核类型为自适应(ADAPTIVE),以及核带宽为BANDWIDTH_PARAMETER的时候,此参数才为可用,默认是30,表示选择回归点周边的30个点作为核局部带宽中作为临近要素的点。

9:权重字段(可选): 本工具可以对每个要素设置独立的权重,把这个将要设定的权重写入一个字段,然后设置到此就行。 一旦设置了权重,就说明这个(些)要素在进行校验的时候,会比其他要素更加重要。 在很多时候,独立设置的权重有着很重大的意义。如下图所示:

要用4个区域的钾含量要进行计算,那么就从四个区域布点进行采样,用采样的平均值来作为每个区域的含量值,可以看见A区域足足布置了20个采样点,D区域3个,BC分别都是2个,这样来说,A区域的钾含量是20个点的平均值,在四个区域里面,A区域的钾含量最接近平稳值,所以在计算的时候,我们可以把每个区域的采样点数放到一个字段里面,作为这个区域的权重——这样来说,在计算的时候A区域的数据,比其他几个区域的数据具有更大的影响力。

具体的参数就先说到这里,GWR后面还有一系列的扩展参数,下一节我们再继续说。

待续未完。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/184894.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月7日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
洛谷CF1744A题解
这道题目就是说每个测试都有一个数组和一个同样长的字符串,每次可以把数组中的一个数批量换成一个小写英文字母,问给定的组合是否合法?
嘉嘉123
2022/12/14
2590
Codeforces 1114E(交互题)
管理员有个乱序数列(举例:{14, 24, 9, 19}),排序以后是个等差数列({9, 14, 19, 24}),现在他只告诉你有n个数(样例n = 4)却不给你数列,让你求出最小的那个数(9)和公差d(5)。
ACM算法日常
2019/03/04
1.2K0
Codeforces Round #549(div1)简析
正解貌似有分四种情况什么的,我做时是发现各个起点其实都等价的,所以随便选一个起点,再暴举终点以暴举答案,更新即可。
ACM算法日常
2019/04/25
4350
1466: [蓝桥杯2019初赛]等差数列
数学老师给小明出了一道等差数列求和的题目。但是粗心的小明忘记了一部分的数列,只记得其中N 个整数。现在给出这N 个整数,小明想知道包含这N 个整数的最短的等差数列有几项?
可爱见见
2020/02/26
8220
2019 第十届蓝桥杯C/C++ 省赛B组题解
又是一年一度的蓝桥杯,这次也应该是我大学最后一次学科竞赛了,今年的省赛题型和往届有些不同,代码填空没有了,只有结果填空和编程大题,不过坑还是一样的多,稍不注意就出错了。这里记录一下自己的做题思路,因为没有现场判题,所以我也不能确定我的答案一定是对的,小伙伴们看看一些题目的思路就好了。话不多说,看题。
指点
2019/03/29
9.2K2
2019 第十届蓝桥杯C/C++ 省赛B组题解
建模-判断一列数是不是等差数列
该文讲述了如何判断一个数列是否为等差数列,并给出了相应的算法实现。主要包括计算最大值、最小值、个数和公差,然后根据这些值判断数列是否满足等差数列的条件。
chaibubble
2018/01/02
1.1K0
动规习题-间隔选数求最大和
现有一个含有n个正整数的数列,从中选择任意个数,但选了第i个数,就不能选第i-1和第i+1的数,求选择的数的最大和。 输入第一行为一个n,表示数的个数,第二行为n个数表示数列 输出选数最大和。 样例输入: 5 4 1 1 9 1 样例输出: 13
六月丶
2022/12/26
2080
动规习题-间隔选数求最大和
河南工程学院2022级新生周赛(三)题解
A. 6男 ---- 原题链接 题目大意: 给定一个字符串 S,求最长的连续的 6 的字串的长度。 S 可能含有空格。 ---- 思想: 签到题。 读入时注意空格。 ---- 代码: #include <iostream> #include <cstring> #include <cstdio> #include <algorithm> #include <cmath> #include <sstream> #include <vector> #include <queue> #include <stac
浪漫主义狗
2022/10/09
3170
洛谷-----P5534 【XR-3】等差数列
显然这里是对一叉树的遍历,递归过程中我们需要求出当前所要累加上去的当前项的值,当前项的值可以通过递推公式求出来,即an=a1+(n-1)*d
大忽悠爱学习
2021/11/15
3350
树状数组-从入门到拓展(转载非原创)
转载来源:https://www.cnblogs.com/AKing-/p/15311440.html
xlj
2021/09/20
4700
AtCoder Beginner Contest 161 A~~F
思路:根据性质,无非是差为0,-1,1的这样的数,但不一定每个都有这样的三个数能找到,因为最后一个数为9的话,要进位,为0的话,自然-1那个实现不了。
杨鹏伟
2020/09/10
2620
武工大2022蓝桥杯预选赛题解复现
寒假期间,痛恨英语的阿祥终于妥协了,他决定重新开始学习英语。但阿祥的英语实在是太差了,他得从最基础的数字开始复习。单纯的背单词也太无聊了吧,你说是不是?所以阿祥花了半天时间用小写英文(zero~nine,add, sub)写了一个超级长的英文加减法算式(当然,垃圾的阿祥不会写大于10的英文数字,全是逐字符翻译的,每个单词都用一个空格隔开),完成后他觉得非常有成就感,hh!!!
h-t-m
2022/11/24
7010
武工大2022蓝桥杯预选赛题解复现
【洛谷 P1141】01迷宫
从每一个为000的位置,可以走到相邻的111处;从每一个为111的位置,可以走到相邻的000处。即上一个走过来的格子不能与现在的格子相同。
pai233
2022/01/12
5370
【洛谷 P1141】01迷宫
Codeforces Round 524(Div. 2)
需要邀请n个人来参加派对.需要制作邀请卡.一张邀请卡需要2红, 5绿, 8蓝. 每个笔记本有k个某种颜色.求最少需要多少个笔记本.
xiaohejun
2020/02/18
3230
【第005题】题解及代码分享:AtCoder ABC326-D
就是一个搜索,4ms的时限还怕什么,更别说n还这么小,这个题给我感觉有点像数独那道题(洛谷可搜),然后再多开数组维护是否满足题目所要求的第一个字符对应就行
小码匠
2023/11/06
2550
【第005题】题解及代码分享:AtCoder ABC326-D
【题解】Gym – 102307C Common Subsequence
题目大意就是给出两个序列,找他们的最长公共子序列,然后判断这个子序列的长度是否大于原序列的0.99。
灯珑LoGin
2022/10/31
1720
codeforces 1216E1(数学+暴力)
题意描述 思路 image.png AC代码 #include<bits/stdc++.h> #define x first #define y second #define PB push_back
dejavu1zz
2020/10/23
3220
codeforces 1216E1(数学+暴力)
KMP算法
一个文本串$S$(主串)和一个模式串$P$,求$P$在$S$中出现的位置,或者$P$在$S$中出现的次数,等等问题。
xiaohejun
2020/02/18
5690
codeforces 1213D2(贪心+思维)
题目中说答案始终存在,因为每个数都可以变成0,但很明显,让数字变成0的情况是不存在的,每个数字不停的除2肯定可以变成1,如果变成0,肯定不是最优解。我们可以使用一个 c n t cnt cnt数组来记录每个数字出现的次数,使用 t o t tot tot数组来记录变成该数需要的次数,因为数据范围最大是 2 ∗ 1 0 5 2*10^5 2∗105,每个数字除2不超过20次就可以变成1,我们遍历一遍数组即可得到答案。
dejavu1zz
2020/10/23
2780
【洛谷习题】P1255 数楼梯
根据题意会发现,到每阶楼梯的走法数量和斐波那契数列很相像,都是f[i] = f[i-2]+f[i-1],但基准情况有点不同,先总结出该题公式
六月丶
2022/12/26
4580
【洛谷习题】P1255 数楼梯
相关推荐
洛谷CF1744A题解
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档