首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

gis地理加权回归步骤_地理加权回归权重

为了解决非稳健的问题,提高模型的性能,可以使用将区域变化合并到回归模型中的方法,也就是GWR(Geographically Weighted Regression)地理加权回归的方法。...GWR工具 来看一下工具的参数: 输入要素:ObsData911Calls面要素 因变量:这里我们选择要解释的变量,也就是Y值为calls,911电话呼叫次数 模型类型:高斯、逻辑以及泊松模型。...也就是0 和1的问题。就可以使用逻辑模型。 再比如我们想解释某地的死亡人数。这是离散的数据,就可以选择泊松模型了。...预测选项:GWR模型用来估计和建模变量之间的线性关系然后用这个模型来产生预测,本练习中我们只探究变量之间的线性关系,不做预测。 再来看其他选项中的局部权重方案和系数栅格工作空间。...使用工具实现回归分析不是我们的最终目的,更多时候我们是想通过这个模型进行预测或者是说明问题,或者说除了得出模型合理的结论之外,结果该如何解读呢? 以本例的GWR工具为例。

2.8K40

R语言拟合改进的稀疏广义加性模型(RGAM)预测、交叉验证、可视化

预测 可以通过使用predict方法获得此模型的预测结果:每列给出了一个lambda值的预测结果。...predict(bi1 # 第10个模型的前5个观察值的预测概率 predict( 计数数据的泊松回归 对于泊松回归,响应变量y应该是一个计数数据向量。...与逻辑回归类似,默认情况下,predict()仅返回线性预测值,即 要获取预测速率,用户必须在predict()调用中传递type = "response"。...对于泊松数据,通常允许用户传入偏移,这是一个与观测数相同长度的向量。...rgam()也允许用户这样做: # 生成数据 set.seed(5) offset <- rnoroffset, verbose = FALSE) 请注意,如果将offset提供给rgam(),则在进行预测时必须还提供一个偏移向量给

32410
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    数据分享|R语言零膨胀泊松回归ZERO-INFLATED POISSON(ZIP)模型分析露营钓鱼数据实例估计IRR和OR

    列出的一些方法是相当合理的,而另一些方法要么失宠,要么有局限性。 零膨胀泊松回归。 零膨胀负二项式回归——负二项式回归在分散数据时表现更好,即方差远大于平均值。 普通计数模型 。...零膨胀泊松回归 summary(m1) 输出看起来非常像 R 中两个 OLS 回归的输出。在模型调用下方,您会发现一个输出块,其中包含每个变量的泊松回归系数以及标准误差、z 分数和 p 值系数。...请注意,上面的模型输出并没有以任何方式表明我们的零膨胀模型是否是对标准泊松回归的改进。我们可以通过运行相应的标准 Poisson 模型然后对这两个模型进行 Vuong 检验来确定这一点。...vuong(p, m) Vuong 检验将零膨胀模型与普通泊松回归模型进行比较。在这个例子中,我们可以看到我们的检验统计量是显着的,表明零膨胀模型优于标准泊松模型。...这两个模型不一定需要使用相同的预测变量。 零膨胀模型的逻辑部分可能会出现完美预测、分离或部分分离的问题。 计数数据通常使用暴露变量来指示事件可能发生的次数。 不建议将零膨胀泊松模型应用于小样本。

    2.2K10

    数据分享|R语言零膨胀泊松回归ZERO-INFLATED POISSON(ZIP)模型分析露营钓鱼数据实例估计IRR和OR|附代码数据

    列出的一些方法是相当合理的,而另一些方法要么失宠,要么有局限性。 零膨胀泊松回归。 零膨胀负二项式回归——负二项式回归在分散数据时表现更好,即方差远大于平均值。 普通计数模型 。...零膨胀泊松回归 summary(m1) 输出看起来非常像 R 中两个 OLS 回归的输出。在模型调用下方,您会发现一个输出块,其中包含每个变量的泊松回归系数以及标准误差、z 分数和 p 值系数。...请注意,上面的模型输出并没有以任何方式表明我们的零膨胀模型是否是对标准泊松回归的改进。我们可以通过运行相应的标准 Poisson 模型然后对这两个模型进行 Vuong 检验来确定这一点。...vuong(p, m) Vuong 检验将零膨胀模型与普通泊松回归模型进行比较。在这个例子中,我们可以看到我们的检验统计量是显着的,表明零膨胀模型优于标准泊松模型。...这两个模型不一定需要使用相同的预测变量。 零膨胀模型的逻辑部分可能会出现完美预测、分离或部分分离的问题。 计数数据通常使用暴露变量来指示事件可能发生的次数。 不建议将零膨胀泊松模型应用于小样本。

    86800

    数据并非都是正态分布:三种常见的统计分布及其应用

    然而,体重减轻通常不会呈线性发展,使用更复杂的数学模型,如泊松回归,可能会更加贴近真实情况。 在探讨体重减轻的模型时,我们通常会遇到各种统计分布,其中最常见的是正态分布和泊松分布。...在处理计数数据,如一定时间内的体重变化次数时,泊松分布则显得更为合适。泊松分布用于描述在固定时间或空间内发生的独立事件的数量,适用于预测罕见事件。...泊松分布 泊松分布是以法国数学家泊松的名字命名,于1837年引入。这种分布描述了在固定的时间或空间间隔内,给定数量的事件发生的概率,前提是这些事件以已知的恒定平均率独立发生。...这里我们讨论的是事件的计数,而不是像胆固醇水平那样从0到无穷大的数据测量。我们使用泊松分布来预测诸如城市中的预期谋杀案数量,或某一天急诊部的访问次数等。...计算给定吸烟状态的癌症几率。然后将这些几率转换为自然对数,将0和1的类别转换为更连续的分布。就可以预测给定吸烟状态的癌症对数几率,包括95%的置信区间等等。

    34110

    R语言从入门到精通:Day13

    Logistic回归 以AER包中的数据框Affairs为例,我们将通过探究婚外情的数据来阐述Logistic 回归的过程。...泊松回归 当通过一系列连续型和/或类别型预测变量来预测计数型结果变量时,泊松回归是一个非常有用的工具。...图6,poisson回归分析结果 ? 同样,还需要评价泊松模型的过度离势。泊松分布的方差和均值相等。当响应变量观测的方差比依据泊松分布预测的方差大时,泊松回归可能发生过度离势。...这与Logistic回归处理过度离势的方法是相同的。图7中是修改参数之后的回归模型,所得的回归系数估计与泊松方法相同,但标准误变大了许多。...稳健泊松回归(robust包中的函数glmRob()可以拟合稳健广义线性模型,包含稳健泊松回归,当存在离群点和强影响点时,该方法会很有效。)。

    1.7K20

    帕绍大学基于ELO评级预测

    在大数据文摘后台回复“世界杯”可下载论文~ 下面是论文精华内容: 本文提出了一种分析和预测足球锦标赛的方法。该方法基于泊松回归模型,由作为协方差的团队Elo评级和球队特定效应的差异组成。...2018年3月28号排名最高的5个球队的ELO评级如下: 下面我们展示了四个更加复杂的模型,在这些模型中,(G_A,G_B)为二维泊松分布随机变量,(G_A,G_B)的分布将取决于A球队和B球队以及两个队伍的...独立泊松回归模型 在这个模型中我们假设G_A和G_B分别是参数为λ_A|B和λ_B|A的独立泊松分布变量。我们通过A和B的ELO分数进行泊松回归来估计λ_A|B和λ_B|A。...,x_i是T在比赛i中的进球数目,μ^_i是估计的泊松回归均值。...在这一章节中我们提出了一个二维回归模型,模型使用下面的回归方法: 1.对于每支参赛队伍T,我们估计参数 这些参数会依赖于对手队伍O的Elo实力Elo_O,为此,我们使用下面的泊松回归模型: 也就是说,队伍

    58630

    R in action读书笔记(18)第十三章

    13.3 泊松回归 泊松回归适用于在给定时间内响应变量为事件发生数目的情形。它假设Y服从泊松分布,线性模型的拟合形式为: ? 其中λ是Y的均值(也等于方差)。...拟合泊松回归: ? 输出结果列出了偏差、回归参数、标准误和参数为0的检验。注意,此处预测变量在p的水平下都非常显著。...13.3.1 解释模型参数 在泊松回归中,因变量以条件均值的对数形式ln(λ)来建模。与Logistic回归中的指数化参数相似,泊松模型中的指数化参数对响应变量的影响都是成倍增加的,而不是线性相加。...同样,还需要评价泊松模型的过度离势。可能发生过度离势的原因有如下几个: 遗漏了某个重要的预测变量。 可能因为事件相关。...在纵向数据分析中,重复测量的数据由于内在群聚特性可导致过度离势 13.3.3 扩展 1. 时间段变化的泊松回归 2. 零膨胀的泊松回归 3.稳健泊松回归

    1.1K10

    R语言泊松回归对保险定价建模中的应用:风险敞口作为可能的解释变量

    p=13564 ---- 在保险定价中,风险敞口通常用作模型索赔频率的补偿变量。...因此,如果   表示被保险人的理赔数量 ,则具有特征 和风险敞口 ,通过泊松回归,我们将写 或等同 根据该表达式,曝光量的对数是一个解释变量,不应有系数(此处的系数取为1)。...我们不能使用暴露作为解释变量吗?我们会得到一个单位参数吗? 当然,在进行费率评估的过程中,这可能不是一个相关的问题,因为精算师需要预测年度索赔频率(因为保险合同应提供一年的保险期)。...泊松过程的(年度)强度在这里 > 365/1000[1] 0.365 因此,如果我们对曝光的对数进行Poisson回归,我们应该获取一个相近参数 > log(365/1000)[1] -1.007858...如果我们以曝光量的对数作为可能的解释变量进行回归,则我们期望其系数接近1。

    96920

    R语言用线性模型进行臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值

    让我们调查数据以确定模型为何存在这些异常值的问题。 ? 直方图表明残差分布右尾的值确实存在问题。由于残差不是真正的正态分布,因此线性模型不是最佳模型。实际上,残差似乎遵循某种形式的泊松分布。...R2值0.616表示泊松回归比普通最小二乘(0.604)稍好。但是,其性能并不优于将负值为0.646的模型。...结合 看到泊松回归可用于防止负估计,加权是改善离群值预测的成功策略,我们应该尝试将两种方法结合起来,从而得出加权泊松回归。 加权泊松回归 p.w.pois ?...如我们所见,该模型结合了使用泊松回归(非负预测)和使用权重(低估离群值)的优势。...因此,如果所有其他特征的值为0,则模型的预测仍将为正。 但是,假设均值应等于泊松回归的方差呢?

    1.6K20

    R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享

    仅仅通过观察,我们就可以看出方差随预测变量而变化。此外,我们处理的是计数数据,它具有自己的分布,即泊松分布。然而,如果我们坚持使用lm进行分析会怎样呢?...train_lm <-......odel(train_lm) 预测值和观测值之间不匹配。部分原因是这里的响应变量在残差中不是正态分布的,而是泊松分布,因为它是计数数据。...泊松回归 具有泊松误差的广义线性模型通常具有对数链接,尽管也可以具有恒等链接。例如, pois_tib <- tibble(x = rep(0:40,2), .........在R中,我们可以使用两种形式来参数化二项逻辑回归 - 这两种形式是等价的,因为它们将结果扩展为成功次数和总试验次数。...GLMM、逻辑回归分析教育留级影响因素数据 逻辑回归Logistic模型原理R语言分类预测冠心病风险实例 数据分享|用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化 R语言高维数据惩罚回归方法

    96520

    逻辑回归原理,最大化似然函数和最小化损失函数

    Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别) 回归模型中,y是一个定性变量,比如y=0或1,logistic方法主要应用于研究某些事件发生的概率...正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(generalizedlinear model)。 这一家族中的模型形式基本上都差不多,不同的就是因变量不同。...泊松分布的概率质量函数为: 泊松分布表示(固定尺度的)连续区间(如时间,距离)上给定的事件发生次数的概率,所以可以看作泊松分布中n是无穷大的。...二项分布是固定实验次数下,事件发生次数的概率,n是有界的。 泊松分布的特点: 泊松分布的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。...逻辑回归用途 寻找危险因素:寻找某一疾病的危险因素等; 预测:根据模型,预测在不同的自变量情况下,发生某病或某种情况的概率有多大; 判别:实际上跟预测有些类似,也是根据模型,判断某人属于某病或属于某种情况的概率有多大

    18110

    R语言线性模型臭氧预测: 加权泊松回归,普通最小二乘,加权负二项式模型

    让我们调查数据以确定模型为何存在这些异常值的问题。  直方图表明残差分布右尾的值确实存在问题。由于残差不是真正的正态分布,因此线性模型不是最佳模型。实际上,残差似乎遵循某种形式的泊松分布。...处理负面的臭氧水平预测 让我们首先处理预测负臭氧水平的问题。 截短的最小二乘模型 处理负面预测的一种简单方法是将其替换为尽可能小的值。这样,如果我们将模型交给客户,他就不会开始怀疑模型有问题。...结合 看到泊松回归可用于防止负估计,加权是改善离群值预测的成功策略,我们应该尝试将两种方法结合起来,从而得出加权泊松回归。...加权泊松回归 p.w.pois  如我们所见,该模型结合了使用泊松回归(非负预测)和使用权重(低估离群值)的优势。确实,[R2[R2该模型的最低价(截断线性模型为0.652 vs 0.646)。...因此,如果所有其他特征的值为0,则模型的预测仍将为正。 但是,假设均值应等于泊松回归的方差呢?

    1.1K00

    【V课堂】R语言十八讲(十六)—广义线性模型

    OLS线性模型.这种模型的拟合方法是将实际观测值与理论预测值的误差平方和使之最小化,从而推导出线性模型的参数,即最小二乘法.而广义线性模型是通过极大似然估计法来估计参数的,所谓极大似然估计,就是将观测值所发生的概率连乘起来...其实在OLS回归中,我们也可以用极大似然估计发方法来估计参数,我们可以发现其结果和最小二乘法的结果是相同的.而在广义模型中我们使用极大似然估计方法.另外,一般的OLS线性模型是有前提假设的,这在前面的章节中有讲到...,是或否,0或1,那么它肯定是不满足正态假设的,这个时候我们使用logistics回归 2.当结果变量为记数型的,也就是非负整数,肯定的离散的,这也不满足正太假设,这个时候我们使用泊松回归. ★ 简介与原理...: 1.logistics回归就是将结果变量做了一个转换,我们可以理解为 将y转换成f(y),而这个f(y)所代表的含义就是1类结果的优势比的对数. 2.泊松回归是假设Y服从泊松分布,知道泊松分布的就可以知道泊松分布的一些特性...,这时我们可以使用泊松回归,当然前提是服从泊松回归的,另外,有时我们并不关心次数,只关心是否出轨,这时我们将数据进行变换,变为出轨与否,这样结果变量就服从了逻辑回归的要求,我们进行了逻辑回归拟合,.

    1.1K90

    广义线性模型glm泊松回归的lasso、弹性网络分类预测学生考试成绩数据和交叉验证

    广义线性模型的交叉验证lasso正则化 从泊松模型构建数据,并使用 lasso确定重要的预测变量 。 创建具有 20 个预测变量的数据。仅使用三个预测变量加上一个常数来创建泊松因变量。...rng % 用于重现性 randn exp(X)*weights + 1 构建数据的泊松回归模型的交叉验证lasso正则化。 检查交叉验证图以查看Lambda 正则化参数的效果 。...假设 中的值 y 是二项分布的。选择对应于Lambda 最小预期偏差的模型系数 。...使用 指定二项式因变量的链接函数 'logit'。将预测值转换为逻辑向量。 使用混淆矩阵确定预测的准确性。 confuhart 该函数可以正确预测 31 个考试成绩。...然而,该函数错误地预测了1名学生获得B或以上的成绩,4名学生获得B以下的成绩。 本文摘选《Matlab广义线性模型glm泊松回归的lasso、弹性网络正则化分类预测考试成绩数据和交叉验证可视化》

    1.1K10

    R语言逻辑回归和泊松回归模型对发生交通事故概率建模

    利用泊松过程模型,我们可以获得 这意味着在一年的前六个月中没有索赔的概率是一年中没有索赔的平方根。...现在,要查看最终模型,我们回到Poisson回归模型,因为我们确实有概率模型 。 现在我们可以比较这三个模型。我们还应该包括没有任何解释变量的预测。...实际上,使用两个模型,可以进行更复杂的回归分析(例如使用样条曲线),以可视化年龄对发生或不发生交通事故概率的影响。...如果将泊松回归(仍为红色)和对数二项式模型与泰勒展开进行比较,我们得到 ---- 参考文献 1.R语言多元Logistic逻辑回归 应用案例 2.面板平滑转移回归(PSTR)分析案例实现 3.matlab...中的偏最小二乘回归(PLSR)和主成分回归(PCR) 4.R语言泊松Poisson回归模型分析案例 5.R语言回归中的Hosmer-Lemeshow拟合优度检验 6.r语言中对LASSO回归,Ridge

    1.2K20

    R语言小数定律的保险业应用:泊松分布模拟索赔次数

    p=14080 在保险业中,由于分散投资,通常会在合法的大型投资组合中提及大数定律。在一定时期内,损失“可预测”。当然,在标准的统计假设下,即有限的期望值和独立性。...启发式方法是,如果考虑大量观察值,并且计算给定(小)区域中有多少观察值,则此类观察值的数量就是泊松分布。...更准确地说,如果自付额   变得非常大(和 ),我们将获得极值理论中的阈值点以上模型:如果   有一个泊松分布,并在有条件的 ,   是独立同分布的广义帕累托随机变量,然后  具有广义的极值分布...因此,超出模型(针对罕见事件)与泊松过程密切相关。 泊松过程 如上所述,当事件以某种方式随机且独立地随时间发生时,就会出现泊松分布。然后很自然地研究两次事件之间的时间(或在保险范围内两次索赔)。...通常用下表来总结此属性, 上表中的对角线非常有趣。似乎在某种程度上趋向极限值(此处为63.2%)。在n年内观察到的事件数量具有二项式分布,其概率为 ,将收敛到参数为1的泊松分布。

    1.3K30

    用LASSO,adaptive LASSO预测通货膨胀时间序列|附代码数据

    LASSO是一个对目标函数中的参数大小进行惩罚的模型,试图将不相关的变量从模型中排除动机它有两个非常自然的用途,第一个是变量选择,第二个是预测。...我们可以非常快速地估计LASSO,并使用交叉验证选择最佳模型。根据我的经验,在时间序列的背景下,使用信息准则(如BIC)来选择最佳模型会更好。它更快,并避免了时间序列中交叉验证的一些复杂问题。...----点击标题查阅往期内容MATLAB用Lasso回归拟合高维数据和交叉验证群组变量选择、组惩罚group lasso套索模型预测新生儿出生体重风险因素数据和交叉验证、可视化高维数据惩罚回归方法:主成分回归...PCR、岭回归、lasso、弹性网络elastic net分析基因数据Python高维变量选择:SCAD平滑剪切绝对偏差惩罚、Lasso惩罚函数比较R使用LASSO回归预测股票收益广义线性模型glm泊松回归的...net分析基因数据(含练习题)广义线性模型glm泊松回归的lasso、弹性网络分类预测学生考试成绩数据和交叉验证贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

    80510
    领券