1回归
(资料图)
1.1回归
回归分析是最常用的社会科学统计方法。回归用于评估两个或更多要素属性之间的关系。通过回归分析,我们可以对空间关系进行建模、检查和探究;回归分析还可以帮助解释所观测到的空间模式背后的诸多因素,例如为什么有些地区会持续发生年轻人早逝或者糖尿病的发病率比预期要高的情况。
回归可以分为两类,一类是线性回归,另一类是非线性的基于机器学习算法的回归。
线性回归,用来确定两种或两种以上变量间相互依赖的定量关系。包括普通最小二乘法OLS (Ordinary Least Squares)、广义线性回归GLR(Generalized Linear Regression)、以及地理加权回归GWR(Geographically weighted Regression)等等。
1.2线性回归存在问题
线性回归经常会遇到两个问题:
一是解释变量多重共线性,或者说冗余,这会导致模型估计失真或难以估计准确,我们希望因变量与不同的解释变量之间存在线性关系,同时不同的解释变量彼此之间不是线性相关的。
二是模型过拟合,过拟合是指为了得到一致假设而使假设变得过度严格。一般是由于强化了太多的局部特征,而导致模型的适应性(泛化)太弱。
三是最小二乘回归存在两个基本假设:误差随机且模型残差不相关。但是,空间数据间的联系总是存在着空间异质性和空间自相关,从而违背了OLS模型的使用原则。
2 地理加权回归(GWR)
2.1简介
早期空间统计分析技术多从全局假设的角度出发,认为空间变量关系是固定的,不随空间位置的变化而改变。这个前提假设明显违背了现实地理世界空间关系的异质性或非平稳性规律。因此,区别于传统研究“单一普适”的空间关系统计分析方法,如何对空间异质性进行精确局部描述的空间分析方法越来越多地受到重视,如随机系数模型、空间变参数回归分析模型和局部加权回归分析模型。
在总结了前人关于局部回归和变参研究的基础上,美国科学院院士,英国圣安德鲁斯大学的A. Stewart Fotheringham教授在1996年,正式提出了地理加权回归模型(Geographical Weighted Regression , GWR)。地理加权回归是一种基于空间变化关系建模的局部线性回归方法,它在研究区域的每一处产生一个描述局部关系的回归模型,从而能很好的解释变量的局部空间关系与空间异质性。
ps.引入的空间关系是什么?
2.2公式与解析
基础 GWR 模型一般可表达如下:
虾神说对GWR的解释
2.3应用
计算全局莫兰斯指数,具有空间异质性时使用。
3 分类与具体实现
3.1模型对比
(来源bilibli: BV1S14y1A7vb)
3.2多尺度地理加权MGWR实操
3.2.1数据与软件准备
(1)数据:自变量、因变量、样本的经纬度坐标(投影)
(2)软件:MGWR2.2(补网址)
3.2.2具体操作
3.2.3数据分析
(1)GWR结果分析
R方数值越大说明模型拟合越好
(2)MGWR结果分析
上述处理后得到图片(可进行冷热点分析)