《城市规划系统工程学空间统计分析初步教学PPT.ppt》由会员分享,可在线阅读,更多相关《城市规划系统工程学空间统计分析初步教学PPT.ppt(76页珍藏版)》请在第壹文秘上搜索。
1、第十五章第十五章 空间统计分析初空间统计分析初步步 探索性空间统计分析 地统计分析方法 空间统计分析空间统计分析,即空间数据(Spatial Data)的统计分析,是现代计量地理学中一个快速发展的方向领域。空间统计分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。第1节 探索性空间统计分析 一、基本原理与方法 (一)空间权重矩阵 (二)全局空间自相关 (三)局部空间自相关 二、应用实例 一、基本原理与方法 通常定义一个二元对称空间权重矩阵,来表达个位置的空间区域的邻近关系,其形式如下:式中:Wij表示区域i与j的临近关系,它可以根据邻
2、接标准或距离标准来度量。(一)空间权重矩阵 nnnnnnwwwwwwwwwW212222111211两种最常用的确定空间权重矩阵的规则:(1)简单的二进制邻接矩阵(2)基于距离的二进制空间权重矩阵 其它相邻接和当区域01jiwij其它时的距离小于和当区域01djiwij(二)全局空间自相关 Moran指数和Geary系数是两个用来度量空间自相关的全局指标。Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度,Geary 系数与Moran指数存在负相关关系。如果是位置(区域)的观测值,则该变量的全局Moran指数I,用如下公式计算:式中:I为Moran指数 ninjniiijnin
3、jjiijxxwxxxxwnI111211ninijijninijjiijwSxxxxw121)(22)(1iixxnSniixnx11 Geary 系数C计算公式如下:式中:C为Geary系数;其它变量同上式。如果引入记号:ninjniiijninjjiijxxwxxwnC111211221ninjijwS110)(xxzii)(xxzjj,21nTzzzz则全局Moran指数I的计算公式也可以进一步写成:Moran指数I的取值一般在-1-1之间,小于0表示负相关,等于0表示不相关,大于0表示正相关;Geary系数C的取值一般在0-2之间,大于1表示负相关,等于1表示不相关,而小于1表示正相
4、关。niininjjiijxxxxxxwSnI12110)()(zzWzzSnzzzwSnTTniininjjiij012110对于Moran指数,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系,Z的计算公式为:当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z值为零时,观测值呈独立随机分布。)()(IVARIEIZ(三)局部空间自相关 局部空间自相关分析方法包括三种分析方法:1.空间联系的局部指标(LISA)2.G统计量 3.Moran散点图 1.空间联系的局部指标(
5、LISA)空间联系的局部指标(Local indicators of spatial association,缩写为LISA)满足下列两个条件:(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;(2)所有区域单元LISA的总和与全局的空间联系指标成比例。LISA包括局部Moran指数(Local Moran)和局部Geary指数(Local Geary),下面重点介绍和讨论局部Moran指数。局部Moran指数被定义为:式中:其中 和 是经过标准差标准化的观测值。局部Moran指数检验的标准化统计量为:jjijiixxwSxxI)()(2iijjij
6、iixxxxwxxnI2)()()(jjijiTjjijizwzzzzwnzizjz)()()(iiiiIVARIEIIZ2.G统计量 全局G统计量的计算公式为:对每一个区域单元的统计量为:ijijjijiijxxxxwG/ijjjijixxwG/对统计量的检验与局部Moran指数相似,其检验值为:显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比,具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。)()()(iiiiGVARGEGGZ3.
7、Moran散点图 以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。由于数据对(Wz,z)经过了标准化,因此界外值可易由2sigma规则可视化地识别出来。Moran散点图的四个象限,分别对应于区域单元与其邻居之间四种类型的局部空间联系形式:第一象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式;第二象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式;第三象限代表了低观
8、测值的区域单元被同是低值的区域所包围的空间联系形式;第四象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。将Moran散点图与LISA显著性水平相结合,也可以得到所谓的“Moran显著性水平图”,图中显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域。二、应用实例二、应用实例 中国大陆各省份人均GDP的空间关联分析根据各
9、省份之间的邻接关系,采用二进制邻接权重矩阵,选取各省分份19982002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I),结果如表15.1.3所示。年份IZP19980.50014.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.0000从表中可以看出,在1998-2002年期间,中国大陆31个省份人均GDP的全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。这就是说,在1998
10、-2002年期间,中国大陆31个省份人均GDP存在着显著的、正的空间自相关,也就是说各省份人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省份相对地趋于和较高人均GDP水平的省份相邻,或者较低人均GDP水平的省份相对地趋于和较低人均GDP水平的省份相邻。选取2001年各省份人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。检验结果表明,贵州、四川、云南西部三省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该四省市在空间上相连成片分布,而且从统计学意义上来说
11、,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。以(Wz,z)为坐标,进一步绘制Moran散点图可以发现,多数省份位于第一和第三象限内,为正的空间联系,属于低-低集聚和高-高集聚类型,而且位于第三象限内的低-低集聚类型的省份比位于第一象限内的高-高集聚类型的省份更多一
12、些。HH:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏LL:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州LH:湖南HL:重庆、广西、河北上图进一步显示了各省人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看:高值被高值包围的高-高集聚省份有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏;低值被低值包围的低-低集聚省份有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州;被低值包围的高值省份有:重庆、广西、河北;被高值包围的低值省份只有湖南。第2节
13、地统计分析方法 一、地统计方法的基本原理 (一)区域化变量 (二)协方差函数 (三)变异函数 (四)克立格插值方法 二、应用实例 地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。协方差函数和变异函数是以区域化变量理论为基础建立起来的地统计学的两个最基本的函数。地统计学的主要方法之一,克立格法就是建立在变异函数理论和结构分析基础之上的。一、地统计方法的基本原理 当一个变量呈现为空间分布时,就称之为区域化变量(Regionalized Variable)。这种变量常常反映某种空间现象的特征,用区域化变量来描述的现
14、象称之为区域化现象。区域化变量,亦称区域化随机变量,G.Matheron(1963)将它定义为以空间点x的三个直角坐标为自变量的随机场 。区域化变量具有两个最显著,而且也是最重要的特征,即随机性和结构性(一)区域化变量)Z(x),Z(wvxxxu(二)协方差函数 1.协方差函数的概念 区域化随机变量之间的差异,可以用空间协方差来表示。区域化变量 在空间点x和x+h处的两个随机变量和的二阶混合中心矩定义为Z(x)的自协方差函数,即),()(wvuxxxZxZ)()()()()(),(hxZExZEhxZxZEhxZxZCov2.协方差函数的计算公式 协方差函数的计算公式为:式中:h为两样本点空间
15、分隔距离或距离滞后,为 在空间位置 处的实测值,是 在 处距离偏离的实测值i=1,2,是分隔距离为h时的样本点对(Paris)总数,和 分别为 和 的样本平均数。)(1)()()()()(1)(hNiiiiihxZhxZxZxZhNhc)(ixZ)(xZix)(hxZi)(xZix)(hN)(hN)(ixZ)(hxZi)(ixZ)(hxZi若 =m(常数),则上式可以改写为:式中:m为样本平均数,可由一般算术平均数公式求得,即:)(ixZ)(hxZi)(12)()()(1)(hNiiimhxZxZhNhcniixZNm1)(1(三)变异函数 1.变异函数的概念 变异函数(Variograms)
16、,又称变差函数、变异矩,是地统计分析所特有的基本工具。在一维条件下变异函数定义为,当空间点x在一维x轴上变化时,区域化变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差的一半为区域化变量Z(x)在x轴方向上的变异函数,记为(h),即 )()(21),(hxZxZVarhx22)()(21)()(21hxZExZEhxZxZE在二阶平稳假设条件下,对任意的h有因此,公式可以改写为 从上式可知,变异函数依赖于两个自变量x和h,当变异函数 仅仅依赖于距离h而与位置x无关时,可改写成 ,即:)()(xZEhxZE2)()(21),(hxZxZEhx),(hx)(h),(hx2)()(21)(hxZxZEh2.变异函数的性质设Z(x)是区域化变量,在满足二阶平稳假设条件下,变异函数式具有如下性质:(1)=0,即在h=0处,变异函数为0;(2)=,即 关于直线h=0是对称的,它是一个偶函数;(3)0,即 只能大于或等于0;(4)|h|时,c(0),或 =c(0),即当空间距离增大时,变异函数接近先验方差 ;(5)-必须是一个条件非负定函数,由 -构成的变异函数矩阵在条件 时,为非负定的