第八章 GIS空间分析的原理和方法.docx
- 文档编号:9806200
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:49
- 大小:702.44KB
第八章 GIS空间分析的原理和方法.docx
《第八章 GIS空间分析的原理和方法.docx》由会员分享,可在线阅读,更多相关《第八章 GIS空间分析的原理和方法.docx(49页珍藏版)》请在冰点文库上搜索。
第八章GIS空间分析的原理和方法
第八章GIS空间分析的原理和方法
一、关于模型的一般知识
1、模型的一般概念
将系统的各个要素,通过适当的筛选,用一定的表现规则所描述出来的简明映象,是对客观地理世界的某一客观事物的抽象和概括。
人们认识和研究客观世界一般有三种方法:
逻辑推理法,实验法和模型法。
模型法是我们了解和探索客观世界的最有力、最方便、最有效的方法。
客观世界的实际系统是极其复杂的,它的属性也是多方面的。
但是,建立模型决不能企图将所有这些因素和属性都包括进去,只能根据系统的目的和要求,抓住本质属性和因素,准确地描述系统。
2、模型的特点
(1)模型在系统内的主要存储方式可以是程序式或非程序式的。
基于数据的模型表示和基于知识的模型表示都可以作为模型的基本形态。
(2)在生成模型的过程中,采用定量建模和推理分析相结合的技术。
其中定量建模用于确定模型的数学形态和有关参数。
(3)模型生成在人机交互中完成。
在传统建模过程中,人的作用和机器的作用是界限分明的,而在模型生成技术中这种分界线是模糊的。
(4)模型生成应该是一个动态过程。
模型的生成环境发生变化时,所生成的模型也不会完全相同。
3、模型的表示方法
模型的表示方法有两种表示形式:
一阶谓词逻辑表示形式与关系表示形式。
一般采用容易为用户接受的关系表示方法。
它将模型看成一个虚关系,它的项由模型的输入项和输出项组成。
这个虚关系是模型输入项与输出项的笛卡尔乘积的子集。
这样,在创建模型时,就象创建关系数据库中的关系一样。
此外,还需定义关系中各项的域值,以及输入项和输出项之间的关系。
例:
关系表示形式对某个模型的具体描述:
a.模型标识(例如模型名、模型编号)
b.输入项
c.输出项
d.输入项限制(任选项)
e.依赖关系(任选项,即输入项和输出项之间的关系)
f.模型类型
g.模型描述
4、模型的分类
模型可以分为两类,即形象模型和抽象模型。
前者包括直观模型、物理模型等,后者包括思维模型、符号模型、数学模型和仿真模型等。
但这些模型之间是互相联系的,一个系统中往往需要多种类型的模型。
(1)直观模型只供展览用的实物模型以及玩具、照片等。
通常是把原型的尺寸放大或缩小。
(2)物理模型主要是直观模型的进一步改进,它不仅可以显示原形的外形和特征,而且可以用来进行模拟实验,间接地研究原形的外形的某些规律。
(3)思维模型指通过人们对原型的反复认识,将获取的知识以经验形式直接存储于大脑中,从而可以根据思维或直觉作出相应的决策。
专家系统中的专家知识就是一种思维模型。
(4)符号模型是在一些约定或假设下借助于专门的符号、线条等,按一定形式组合起来描述原型。
地图就是一种典型的符号模型。
(5)仿真模型这是通过计算机上运行的程序表达的模型。
物理模型和数学模型一般可以转化为仿真模型,常见的有三维仿真模型。
(6)数学模型是用的最多、最广的一种模型。
它是用字母、数字和其它数学符号构成的等式或不等式,或用图表、图象、框图、数理逻辑来描述事物的,它是真实系统的一种抽象,是研究和掌握系统运动规律的有利工具,是分析、设计、预报、控制实际系统的基础。
5、模型生成的一般步骤
模型的描述方式和模型的生成关系密切。
不同的描述方式有不同的建模步骤,下面介绍模型生成的一般步骤。
1°、建模准备:
了解所分析的问题的实际背景,弄清建立模型的目的,掌握所分析的对象的各种信息。
2°、模型假设:
对所研究的问题进行必要的简化,并用明确的语言对模型作出假设,即用语言对模型予以描述。
3°、模型建立:
利用适当的数学工具建立各种量之间的关系,给出具体的数学结构。
4°、模型求解:
求解数学方程参数,绘制图形,证明定理,进行逻辑运算等,一般利用计算机完成。
5°、模型分析:
对上述结果进行数学上的分析,给出预测或给出最优决策或控制。
6°、模型检验:
用实际现象、数据等检验模型的合理性和适用性。
7°、模型应用:
如果检验结果符合要求,就可实际应用;若检验结果不符合实际情况,还需对模型进行修改、补充、假设、重新建模。
二、GIS的空间分析模型
1、GIS空间分析模型的概念
GIS空间分析模型是在GIS空间数据基础上建立起来的模型,它是对现实世界科学体系问题域抽象的空间概念模型,和广义的模型概念既有区别,又相互联系。
GIS空间分析模型主要是数学模型。
特点表现在:
(1)空间定位是空间分析模型特有的特性,构成空间分析模型的空间目标(点、弧段、网络、面域、复杂地物等)的多样性决定了空间分析模型建立的复杂性。
(2)空间关系也是空间分析模型的一个重要特征,空间层次关系、相邻关系以及空间目标的拓扑关系也决定了空间分析模型建立的特殊性。
(3)包括坐标、高程、属性以及时序特征的空间数据极其庞大,大量的空间数据通常用图形的方式来表示,这样,由空间数据构成的空间分析模型也具有了可视化的图形特征。
(4)空间分析模型不是一个独立的模型实体,它和广义模型中抽象模型的定义是交叉的。
GIS要求完全精确地表达地理环境间复杂的空间关系,因而常使用数学模型,此外,仿真模型和符号模型也在GIS中得到了很好的应用。
2、GIS空间分析模型的作用
1)空间分析模型是联系GIS应用系统与专业领域的纽带,必须以广泛、深入的专业研究为基础;
2)空间分析模型是综合利用GIS中大量数据的工具,数据的综合分析和应用主要通过模型来实现;
3)空间分析模型是分析型和辅助决策型GIS区别于管理型GIS的一个重要特征,是解决空间分析和辅助决策问题的核心。
3、空间分析模型的类型
GIS中空间分析模型的分类问题,目前研究的很少。
这里,把空间分析模型分为以下几种类型:
1°、空间分布分析模型
用于研究地理对象的空间分布特征。
主要包括:
空间分布参数的描述,如分布密度和均值、分布中心、离散度等;空间分布检验,以确定分布类型;空间聚类分析,反映分布的多中心特征并确定这些中心;趋势面分析,反映现象的空间分布趋势;空间聚合与分解,反映空间对比与趋势。
2°、空间关系分析模型
用于研究基于地理对象的位置和属性特征的空间物体之间的关系。
包括距离、方向、连通和拓扑等四种空间关系。
其中,拓扑关系是研究得较多的关系;距离是内容最丰富的一种关系;连通用于描述基于视线的空间物体之间的通视性;方向反映物体的方位。
3°、空间相关分析模型
用于研究物体位置和属性集成下的关系,尤其是物体群(类)之间的关系。
在这方面,目前研究得最多的是空间统计学范畴的问题。
统计上的空间相关、覆盖分析就是考虑物体类之间相关关系的分析。
4°、预测、评价与决策模型
用于研究地理对象的动态发展,根据过去和现在推断未来,根据已知推测未知,运用科学知识和手段来估计地理对象的未来发展趋势,并作出判断与评价,形成决策方案,用以指导行动,以获得尽可能好的实践效果。
三、GIS常用的空间统计分析模型
1、相关分析模型
GIS地理数据库中存储的各种自然和人文地理要素(现象)的数据并不是孤立的,它们相互影响、相互制约,彼此之间存在着一定的联系。
相关分析模型就是用来分析研究各种地理要素数据之间相互关系的一种有效手段。
地理数据库中各种地理要素数据之间的相关关系,通常可以分为参数相关和非参数相关两大类。
其中,参数相关又可分为简单(两要素)线性相关,多要素间的相关模型,非参数相关可以分为顺序(等级)相关和二元分类相关。
(1)简单(两要素)线性相关分析
在一般情况下,当两种要素之间为线性相关时,就要研究它们之间的相关程度和相关方向。
所谓相关程度,指它们之间的相关关系是否密切;所谓相关方向,就是两种要素之间相关的正负。
相关程度和相关方向,可以用相关系数来衡量。
设X和Y为两种地理要素(现象),Xj和Yj分别为它们的样本统计值(j=1,2,…,n),则它们之间的相关系数模型为:
式中:
相关系数的取值范围为-1≤γ≤+1。
当相关系数为正时,表示两种要素之间为正相关;反之,为负相关。
相关系数的绝对值|γ|越大,表示两种要素之间的相关程度越密切,γ=+1为完全正相关,γ=-1为完全负相关,γ=0为完全线性无关。
(2)多要素相关模型
1°、任意两种要素间的相关系数模型
设有一组地理要素变量X1,X2,…,Xm,统计n个样本,则n个样本m个指标可构成一个n×m阶的原始数据矩阵。
此时,任意两种要素间的相关系数模型为:
式中σik,σk2,σi2分别为样本的协方差和方差。
2°、偏相关系数模型
当研究某一种要素对另一种要素的影响或相关程度,而把其它要素的影响完全排除在外,单独研究那两种要素之间的相关系数时,就要使用偏相关分析方法,偏相关程度用偏相关系数来衡量。
若i,j,k代表变量{x1,x1,…,xm}中任意三种不同的变量,则所有一阶偏相关系数模型如下:
式中:
γij、γik、γjk为单相关系数。
逐次使用递归公式
就可以得到任意阶的偏相关系数。
其中,c是其余变量的任意子集合。
3°、复相关系数模型
以上都是在把其它要素的影响完全排除在外的情况下研究两种要素之间的相关关系。
但是实际上,GIS的空间分析中,一种要素的变化往往要受到多种要素的综合影响,这时就需要采用复相关分析方法。
所谓复相关,就是研究几种地理要素同时与某一种要素之间的相关关系,度量复相关程度的指标是复相关系数。
设因变量为Y,自变量为X1,X1,…,Xk,则Y与X1,X2,…,Xk的复相关系数
计算公式为:
作为特例,三个变量(Y,X1,X2)之间的复相关系数的计算公式为:
2、趋势面分析模型
在GIS的空间分析中,经常要研究某种现象的空间分布特征与变化规律。
许多现象在空间都具有复杂的分布特征,它们常常呈现为不规则的曲面。
欲研究这些现象的空间分布趋势,就要用适当的数学方法将现象的空间分布及其区域变化趋势模拟出来,这就是趋势面分析方法。
趋势面分析,是用一个多项式对地理现象的空间分布特征进行分析,用该多项式所代表的曲面来逼近(或拟合)现象分布特征的趋势变化,也就是用数学方法把观测值分解为两个部分:
趋势部分和偏差部分。
趋势部分反映区域性的总的变化,受大范围的系统性因素的控制;偏差部分反映局部范围的变化特点,受局部因素和随机因素的控制。
(1)原理
设Zj(xj,yj)表示所分析现象的特征值,即观测值。
趋势面分析就是把观测值Z的变化分解成两个部分,即:
Zj(xj,yj)=f(xj,yj)+σj
式中:
f(xj,yj)为趋势值,σj为剩余值。
我们可以用回归方法求得趋势值和剩余值,即根据已知数据Z的一个回归方程f(x,y),使得
达到极小。
这实际上是在最小二乘法意义下的曲面拟合问题,即根据观测值Zj(xj,yj)用回归分析方法求得一个回归曲面
而以对应于回归曲面的值
作为趋势值,以残差
作为剩余值。
(2)多项式趋势面的数学模型
在趋势面分析中,我们通常选择多项式作为回归方程,因为任何一个函数在一个适当的范围内总是可以用多项式来逼近,而且调整多项式的次数可以使求得的回归方程适合问题的需要。
当某一地理现象的特征值在空间的分布为平面、二次曲面即抛物曲面、三次曲面、四次曲面、五次曲面或六次曲面时,可分别用一次多项式、二次多项式、三次多项式、四次多项式、五次多项式或六次多项式来拟合。
多项式数学模型中各项的排列顺序有一定规律,便于编程计算。
(3)多项式趋势面数学模型的解算
实际上是求多项式系数的最佳无偏估值问题。
最小二乘法可以给出多项式系数的最佳线性无偏估值,这些估值使残差平方和达到最小。
所以求回归方程也就是要求根据观测值Zj(xj,yj)(j=1,2,…,n),确定多项式的系数a0,a1,…,以使残差平方和最小,即:
我们记x=x1,y=x2,x2=x3,xy=x4,y2=x5,………,则多项式可以写为:
这样,多项式回归问题就可以转化为多元线性回归问题来解决。
现在,残差就是:
根据最小二乘法原理,我们要选择这样的系数a0,a1,……ap(p<n),以使Q达到极小。
为此,求Q对a0,a1,……,ap的偏导数,并令其等于零,则得正规方程组。
解此正规方程组,即得p+1个系数a0,a1,…,ap。
在原始数据量很大的情况下,用矩阵方法求解在计算机上实现是困难的,因为占据存储空间太大。
所以,一般采用高斯主元消去法或正交变换法求解正规方程组。
(4)趋势面拟合程度的检验
趋势面的拟合程度就是趋势面对原始数据面的逼近度。
这里介绍两种检验方法:
1°、F—分布检验
检验统计量为:
式中:
U为回归平方和,Q为剩余平方和,P为多项式的项数(不含常数项),n为观测点数。
在给定置信水平α的条件下,若F>Fα,则趋势面拟合效果显著,否则不显著。
2°、拟合指数公式检验
拟合指数公式为:
式中:
C为拟合指数,Zj为第j点的观测值,
为第j点的趋势值,
为全部观测值的平均值。
当C=100%时,表明趋势值在所有观测点上都与实际值吻合,但这种情况是很少的。
当C=75%以上时,拟合误差均在10%以下,这时可以认为趋势面的拟合效果良好。
3、预测模型
GIS地理数据库的数据除了反映各种自然和人文要素(现象)的空间分布特征和相互关系外,还能反映地理要素的动态发展规律,并用于预测分析。
这种预测分析是建立在现象间因果关系的基础上的,即某些现象作为原因,另一种现象作为结果,原因与结果的关系可以用确定的函数来描述,函数中的参数能说明这种因果关系的本质。
预测模型常用于判断结果随原因的变化而变化的方向和程度,用于推断随时间发生变化的大小。
所谓回归模型方法,就是从一组地理要素(现象)的数据出发,确定这些要素数据之间的定量表述形式,即建立回归模型。
通过回归模型,根据一个或几个地理要素数据来预测另一个要素的值。
这种回归模型就是一种预测模型。
Ø一元回归模型
Ø多元线性回归模型
4、聚类模型
聚类分析是根据多种地学要素对地理实体进行划分类别的方法,对不同的要素划分类别往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级等。
聚类分析的步骤一般是根据实体间的相似程度,逐步合并若干类别,其相似程度由距离或相似系数定义。
进行类别合并的准则是使得类间差异最大,而类内差异最小。
Ø最短距离聚类模型
Ø模糊聚类模型
Ø模糊多元统计分析模型
Ø相似聚类
四、空间数据的查询
查询和定位空间对象,直接提取信息,是地理信息系统进行高层次空间分析的基础。
1、空间数据查询的概念
查询属于数据库的范畴,一般定义为作用在库体上的函数,它返回满足条件的内容。
查询是用户与数据库交流的途径。
查询是GIS用户最经常使用的功能,GIS用户提出的很大一部分问题都可以以查询的方式解决,查询的方法和查询的范围在很大程度上决定了GIS的应用程度和应用水平。
目前GIS的空间查询主要有下列4种方式:
Ø扩展关系数据库的查询语言(SQL)
Ø可视化空间查询
Ø超文本查询
Ø自然语言空间查询
2、扩展关系数据库的查询语言(SOL)
目前GIS的地理数据库大多是以传统的关系数据库为基础的,但GIS中的地理数据库是一种特殊的数据库,其最大的不同是具有“空间”概念。
而SQL语句通常是由关系运算组合而成的,非常适合于关系表的查询与操作,但并不支持空间运算,因此,不能进行空间数据的查询。
目前的空间数据查询语言是通过对标准SQL的扩展来形成的,即在数据库查询语言上加入空间关系查询。
为此需要增加空间数据类型(如点、线、面等)和空间操作算子(如求长度、面积、叠加等)。
在给定查询条件时也需含有空间概念,如距离、邻近、叠加等。
例如,“显示与价值超过60000的地块相交的土壤图”,可表示为:
SELECTSOIL.MAP
FROMSOIL,PARCELS
WHEREVALUATION>60000ANDOVERLAY(SOILS,PARCELS)
通过对标准SQL的扩展来实现空间数据的查询主要优点是:
保留SQL风格,便于熟悉SQL的用户掌握,通用性较好,易于与关系数据库连接。
但Egenhofer(1992)在分析了扩展SQL作为空间数据查询语言的特点和局限后认为,对SQL扩展并不是空间数据查询的适当方案,其主要原因是:
(1)SQL结构很难描述复杂的空间关系查询。
(2)简单的表格形式不能作为空间数据的表现形式。
对于空间数据查询语言,最关键的是对空间概念的描述。
理想的情况是空间数据查询语言能完全表示人所理解的空间概念,但目前的空间数据查询语言所能理解和表达的空间概念还很有限。
在这方面还需要作进一步的研究。
2、可视化空间查询
可视化查询是指将查询语言的元素,特别是空间关系,用直观的图形或符号表示。
因为对于某些空间概念用二维图形表示比用一维文字语言描述更清晰、更本质和更易理解。
可视化查询主要使用图形、图像、图标、符号来表达概念,具有简单、直观、易于使用的特点。
例如某些空间操作可下图表示:
ON INSIDE OUTSIDE
CROSSTHROUGHINSIDEOUTSIDE
可视化空间查询的主要优点是:
自然、直观、易操作,用不同的图符可以组成比较复杂的查询。
但也存在一些缺点,如:
当空间约束条件复杂时,很难用图符描述;用二维图符表示图形之间的关系时,可能会出现歧义;难以表示“非”关系;不易进行范围(圆、矩形、多边形等)约束;无法进行屏幕定位查询等。
可视化空间查询是为方便用户输入查询条件而设计的,在GIS中仍然要翻译成形式化的SQL语言。
目前可视化空间查询所设计的图符以及所表示的操作缺乏规范性,不能表达所有的空间查询,但其简单、直观的特点值得其它空间查询方法借鉴。
3、超文本查询
超文本查询把图形、图像、字符等皆当作文本,并设置一些“热点”(HotSpot),“热点”可以是文本、键等。
用鼠标点击“热点”后,可以弹出说明信息、播放声音、完成某项工作等。
但超文本查询只能预先设置好,用户不能实时构建自己要求的各种查询。
4、自然语言空间查询
在空间数据查询中引入自然语言可以使查询更轻松自如。
在GIS中很多地理方面的概念是模糊的,例如地理区域的划分实际上并没有象境界一样明确的界线。
而空间数据查询语言中使用的概念往往都是精确的。
为了在空间查询中使用自然语言,必须将自然语言中的模糊概念量化为确定的数据值或数据范围。
例如查询高气温的城市时,引入自然语言时可表示为:
SELECTname
FROMCities
WHEREtemperatureishigh
如果通过统计分析和计算,以及用模糊数学的方法处理,认为当城市气温大于或等于33.75°C时是高气温。
则对上述用自然语言描述的查询操作转换为:
SELECTname
FROMCities
WHEREtemperature>=33.75
在对自然语言中的模糊概念量化时,必须考虑当时的语义环境。
例如,对于不同的地区,城市为“高气温”时的温度是不同的;气温的“高(high)”和人身材的“高(high)”也是不同的;等等。
因此,引入自然语言的空间数据查询只能适用于某个专业领域的地理信息系统,而不能作为地理信息系统中的通用数据库查询语言。
5、查询结果显示
GIS空间数据查询不仅能给出查询到的数据,还应以最有效的方式将空间数据显示给用户。
例如对于查询到的地理现象的属性数据,能以表格、统计图表的形式显示,或根据用户的要求来确定。
空间数据的最佳表示方式是地图,因而,空间数据查询的结果最好以专题地图的形式表示出来。
但目前把查询的结果制作成专题地图还需要一个比较复杂的过程。
为了方便查询结果的显示,Max(1991,1994)在基于扩展SQL的查询语言中增加了图形表示语言,作为对查询结果显示的表示。
具有6种显示环境的参数可选定:
1、显示方式(thedisplaymode)
有5种显示方式用语多次查询结果的运算:
刷新、覆盖、清除、相交和强调。
2、图形表示(thegraphicalpresentation)
用于选定符号、图案、色彩等。
3、绘图比例尺(thescaleofthedrawing)
确定地图显示的比例尺(内容和符号不随比例尺变化)。
4、显示窗口(thewindowtobeshown)
确定屏幕上显示窗口的尺寸。
5、相关的空间要素(thespatialcontext)
显示相关的空间数据,使查询结果更容易理解。
6、查询内容的检查(theexaminationofthecontent)
检查多次查询后的结果。
通过选择这些环境参数可以把查询结果以用户选择的不同的形式显示出来,但离把查询结果以丰富多彩的专题地图显示出来的目标还相差很远。
五、属性数据的查询统计
1、属性数据的集中特征数
反映属性数据集中特性的参数有:
频数和频率、平均数、数学期望、中数及众数。
(1)频数和频率
将变量xi(i=1,2,…,n)按大小顺序排列,并按一定的间距分组。
变量在各组出现或发生的次数称为频数,一般用fi表示。
各组频数与总频数之比叫做频率,按如下公式计算:
根据大数定理,当n相当大时,频率可近似地表示事件的概率。
计算出各组的频率后,就可作出频率分布图。
若以纵轴表示频率,横轴表示分组,就可作出频率直方图。
用以表示事件发生的频率和分布状况。
(2)平均数
平均数反映了数据取值的集中位置,常以
表示。
对于数据Xi(i=1,2,…,n)通常有简单算术平均数和加权算术平均数。
简单算术平均数的计算公式为:
加权算术平均数的计算公式为:
其中Pi为数据xi的权值。
(3)、数学期望
以概率为权值的加权平均数称为数学期望,用于反映数据分布的集中趋势。
计算公式为:
其中Pi为事件发生的概率。
(4)、中数
对于有序数据集X,如果有一个数x,能同时满足以下两式:
则称x为数据集X的中数,记为Me。
若X的总项数为奇数,则中数为:
若X的总顶数为偶数,则中数为:
(5)众数
众数是具有最大可能出现的数值。
如果数据X是离散的,则称X中出现最大可能性的值x为众数;如果X是连续的,则以X分布的概率密度P(x)取最大值的x为X的众数。
显然,众数可能不是唯一的。
2、属性数据的离散特征数
在分析GIS的属性数据时,不仅要找出数据的集中位置,而且还要查明这些数据的离散程度,即它们相对于中心位置的程度,同时,还要分析它的变化范围。
对于两组数据,可能它们的平均数是一样的,但它们分布在平均数附近的疏密程度却可能不同,即它们的离散程度可能不一样。
从统计规律的角度讲,离散程度较小的区域,其平均数的代表性较好;反之则较差。
很明显,前述的平均数、数学期望、中数和众数是不可能反映数据的离散程度的,因此需要引入刻划离散程度差异的统计特征数,即极差、离差、方差、标准差、变差系数。
(1)极差
极差是一组数据中最大值与最小值之差,即
(2)离差、平均离差与离差平方和
一组数据中的各数据值与平均数之差称为离差,即
若把离差求平方和,即得离差平方和,记为
若将离差取绝对值,然后求和,再取平均数,得平均离差,记为
平均离差和离差平方和是表示各数值相对于平均数的离散程度的重要统计量。
(3)、方差与标准差
方差是均方差的简
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八章 GIS空间分析的原理和方法 第八 GIS 空间 分析 原理 方法