空间数据库复习题.docx
- 文档编号:6233071
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:25
- 大小:455.84KB
空间数据库复习题.docx
《空间数据库复习题.docx》由会员分享,可在线阅读,更多相关《空间数据库复习题.docx(25页珍藏版)》请在冰点文库上搜索。
空间数据库复习题
Chapter1:
IntroductiontoSpatialDatabases
1、举例说明什么是空间数据、非空间数据?
如何理解空间查询〔spatialqueries〕和非空间查询的区别〔Non-spatialqueries〕?
答:
河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据
书店名称店员人数,去年的销售量,等是非空间数据
空间查询是对空间数据的查询或命令
2、什么是GIS,什么是SDBMS?
请阐述二者的区别和联系。
答:
1、GIS是一个利用空间分析功能进展可视化和空间数据分析的软件。
它的主要功能有:
搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量
GIS可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集
2、SDBMS是一个软件模块。
它可以
①、利用一个底层的数据库管理系统
②、支持多种空间数据模型、相应的空间抽象数据类型〔ADT〕以及一种能够调用这些ADT的查询语言
③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规那么
3、区别与联系:
①、利用GIS可以对某些对象和图层进展操作,而利用SDBMS那么可以对更多的对象集和图层进展更加简单的操作
②、SDBMS可以在GIS不能使用的某些领域进展使用,例如基因组学、天文学、多媒体信息系统等
③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。
3、从GIS这一缩写的三种含义来理解GIS的开展历程。
答:
地理信息系统:
为专业人员提供的软件
地理信息科学:
为地理信息系统和效劳提供使用和开展的定义、框架和理论
地理信息效劳:
为普通用户提供的网点和效劳中心,例如PC机上的地理和空间效劳
4、用传统数据库系统管理空间数据,存在什么缺乏之处?
答:
1〕无法用递归和嵌套的方式来描述复杂关系的层次和网状构造,模拟和操作复杂地理对象的能力较弱;
2〕用关系模型描述本身具有复杂构造和涵义的地理对象时,需对地理实体进展不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理;
3〕由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高
4〕空间数据通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。
5〕一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等根本操作。
6〕一般DBMS不能支持GIS需要的一些复杂图形功能。
7〕一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。
8〕GIS管理的是具有高度部联系的数据,为了保证地理数据库的完整性,需要复杂的平安维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统数据的完整性。
否那么,一条记录的改变会导致错误、相互矛盾的数据存在,而一般RDBMS难以实现这一功能。
5、WhatisaSDBMS?
答:
SDBMS是一个软件模块。
它可以
①、利用一个底层的数据库管理系统
②、支持多种空间数据模型、相应的空间抽象数据类型〔ADT〕以及一种能够调用这些ADT的查询语言
③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规那么
6、什么是后关系数据库模型?
后关系数据库模型有哪些?
答:
后关系数据库模型支持用户定义抽象数据类型,空间数据的类型可以添加。
包括面向对象的数据库模式OOBDMS和面向关系ORDBMS的数据库模式。
7、SDBMS的三层体系构造〔ThreeLayerArchitecture〕是什么?
借此深入理解SDBMS的作用。
答:
空间应用—空间数据库—DBMS
教材P11的图
8、空间数据库主要涉及哪些容?
答:
数据模型、查询语句、查询处理与优化、文件组织和索引、数据挖掘
9、举例说明单遍扫描查询和多遍扫描查询的概念。
答:
单边扫描查询中,被查询的表〔关系〕中的一条记录〔元组〕最多只被访问一次;例如“列出武大周围5km的书店的名字〞。
多遍扫描查询是被查询的表〔关系〕中的一条记录〔元组〕至少被访问一次,例如“找出其代表的选取围大于200公顷并且在这区拥有公司的女议员的名字〞
10、过滤-精炼策略的作用?
两个步骤的容是什么?
提示:
ppt:
Efficientalgorithmstoanswerspatialqueries
CommonStrategy-filterandrefine〔过滤-精炼〕
FilterStep:
QueryRegionoverlapswithMBRsofB,CandD
过滤:
查询区域与B、C、D的最小外接矩形有重叠局部,保存B、C、D,其他的舍弃
RefineStep:
QueryRegionoverlapswithBandC
精炼:
查询区域与B、C有重叠,舍弃D
11、平面扫描(planesweep)技术主要解决什么问题?
其主要步骤?
答:
主要解决的是如何在过滤阶段中尽可能多的淘汰不符合条件的对,从而减少几何计算的计算代价。
Step1:
从左至右移动一条扫描线(例如,垂直于x轴的线),停在R∪S的第一个元素处。
这就是具有最小T.xl值的矩形T,例子为是矩形R4。
Step2:
搜索S中已排序的矩形,直到抵达第一个矩形Sf,这里有Sf.xl>T.xu。
显然,对于所有1≤j 注意f是以图1-9c的数组索引为序,即S1=S2、S2=S1、S3=S3。 这样S2就是一个可能与R4交叠的候选矩形。 Step3: 如果对任意l≤j≤f,关系[T.yl,T.yu]∩[Sj.yl,Sj.yu]存在,那么Sj与T相交。 因此,这一步就确定了R4与S2确实是交叠的,并且 记录所有这样的信息,然后将矩形T〔R4〕从集合R∪S中去掉,它不再需要参与结果集中的其他相交对。 Step4: 继续移动扫描线来穿过集合R∪S,直至碰到下一个矩形,在本例中是S2。 这时进展步骤2和3。 Step5: 当R∪S=∅时,处理完毕; 12、从程序员的观点和DBMS设计者的观点看,影响系统效率的因素有何不同。 答: 在程序员看来,计算机主要包括两个局部: CPU和无限量的存 在DBMS设计者看来,计算机主要包括三个局部: CPU、有限的存、无限的硬盘空间。 访问硬盘的速度要远远小于访问存的速度,因此前者关注减少算法的计算时间,后者强调的是将计算时间和I/O时间的总和减少到最小。 13、查询优化和数据挖掘的概念。 答: 查询优化: 基于数据集的特点对查询中的操作进展排序,为每一步操作选择有效策略 数据挖掘: 即进展系统的搜索,找出隐藏在电子信息中潜在的有用信息。 Chapter2: SpatialConceptsandDataModels 1、什么是数据模型? 举例说明数据模型的重要性。 答、数据模型是数据集的特定构造和模式,是对数据的文件描述,有利于某些性质的前期分析。 作用: ①、属性的前期分析;②、重利用多媒体应用中的共享数据;③、组织换数据 ④、将数据传递给新软件或环境 例子: 千禧年危机正确的使用数据模式可以显著的降低本钱,如果软件中的时间和数据被定义成抽象数据模型,只有一小局部的软件会执行数据,ADT数据要被重新修改。 2、掌握两种常用的空间信息模型: 要素模型和场模型,矢量、栅格数据构造。 答: 场模型: ①、空间分割框架②、场函数③、场操作: 并、复合 森林模型中分段函数表示,区域中每个点被映射成主要树种对应的值 要素模型: ①、对象: 把空间信息抽象成明确的,可识别的事物或实体;②、对象具有属性和操作 森林模型中多边形表示〔林分〕,每个对象有唯一的标示符、主要树种和一块区域。 矢量数据构造 栅格数据构造: 栅格构造用密集正方形〔或三角形,多边形〕将地理区域划分为网格阵列。 位置由行,列号定义,属性为栅格单元的值。 点: 由单个栅格表达。 线: 由沿线走向有一样属性取值的一组相邻栅格表达。 面: 由沿线走向有一样属性取值的一片栅格表达。 3、基于场模型的操作有哪些,举例说明区基于场模型的局部操作、聚焦(focal)和区域操作? 基于对象模型的操作有哪些? 答: 基于场模型: 局部操作: 空间框架一个给定位置的新场的取值只依赖于同一个位置场的输入值。 书上P31。 聚焦操作: 在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值。 极限、高程场的梯度 区域操作: 与聚集运算符或微积分中的积分运算有关。 计算每个树种的平均高度。 基于对象模型: 面向集合、拓扑、方位、度量空间 4、什么是拓扑关系,举例说明拓扑与非拓扑特性、拓扑与非拓扑操作。 答: 是指满足拓扑几何学原理的各空间数据间的相互关系。 即用结点、弧段和多边形所表示的实体之间的邻接关联和包含等关系。 拓扑特性: 弹性变形后临近物体之间的拓扑关系没有发生改变 非拓扑特性: 弹性变形后临近物体之间的拓扑关系发生了改变 拓扑操作与非拓扑操作 5、OGIS提出的关于空间几何体的根本构件有哪些? 6、说明九交模型表达拓扑关系的原理。 答: 在一个平面上。 两个对象A、B之间的二元拓扑关系主要基于以下的相交情况,即分别是A和B的部、边界、外部。 值六局部可以构成九交模型。 考虑取值有空(0)和非空 (1),可以确定有29=512种二元拓扑关系。 对于R²嵌在中的二维区域,有八个关系是可实现的,并且它们彼此互斥且完全覆盖。 : 相离、相接、交叠、相等、包含、在部、覆盖、被覆盖。 7、数据库设计的三个步骤及其主要容。 答、首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息; 然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关 最后,数据库设计的第三个步骤是物理设计的建模,它解决数据库营养在计算机中具体实现是方方面面的细节。 8、ER模型的作用,ER图包括哪些要素,如何表达多值属性? ER图与空间信息对象模型之间的异同? 答: ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节别离开来。 ER图包括实体〔物理上或概念上独立存在的事物或对象〕、属性和联系。 实体用属性来刻画性质,实体之间通过练习相互作用和关联。 属性可以是单值或多值。 ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。 码属性加下划线,多值属性用双椭圆。 异同: ①、实体是物体属性的集合;②、ER模型不允许普通用户定义操作;③、在对象模型中关系不被直接支持,但可以由操作来模仿。 9、数据库三层约束的容: 码约束--实体完整性(entityintegrity)约束,参照完整性(referentialintegrity]约束和用户参照完整性。 简述关系模式中的三种完整性。 答;码约束: 每个关系必须要有一个主码; 实体完整性约束: 主码不能为空; 参照完整性约束: 外码的属性值要么是另一个关系的主码,要么为空值。 10、外码的概念。 答: 外码是一个关系的属性集,这个关系被复制到另外一个关系中。 主码与外部码提供了一个实现关系间联系的手段。 11、ER图向关系模型的转换,注意对多值属性的转换。 〔P16〕 答: ①、实体成为关系;实体的属性映射成为关系的属性;多值属性形成新的关系 ②、Relationships(1: 1): 将任一实体的码属性作为其他关系的一个外码 ③、Relationships(M: 1): 将“1”侧的关系的主码作为“M〞侧关系的外码。 ④、M: NRelationshipsbecomearelation〔M: N中M和N共同形成新表的关键字〕 12、对于空间数据,ER模型方法的缺乏之处? 为表达空间概念,扩展ER模型主要增加了哪些要素? --实体象形图、关系象形图,读懂扩展ER模型的表示符号。 〔书上P51〕 答: 1〕、ER模型的最初设计隐含了基于对象模型的假设。 因此,场模型无法用ER模型进展自然的映射 2〕、在传统的ER模型中,实体之间的联系由所要开发的应用来导出,而在空间建模中,空间对象之间总会有在的联系 3〕、建模空间对象所使用额试题联系类型和“地图〞的比例尺有关 13、举例说明用象形符号扩展ER图,对于空间数据建模有何好处? 用象形符号扩展ER图,以便专门处理空间数据类型。 这将减少ER图以及所产生的关系模式的复杂度,同时改良空间建模的质量。 空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表示。 关系模式中的表达多值空间属性的关系和M: N空间联系也就不需要了 14、举例说明类、属性、方法、聚合、泛化、和关联等概念? 答: 类: 是多有在应用中具有一样性质的对象的封装,等价于ER模型中的实体;例如设施就是一个类。 属性: 描述类的对象。 属性还有一个与之相关联的作用域,分为公有、私有、受保护 方法: 是一些函数,是类定义的一局部,用来修改类的行为或状态 关系: 将一个类与另一个类或者它自己相联系,类似于ER中的联系。 UMLCD中三种重要关系: 聚合、泛化、关联。 聚合: 描述局部与整体的关系: 强聚合、弱聚合 泛化: eg.多边形是点线面的泛化;关联: 反响不同类的对象是如何联系的。 15、UML的作用? 了解UML的主要符号。 答: UML是用于面向对象软件设计的概念层建模的新兴标准之一,它是一种标准化语言,用于在概念层对构造化模式和董涛行为进展建模。 16、比拟ER与UML。 答: 1〕、没有方法的类就是实体;2〕、属性在两个里都一样;3〕、UML中没有主键和完整性约束;4〕、ER中没有方法;5〕、ER中关系的容更丰富;6〕、ER图中的实体与数据集有关,但UML的类几乎和数据集无关。 Chapter3SpatialQueryLanguages 1.ThreeComponentsofSQL。 请列举SQL所包含的功能,并对每种功能列举相关的操作符〔语句〕。 答: 数据定义语言DDL: 创立和修改关系表〔包括索引〕 数据操纵语言DML: 插入,删除,更新,查询 数据控制语言DCL: 并发控制,事务处理 2.SELECTspecifiesdesiredcolumns FROMspecifiesrelevanttables WHEREspecifiesqualifyingconditionsforrows(限定条件) ORDERBYspecifiessortingcolumnsforresults GROUPBY,HAVINGspecifiesaggregationandstatistics 〔要求: 看懂书上例句,要求会写语句〕 3.扩展SQL以处理空间数据,掌握对标准SQL进展了哪些方面的扩展? 提示: ppt: SQL3allowsuserdefineddatatypesandoperations.SpatialdatatypesandoperationscanbeaddedtoSQL3 SQL3支持用户自定义类型和操作,空间数据类型和操作被允许参加到SQL3中 4.OpenGeodataInterchangeStandard(OGIS)支持的SpatialDataModel和空间操作有哪些 答: 用于所有集合类型的根本操作; 用于空间对象间拓扑关系的操作谓词; 用于空间分析的一般操作 5.读懂ListofSpatialQueryExamples。 给语句,说明查询目的? 或者给出查询目的,要求写语句。 6.view(视图)的含义。 视图使用来描述导出数据或查询结果简化复杂网状查询的表 Chapter4: SpatialStorageandIndexing 1、Whatisaphysicaldatamodel? Whylearnphysicaldatamodelconcepts? 答: 1〕、执行逻辑数据模型的理论根底,使用现有的构件在一个有效容错的方式中 2〕、选择适宜的DBMS,某些DBMS不支持空间索引;使DBMS运行的更加有效率。 2、IsrelationalDBMSphysicaldatamodelsuitableforspatialdata? 如果不适合,有哪两类解决途径? 答: 不适宜。 关系DBMS那么只能对数字进展简单处理;排序、查询树对数字非常有效,但这些概念都不适合用于处理空间数据 提示: ppt途径1〕Reusingrelationalphysicaldatamodelconcepts,重新使用关系物理数据模型的概念: Spacefillingcurvesdefineatotalorderforpoints用空间填充曲线来定义点的排列 Thistotalorderhelpsinusingorderedfiles,searchtrees有助于使用有序文件和查询树 Butmayleadtocomputationalinefficiency! 但可能会导致计算无效率 途径2〕: Newspatialtechniques新空间技术: Spatialindices,e.g.grids,hierarchicalcollectionofrectangles空间索引: 例如网格 Providebettercomputationalperformance能提供更好的计算表现 3、计算机存储设备的种类? 数据库系统是怎么利用各种设备的? 提示: ppt: TypesofstorageDevices: Mainmemories-fastbutcontentislostwhenpowerisoff主存: 速度快,信息断电丧失 Secondarystorage-slower,retainscontentwithoutpower二级存储器: 慢,信息断电不丢 Tertiarystorage〔如磁带驱动器〕-veryslow,retainscontent,verylargecapacity脱机存储器: 非常慢,保存信息容量非常大。 DBMSusuallymanagedata •onsecondarystorage,e.g.disks •Usemainmemorytoimproveperformance •Usertertiarystorage(e.g.tapes)forbackup备份,archival档案etc. 4、磁盘存储相关概念: 磁道track、扇区sector、柱面cylinder? 页面的概念? 答: 磁道: 圆心磁盘片上向边缘延伸的同心圆 扇区: 每个磁道中被分成假设干等份的区域 柱面: 是磁盘上具有一样镭的磁道的集合 页面: 又称磁盘块。 是磁盘与主存之间的最小传输单位 5、访问磁盘扇区数据的过程,哪个过程花费的时间最多? 提示: ppt: Accessingasectorhasthreemajorsteps: •Seek〔寻道〕: Moveheadassemblytorelevanttrack〔ts〕 •磁头到达特定磁道所用的时间 •Latency(延迟时间): Waitforspindletorotaterelevantsectorunderdiskhead〔tl〕块旋转到磁头下方所用的时间 •Transfer传输时间: Readorwritethesector(tt)置于正确位置后读写块中数据的实际时间 •1>2>3 6、如何有效利用磁盘硬件? 提示: ppt: UsingDiskHardwareEfficiently •Sizeofsectors扇区面积 •Largersectorprovidefastertransferoflargedatasets •数据集大时大扇区提供更快的传输速度 •Butwastestoragespaceinsidesectorsforsmalldatasets •但浪费了小数据集的存储空间 •Placementofmostfrequentlyaccesseddataitems放置频繁使用的数据 •Onmiddletracksratherthaninnermostoroutermosttracks •在中间的磁道而不是最里面或最外面的磁道 •Reason: minimizeaverageseektime可以减少寻道时间 •Placementofitemsinalargedatasetrequiringmanysectors放置一个需要很多扇区的大数据集 •Choosesectorsfromasinglecylinder尽量放在同一个柱面 •Reason: Minimizeseekcostinscanningtheentiredataset.减少扫描全集花费的时间 7、域(filed)、记录(record)、文件〔file〕的概念, 提示: MappingRecordsandfilestoDisk. •Records •Oftensmallerthanasector •Manyrecordsinasector •Fileswithmanyrecords文件是记录的集合 •Manysectorsperfile 8、页面的概念: 磁盘与主存之间的最小传输单位。 一个文件可能跨越多个页面。 一个页面是槽的集合,一个槽包含一条记录 9、文件构造的含义,举例说明几种常用文件构造—heap,Ordered、Hashed、Clustered。 答: 文件构造是指文件中记录的组织形式。 堆: 无序文件。 记录没有特定的顺序。 根据给定的关键码(如name)查找一条记录需要扫描文件中的记录。 在最坏情况下,文件的所有记录都要被检查,所有存储该文件数据的磁盘页面都要被访问。 平均来说,需要检索一半的磁盘页面。 优点是在进展插入操作时可以很容易地在文件末尾插入一条新记录。 存储河流表 散列文件: 使用散列函数吧记录分到一系列散列单元中。 可取之处在于它能够把数量大致一样的记录放入每个散列单元中。 对于点查询、插入、删除都很有效。 不适合围查询。 按字符个数存储城市名称。 有序文件: 根据给定的主码与对记录进展组织。 折半法非常有效。 不能直接运用在空间领域例如,除非对多维空间中的点定义一个全序,否那么无法对城市的位置排序。 有序文件组织方式还可以根据对空间数据集的文件组织方式而概括成空间聚类。 聚类: 聚类的目的就是降低响应常见的大查询的寻道时间(ts)和等待时间(t1)。 对于空间数据库来说,这意味着在二级存储中,空间上相邻的和查询上有关联性的对象在物理上应当存储在一起。 10、使用空间填充曲线组织空间数据的意义? 提示: Chapter1,Organizingspatialdatawithspacefillingcurves •Imposeanorderingonthelocationsinamult
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据库 复习题