空间数据库复习重点答案(完整)

更新时间:2024-07-12 09:15:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1、举例说明什么是空间数据、非空间数据?如何理解空间查询和非空间查询的区别?常用的空间数据库管理方式有哪几种及其各自特点。

数据:是指客观事务的属性、数量、位置及其相互关系等的符号描述。空间数据:是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据。河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据 书店名称 店员人数,去年的销售量,电话号码等是非空间数据 空间查询是对空间数据的查询或命令 人工管理阶段

文件管理阶段 缺点:

1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。

2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。不能达到真正的共享,即数据项、记录项的共享。 常用:

文件与数据库系统混合管理阶段 优点:由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。

缺点:1)由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。

2)数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。

3)几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多

全关系型空间数据库管理系统

◆属性数据、几何数据同时采用关系式数据库进行管理 ◆空间数据和属性数据不必进行烦琐的连接,数据存取较快

◆属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作 ◆GIS软件:System9,Small World、GeoView等

本质:GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。 对象关系数据库管理系统

优点:在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。 缺点:用户须在DBMS环境中实施自己的数据类型,对有些应用相当困难。 面向对象的数据库系统。

采用面向对象方法建立的数据库系统;

对问题领域进行自然的分割,以更接近人类通常思维的方式建立问题领域的模型。 目前面向对象数据库管理系统还不够成熟,价格昂贵,在空间数据管理领域还不太适用; 基于对象关系的空间数据库管理系统可能成为空间数据管理的主流 2、什么是GIS,什么是SDBMS?请阐述二者的区别和联系。

GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量 GIS 可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集

改:地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,运用系统工程和信息科学的理论,科学管理和综合分析具有空间内涵的地理数据,以提供管理、决策等所需信息的技术系统。简单的说,地理信息系统就是综合处理和分析地理空间数据的一种技术系统。

2、SDBMS是一个软件模块。它可以 ①、利用一个底层的数据库管理系统 ②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言 ③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则 3、区别与联系:①、利用GIS可以对某些对象和图层进行操作,而利用SDBMS则可以对更多的对象集和图层进行更加简单的操作 ②、SDBMS可以在GIS不能使用的某些领域进行使用,例如基因组学、天文学、多媒体信息系统等 ③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。

改:联系:GIS可作为SDBMS的前端工具,一个高效的空间数据库系统是实现GIS高效查询和分析的前提条件。

区别:GIS和SDBMS的主要不同侧重点:

GIS是一个侧重于空间数据可视化和分析的软件,GIS常用分析功能:

GIS使用SDBMS存储、检索、查询、共享大型空间数据集 SDBMS重点关注:

高效存储、查询和共享大型空间数据集 提供尽量简单的查询方法

通过空间索引和查询优化方法加快大型空间数据集的查询反应时间 SDBMS有可能用于非GIS领域的其它方面:如天文、气象、生物等

3、用传统数据库系统管理空间数据,存在哪些局限?

只支持简单的数据类型,如:数字、字符串、日期。实现上述的多段线表达非常复杂

答:(1)传统数据库系统管理的是不连续的、相关性较小的数字和字符;而地理信息数据是连续的,并且具有很强的空间相关性。

(2)传统数据库系统管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系;而地理空间数据的实体类型繁多,实体类型之间存在着复杂的空间关系,并且还能产生新的关系(如拓扑关系)。

(3)传统数据库系统存贮的数据通常为等长记录的数据;而地理空间数据通常由于不同空间目标的坐标串长度不定,具有变长记录,并且数据项也可能很大,很复杂。

(4)传统数据库系统只操纵和查询文字和数字信息;而空间数据库中需要有大量的空间数据操作和查询,如相邻、连通、包含、叠加等。

或者:总结标准DBMS存储空间数据的局限性

空间数据记录是变长的(如点数的可变性),而一般的数据库都只允许把记录的长度设定为固定; 在存储和维护空间数据拓扑关系方面存在着严重缺陷;

一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作; 不能支持复杂的图形功能;

单个地理实体的表达需要多个文件、多条记录,一般的DBMS也难以支持; 难以保证具有高度内部联系的GIS数据记录需要的复杂的安全维护。

4、什么是SDBMS?SDBMS的三层体系结构是什么?

一个SDBMS(空间数据库管理系统)是一个软件模块,它利用一个底层数据库管理系统(如ORDBMS、OODBMS);

SDBMS支持多种空间数据类型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言

SDBMS支持空间索引、高效的空间操作算法以及 用于查询优化的特定领域规则

SDBMS包括:空间数据模型、查询语言、文件组织、查询优化等。下图表示了基于对象关系模型上的一个空间数据库应用的三层体系结构。 SDBMS三层体系结构

顶层为空间应用,如GIS、MMIS(多媒体信息系统),或者CAD。该层不直接与OR-DBMS打交道,需要一个中间层与OR-DBMS交互。

中间层:空间数据库(SDB),中间层是封装大多数空间领域知识的地方,不“插”入到OR-DBMS中。又称空间数据刀片、空间数据暗盒、空间数据引擎。 最后一层;DBMS 5、数据库模式有哪些?

物理模式(物理层设计)内模式、逻辑模式(通常简称为“模式”)子模式(外模式)通常,数据库管理系统支持一个物理模式、一个逻辑模式和多个子模式。

6、什么是数据模型?概念模型有哪些?逻辑模型有哪些?每一种模式的原理是什么?

数据模型是数据库系统中关于数据内容和数据之间联系的逻辑组织的形式表示。每一个具体的数据库都由一个相应的数据模型来定义。(数据库的概念描述,是数据库系统中用于提供信息表示和操作手段的形式构架。)

概念模型:按用户的观点从现实应用中抽象出事物以及事物之间的联系 结构数据模型:从计算机实现的观点来对数据建模 概念模型:

实体-联系模型(ER)

? 现实世界被划分为若干实体(entity),由属性(attribute)来描述性质,通过联系(relationship)

互相关联

面向对象模型 逻辑数据模型: 层次模型

? 用树结构表示实体之间联系的模型叫层次模型 ? 树由节点和连线组成

? 节点代表实体型

? 连线表示两实体型间的一对多联系

网状模型

网状数据模型是一个满足下列条件的有向图: 1、可以有一个以上的节点无父节点。

2、至少有一个节点有多于一个的父节点(排除树结构)。 关系模型

? 用二维表来表示实体及其相互联系

面向对象模型

为了有效地描述复杂的事物或现象,需要在更高层次上综合利用和管理多种数据结构和数据模型,并用面向对象的方法进行统一的抽象。

7、 数据库设计的三个步骤有哪些?每一步有些什么内容?

答、首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息; 然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关

最后,数据库设计的第三个步骤是物理设计的建模,它解决数据库营养在计算机中具体实现是方方面面的细节。 改:概念模型

? 按用户的观点从现实应用中抽象出事物以及事物之间的联系

逻辑建模

? 建立概念和联系的逻辑结构 逻辑结构设计的步骤:

1)将概念结构转化为一般的关系、网状、层次模型、面向对象模型 2)对数据模型进行优化 3) 设计用户子模式

物理设计建模

? 对逻辑结构进行具体实现方面的安排和考虑 ? 存储组织、索引、内存管理……

8、ER模型的作用,ER图包括哪些要素,如何表达多值属性?

答:ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节分离开来。

ER图包括实体(物理上或概念上独立存在的事物或对象)、属性和联系。实体用属性来刻画性质,实体之间通过练习相互作用和关联。属性可以是单值或多值。ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。码属性加下划线,多值属性用双椭圆。

9、对于空间数据,ER模型方法的不足之处?为表达空间概念,扩展ER模型主要增加了哪些要素?举例说明用象形符号扩展ER图,对于空间数据建模有何好处? .ER图在空间建模中的不足:

场模型无法用ER模型进行自然映射——因为:ER模型的最初设计隐含了基于对象模型的假设。 传统ER模型中,实体之间的关系由应用来导出;而空间建模中,空间对象之间总会有内在联系。 建模空间对象所使用的实体类型与“地图”比例尺有关。有时是点、线,有时是多边形。 扩展E-R模型:

1)、实体象形图 :

象形图 :象形图是一种将对象插在方框内的微缩图表示,这些微缩图用来扩展ER图,并插到实体矩形框中的适当位置。

形状:形状是象形图中的基本图形元素,它代表着空间数据模型中的元素。 一个模型元素可以是基本形状、复合形状、导出形状或备选形状。 基本形状

复合形状:为了处理那些不能用某个基本形状表示的对象,我们定义了一组聚合的形状,并用基数来量化这些复合形状

导出形状:如果一个对象的形状是由其他对象的形状导出的,那么就用斜体形式来表示这个象形图。

备选形状:备选形状可以用于表示某种条件下的同一个对象。 例如,根据比例尺,一条河流可以表示成一个多边形或一条线。

任意形状:对于形状的组合,我们用通配符(*)表示,它表示各种形状。 例如,一个灌溉网是由泵站(点)、水渠(线)以及水库(多边形)所组成的。

用户自定义形状 2)、联系象形图。

联系象形图用来构建实体间联系的模型。例如,part-of用于构建道路与路网之间联系的模型,或是用于把森林划分成林分的建模。

好处:用象形符号扩展ER图,以便专门处理空间数据类型。这将减少ER图以及所产生的关系模式的复杂度,同时改进空间建模的质量。空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表示。关系模式中的表达多值空间属性的关系和M:N空间联系也就不需要了 10、举例说明如何将ER图映射成关系模型? 1.实体映射成单独关系

2.对于基数为1∶1的联系转换为一个独立的关系模式,也可与任一端对应的关系模式合并。将任一实体的码属性作为其他关系的一个外码。如Manager-Forest

3.对于基数为M∶1的联系,可以转换为一个独立的关系模式,也可以与M端对应的关系模式合并。将“1”侧关系的主码作为“M”侧关系的外码,转换来的关系的主码为M 侧的码。如Forest-FireStation

4.对于基数M:N的联系,则每一个M:N的联系被映射成一个新关系,其主码由参与的实体对主码组成,联系的属性映射成关系的属性,如Facility-River

5.对于多值属性,创建一个具有两列的新关系,一列对应多值属性,另一列对应实体的码。多值属性和实体码一起构成新的关系的主码。如Forest-stand的几何属性polygonid,新表为Fstand-Geom。 6.多值属性Elevation也需要一个新表,表中由ForestName、Elevation和Pointid共同构成主码。 7. 具有相同码的关系模式可合并

11、常用的空间信息模型有哪些?它们分别由哪些内容组成?采用什么样的数据结构?基于每种空间信息模型有哪些操作? 两种常用空间信息模型:

场模型(Field base model),采用栅格模型 对象模型(Object based model),采用矢量结构

场模型用于表示具有连续的空间变化的情况,形状不定的现象。对象模型用于表示具有固定形状的空间实体/概念描述空间上离散的空间对象。

场模型的3个组成部分:空间框架、场函数、场操作。 场操作分类: (1)局部操作

对于局部操作,空间框架内一给定位置的新场取值只依赖于同一位置场的输入值。

(2)聚焦操作

指定位置的结果场的值依赖于同一位置的一个假定领域上的场的值

设E(x,y)是state-park的高程场,E给出了空间框架F在位置(x,y)的高程值,计算高程场的梯度▽E(x,y) ,就是一个聚焦操作,梯度值依赖于(x,y)的邻域场(x1,y1)的高程。 (3)区域操作

与聚集运算符或积分运算有关。如在森林的例子中求某种树种的平均高度。 对象模型的组成部分:对象类型、对象属性和操作、对象关系。

空间对象的操作:面向集合的、拓扑的方位的、度量空间的、欧氏空间的

12、什么是范式理论?理解并简述函数依赖、部分函数依赖、部分函数依赖、传递函数依赖的涵义。 范式是符合某一种级别的关系模式的集合。

设R(U)是一个属性集U上的关系模式,X和Y是U的子集。 若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y。 X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)

函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。

在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X?,都有X? Y, 则称Y完全函数依赖于X,记作X f Y。若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作X P Y。 在关系模式R(U)中,如果X→Y,Y→Z,且Y ?X,Y→X,则称Z传递函数依赖于X。 注: 如果Y→X, 即X←→Y,则Z直接依赖于X。

13、结合实例,简述1~4NF的涵义,并能判别属于第几范式,及如何转换成更高级别的范式。 各种范式之间存在联系:

1NF?2NF?3NF?BCNF?4NF?5NF

某一关系模式R为第n范式,可简记为R∈nNF。

1NF的定义:如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。 但是满足第一范式的关系模式并不一定是一个好的关系模式。

2NF的定义:定义5.6 若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。(所有非主属性完全依赖每个候选关键字。 ) 例:SLC(Sno, Sdept, Sloc, Cno, Grade) ∈1NF SLC(Sno, Sdept, Sloc, Cno, Grade) ∈2NF

SL(Sno, Sdept, Sloc) ∈ 2NF

(sloc为学生住处,sdept为选课)

订单号 商品号 商品名 商品描述 单价 供应商号 供应商名 供应商电话 000001 200 A ........ 2.00 234560 XXXXXX .......... 000001 201 B ........ 1.00 234560 XXXXXX .......... 000001 202 C ........ 10.00 234560 XXXXXX .......... 000001 203 D ........ 20.00 234560 XXXXXX .......... 000001 204 E ........ 5.00 234560 XXXXXX .......... ------------------------------------------------------------------------------- 000002 200 A ........ 2.00 234561 YYYYYY .......... 000002 201 B ........ 1.00 234561 YYYYYY .......... 000002 202 C ........ 10.00 234561 YYYYYY .......... 000002 204 E ........ 5.00 234561 YYYYYY ..........

SC(Sno, Cno, Grade) ∈ 2NF

------------------------------------------------------------------------------- 000003 202 C ........ 10.00 234560 XXXXXX .......... 000003 203 D ........ 20.00 234560 XXXXXX .......... 000003 204 E ........ 5.00 234560 XXXXXX ..........

(订单号 商品号 商品名 商品描述 单价 供应商号 供应商名 供应商电话) 其中: 主码(订单号 ,商品号 )

商品号?(商品名 ,商品描述, 单价)

因为“商品号”在表中是主键的一部分, 所以“商品名 商品描述 单价”对于“商品号”存在部分函数依赖.

将存在部分依赖关系的列拿出来新生成一个新的表Product, 而原来的Order表中去掉了一些列,形成一个新的Order表,

Order表: 订单号 商品号 供应商号 供应商名 供应商电话 ... Product表: 商品号 商品名 商品描述 单价 ...

采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。

将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。

SL(Sno, Sdept, Sloc) ∈ 2NF 例:2NF关系模式SL(Sno, Sdept, Sloc)中 函数依赖:

Sno→Sdept Sdept→Sloc Sno→Sloc

Sloc传递函数依赖于Sno,即SL中存在非主属性对码的传递函数依赖。 ? 解决方法

采用投影分解法,把SL分解为两个关系模式,以消除传递函数依赖: SD(Sno, Sdept) DL(Sdept, Sloc) SD的码为Sno, DL的码为Sdept。

定义3FN: 关系模式R 中若不存在这样的码X、属性组Y及非主属性Z(Z ? Y), 使得X→Y,Y → X,Y→Z,成立,则称R ∈ 3NF。(所有非主属性都不传递函数依赖每个候选关键字或一个或多个属性(列)依赖于非主键的属性(列). ) 例, SL(Sno, Sdept, Sloc) ∈ 2NF SL(Sno, Sdept, Sloc) ∈ 3NF SD(Sno, Sdept) ∈ 3NF DL(Sdept, Sloc)∈ 3NF

若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。 如果R∈3NF,则R也是2NF。

采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。

将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。 学生关系表Student(学号, 姓名, 年龄, 所在学院, 学院地点, 学院电话), 关键字: “学号”,

(学号) → (姓名, 年龄, 所在学院, 学院地点, 学院电话)

(学号) → (所在学院) → (学院地点, 学院电话):即存在非关键字段“学院地点”、“学院电话”对关键字段“学号”的传递函数依赖。

这个关系是符合2NF的,但是不符合3NF,

它也会存在数据冗余、更新异常、插入异常和删除异常的情况, 把学生关系表分为如下两个表: 学生:(学号, 姓名, 年龄, 所在学院); 学院:(学院, 地点, 电话)。 这样的关系是符合3NF

假设仓库管理关系表为StorehouseManage(仓库ID, 存储物品ID, 管理员ID, 数量),且一个管理员只在一个仓库工作;一个仓库可以存储多种物品。判断该关系模式所属范式 这个数据库表中存在如下决定关系:

(仓库ID, 存储物品ID) →(管理员ID, 数量)

(管理员ID, 存储物品ID) → (仓库ID, 数量)

所以,(仓库ID, 存储物品ID)和(管理员ID, 存储物品ID)都是StorehouseManage的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。 范式的判断:

1、确定候选键,找出主属性和非主属性

2、确定非主属性和候选键之间是否存在函数依赖,若存在部分函数依赖,则关系模式属于1NF, 若存在传递函数依赖,则关系模式属于2NF, 若消除了部分函数依赖和传递函数依赖,则关系模式属于3NF

候选键的确定:

1、可以按照候选键的定义求解,即关系模式R(U,F)中的一个或一组属性X,若属性集U完全依赖于X,则X为关系模式R的候选键。也就是说根据语义分析得到的F,如果X可以确定每一个属性,那么X就是候选键。

4NF定义: 关系模式R(U,F)∈1NF,如果对于R的每个非平凡多值依赖X??Y(Y不包含于X),X都含有候选码,则R ∈ 4NF。

4NF 限制关系模式的属性之间不允许有非平凡且非函数依赖的多值依赖。 如果一个关系模式是4NF,则必为BCNF

课程C 教师T 参考书B 数学 数学 数学 数学 数学 数学 物理 物理 … 邓海 邓海 邓海 陈红 陈红 陈红 李东 李东 … 高数 数学分析 微分方程 高数 数学分析 微分方程 普通物理 光学 … 关系模式: TEACH(C,T,B),C表示课程,T表示教师,B表示参考书。假设某一门课由多个教师讲授,一门课使用相同的一套参考书。 关系模式存在以下依赖:

数学?[邓海,陈红]?[高数,数学分析,微分方程] 物理?[李东,张强,刘明] ?[普通物理学,光学]

该关系模式码为(C,T,B),为全码。满足BCNF,但仍存在四种异常。 为什么呢?

对TEACH(C,T,B)处理,去掉多值依赖。 分解两个关系模式:

CT(C,T) ∈ 4NF CB(C,B) ∈ 4NF

14、什么是拓扑关系,举例说明拓扑与非拓扑特性、拓扑与非拓扑操作。 拓扑关系

答:是指满足拓扑几何学原理的各空间数据间的相互关系。即用结点、弧段和多边形所表示

的实体之间的邻接关联和包含等关系。

拓扑特性:弹性变形后临近物体之间的拓扑关系没有发生改变 非拓扑特性:弹性变形后临近物体之间的拓扑关系发生了改变 拓扑操作与非拓扑操作

常见的拓扑属性

endpoint(point, arc) 点是弧的端点 simple-nonself-intersection(arc) 非自交的弧

on-boundary(point, region) 点在区域的边界上 inside(point, region) 点在区域内部 outside(point, region) 点在区域之外

open(region) 区域是开域(不包括边界) close(region) 区域是闭域(包括边界)

connected(region) 区域是连通域(区域上任2点,都有路径相连) inside(point, loop) 点在环中 crosses(arc, region) 弧穿过区域 touches(region, region) 区域与区域相邻 touches(arc, region) 弧与区域相邻 overlap(region, region) 区域与区域重叠 常见的非拓扑属性

Euclidean-distance(point, point) 2点间的欧氏距离 direction(point, point) 点在点的东面

length(arc) 弧的长度(单位向量长度为1个单位) perimeter(area) 区域的周长(单位正方形的周长为4个单位) area(region) 区域的面积(单位正方形的面积为1个平方单位)

拓扑信息:研究空间相关的事物本身或者事物之间的在空间坐标变换下的不变质 事物本身的内外关系

事物之间的相离、相接、相交

内部聚类(internal clustering)——为了加快对单个对象的访问,一个对象的全部表示都存放在一个磁盘页面中

本地聚类(local clustering)——为了加快对多个对象的访问,一组空间对象被分配在同一磁盘页面中,一般:依据数据空间中对象的位置/近似

全局聚类(global clustering)——一组空间邻接的对象存储在多个物理上邻接的磁盘页面中,这些页面可由一条读命令访问

39、使用空间填充曲线组织空间数据的意义?

答:1)空间中的位置排序 2)据中使用传统的有效搜索 40. 结合实例,简述Hilbert、Z曲线编码原则。

Z曲线:1)读入空间对象点的x,y坐标——二进制表示

2)对二进制的x,y坐标的每一位,隔行扫描,形成一个由0,1组成的字符串 3)计算该二进制

字符串的十进制数值, 该十进制数——Z值 4)按Z值,由小到大,

连线——Z曲线 Hilbert曲线算法

1)读入对象点的x,y坐标——二进制表示,n位

2)对二进制的x,y坐标的每一位,隔行扫描,形成一个由0,1组成的字符串(图a))

3)将该字符串自左至右分成2位长的串si,i = 1, 2, …, n

4)给每个2位长的串规定一个十进制数di,如:规定“00”为0, “10”为3,“11”为2 (图b))

对于上步合并后的数组,对左第一位值,若: j = 0 ——把后面所有的1变成3,3变成1

j = 3 ——把后面所有的0变成2,2变成0(图c))

计算变换后的二进制串的十进制数,按数值大小,由小到大连线——Hilbert曲线(图d))

41、什么是索引?索引文件的内容。主索引和二级索引。

索引文件是用来提高数据文件查询效率的辅助文件。记录的只有码值和数据文件中的页面地址。索引记录被排序,数据文件本身可以是不按关键码排序。

主索引,如果数据文件的记录是按照主码排列的,那么索引就只需要保存数据文件的每个磁盘页面第一个

主码域值。每个索引记录一个数据页面。

二级索引:堆数据文件,一个索引记录一个数据。

一个磁盘最多只有一个主索引,因为主索引决定了数据在磁盘上的存储顺序。

42、什么是空间索引?有哪些空间索引方法?阐述格网索引、四叉树索引、R树索引的基本思想。 答:空间索引结构用一组桶(通常对应二级存储的页面)来组织对象。

空间索引呢就是依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。 方法:1)在系统中加入专门的外部空间数据结构,为空间属性提供如同B树之于线性属性的功能。

2)使用空间填充曲线(如Z序、Hilbert曲线)将空间对象映射到一维空间,以便空间对象存储在标准的一维索引(例如B树)中。

43、网格文件包含哪两部分内容?建立格网索引的思路和步骤?了解R树索引和R+树索引的思想? 由二部分组成:

? 网格目录——目录中每一项指向一个数据桶

? 线性比例的一维数组——标示网格目录的索引,包含对象(记录)的块/桶。(如图中的

每个桶的号码)

? R树的特性:

对于空间中的M个对象,每个页面m个键:

? 每个叶结点,包含m~M条索引记录(m<=M/2),除非它是根结点

? 一个叶结点上的每条索引,记录项(I,元组标示符)。I——MBR,在空间上包含了所

指元组表达的k维数据对象;元组标示符——对应MBR的空间对象的元组的唯一标示符

? 每个非叶结点,都有m~M个子结点,除非它是根结点

? 对于非叶结点中的每个项(I,子结点指针)。I——子结点指针指向的、更低层次上结点

项中所有矩形的MBR

? 根结点,至少有2个子结点,除非它是叶结点

? 所有叶结点出现在同一层上

? 所有MBR的边与全局坐标系的轴平行

? R+树

——空间对象的MBR可能被非叶结点的MBR分割

R+树的特点:

? 对于中间结点,每个项(I,child-pointer),当且仅当R被I覆盖时,以child-pointer指

向的结点为根的子树,包括一个矩形R。当I为一个叶结点的矩形时,R只与I交叠

? 对于中间结点,任何2个结点(I1,child-pointer1)和(I2,child-pointer2),I1与I2

之间的交叠为0——中间结点的所有矩形不相交

? 根至少有2个结点,除非它是叶结点

? 所有叶结点在同一层上

44、什么是查询优化器?查询优化器所承担的主要任务是什么?

答:查询优化器是数据库软件中的一个模块,它用于产生不同计算计划并确定适当的执行策略。主要任务:逻辑转换、动态规划。

45. 查询语言与查询树之间的互换由什么执行? 答:由语法分析器执行

46. 对查询树进行逻辑转换的目的和一般方法是什么?

答:方法:将非空间的选择和投影操作下推 目的:减少连接操作所涉及的关系大小,从而减少计算代价。

47、简述SQL sever 2008的安全机制。

第一层是SQL Server服务器级别的安全性,这一级别的安全性建立在控制服务器登录账号和密码的基础上,即必须具有正确的服务器登录账号和密码才能连接到SQL Server服务器。

第二层安全性是数据库级别的安全性,用户提供正确的服务器登录账号和密码通过第一层的SQL Server服务器的安全性检查之后,将接受第二层的安全性检查,即是否具有访问某个数据库的权利。

第三层安全性是数据库对象级别的安全性,用户通过了前两层的安全性验证之后,在对具体的数据库安全对象(表,视图,存储过程等)进行操作时,将接受权限检查,即用户要想访问数据库里的对象时,必须事先被赋予相应的访问权限,否则系统将拒绝访问。

48、什么是存储过程?什么是触发器?二者之间有哪些联系与区别?

存储过程:一组为了完成特定功能的SQL 语句集,经编译后存储在数据库中,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。在SQL Server中存储过程分为两类:即系统提供的存储过程和用户自定义的存储过程。

触发器(Trigger)是SQL Server提供的除约束之外的另一种保证数据完整性的方法,它可以实现约束所不能实现的更复杂的完整性要求。DML触发器可以分为两种:After触发器和Instead of触发器。 触发器是一种特殊的存储过程,它不允许带参数,不能由用户直接通过名称调用,而是由用户的某一动作自动触发。

49、三代地理数据信息及优缺点? 1、CAD数据模型 优点:

缺点:不能存储足够多的属性信息,地图图层和注记标注是基本的属性描述 2、Coverage数据模型

优点:Coverage数据模型的优势是用户可以自定义要素表格;不仅可以添加字段并且还可以建立与外部数据表格的关联。

缺点:Coverage数据模型有个重大缺陷——要素是以统一的行为聚集的点、线和面的集合。也就是说,表示道路的线的行为和表示溪流的线的行为是一模一样的——显然,这并不是我们所需求的。 3、Geodatabase数据模型

优点:与过去的数据模型相比,其最大的特点是geodatabase更加智能化,每个要素不再仅仅是一条有几何字段的记录,而是一个拥有属性和行为的对象,是一个基于面向对象模型的关系数据库(对象——关系数据库) 缺点:

50、Geodatabase的概念?包含Geodatabase的内容包含哪些?

Geodatabase 是一种采用标准关系数据库技术来表现地理信息的数据模型。Geodatabase 支持在标准的数据库管理系统(DBMS)表中存储和管理地理信息。Geodatabase 支持多种DBMS 结构和多用户访问,且大小可伸缩。

(1)要素类(Feature Class):是具有同样几何类型和属性的要素集合;——矢量图层。

(2)对象类(Object):是Geodatabase数据模型中存储数据库表;——表

(3)要素数据集( Feature Database):是有相同空间参考的要素类的集合。 (4)表:同纯关系数据库中的表。

(5)子类(subtype ):在要素类内部可以划分若干个次一级的组,每个组是一个子类。每个子类有其自己的完整性规则和GIS行为。

(6)关系(relationship)是一种表(或要素类)与表(或要素类)之间的关系,通过建立这些关系类,可以改善数据库查询机制,提高数据查询检索效率。

(7)拓扑关系(topology):拓扑关系将参与拓扑的各个要素类集成在一个拓扑图中作为一个拓扑单元来管理,规定同一个要素类中的各个要素如何与其他要素共享几何,或者不同要素类之间如何共享几何。

(8)几何网络:各个要素类作为一个整体参与到几何网络的构造, Geodatabase通过拓扑关联保证参与到几何网格中的各个要素类的空间几何的连通性。几何网络将导致保证网络连通性的行为。 (9)栅格数据集:影像

(10)元数据:对数据中各个数据元素的描述。

51、ADO.NET的两个组件是什么?NET Framework 数据提供程序的四个对象及其用途。 两个组件:Dataset 和 .NET数据提供者。

SqlConnection、sqlCommand、sqlDataReader、sqlDataAdapter。 1)Connection:建立与特定数据源的连接。

2)Command:对数据源执行数据库命令,用于返回数据,修改数据,运行存储过程以及发送和检索参数信息等。

3)DataReader:从数据源种读取只进且只读的数据流。

4)DataAdapter:执行SQL命令并用数据源填充DataSet。DataAdapter提供连接DataSet对象和数据源的桥梁。DataAdapter使用Command对象在数据源中执行SQL命令,以便将数据加载到DataSet中,并使DataSet中的数据更改与数据源保持一致。

52、以长沙市或实习作业的地形图为例,以书上的例子为参考,建立一个空间数据库模式,要求通过分析建立空间扩展的E-R图,然后把实体和联系映射到关系数据库中,每个模式要求达到第三范式。

选择题 填空题 名词解释 简答或应用题 写程序题 论述题 10题 6题20空 4题 3题 2大题7小题 1题

10分 20分 12分 23分 20分 15分

本文来源:https://www.bwwdw.com/article/gxw.html

Top