数据库原理与应用期末复习总结含试题及其答案

更新时间:2024-05-06 04:11:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数据库原理综合习题答案 1.1 名词解释

(1) DB:即数据库(Database),是统一管理的相关数据的集合。 DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。

(2) DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。 DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。

(3) DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。

(4) 1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。 (5) 1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。

(6) M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。

(7) 数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。

(6) 概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。

(9) 结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。 (10) 层次模型:用树型结构表示实体类型及实体间联系的数据模型。 (11) 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。

(12) 关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。

(13) 概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。

(14) 外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。

(15) 内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。

(16) 模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。

(17) 外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。

(18) 数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。

(19) 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。

(20) 逻辑数据独立性:如果数据库的概念模式要进行修改(如增加记录类型或增加数据项),那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。也就是对概念模式的修改尽量不影响外模式和应用程序。

(21) 宿主语言:在数据库技术中,编写应用程序的语言仍然是一些高级程序设计语言,这些语言称为宿主语言(host language),简称主语言。

(22) DDL:数据定义语言(Data Definition Language),用于定义数据库的三级结构,包括外模式、概念模式、内模式及其相互之间的映象,定义数据的完整性、安全控制等约束。

(23) DML:数据操纵语言(Data Manipulation Language),由DBMS提供,用于让用户或程序员使用,实现对数据库中数据的操作。 DML分成交互型DML和嵌入型DML两类。依据语言的级别,DML又可分成过程性DML和非过程性DML两种。

(24) 交互型DML:如果DML自成系统,可在终端上直接对数据库进行操作,这种DML称为交互型DML。 (25) 嵌入型DML:如果DML嵌入在主语言中使用,此时主语言是经过扩充能处理DML语句的语言,这种DML称为嵌入型DML。

(26) 过程性DML:用户编程时,不仅需要指出“做什么”(需要什么样的数据),还需要指出“怎么做”(怎么获得数据)。层状、网状的DML属于过程性语言。 (27) 非过程性DML:用户编程时,只需要指出“做什么”,不需要指出“怎么做”。 Notice:以上关于DML的各个概念单独出现时,首先要解释DML的含义。 (28) DD:数据字典(Data Dictionary),数据库系统中存放三级结构定义的数据库称为数据字典。对数据库的操作都要通过访问DD才能实现。

(29) DD系统:管理DD的实用程序称为“DD系统”。

1.2 文件系统阶段的数据管理有些什么缺陷?试举例说明。 文件系统有三个缺陷:

(1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。

(2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。

(3)数据联系弱(poor data relationship)。这是由文件之间相互独立,缺乏联系造成的。

1.3 数据库阶段的数据管理有些什么特点? (1) 采用复杂的数据模型表示数据结构

(2) 有较高的数据独立性(数据结构分成用户的逻辑结构、整体逻辑结构和物理结构三级) (3) 数据库系统为用户提供方便的用户接口,可以使用查询语言、终端命令或程序方式操作数据,也可以用程序方式操作数据库。

(4) 系统提供了四个方面的数据控制功能:数据库的恢复、并发控制、数据完整性和数据安全性,以保证数据库中数据是安全的、正确的和可靠的。

(5) 对数据的操作不一定以记录为单位,还可以数据项为单位,增加了系统的灵活性。

1.4 你怎样理解实体、属性、记录、字段这些概念的类型和值的差别?试举例说明。 实体(entity):是指客观存在可以相互区别的事物。实体可以是具体的对象,如:一个学生,一辆汽车等;也可以是抽象的事件,如:一次借书、一场足球赛等。

属性(attribute):实体有很多特性,每一个特性称为属性。每个属性有一个值域,其类型可以是整数型、实数型、字符串型。比如,学生(实体)有学号、姓名、年龄、性别等属性,

相应值域为字符、字符串、整数和字符串型。

字段(field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。字段的命名往往和属性名相同,比如,学生有学号、姓名、年龄、性别等字段。

记录(record):字段的有序集合称为记录。一般用一个记录描述一个实体,所以记录又可以定义为能完整地描述一个实体的字段集。如:一个学生记录,由有序的字段集(学号、姓名、年龄、性别等)组成。

1.5 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别? 联系:

(1)逻辑记录与物理记录都是记录,是字段的有序集合; (2)逻辑文件与物理文件都是文件,是同一类记录的汇集。 区别:

(1)逻辑记录与逻辑文件是逻辑数据描述,物理记录与物理文件是物理数据描述。

(2)物理数据描述是指数据在存储设备上的存储方式,物理记录、物理文件(还有物理联系、物理结构等术语),都是用来描述实际存储设备上的数据。 (3)逻辑数据描述是指程序员或用户用以操作的数据形式,是抽象的概念化数据。逻辑记录、逻辑文件(还有逻辑联系、逻辑结构等术语),都是用户观点的数据描述。

1.6 为某百货公司设计一个ER模型。

百货管辖若干个连锁商店,每家商店经营若干商品,每家商店有若干职工,但每个职工只能服务于一家商店。实体类型“商店”的属性有:商店编号,店名,店址,店经理。实体类型“商品”的属性有:商品编号,商品名,单价,产地。实体类型“职工”的属性有:职工编号,职工名,性别,工资。在联系中应反映出职工参加某商店工作的开始时间,商店销售商品的月销售量。 试画出反映商店、商品、职工实体类型及联系类型的ER图,并将其转换成关系模式集。

实体:商店(商店编号,店名,店址,店经理)

商品(商品编号,商品名,单价,产地) 职工(职工编号,职工名,性别,工资) 联系:SC(商店—商品之间1:N的联系,联系属性为“职工参加商店工作的开始时间”。 SE(商店—职工之间1:N的联系),联系属性为“月销售量”。

关系模式集:商店模式(商店编号,店名,店址,店经理)

商品模式(商品编号,商品名,单价,产地,商店编号,月销售量) 职工模式(职工编号,职工名,性别,工资,商店编号,开始时间)

1.7 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。 ER模型的主要特点:

(1)优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。 (2)缺点:只能说明实体间语义的联系,不能进一步说明详细的数据结构。

层次模型的特点:

(1)优点:记录之间的联系通过指针实现,查询效率较高。

(2)缺点:只能表示1:N联系,实现M:N结构较复杂;由于层次顺序的严格和复杂,引起数据的查询和更新操作也很复杂。

网状模型的特点:

(1)优点:记录之间联系通过指针实现,M:N联系也容易实现(每个M:N联系可拆成两个1:N联系),查询效率较高。

(2)缺点:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。

关系模型的特点:

用关鍵码而不是用指针导航数据,表格简单,用户易懂,编程时并不涉及存储结构、访问技术等细节。

1.8 试述概念模式在数据库结构中的重要地位。

概念模式是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。

1.9 数据独立性与数据联系这两个概念有什么区别?

数据独立性是指应用程序与数据之间相互独立,不受影响。

数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。

1.10 试述DBMS在用户访问数据库过程中所起的作用.

用户对数据库进行操作,DBMS把操作从应用程序带到外部级、概念级、再导向内部级,进而操作存储器中的数据。

(结合P22“用户访问数据的过程”来理解)

1.11 试述DBMS的主要功能。 DBMS的主要功能有:

(1)数据库的定义功能 (2)数据库的操纵功能 (3)数据库的保护功能 (4)数据库的存储管理 (5)数据库的维护功能 (6)数据字典

1.12 试叙DBMS对数据库的保护功能。

DBMS对数据库的保护主要通过四个方面实现: (1)数据库的恢复。 (2)数据库的并发控制。 (3)数据库的完整性控制。 (4)数据库的安全性控制。

1.13 试叙DBMS对数据库的维护功能。

DBMS中有一些程序提供给数据库管理员运行数据库系统时使用,这些程序起着数据库维护的功能。

主要有四个实用程序:

(1)数据装载程序(loading) (2)备份程序(backup) (3)文件重组织程序 (4)性能监控程序

1.14 从模块结构看,DBMS由哪些部分组成?

从模块结构看,DBMS由两大部分组成:查询处理器和存储管理器 (1)查询处理器有四个主要成分:DDL编译器,DML编译器,嵌入型DML的预编译器,查询运行核心程序

(2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器

(以上几题具体可参照书上p20-21)

1.15 DBS由哪几个部分组成?

DBS由四部分组成:数据库、硬件、软件、数据库管理员。

1.16 什么样的人是DBA?DBA应具有什么素质?DBA的职责是什么?

DBA是控制数据整体结构的人,负责DBS的正常运行。DBA可以是一个人,在大型系统中也可以是由几个人组成的小组。 DBA承担创建、监控和维护整个数据库结构的责任。

DBA应具有下列素质:

(1)熟悉企业全部数据的性质和用途; (2)对用户的需求有充分的了解; (3)对系统的性能非常熟悉。 DBA的主要职责有五点: (1)概念模式定义 (2)内模式定义

(3)根据要求修改数据库的概念模式和内模式 (4)对数据库访问的授权 (5)完整性约束的说明

1.17 试对DBS的全局结构作详细解释。 参照教材p24-25。

1.18 使用DBS的用户有哪几类? 使用DBS的用户有四类: 1)DBA 2)专业用户 3)应用程序员 4)最终用户

(11)联接查询:查询时先对表进行笛卡尔积操作,然后再做等值联接、选择、投影等操作。联接查询的效率比嵌套查询低。

(12)交互式SQL:在终端交互方式下使用的SQL语言称为交互式SQL。

(13)嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言称为嵌入式SQL。 (14)共享变量:SQL和宿主语言的接口。共享变量有宿主语言程序定义,再用SQL的DECLARE语句说明, SQL语句就可引用这些变量传递数据库信息。 (15)游标:游标是与某一查询结果相联系的符号名,用于把集合操作转换成单记录处理方式。 (16)卷游标:为了克服游标在推进时不能返回的不便,SQL2提供了卷游标技术。卷游标在推进时不但能沿查询结果中元组顺序从头到尾一行行推进,也能一行行返回。

3.2 对于教学数据库的三个基本表 学生 S(S#,SNAME,AGE,SEX) 学习 SC(S#,C#,GRADE)

课程 C(C#,CNAME,TEACHER)

试用SQL的查询语句表达下列查询:

(1)检索LIU老师所授课程的课程号和课程名。 SELECT C#,CNAME FROM C

WHERE TEACHER=‘LIU’

(2)检索年龄大于23岁的男学生的学号和姓名。 SELECT S#,SNAME FROM S

WHERE (AGE>23) AND (SEX=‘M’)

(3)检索至少选修LIU老师所授课程中一门课程的女学生姓名。 SELECT SNAME FROM S

WHERE SEX=‘F’ AND S# IN (SELECT S# FROM SC WHERE C# IN (SELECT C# OM C

WHERE TEACHER=‘LIU’)

NOTICE:有多种写法,比如联接查询写法: SELECT SNAME FROM S,SC,C

WHERE SEX=‘F’ AND SC.S#=S.S# AND SC.C#=C.C#

FR

AND TEACHER='LIU' 但上一种写法更好一些。

(4)检索WANG同学不学的课程的课程号。 SELECT C# FROM C

WHERE C# NOT IN (SELECT C# FROM SC WHERE S# IN (SELECT S# FROM S

WHERE SNAME='WANG'))

(5)检索至少选修两门课程的学生学号。 SELECT DISTINCT X.SNO FROM SC X,SC Y

WHERE X.SNO=Y.SNO AND X.CNO<>Y.CNO

Notice:对表SC进行自连接,X,Y是SC的两个别名。

(6)检索全部学生都选修的课程的课程号与课程名。 SELECT C#,CNAME FROM C

WHERE NOT EXISTS (SELECT * FROM S

WHERE S# NOT IN (SELECT * FROM SC

WHERE SC.C#=C.C#))

要从语义上分解:(1)选择课程的课程号与课程名,不存在不选这门课的同学。 其中,“不选这门课的同学”可以表示为:

SELECT *

FROM S

WHERE S# NOT IN

(SELECT *

FROM SC

WHERE SC.C#=C.C#)

或者

SELECT *

FROM S

WHERE NOT EXISTS

(SELECT *

FROM SC

WHERE S.S#=C.S# AND

SC.C#=C.C# )

(7)检索选修课程包含LIU老师所授课的学生学号。 SELECT DISTINCT S# FROM SC WHERE C# IN (SELECT C# FROM C

WHERE TEACHER='LIU'))

3.3 设有两个基本表R(A,B,C)和S(D,E,F),试用SQL查询语句表达下列关系代数表达式:

(1)πA(R) (2)σB='17'(R) (3)R×S (4))πA,F(σC=D(R×S)) (1)SELECT A FROM R

(2)SELECT * FROM R WHERE B='17' (3)SELECT A,B,C,D,E,F FROM R,S

(4)SELECT A,F FROM R,S WHERE R.C=S.D

3.4 3.4 设有两个基本表R(A,B,C)和S(A,B,C)试用SQL查询语句表达下列关系代数表达式:

(1)R∪S (2)R∩S (3)R-S (4)πA,B(R)πB,C(S)

(1)SELECT A,B,C FROM R UNION

SELECT A,B,C FROM S

(2)SELECT A,B,C FROM R INTERSECT SELECT A,B,C FROM S

(3)SELECT A,B,C FROM R

WHERE NOT EXISTS (SELECT A,B,C FROM S

WHERE R.A=S.A AND R.B=S.B AND R.C=S.C)

(4)SELECT R.A,R.B,S.C FROM R,S RE R.B=S.B

3.5 试叙述SQL语言的关系代数特点和元组演算特点。 (P61-62)

3.6 试用SQL查询语句表达下列对教学数据库中三个基本表S、SC、C的查询:

(1)统计有学生选修的课程门数。

SELECT COUNT(DISTINCT C#) FROM SC

(2)求选修C4课程的学生的平均年龄。 SELECT AVG(AGE) FROM S

WHERE S# IN (SELECT S# FROM SC

WHERE C#='C4') 或者,

SELECT AVG(AGE) FROM S,SC

WHE

WHERE S.S#=SC.S# AND C#='004'

(3)求LIU老师所授课程的每门课程的学生平均成绩。 SELECT CNAME,AVG(GRADE) FROM SC ,C

WHERE SC.C#=C.C# AND TEACHER='LIU' GROUP BY C#

(4)统计每门课程的学生选修人数(超过10人的课程才统计)。要求输出课程号和选修人数,查询结果按人数降序排列,若人数相同,按课程号升序排列。 SELECT DISTINCT C#,COUNT(S#) FROM SC GROUP BY C#

HAVING COUNT(S#)>10 ORDER BY 2 DESC, C# ASC

(5)检索学号比WANG同学大,而年龄比他小的学生姓名。 SELECT X.SNAME FROM S AS X, S AS Y

WHERE Y.SNAME='WANG' AND X.S#>Y.S# AND X.AGE

(6)检索姓名以WANG打头的所有学生的姓名和年龄。 SELECT SNAME,AGE FROM S

WHERE SNAME LIKE 'WANG%'

(7)在SC中检索成绩为空值的学生学号和课程号。 SELECT S#,C# FROM SC

WHERE GRADE IS NULL

(8)求年龄大于女同学平均年龄的男学生姓名和年龄。 SELECT SNAME,AGE FROM S AS X

WHERE X.SEX='男' AND X.AGE>(SELECT AVG(AGE) FROM S AS Y WHERE Y.SEX='女')

(9)求年龄大于所有女同学年龄的男学生姓名和年龄。 SELECT SNAME,AGE FROM S AS X

WHERE X.SEX='男' AND X.AGE>ALL (SELECT AGE FROM S AS Y WHERE Y.SEX='女')

3.7 试用SQL更新语句表达对教学数据库中三个基本表S、SC、C的各个更新操作: (1)往基本表S中插入一个学生元组(‘S9’,‘WU’,18)。

专业每年只招一个班,每个班有若干个学生,一个系的学生住在同一宿舍区,每个学生可以参加若干个社团,每个社团有若干学生。

描述学生的属性有:学号、姓名、出生年月、系名、班级号、宿舍区。 描述班级的属性有:班级号、专业名、系名、人数、入校年份。 描述系的属性有:系名、系号、系办公地点、人数。

描述社团的属性有:社团名、成立年份、地点、人数、学生参加某社团的年份。

请给出关系模式,写出每个关系模式的最小函数依赖集,指出是否存在传递函数依赖,对于函数依赖左部是多属性的情况,讨论函数依赖是完全函数依赖还是部分函数依赖。指出各关系的候选键、外部键,有没有全键存在?

各关系模式如下:

学生(学号,姓名,出生年月,系名,班级号,宿舍区) 班级(班级号,专业名,系名,人数,入校年份) 系(系名,系号,系办公地点,人数) 社团(社团名,成立年份,地点,人数)

加入社团(社团名,学号,学生参加社团的年份)

学生(学号,姓名,出生年月,系名,班级号,宿舍区)

●“学生”关系的最小函数依赖集为:

Fmin={学号→姓名,学号→班级号,学号→出生年月,学号→系名,系名→宿舍区} ●以上关系模式中存在传递函数依赖,如:学号→系名,系名→宿舍区 ●候选键是学号,外部键是班级号,系名。

notice: 在关系模式中,如果Y→X,X→A,且XY(X不决定Y), A不属于X,那么称Y→A是传递依赖。

班级(班级号,专业名,系名,人数,入校年份)

●“班级”关系的最小函数依赖集为:

Fmin={(系名,专业名)→班级号,班级号→人数,班级号→入校年份,班级号→系名,班级号→专业名}

(假设没有相同的系,不同系中专业名可以相同) ●以上关系模式中不存在传递函数依赖。

●“(系名,专业名)→班级号”是完全函数依赖。 ●候选键是(系名,专业名),班级号,外部键是系名。

系(系名,系号,系办公地点,人数)

●“系”关系的最小函数依赖集为: Fmin={系号→系名,系名→系办公地点,系名→人数,系名→系号}

●以上关系模式中不存在传递函数依赖 ●候选键是系名,系号

社团(社团名,成立年份,地点,人数)

●“社团”关系的最小函数依赖集为: Fmin={社团名→成立年份,社团名→地点,社团名→人数)

●以上关系模式中不存在传递函数依赖。 ●候选键是社团名

加入社团(社团名,学号,学生参加社团的年份)

●“加入社团”关系的最小函数依赖集为: Fmin={(社团名,学号)→学生参加社团的年份) ●“(社团名,学号)→学生参加社团的年份”是完全函数依赖。

●以上关系模式中不存在传递函数依赖。 ●候选键是(社团名,学号)。

4.4 对函数依赖X→Y的定义加以扩充,X和Y可以为空属性集,用φ表示,那么X→φ,φ→Y,φ→φ的含义是什么?

根据函数依赖的定义,以上三个表达式的含义为:

(1)一个关系模式R(U)中,X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2, 由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空属性函数依赖于X。这是任何关系中都存在的。

(2)φ→Y表示Y函数依赖于空属性。由此可知该关系中所有元组中Y属性的值均相同。 (3)φ→φ表示空属性函数依赖于空属性。这也是任何关系中都存在的。

4.5 已知关系模式R(ABC),F={A→C,B→C},求F+。

可以直接通过自反律、增广律、传递律加以推广:

F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC}

4.6 试分析下列分解是否具有无损联接和保持函数依赖的特点: (1)设R(ABC),F1={A→B} 在R上成立,ρ1={AB,AC}。

首先,检查是否具有无损联接特点: 第1种解法--算法4.2:

A B C AB a1 a2 b13 AC a1 b22 a3 A B C a1 a2 b13 a1 a2 a3

(1) 构造表

(2)根据A→B进行处理

结果第二行全是a行,因此分解是无损联接分解。

第2种解法:(定理4.8) 设 R1=AB,R2=AC R1∩R2=A R2- R1=B

∵A→B,∴该分解是无损联接分解。

然后,检查分解是否保持函数依赖

πR1(F1)={A→B,以及按自反率推出的一些函数依赖}

πR2(F1)={按自反率推出的一些函数依赖}

F1被πR1(F1)所蕴涵,∴所以该分解保持函数依赖。

(2)设R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC}

首先,检查是否具有无损联接特点: 第1种解法(略) 第2种解法:(定理4.8) 设 R1=AB,R2=AC R1∩R2=A R2- R1=C

∵A→C,∴该分解是无损联接分解。

然后,检查分解是否保持函数依赖

πR1(F2)={按自反率推出的一些函数依赖}

πR2(F2)={A→C,以及按自反率推出的一些函数依赖}

∵F1中的B→C没有被蕴涵,所以该分解没有保持函数依赖。

(3)设R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}.

首先,检查是否具有无损联接特点: 第1种解法: A B C AB a1 a2 b13 BC b21 a2 a3 A B C a1

a2 a3 a1 b22 a3

(1) 构造表

(2)根据A→B进行处理

没有一行全是a行。因此这个分解不具有无损联接特性。

第2种解法:(定理4.8) 设 R1=AB,R2=BC R1∩R2=B

R2- R1=C,R1- R2=A

∵B→C,B→A不在F3中∴该分解不具有无损联接特性。

然后,检查分解是否保持函数依赖

πR1(F3)={A→B,以及按自反率推出的一些函数依赖} πR2(F3)={按自反率推出的一些函数依赖}

F1被πR1(F3)所蕴涵,所以该分解保持函数依赖。 (4)设R(ABC),F4={A→B,B→C}在R上成立,ρ4={AC,BC}

首先,检查是否具有无损联接特点: 第1种解法(略)

第2种解法:(定理4.8)

设 R1=AC,R2=BC R1(AC)∩R2(BC)=C R2- R1=B,R1- R2=A

∵C→B,C→A不在F4中∴该分解不具有无损联接特性。

然后,检查分解是否保持函数依赖

πR1(F2)={按自反率推出的一些函数依赖}

πR2(F2)={B→C,以及按自反率推出的一些函数依赖}

∵F1中的A→B没有被蕴涵,所以该分解没有保持函数依赖。

4.7 设R=ABCD,R上的函数依赖集F={A→B,B→C,A→D,D→C},R的一个分解ρ={AB,AC,AD},求:(1)F在ρ的每个模式上的投影。(2)ρ相对于F是无损联接分解吗?(3)ρ保持依赖吗? (1)

完全依赖于C#。因此,该分解符合2NF模式。

(3)3NF:若每个关系模式是2NF,则每个非主属性都不传递于R的候选键。

按上述已分好的两个模式,SC中已满足“每个非主属性都不传递于R的候选键”,已是3NF,而在C中, C#→TNAME,TNAME→TADDR,TADDR传递依赖于C#,因此还需分成两个模式:CT(C#,TNAME), T(TNAME,TADD)。

分解后,总共有SC={S#,C#,GRADE},CT(C#,TNAME), T(TNAME,TADD)三个模式。 该分解符合3NF模式。

4.12 图4.6表示一个公司各部门的层次结构,对每个部门,数据库中包含部门号 (唯一的)D#,预算费(BUDGET)以及此部门领导人员的职工号(唯一的)E#等信息。对每一个部门,还存有部门的全部职工,生产科研项目以及办公室的信息。

职工信息包括:职工号,他所参加的生产科研项目号(J#),他所在办公室的电话号(PHONE#)。 生产科研项目包含:项目号(唯一的),预算费。 办公室信息包含:办公室号(唯一的),面积。 对每个职工,数据库中有他曾担任过的职务以及担任某一职务时的工资历史。对每个办公室包含此办公室中全部电话号吗的信息。

请给出你认为合理的数据依赖,把这个层次结构转换成一组规范化的关系。

提示:此题可分步完成,先转换成一组1NF的关系,然后逐步转换成2NF,3NF,...。 先得到一个泛关系的模式如下:

D={D#,Manager_E#,Budget,E#,J#,Phone#,Business,Sa_History,Office#,Area}

D#:部门号, Manager_E#:部门领导人员的职工号, E#:职工号, J#:生产科研项目号, Phone#:办公室的电话号,Business:职工职务,Sa_History:工资历史,Office#:办公室号,Area:办公室面积 根据所给信息,给出下列数据依赖:

F={D#→Manager_E#,E#→Office#,(E#,Business)→Sa_History,J#→Budget,E#→J#, Office#→Area,Office→D#,#Phone#→Office#} (假设一个部门可能有多个办公室,有多个项目,一个办公室只属于一个部门,有多部电话,一个员工只参加一个项目,一个项目可能属于多个部门)

只要保证每个属性值不可分割,以上范式即为1NF。候选键为(E#,Business,Phone#)

转换成2NF关系(消除局部依赖):

Em_Dep(E#,D#,Manager_E#,Office#,Area,J#,Budget)

对应 F={D#→Manager_E#,E#→Office#,J#→Budget,E#→J#,Office#→Area,Office→D#} History(E#,Business,History)

对应 F={(E#,Business)→Sa_History} Phone(Phone#,Office#)

对应 F={Phone#→Office#}

转换成3NF关系(消除非主属性对侯选键的传递依赖):

Department(D#,Manager_E#)

Office(Office#,Area,D#) Emproee(E#,J#,Office#) History(E#,Business,History) Phone(Phone#,Office#) Project(J#,Budget)

注意:由于对题意理解的不同,可能答案不唯一。

4.13 设关系模式R(ABC)上有一个多值依赖A→→B。如果已知R的当前关系中存在三组(ab1c1)、(ab2c2)和(ab3c3),那么这个关系中至少还应存在哪些元组? 从多值依赖的定义可以得出,至少应存在下列元组: (ab1c2)、(ab1c3)、(ab2c1)、(ab2c3)、(ab3c1)、(ab3c2)

5.1 名词解释

(1)数据库设计:数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。

(2)数据库工程:指数据库应用系统的开发,它是一项软件工程,但有数据库应用自身的特点。

(3)评审:在数据库设计过程中,评审的目的是为了确认某一阶段的任务是否全部完成,避免重大的疏漏或错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。

(4)数据字典:是对系统中数据的详尽描述,它提供对数据库数据描述的集中管理。它的处理功能是存储和检索元数据,并且为数据库管理员提供有关的报告。对数据库设计来说,数据字典是进行详细的数据收集和数据分析所获得的主要成果。数据字典主要包括四个部分:数据项、数据结构、数据流、数据存储。

5.2 数据系统的生存期分成哪几个阶段?数据库结构的设计在生存期中的地位如何?

分成七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行和维护。 数据库结构的设计在生存期中的地位很重要,数据库结构的设计包括逻辑设计、物理设计,逻辑设计把概念模式转化为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构,而物理设计主要是设计DB在物理设备上的存储结构与存取方法等。

5.3 什么是数据库设计?数据库设计过程的输入和输出有哪些内容? 数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。

数据库设计过程的输入包括四部分内容:1)总体信息需求;2)处理需求;(3)DBMS的特征;(4)硬件和OS(操作系统)特征。

数据库设计过程的输出包括两部分:

(1)完整的数据库结构,其中包括逻辑结构和物理结构;

(2)基于数据库结构和处理需求的应用程序的设计原则。这些输出一般以说明书的形式出现。

5.4 基于数据库系统生存期的数据库设计分成哪几个阶段?

分为5个阶段:简记为(规需概逻物):规划、需求分析、概念设计、逻辑设计和物理设计五个阶段。

5.5 什么是比较好的数据库设计方法?数据库设计方法应包括哪些内容? 一个好的数据库设计方法应该能在合理的期限内,以合理的工作量产生一个有实用价值的数据库结构。

一种实用的数据库设计方法应包括以下内容:设计过程、设计技术、评价准则、信息需求、描述机制。

5.6 数据库设计的规划阶段应做哪些事情?

数据库设计中的规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。

5.7 数据库设计的需求分析阶段是如何实现的?目标是什么?

数据库设计的需求分析通过三步来完成:即需求信息的收集、分析整理和评审。 其目的在于对系统的应用情况作全面详细的调查,确定企业组织的目标,收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求,并把这些要求写成用户和数据设计者都能够接受的文档。

5.8 评审在数据库设计中有什么重要作用?为什么允许设计过程中有多次的回溯与反复? 评审的作用在于确认某一阶段的任务是否全部完成,通过评审可以及早发现系统设计中的错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。 如果在数据库已经实现时再发现设计中的错误,那么代价比较大。因此应该允许设计过程的回溯与反复。设计过程需要根据评审意见修改所提交的阶段设计成果,有时修改甚至要回溯到前面的某一阶段,进行部分乃至全部重新设计。

5.9 数据字典的内容和作用是什么?

数据字典的内容一般包括:数据项、数据结构、数据流、数据存储和加工过程。 其作用是对系统中数据做出详尽的描述,提供对数据库数据的集中管理。

5.10 对概念模型有些什么要求? 对概念模型一般有以下要求:

(1)概念模型是对现实世界的抽象和概括,它应真实、充分地反映现实世界中事物和事物之间的联系,具有丰富的语义表达能力,能表达用户的各种需求,包括描述现实世界中各种对象及其复杂联系、用户对数据对象的处理要求和手段。

(2)概念模型应简洁、明晰,独立于机器、容易理解、方便数据库设计人员与应用人员交换意见,使用户能积极参与数据库的设计工作。

(3)概念模型应易于变动。当应用环境和应用要求改变时,容易对概念模型修改和补充。

(4)概念模型应很容易向关系、层次或网状等各种数据模型转换,易于从概念模式导出也DBMS有关的逻辑模式。

5.11 概念设计的具体步骤是什么? 概念设计的主要步骤为:

(1)进行数据抽象、设计局部概念模式; (2)将局部概念模式综合成全局概念模式; (3)评审。

(具体解释参见教材p131)

5.12 什么是数据抽象?主要有哪两种形式的抽象?数据抽象在数据库设计过程中起什么作用?

数据抽象是对人、物、事或概念的人为处理,它抽取人们关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。 数据抽象有两种形式:

(1)系统状态的抽象,即抽象对象; (2)系统转换的抽象,即抽象运算。 数据抽象是概念设计中非常重要的一步。通过数据抽象,可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。

5.13 什么是ER图?构成ER图的基本要素是什么?

ER图是用来表示数据库概念设计ER模型的工具,它提供了表示实体、属性和联系的方法。 构成ER图的基本要素是实体、属性和联系。

5.14 试述采用ER方法的数据库概念设计的过程.

利用ER方法进行数据库的概念设计,可分成三步进行:首先设计局部ER模式,然后把各局部ER模式综合成一个全局ER模式,最后对全局ER模式进行优化,得到最终的ER模式,即概念模式。

5.15 逻辑设计的目的是什么?试述逻辑设计过程的输入和输出环境。

逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。 逻辑设计过程中的输入信息有:

(1)独立于DBMS的概念模式,即概念设计阶段产生的所有局部和全局概念模式; (2)处理需求,即需求分析阶段产生的业务活动分析结果;

(3)约束条件,即完整性、一致性、安全性要求及响应时间要求等;

(4)DBMS特性,即特定的DBMS特性,即特定的DBMS所支持的模式、子模式和程序语法的形式规则。

逻辑设计过程输出的信息有:

(1)DBMS可处理的模式;

(2)子模式;

(3)应用程序设计指南;

(4)物理设计指南。

5.16 试述逻辑设计阶段的主要内容。

逻辑设计主要是把概念模式转换成DBMS能处理的模式。转换过程中要对模式进行评价和性能测试,以便获得较好的模式设计。

逻辑设计的主要步骤包括: (1)初始模式的形成 (2)子模式设计

(3)应用程序设计梗概 (4)模式评价 (5)修正模式。

5.17 规范化理论对数据库设计有什么指导意义? 在概念设计阶段,已经把关系规范化的某些思想用作构造实体类型和联系类型的标准,在逻辑设计阶段,仍然要使用关系规范化的理论来设计模式和评价模式。规范化的目的是减少乃至消除关系模式中存在的各种异常,改善完整性,一致性和存储效率。

5.18 什么是数据库结构的物理设计?试述其具体步骤。

数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。

物理设计的步骤为:

(1)设计存储记录结构,包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射;

(2)确定数据存储安排;

(3)设计访问方法,为存储在物理设备上的数据提供存储和检索的能力; (4)进行完整性和安全性的分析、设计; (5)程序设计。

5.19 数据实现阶段主要做哪几件事情? 数据库实现阶段的主要工作有以下几点: (1)建立实际数据库结构 (2)试运行 (3)装入数据

(具体解释参见教材p150)

5.20 什么是数据的再组织设计?试述其重要性。

对数据的概念模式、逻辑结构或物理结构的改变称作数据再组织。

数据再组织,通常是由于环境,需求的变化或性能原因而进行的,如信息定义的改变,增加新的数据类型,对原有的数据提出了新的使用要求,改用具有不同物理特征的新存储设备以

本文来源:https://www.bwwdw.com/article/uevg.html

Top