数据结构笔试题基础

更新时间:2024-01-08 02:28:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 数据结构与算法

一.算法的基本概念

计算机解题的过程实际上是在实施某种算法,这种算法称为计算机算法。 1.算法的基本特征:可行性,确定性,有穷性,拥有足够的情报。 2.算法的基本要素:算法中对数据的运算和操作、算法的控制结构。

3.算法设计的基本方法:列举法、归纳法、递推、递归、减半递推技术、回溯法。 4.算法设计的要求:正确性、可读性、健壮性、效率与低存储量需求

二.算法的复杂度

1.算法的时间复杂度:指执行算法所需要的计算工作量 2.算法的空间复杂度:执行这个算法所需要的内存空间

三.数据结构的定义

1.数据的逻辑结构:反映数据元素之间的关系的数据元素集合的表示。数据的逻辑结构包括集合、线形结构、树形结构和图形结构四种。

2.数据的存储结构:数据的逻辑结构在计算机存储空间种的存放形式称为数据的存储结构。常用的存储结构有顺序、链接、索引等存储结构。

四.数据结构的图形表示:

在数据结构中,没有前件的结点称为根结点;没有后件的结点成为终端结点。插入和删除是对数据结构的两种基本运算。还有查找、分类、合并、分解、复制和修改等。

五.线性结构和非线性结构

根据数据结构中各数据元素之间前后件关系的复杂程度,一般将数据结构分为两大类型:线性结构和非线性结构。

线性结构:非空数据结构满足:有且只有一个根结点;每个结点最多有一个前件,最多只有一个后件。非线性结构:如果一个数据结构不是线性结构,称之为非线性结构。 常见的线性结构:线性表、栈、队列

六.线性表的定义

线性表是n 个元素构成的有限序列(A1,A2,A3……)。表中的每一个数据元素,除了第一个以外,有且只有一个前件。除了最后一个以外有且只有一个后件。即线性表是一个空表,或可以表示为(a1,a2,……an), 其中ai(I=1,2,……n)是属于数据对象的元素,通常也称其为线性表中的一个结点。 非空线性表有如下一些特征:

(1)有且只有一个根结点a1,它无前件; (2)有且只有一个终端结点an,它无后件;

(3)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。线性表中结点的个数n称为线性表的长度。当n=0时称为空表。

七.线性表的顺序存储结构

线性表的顺序表指的是用一组地址连续的存储单元依次存储线性表的数据元素。 线性表的顺序存储结构具备如下两个基本特征: 1.线性表中的所有元素所占的存储空间是连续的;

2.线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。

即线性表逻辑上相邻、物理也相邻,则已知第一个元素首地址和每个元素所占字节数,则可求出任一个元素首地址。

假设线性表的每个元素需占用K个存储单元,并以所占的第一个单元的存储地址作为数据元素的存储位

置。则线性表中第i+1个数据元素的存储位置LOC(ai+1)和第i个数据元素的存储位置LOC(ai)之间满足下列关系:

LOC(ai+1)=LOC(ai)+K LOC(ai)=LOC(a1)+(i-1)*K ①

其中,LOC(a1)是线性表的第一个数据元素a1的存储位置,通常称做线性表的起始位置或基地址。 因为在顺序存储结构中,每个数据元素地址可以通过公式①计算得到,所以线性表的顺序存储结构是随机存取的存储结构。

在线性表的顺序存储结构下,可以对线性表做以下运算: 插入、删除、查找、排序、分解、合并、复制、逆转

八.顺序表的插入运算

线性表的插入运算是指在表的第I个位置上,插入一个新结点x,使长度为n的线性表(a1,a2 …ai…an)变成长度为n+1的线性表(a1,a2…x,ai…an).

该算法的时间主要花费在循环的结点后移语句上,执行次数是n-I+1。 当I=n+1,最好情况,时间复杂度o(1) 当I=1, 最坏情况,时间复杂度o(n) 算法的平均时间复杂度为o(n)

九.顺序表的删除运算

线性表的删除运算是指在表的第I个位置上,删除一个新结点x,使长度为n的线性表(a1,a2 …ai…an)变成长度为n-1的线性表(a1,a2…ai-1,ai+1…an).

当I=n,时间复杂度o(1),当I=1,时间复杂度o(n) ,平均时间复杂度为o(n)

十.栈及其基本运算

1.什么是栈? 栈实际上也是一个线性表,只不过是一种特殊的线性表。栈是只能在表的一端进行插入和删除运算的线性表,通常称插入、删除这一端为栈顶(TOP),另一端为栈底(BOTTOM)。当表中没有元素时称为空栈。栈顶元素总是后被插入的元素,从而也是最先被删除的元素;栈底元素总是最先被插入的元素,从而也是最后才能被删除的元素。

假设栈S=(a1,a2,a3,……an),则a1 称为栈底元素,an称为栈顶元素。栈中元素按a1,a2,a3……an的次序进栈,退栈的第一个元素应该是栈顶元素。即后进先出。 2.栈的顺序存储及其运算

用S(1:M)作为栈的顺序存储空间。M为栈的最大容量。 栈的基本运算有三种:入栈、退栈与读栈顶元素。 入栈运算:在栈顶位置插入一个新元素。

首先将栈顶指针进一(TOP+1),然后将新元素插入到栈顶指针指向的位置。 退栈运算:指取出栈顶元素并赋给一个指定的变量。

首先将栈顶元素赋给一个指定的变量,然后将栈顶指针退一(TOP-1) 读栈顶元素:将栈顶元素赋给一个指定的变量。栈顶指针不会改变。

十一.队列及其基本运算

1.什么是队列

队列是只允许在一端删除,在另一端插入的顺序表,允许删除的一端叫做对头,允许插入的一端叫做对尾。 队列的修改是先进先出。往队尾插入一个元素成为入队运算。从对头删除一个元素称为退队运算。 2.循环队列及其运算

在实际应用中,队列的顺序存储结构一般采用循环队列的形式。所谓循环队列,就是将队列存储空间的最后一个位置绕到第一个位置,形成逻辑上的环状空间。在循环队列中,,用队尾指针rear指向队列中的队尾元素,用排头指针front指向排头元素的前一个位置,因此,从排头指针front指向的后一个位置直到队尾指针 rear指向的位置之间所有的元素均为队列中的元素。

在实际使用循环队列时,为了能区分队满还是队列空,通常需要增加一个标志S:

队列空,则S=0,rear=front=m 队列满,则S=1,rear=front=m 循环队列主要有两种基本运算:入队运算和退队运算 n 入队运算

指在循环队列的队尾加入一个新元素,首先rear=rear+1,当rear=m+1时,置rear=1,然后将新元素插入到队尾指针指向的位置。当S=1,rear=front,说明队列已满,不能进行入队运算,称为“上溢”。 n 退队运算

指在循环队列的排头位置退出一个元素并赋给指定的变量。首先front=front+1,并当front=m+1时,置front=1,然后将排头指针指向的元素赋给指定的变量。当循环队列为空S=0,不能进行退队运算,这种情况成为“下溢”。

十二.线性单链表的结构及其基本运算

1.线性单链表的基本概念

一组任意的存储单元存储线性表的数据元素,因此,为了表示每个数据元素ai与其直接后继数据元素ai+1之间的逻辑关系,对数据元素ai来说,除了存储其本身的信息之外,还需存储一个指示其直接后继的信息(即直接后继的存储位置)。这两部分信息组成数据元素ai的存储映象,成为结点。它包括两个域:其中存储数据元素信息的域称为数据域,存储直接后继存储位置的域称为指针域。指针域中存储的信息称做指针或链。N个结点链结成一个链表,即为线性表(a1, a2,……,an)的链式存储结构。又由于此链表的每个结点中只包含一个指针域,故又称线性链表或单链表。

有时,我们在单链表的第一个结点之前附设一个结点,称之为头结点,它指向表中第一个结点。头结点的数据域可以不存储任何信息,也可存储如线性表的长度等类的附加信息,头结点的指针域存储指向第一个结点的指针(即第一个元素结点的存储位置)。

在单链表中,取得第I个数据元素必须从头指针出发寻找,因此,单链表是非随机存取的存储结构 链表的形式:单向,双向 2.线性单链表的存储结构 3带链

3.带列的栈与队列

栈也是线性表,也可以采用链式存储结构。 队列也是线性表,也可以采用链式存储结构。

十三.线性链表的基本运算 1.线性链表的插入 2.线性链表的删除 十四.双向链表的结构及其基本运算

在双向链表的结点中有两个指针域,其一指向直接后继,另一指向直接前驱。

十五.循环链表的结构及其基本运算

是另一种形式的链式存储结构,它的特点是表中最后一个结点的指针域指向头结点,整个链表形成一个环。因此,从表中任一结点出发均可找到表中其他结点。

十六.树的定义

树是一种简单的非线性结构。树型结构的特点:

1.每个结点只有一个前件,称为父结点,没有前件的结点只有一个,称为树的根结点。 2.每一个结点可以有多个后件结点,称为该结点的子结点。没有后件的结点称为叶子结点 3.一个结点所拥有的后件个数称为树的结点度 4.树的最大层次称为树的深度。

十七.二叉树的定义及其基本性质

1.二叉树是另一种树型结构,它的特点是每个结点至多只有二棵子树(即二叉树中不存在度大于2的结点),并且,二叉树的子树有左右之分,其次序不能任意颠倒。 2.二叉树的基本性质

①在二叉树的第I层上至多有2i-1个结点。

②深度为k的二叉树至多有2k-1个结点(k>=1)

③在任意一个二叉树中,度为0的结点总是比度为2的结点多一个; ④具有n 个结点的二叉树,其深度至少为[log2n]+1。

一棵深度为k且有2k-1个结点的二叉树称为满二叉树。这种树的特点是每一层上的结点数都是最大结点数。 3.满二叉树与完全二叉树

满二叉树:除最后一层以外,每一层上的所有结点都有两个子结点。在满二叉树的第K层上有2K-1个结点,且深度为M的满二叉树右2M-1个结点

完全二叉树:除最后一层以外,每一层上的结点数均达到最大值;在最后一层上只缺少右边的若干结点。具有N个结点的完全二叉树的深度为[log2n]+1 完全二叉树总结点数为N,

若N为奇数,则叶子结点数为(N+1)/2 若N为偶数,则叶子结点数为N/2 4.二叉树的存储结构

二叉树通常采用链式存储结构

十八.二叉树的遍历

就是遵从某种次序,访问二叉树中的所有结点,使得每个结点仅被访问一次。一般先左后右。 1.前序遍历DLR 首先访问根结点,然后遍历左子树,最后遍历右子树。 2.中序遍历LDR 首先遍历左子树,然后根结点,最后右子树

3.后序遍历LRD 首先遍历左子树,然后遍历右子树,最后访问根结点。

十九.顺序查找与二分查找

1.顺序查找 在两种情况下只能用顺序查找:线性表为无序表、链式存储结构的有序表 2.二分查找 只适用于顺序存储的有序表(从小到大)。

对于长度为N的有序线性表,在最坏情况下,二分查找只需要比较log2N次,而顺序查找要比较N次。 排序:指将一个无序序列整理成按值非递减顺序排列的有序序列。

二十.交换类排序法

冒泡排序与快速排序法属于交换类的排序方法

1.冒泡排序法 假设线性表的长度为N,则在最坏的情况下,冒跑排序需要经过N/2遍的从前往后的扫描和N/2遍的从后往前的扫描,需要的比较次数为N(N-1)/2 2.快速排序法

二十一.选择类排序法 1.简单选择排序法 2.堆排序法 二十三.插入类排序法 1.简单插入排序法2.希尔排序法

最坏情况下 最好情况下 说明

交换排序 冒泡排序 n(n-1)/2 最简单的交换排序。在待排序的元素序列基本有序的前提下,效率最高

快速排序 n(n-1)/2 O(Nlog2 N)

插入排序 简单插入排序 n(n-1)/2 每个元素距其最终位置不远时适用 希尔排序 O(n1.5)

选择排序 简单选择排序 n(n-1)/2

堆排序 O(nlog2n) 适用于较大规模的线性表 练习:

1.栈和队列的共同特点是(只允许在端点处插入和删除元素) 2.如果进栈序列为e1,e2,e3,e4,则可能的出栈序列是(e2,e4,e3,e1)

3.栈底至栈顶依次存放元素A、B、C、D,在第五个元素E入栈前,栈中元素可以出栈,则出栈序列可能是(DCBEA)

4.栈通常采用的两种存储结构是(线性存储结构和链表存储结构)

5.下列关于栈的叙述正确的是(D)

A.栈是非线性结构B.栈是一种树状结构C.栈具有先进先出的特征D.栈有后进先出的特征 6.链表不具有的特点是(B)A.不必事先估计存储空间 B.可随机访问任一元素 C.插入删除不需要移动元素 D.所需空间与线性表长度成正比 7.用链表表示线性表的优点是(便于插入和删除操作) 8.在单链表中,增加头结点的目的是(方便运算的实现)

9.循环链表的主要优点是(从表中任一结点出发都能访问到整个链表) 10.线性表L=(a1,a2,a3,……ai,……an),下列说法正确的是(D) A.每个元素都有一个直接前件和直接后件 B.线性表中至少要有一个元素 C.表中诸元素的排列顺序必须是由小到大或由大到小

D.除第一个和最后一个元素外,其余每个元素都有一个且只有一个直接前件和直接后件 11.线性表若采用链式存储结构时,要求内存中可用存储单元的地址(D)

A.必须是连续的 B.部分地址必须是连续的C.一定是不连续的 D.连续不连续都可以

12.线性表的顺序存储结构和线性表的链式存储结构分别是(随机存取的存储结构、顺序存取的存储结构) 13.树是结点的集合,它的根结点数目是(有且只有1) 14.在深度为5的满二叉树中,叶子结点的个数为(31) 15.具有3个结点的二叉树有(5种形态)

16.设一棵二叉树中有3个叶子结点,有8个度为1的结点,则该二叉树中总的结点数为(13) 17.已知二叉树后序遍历序列是dabec,中序遍历序列是debca,它的前序遍历序列是(cedba) 18.已知一棵二叉树前序遍历和中序遍历分别为ABDEGCFH和DBGEACHF,则该二叉树的后序遍历为(DGEBHFCA)

19.若某二叉树的前序遍历访问顺序是abdgcefh,中序遍历访问顺序是dgbaechf,则其后序遍历的结点访问顺序是(gdbehfca)

20.数据库保护分为:安全性控制、 完整性控制 、并发性控制和数据的恢复。 1. 在计算机中,算法是指(解题方案的准确而完整的描述)

2.在下列选项中,哪个不是一个算法一般应该具有的基本特征(无穷性) 说明:算法的四个基本特征是:可行性、确定性、有穷性和拥有足够的情报。 3. 算法一般都可以用哪几种控制结构组合而成(顺序、选择、循环) 4.算法的时间复杂度是指(算法执行过程中所需要的基本运算次数) 5. 算法的空间复杂度是指(执行过程中所需要的存储空间) 6. 算法分析的目的是(分析算法的效率以求改进) 7. 下列叙述正确的是(C)

A.算法的执行效率与数据的存储结构无关

B.算法的空间复杂度是指算法程序中指令(或语句)的条数 C.算法的有穷性是指算法必须能在执行有限个步骤之后终止 D.算法的时间复杂度是指执行算法程序所需要的时间

8.数据结构作为计算机的一门学科,主要研究数据的逻辑结构、对各种数据结构进行的运算,以及(数据的存储结构)

9. 数据结构中,与所使用的计算机无关的是数据的(C)

A.存储结构 B.物理结构 C.逻辑结构 D.物理和存储结构 10. 下列叙述中,错误的是(B)

A.数据的存储结构与数据处理的效率密切相关 B.数据的存储结构与数据处理的效率无关

C.数据的存储结构在计算机中所占的空间不一定是连续的

D.一种数据的逻辑结构可以有多种存储结构

11. 数据的存储结构是指(数据的逻辑结构在计算机中的表示) 12. 数据的逻辑结构是指(反映数据元素之间逻辑关系的数据结构)

13. 根据数据结构中各数据元素之间前后件关系的复杂程度,一般将数据结构分为(线性结构和非线性结构)

14. 下列数据结构具有记忆功能的是(C)A.队列B.循环队列C.栈D.顺序表 15. 下列数据结构中,按先进后出原则组织数据的是(B) A.线性链表 B.栈 C.循环链表 D.顺序表 16. 递归算法一般需要利用(队列)实现。 17. 下列关于栈的叙述中正确的是(D)

A.在栈中只能插入数据B.在栈中只能删除数据

C.栈是先进先出的线性表 D.栈是先进后出的线性表

18. 栈底至栈顶依次存放元素A、B、C、D,在第五个元素E入栈前,栈中元素可以出栈,则出栈序列可能是(DCBEA)

19.如果进栈序列为e1,e2,e3,e4,则可能的出栈序列是(e2,e4,e3,e1)

20. 由两个栈共享一个存储空间的好处是(节省存储空间,降低上溢发生的机率)

21. 应用程序在执行过程中,需要通过打印机输出数据时,一般先形成一个打印作业,将其存放在硬盘中的一个指定(队列)中,当打印机空闲时,就会按先来先服务的方式从中取出待打印的作业进行打印。 22.下列关于队列的叙述中正确的是(C)

A.在队列中只能插入数据 B.在队列中只能删除数据

C.队列是先进先出的线性表 D.队列是先进后出的线性表 23.下列叙述中,正确的是(D)

A.线性链表中的各元素在存储空间中的位置必须是连续的 B.线性链表中的表头元素一定存储在其他元素的前面

C.线性链表中的各元素在存储空间中的位置不一定是连续的,但表头元素一定存储在其他元素的前面 D.线性链表中的各元素在存储空间中的位置不一定是连续的,且各元素的存储顺序也是任意的 24.下列叙述中正确的是(A)

A.线性表是线性结构 B.栈与队列是非线性结构 C.线性链表是非线性结构 D.二叉树是线性结构

25. 线性表L=(a1,a2,a3,……ai,……an),下列说法正确的是(D) A.每个元素都有一个直接前件和直接后件 B.线性表中至少要有一个元素

C.表中诸元素的排列顺序必须是由小到大或由大到小

D.除第一个元素和最后一个元素外,其余每个元素都有一个且只有一个直接前件和直接后件 26.线性表若采用链式存储结构时,要求内存中可用存储单元的地址(连续不连续都可以) 27. 链表不具有的特点是(B)

A.不必事先估计存储空间 B.可随机访问任一元素

C.插入删除不需要移动元素 D.所需空间与线性表长度成正比 28. 非空的循环单链表head的尾结点(由p所指向),满足(p->next=head) 29.与单向链表相比,双向链表的优点之一是(更容易访问相邻结点)

30. 在(D)中,只要指出表中任何一个结点的位置,就可以从它出发依次访问到表中其他所有结点。 A.线性单链表 B.双向链表 C.线性链表 D.循环链表 31. 以下数据结构属于非线性数据结构的是(C) A.队列 B.线性表C.二叉树 D.栈

32.树是结点的集合,它的根结点数目是(有且只有1) 33.具有3个结点的二叉树有(5种形态)

34. 在一棵二叉树上第8层的结点数最多是(128) 注:2K-1 35. 在深度为5的满二叉树中,叶子结点的个数为(16) 注:2n-1 36. 在深度为5的满二叉树中,共有(31)个结点。 注:2n-1

37.设一棵完全二叉树共有699个结点,则在该二叉树中的叶子结点数为(350)

说明:完全二叉树总结点数为N,若N为奇数,则叶子结点数为(N+1)/2;若N为偶数,则叶子结点数为N/2。

38. 设有下列二叉树,对此二叉树中序遍历的结果是(B) A.ABCDEF B.DBEAFC C.ABDECF D.DEBFCA

39.已知二叉树后序遍历序列是dabec,中序遍历序列debac,它的前序遍历序列是(cedba)

40. 已知一棵二叉树前序遍历和中序遍历分别为ABDEGCFH和DBGEACHF,则该二叉树的后序遍历为(DGEBHFCA)

41.若某二叉树的前序遍历访问顺序是abdgcefh,中序遍历访问顺序是dgbaechf,则其后序遍历的结点访问顺序是(gdbehfca)

42. 串的长度是(串中所含字符的个数)

43.设有两个串p和q,求q在p中首次出现位置的运算称做(模式匹配) 44. N个顶点的连通图中边的条数至少为(N-1) 45.N个顶点的强连通图的边数至少有(N)

46.对长度为n的线性表进行顺序查找,在最坏情况下所需要的比较次数为(N) 47. 最简单的交换排序方法是(冒泡排序)

48.假设线性表的长度为n,则在最坏情况下,冒泡排序需要的比较次数为(n(n-1)/2) 49. 在待排序的元素序列基本有序的前提下,效率最高的排序方法是(冒泡排序) 50. 在最坏情况下,下列顺序方法中时间复杂度最小的是(堆排序) 51. 希尔排序法属于(插入类排序) 52. 堆排序法属于(选择类排序)

53. 在下列几种排序方法中,要求内存量最大的是(归并排序)

54. 已知数据表A中每个元素距其最终位置不远,为节省时间,应采用(直接插入排序) 55. 算法的基本特征是可行性、确定性、 有穷性 和拥有足够的情报。

1.一个算法通常由两种基本要素组成:一是对数据对象的运算和操作,二是算法的控制结构。 1. 算法的复杂度主要包括时间复杂度和 空间 复杂度。

2. 实现算法所需的存储单元多少和算法的工作量大小分别称为算法的空间复杂度和时间复杂度 。 3.所谓数据处理是指对数据集合中的各元素以各种方式进行运算,包括插入、删除、查找、更改等运算,也包括对数据元素进行分析。

4.数据结构是指相互有关联的 数据元素 的集合。

5.数据结构分为逻辑结构与存储结构,线性链表属于 存储结构 。 6.数据结构包括数据的 逻辑 结构和数据的存储结构。

7. 数据结构包括数据的逻辑结构、数据的 存储结构 以及对数据的操作运算。 8.数据元素之间的任何关系都可以用 前趋和后继 关系来描述。 9.数据的逻辑结构有线性结构和非线性结构两大类。 10.常用的存储结构有顺序、链接、 索引 等存储结构。

11. 顺序存储方法是把逻辑上相邻的结点存储在物理位置 相邻 的存储单元中。 12. 栈的基本运算有三种:入栈、退栈与读栈顶元素 。 13. 队列主要有两种基本运算:入队运算与 退队运算 。

14. 在实际应用中,带链的栈可以用来收集计算机存储空间中所有空闲的存储结点,这种带链的栈称为 可利用栈 。

15.栈和队列通常采用的存储结构是 链式存储和顺序存储 。

16.当线性表采用顺序存储结构实现存储时,其主要特点是 逻辑结构中相邻的结点在存储结构中仍相邻 。 17. 循环队列主要有两种基本运算:入队运算与退队运算。每进行一次入队运算,队尾指针就 进1 。 18.当循环队列非空且队尾指针等于对头指针时,说明循环队列已满,不能进行入队运算。这种情况称为 上溢 。

19.当循环队列为空时,不能进行退队运算,这种情况称为 下溢 。

20. 在一个容量为25的循环队列中,若头指针front=16,尾指针rear=9,则该循环队列中共有 18 个元素。注:当rearfront时,元素个数=rear-front。

21. 在一个容量为15的循环队列中,若头指针front=6,尾指针rear=9,则该循环队列中共有3 个元素。 22.顺序查找一般是指在 线性表 中查找指定的元素。 23.在计算机中存放线性表,一种最简单的方法是 顺序存储 。

24.在程序设计语言中,通常定义一个 一维数组 来表示线性表的顺序存储空间。

25.在链式存储方式中,要求每个结点由两部分组成:一部分用于存放数据元素值,称为数据域,另一部分用于存放指针,称为 指针域 。其中指针用于指向该结点的前一个或后一个结点(即前件或后件)。 26.在 线性单链表中 ,每一个结点只有一个指针域,由这个指针只能找到后继结点,但不能找到前驱结点。 27. 为了要在线性链表中插入一个新元素,首先要给该元素分配一个 新结点 ,以便用于存储该元素的值。 28. 在线性链表中删除一个元素后,只需要改变被删除元素所在结点的前一个结点的 指针域 即可。 29. 用链表表示线性表的突出优点是 便于插入和删除操作 。 30. 在树形结构中,树根结点没有 前件 。

31. 在树结构中,一个结点所拥有的后件个数称为该结点的度。叶子结点的度为 0 。 32. 设一棵二叉树中有3个叶子结点,8个度为1的结点,则该二叉树中总的结点数为 13。 33. 设一棵完全二叉树共有739个结点,则在该二叉树中有 370 个叶子结点。 34. 设一棵完全二叉树共有700个结点,则在该二叉树中有 350 个叶子结点。

35. 在先左后右的原则下,根据访问根结点的次序,二叉树的遍历可以分为三种:前序遍历、 中序 遍历和后序遍历。

36. 若串S=\,则其子串的数目是 29 。 注:n(n+1)/2+1 37. 若串S=”MathTypes”,则其子串的数目是 46 。

38. 对长度为n的线性表进行插入一个新元素或删除一个元素时,在最坏情况下所需要的比较次数为 n 。 39. 在长度为n的有序线性表中进行顺序查找。最坏的情况下,需要的比较次数为 n 。 40. 在长度为n的有序线性表中进行二分查找。最坏的情况下,需要的比较次数为 log2n 。

41. 长度为n的顺序存储线性表中,当在任何位置上插入一个元素概率都相等时,插入一个元素所需移动元素的平均个数为 n/2 。

42. 排序是计算机程序设计中的一种重要操作,常见的排序方法有插入排序、 交换排序 和选择排序等。 43. 快速排序法可以实现通过一次交换而消除多个 逆序 。 44. 快速排序法的关键是对线性表进行 分割 。

45. 冒泡排序算法在最好的情况下的元素交换次数为 0 。 46. 在最坏情况下,冒泡排序的时间复杂度为 n(n-1) /2 。

47. 对于长度为n的线性表,在最坏情况下,快速排序所需要的比较次数为 n(n-1) /2 。

48.在最坏情况下,简单插入排序需要比较的次数为 n(n-1) /2 。

49.在最坏情况下,希尔排序需要比较的次数为 O(n1.5) 。注:括号里是n的1.5次方。 50. 在最坏情况下,简单选择排序需要比较的次数为 n(n-1) /2 。 51. 在最坏情况下,堆排序需要比较的次数为 o(nlog2n) 。

52.对于输入为N个数进行快速排序算法的平均时间复杂度是 O(Nlog2 N)。

第二章 程序设计基础

一.程序设计方法与风格

当今主导的程序设计风格是“清晰第一,效率第二”的观点。

1.在结构化程序设计思想提出之前,在程序设计中曾强调程序的效率。与程序的效率相比,人们更重视程序的( C )。 A.安全性 B.一致性 C.可理解性D.合理性 2.对建立良好的程序设计风格,下面的描述正确的是(A )

A.程序应简单、清晰、可读性好 B.符号名的命名只要符合语法 C.充分考虑程序的执行效率 D.程序的注释可有可无 3. 在设计程序时.应采纳的原则之一是( D)。

A.不限制GOTO语句的使用 B.减少或取消注解行 C.程序越短越好 D.程序结构应有助于读者理解

4.程序应该简单易懂,语句构造应该简单直接,不应该为提高效率而把语句复杂化。 5.源程序文档化要求程序应加注释,注释一般分为序言性注释和 功能性注释 。

6.在编写程序时,需要注意 数据说明 的风格,以便使程序中的数据说明更易理解和维护。 7.当程序设计语言对输入格式有严格要求时,应保持输入格式与输入语句的一致性 程序设计语言的基本成分是数据成分、运算成分、控制成分和(传输成分)。 二.结构化程序设计 1结构化程序设计的原则

8.结构化程序设计方法的主要原则是:自顶向下、逐步求精、模块化、限制使用goto语句 2结构化程序的基本结构与特点

9.结构化程序设计主要强调的是(B)

A.程序的规模 B.程序的易读性 C.程序的执行效率 D.程序的可移植性 10.结构化程序设计的3种结构是(顺序结构、选择结构、循环结构)。

结构化程序设计方法是程序设计的先进方法和工具。下面为三种基本的控制结构: 顺序结构:是一种简单的程序设计,它是最基本,最常用的结构 选择结构:又称为分支结构,包括简单选择和多分支选择结构

重复结构:又称循环结构,有两类循环语句:当型循环结构(先判断后执行循环体)和直到型循环结构(先执行循环体后判断)

按结构化程序设计方法设计出的程序具有两大明显的优点:1、程序易于理解、使用和维护。2、提高了编程工作效率,降低了软件开发成本。 3.结构化程序设计原则和方法的应用

11.结构化程序设计的主要特点是(每个控制结构只有一个入口和一个出口) 12.下列叙述中,不属于结构化程序设计方法的主要原则的是(B)。 A.自顶向下 B.由底向上 C.模块化 D.限制使用GOTO语句 在结构化程序设计的具体实施中,要注意如下要素:

使用程序设计语言中的顺序、选择、循环等有限的控制结构表示程序的控制逻辑;选用的控制结构只准许的一个入口和一个出口;程序语句组成容易识别的块,每块只有一个入口和一人出口;复杂结构应该用嵌套的基本控制结构进行组合嵌套来实现;语言中所没有的控制结构,应该采用前后一致的方法来模拟;严

格控制GOTO语句的使用。其意思有三:1.用一个非结构化的程序设计语言去实现一个结构化的构造;2.如不使用GOTO语句会使功能模糊;3.在某种可以改善而不是损害程序可读性的情况下。 三.面向对象的程序设计 1. 关于面向对象方法

25.面向对象的程序设计方法中涉及的对象是系统中用来描述客观事物的一个 实体

传统的程序设计方法是面向过程的,其核心方法是以 算法 为核心。面向对象方法和技术以 对象 为核心。对象是由 数据 和 容许的操作 组成的封装体,与客观实体有直接的对应关系。对象之间通过传递 消息 互相联系,以模拟现实世界中不同事物彼此之间的联系。

面向对象方法基于构造问题领域的对象模型,以对象为中心构造软件系统。它的基本作法是用 对象 模拟问题领域中的实体,以 对象间的联系 刻画实体间的联系。

软件重用 是指在不同的软件开发过程中重复使用相同的或者相似软件元素的过程。 重用是提高软件生产率的最主要的方法。

2. 面向对象方法的基本概念(对象、类、消息、继承、多态性) 13.面向对象的模型中,最基本的概念是对象和 类 14.类是一个支持集成的抽象数据类型,而对象是类的 实例

对象:面向对象的程序设计方法中涉及的对象是系统中用来描述客观事物的一个实体,是构成系统一个基本单位,它由一组表示静态特征的属性和它可执行的一组操作组成。(是由描述该对象属性的数据以及可以对这些数据施加的所有操作封装在一起构成的统一体。)

属性:是对象所包含的信息,它在设计对象时确定,一般只能通过执行对象的操作来改变。

操作:描述了对象执行的功能,若通过信息传递,还可为其它对象使用。操作过程对外是封闭的,用户只能看到这一操作实施后的结果,对象的这一特性,即是对象的封装体。 15.对象实现了数据和操作的结合,是指对数据和数据的操作进行(封装)。 16.封装是一种(信息屏蔽)技术,封装的目的是使对象的定义和实现分离。 17.以下不属于对象的基本特点的是(C)。 A.分类性 B.多态性 C.继承性 D.封装性 对象有如下一些基本特点.即标识惟一性、分类性、多态性、封装性和模块独立性。

18.下面关于对象的描述错误的是(A)A.任何对象都必须有继承性B.对象是属性和方法的封装体 C.对象间的通迅靠消息传递 D.操作是对象的动态属性

19.信息隐蔽的概念与下述哪能一种概念直接相关(模块独立性) 20.可以把具有相同属性的一些不同对象归类,称为 对象类 。

类:是具有其同属性、共同方法的对象的集合。所以,类是对象的抽象,这描述了属于该对象类型的所有对象的性质,而一个对象则是其对应类的一个实例。类同对象一样,包括一组数据属性和在数据上的一组合法操作。 对象可以是一个具体的对象也可以是泛指一般的对象,而实例必然是指一个具体的对象。 21.在面向对象方法中,一个对象请求另一对象为其服务的方式是通过发送(消息)

消息:面向对象的世界是通过对象与对象间彼此的相合合作来推动的,对象间这种合作需要一个机制协助进行,这样的机制称为“消息”。消息就是一个实例与另一个实例之间传递的信息,它统一了数据流和控制流。一个消息由下述三部分组成:1、接收消息的对象的名称。 2、消息标识符(即消息名)3、零个或多个参数。

22.在面向对象方法中,类之间共享属性和操作的机制称为 继承 。

23.一个类可以从直接或间接的祖先中继承所有属性和方法。采用此方法提高了软件的可重用性

继承:是面向对象方法的一个主要特征。继承是使用已有的定义作为基础建立新类的定义技术。也就是说继承是指能够直接获得已有的功能和突出的优点,而不必重复定义它们。

继承具有传递性,可分为单继承与多重继承。单继承是指一个类只允许有一人父类,即类等级为树形结构。多重继承是指一个类允许有多个父类。多态性:对象根据所接受的消息而做出动作,同样的消息被不同的对象接受时可导致完全不同的行动,这种现象即为多态性。多态性机制可提高软件系统的灵活性,可

重用性和可扩充性。

24.子程序通常分为两类: 过程 和函数,前者是命令的抽象,后者是为了求值。

第三章 软件工程

重点:需求分析、概要设计、详细设计、软件测试和软件调试的作用、方法等 一、 软件工程基本概念

1. 软件是计算机系统中与硬件相互依存的重要部分,包括程序、数据及相关的 文档 。其中,程序 是软件开发人员根据用户需求开发的、用程序设计语言描述的、适合计算机执行的指令(语句)序列。 2. 下列叙述中,正确的是(D)。 A.软件就是程序清单 B.软件就是存放在计算机中的文件 C.软件应包括程序清单及运行结果 D.软件包括程序和文档

3. 软件按功能可以分为:应用软件、系统软件、支撑软件(或工具软件) 4. 软件工程的出现是由于(软件危机的出现)

5. 开发软件所需高成本和产品的低质量之间有着尖锐的矛盾,这种现象称做(软件危机)

软件工程概念的出现源自软件危机。所谓软件危机是泛指在计算机软件的开发和维护过程中所遇到的一系列严重问题。总之,可以将软件危机归结为成本、质量、生产率等问题。 6. 开发大型软件时,产生困难的根本原因是(大型系统的复杂性)。

7. 软件危机出现于20世纪60年代末,为了解决软件危机,人们提出了 软件工程学 的原理来设计软件这就是软件工程诞生的基础。

8. 下列不属于软件工程的3个要素的是(D) A.工具 B.过程 C.方法 D.环境 软件工程过程与软件生命周期

9. 软件工程过程是把输入转化为输出的一组彼此相关的 资源 和活动。通常,将软件产品从提出、实现、使用维护到停止使用退役的过程称为 软件生命周期 10.软件生命周期中所花费用最多的阶段是(软件维护)

11.软件开发的结构化生命周期方法将软件生命周期划分成(定义、开发、运行维护)。

12. 软件生命周期一般包括可行性研究与需求分析、设计、实现、测试、交付使用以及维护等活动。 软件工程的目标与原则

13. 软件工程的理论和技术性研究的内容主要包括:软件开发技术和软件工程管理。软件开发技术包括:软件开发方法学、开发过程、开发工具和软件工程环境,主体内容是软件开发方法学。软件工程管理包括:软件管理学、软件工程经济学、软件心理学等内容。

14. 软件工程的理论和技术性研究的内容主要包括软件开发技术和(软件工程管理)

15. 软件工程的原则包括抽象、信息隐藏、模块化、局部化、确定性、一致性、完备性和可验证性。 软件开发工具与软件开发环境

16. 开发软件时对提高开发人员工作效率至关重要的是(先进的软件开发工具和环境) 17. 软件开发环境是全面支持软件开发全过程的 软件工具 集合。

常用的软件开发方法和技术可以分为三大类:瀑布型、增量型和变换型。瀑布型开发方法将软件生命周期的各项活动规定为按固定顺序连接的若干阶段,强调早期的需求分析和开发的阶段性,强调产品测试;但是不能适应需求的变化。增量型则先建立一个不完全的系统,通过对需求的理解再进一步扩充和完善。 例:瀑布模型突出的缺点是不适应(D)的变动 A.算法B.平台C)程序语言D.用户需求 二、结构化分析方法 需求分析与需求分析方法

18. 在软件生产过程中,需求信息的给出是(软件用户)。 19. 需求分析中,开发人员要从用户那里了解(软件做什么)。

20. 需求分析阶段的任务是确定 (软件系统功能)

21. 需求分析的任务是发现需求、求精、建模和定义需求的过程。需求分析将创建所需的数据模型、功能模型和 控制模型

22. 需求分析阶段的工作:需求获取、需求分析、编写需求规格说明书、需求评审 下列工具中属于需求分析常用工具的是(D)。 A)PAD B)PFD C)N—S D)DFD 结构化分析方法 常用的需求分析方法:

(1)结构化分析方法。主要包括:面向数据流的结构化分析方法(SA),面向数据结构的Jackson方法(JSD)和面向数据结构的结构化数据系统开发方法(DSSD) (2)面向对象的分析方法(OOA)

23. 结构化方法的核心和基础是 结构化程序设计理论 24. 下列不属于结构化分析的常用工具的是(D)。 A)数据流图 B)数据字典 C)判定树 D)PAD图

25. 在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是 (B) A)可行性分析 B)需求分析 C)详细设计 D)程序编码

26. 数据流图用于抽象描述一个软件的逻辑模型.数据流图由一些特定的图符构成。下列图符名标识的图符不属于数据流图合法图符的是(A)。 A)控制流 B)加工 C)数据存储 D)源和潭 说明:数据流图中的主要图形元素与说明: 27. 在数据流图(DFD)中的箭头代表的是(数据流)

28. 在数据流图(DFD)中,带有名字的箭头表示(数据的流向)。

29. 在结构化分析方法中,用于描述系统中所用到的全部数据和文件的文档称为 数据字典 软件需求规格说明书

30. 软件需求规格说明书 是需求分析阶段的最后结果

31. 下列叙述中,不属于软件需求规格说明书的作用的是(D) A.便于用户、开发人员进行理解和交流

B.反映出用户问题的结构,可以作为软件开发工作的基础和依据 C.作为确认测试和验收的依据 D.便于开发人员进行需求分析

32. (数据描述)是对软件系统所必须解决的问题做出的详细说明

说明:需求规格说明书一般包括以下内容:概述、数据描述、性能描述、功能描述、参考文献目录等。其中概述从系统角度描述软件的目标和任务;功能描述中描述了为解决用户问题所需要的每一项功能的过程细节;性能描述说明系统应达到的性能和应该满足的限制条件、检测的方法和标准。 三、结构化设计方法 软件设计的基本概念

33. 在软件开发中,下面任务不属于设计阶段的是(D)

A)数据结构设计 B) 给出系统模块结构 C)定义模块算法 D)定义需求并建立系统模型

34. 软件设计包括软件的结构、数据、接口和过程设计,其中软件的过程设计是指(系统结构部件转换成软件的过程描述)。

说明:结构设计:定义软件系统各主要部件之间的关系;数据设计:将分析时创建的模型转化为数据结构的定义;接口定义:描述软件内部、软件和协作系统之间以及软件与人之间如何通信;过程设计:把系统结构部件转换成软件的过程性描述。

35. 下面不属于软件设计原则的是(C)A.抽象 B.模块化 C.自底向上 D.信息隐藏

36. 耦合和内聚是评价模块独立性的两个主要标准,其中 内聚 反映了模块内各成分之间的联系,耦合反映了模块间互相连接的紧密程度。

37. 内聚性是信息隐蔽和局部化概念的自然扩展,一个模块的内聚性越强,则该模块的模块独立性越 强 。一个模块与其它模块的耦合性越强,则它的模块独立性越 弱 。 38. 下列叙述中,正确的是(C)

A.接口复杂的模块,其耦合程度一定低 B.耦合程度弱的模块,其内聚程度一定低 C.耦合程度弱的模块,其内聚程度一定高 D.以上都不对

39.下列选项中,不属于模块间耦合的是(B)。A.数据耦合B.同构耦合C.异构耦D.公用耦合 40.软件设计中,有利于提高模块独立性的一个准则是( C)。

A.低内聚低耦合 B.低内聚高耦合 C.高内聚低耦合 D.高内聚高耦合 概要设计

41. 软件的概要 设计又称为总体结构设计,其主要任务是建立软件系统的总体结构,设计数据结构及数据库,编写概要设计文档,概要设计文档评审。

42. 在结构化方法中,软件功能分解属于下列软件开发中的阶段是 (C) A.详细设计 B.需求分析 C.总体设计 D.编程调试

43. 在概要设计阶段,常用的软件结构设计工具是 结构图 (sc),也称程序结构图。生成的结构图中,带有箭头的连线表示(模块之间的调用关系),矩形表示模块。

44. 在概要设计阶段,一般采用面向数据流的设计方法。数据流的类型有 变换型 和事务型。将变换型映射成结构图称为 变换分析 。将事务型映射成结构图称为 事务分析 。 45. 好的软件设计结构通常 顶层 高 扇出,中间扇出较少,底层 高 扇入。

46. 模块的控制范围包括它本身以及它所有的从属模块,模块的作用范围是指模块内一个判定的作用范围,凡是受到这个判定影响的所有模块都属于这个判定的作用范围。理想的情况是(模块的作用范围应在控制范围内) 详细设计

47. 详细设计 的任务是为软件结构图中的每一个模块确定实现算法和局部数据结构,用选定的表达工具表示算法和数据结构的细节。确定怎样来具体实现所要求的系统。

48. 为了避免流程图在描述程序逻辑时的灵活性,提出了用方框图来代替传统的程序流程图,通常也把这种图称为(N—S图)。

49. 详细设计的结果基本决定了最终程序的(质量)。 50. 软件设计模块化的目的是 降低复杂性。 51. 详细设计的典型语言描述工具是(PDL)

结构化分析(需求阶段)的常用工具有:数据流图(DFD)、数据字典(DD)、判定树和判定表 结构设计(概要设计阶段)工具是:结构图(SC, structure chart)

过程设计(详细设计阶段)常见的工具有:程序流程图、N—S图、PAD图(问题分析图,)和PDL( 过程设计语言)

四、软件测试 软件测试的目的

52. 在软件测试设计中,软件测试的主要目的是(D)。A.实验性运行软件 B.证明软件正确 C.找出软件中全部错误 D.发现软件错误而执行程序

(注意:不是为了证明软件的正确性,也不是为了找出全部错误) 软件测试的准则

53. 下列叙述中.不属于测试的特征的是(C)。

A.测试的挑剔性 B.完全测试的不可能性 C.测试的可靠性 D.测试的经济性

软件测试技术与方法

软件测试方法从是否需要执行被测试软件的角度,可以分为 静态测试 和 动态测试 ;按功能划分为 白盒测试 和 黑盒测试 。

静态测试包括 代码检查 、 静态结构分析 、 代码质量量度 等 白盒测试和黑盒测试都属于 动态测试

白盒测试的主要方法: 逻辑覆盖 、 基本路径测试 等

黑盒测试的主要方法: 等价类划分法 、 边界值分析法 、 错误推测法 、 因果图 等 54. 下列不属于静态测试方法的是(B)。

A.代码检查 B.白盒法 C.静态结构分析 D.代码质量度量

55. 在软件工程中,白箱测试法可用于测试程序的内部结构。此方法将程序看做是(A)。 A.路径的集合 B.循环的集合 C.目标的集台 D.地址的集合

56. 完全不考虑程序的内部结构和内部特征,而只是根据程序功能导出测试用例的测试方法是(A) A.黑箱测试法 B.白箱测试法 C.错误推测法 D.安装测试法

57. 黑盒测试是对软件已经实现的功能是否满足需求进行测试和验证,不考虑程序内部的逻辑结构,在软件接口处进行。常用的黑箱测试有等价分类法、 边界值分析法 、因果图法和错误推测法4种。 软件测试的实施

58. 软件测试过程一般按4个步骤进行,即单元测试、集成测试、验收测试(确认测试)和系统测试 58.检查软件产品是否符合需求定义的过程称为(A) A.确认测试B.集成测试C.验证测试D.验收测试 说明:软件的测试过程一般按4个步骤进行:

单元测试:对软件设计的最小单位—模块进行正确性检验的测试,发现模块内部可能存在的错误。由于模块通常不是一个独立的程序,不能单独运行,所以常常需要用到模拟环境。可以采用静态测试和动态测试(以白盒测试为主)。

集成测试:测试和组装模块的过程,主要是发现与接口有关的错误,依据是概要设计说明书。涉及的内容有:软件单元的接口测试、全局数据结构测试、边界条件和非法输入的测试等。通常采用两种方式:非增量方式组装域增量方式组装

验收测试(确认测试):验证软件的功能和性能以及其他特性是否满足了需求规格说明书中确定的各种需求,以及软件配置是否完全、正确。采用黑盒测试。

系统测试:将软件与硬件、用户、数据等组合,在实际运行环境下对整个系统进行集成测试和确认测试。 59. 软件开发离不开系统环境资源的支持.其中必要的测试数据属于(D)。 A.硬件资源 B.通信资源 C.支持软件 D.辅助资源

软件测试过程中,辅助资源包括测试用例(测试数据)、测试计划、出错统计和最终分析报告等。

60. 为了提高测试的效率,应该(D)A.随机选取测试数据 B.取一切可能的输入数据作为测试数据 C.在完成编码以后制定软件的测试计划 D.集中对付那些错误群集的程序

61. 为了便于对照检查,测试用例应由输入数据和预期的 输出结果 两部分组成。 四、程序的调试

软件调试(Debug,即排错)的任务是诊断和改正程序中的错误,与软件测试不同,软件测试是尽可能多地发现软件中的错误。软件测试贯穿整个软件生命期,调试主要在开发阶段。

62. 程序调试的基本步骤:错误定位、修改和设计代码以排除错误、进行回归测试防治引进新的错误。 63.下列叙述正确的是(D)

A.测试和调试工作必须由程序编制者自己完成 B.测试用例和调试用例必须完全一致 C.一个程序经调试改正错误后,一般不必再进行测试 D.上述三种说法都不对 软件调试方法

64. 下列不属于软件调试技术的是(B)。

A.强行排错法B.集成测试法C.回溯法D.原因排除法 六、软件维护

65. 软件维护活动包括以下几类:校正性维护、适应性维护、 完善性维护和预防性维护。

第四章 数据库设计基础

一、数据库系统的基本概念 数据、数据库、数据库管理系统 1.数据处理的最小单位是(C)。

A.数据 B.数据元素 C.数据项 D.数据结构

2.下列有关数据库的描述,正确的是(C)。A.数据库是一个DBF文件 B.数据库是一个关系 C.数据库是一个结构化的数据的集合 D.数据库是一组文件 3.下述关于数据库系统的叙述中正确的是(A)

A.数据库系统减少了数据冗余 B.数据库系统避免了一切冗余

C.数据库系统避免了一切数据的重复 D.数据库系统比文件系统能管理更多的数据 4.下列有关数据库的描述.正确的是(D)。A.数据处理是将信息转化为数据的过程 B.数据的物理独立性是指当数据的逻辑结构改变时,数据的存储结构不变 C.关系中的每一列称为元组,一个元组就是一个字段

D.如果一个关系中的属性或属性组并非该关系的关键字,但它是另一个关系的关键字,则称其为本关系的外关键字

5.下列4项说法中不正确的是(C)。

A.数据库减少了数据冗余 B.数据库中的数据可以共享

C.数据库避免了一切数据的重复 D.数据库具有较高的数据独立性 6.下列叙述中。不属于数据库系统的是(D)。

A.数据库 B.数据库管理系统 C.数据库管理员 D.数据库应用系统 7.数据库系统的核心是(数据库管理系统)。

8.数据库、数据库系统和数据库管理系统之间的关系是(数据库系统包括数据库和数据库管理系统)。 9.为用户与数据库系统提供接口的语言是(数据操纵语言(DML))。 数据库管理系统一般提供的数据语言有:

数据库定义语言(DDL):负责数据的模式定义与数据的物理存取构建 数据操纵语言(DML):负责数据的操纵,包括查询及增、删、改变等操作

数据库控制语言(DCL):负责数据完整性、安全性的定义与检查以及并发控制、故障恢复等 2. 数据库系统的发展

10.在数据管理技术的发展过程中.经历了人工管理阶段、文件系统阶段和数据库系统阶段。其中数据独立性最高的阶段是(数据库系统)。

11.在数据管理技术发展过程中,文件系统与数据库系统的主要区别是数据库系统具有(A)。 A.特定的数据模型 B.数据无冗余 C.数据可共享 D.专门的数据管理软件

12.相对于数据库系统,文件系统的主要缺陷有数据关联差、数据不一致性和(冗余性)。 13.分布式数据库系统不具有的特点是( D)。 A.数据分布性和逻辑整体性 B.位置透明性和复制透明性 C.分布性 D.数据冗余 3.数据库系统的基本特点

数据独立性 是数据与程序间的互不依赖性,即数据库中数据独立于应用程序而不依赖于应用程序。也就是说,数据的逻辑结构、存储结构和存取方式的改变都不会影响应用程序。数据独立性包括物理独立性和 逻辑独立性 两个含义。

当数据的物理结构(存储结构、存取方式等)改变时,不影响数据库的逻辑结构.从而不致引起应用程序的

变化,这是指数据的 物理独立性 。 4.数据库系统的内部结构

数据库系统在其内部具有三级模式及二级映射,三级模式分别是概念级模式、内部级模式与外部级模式,二级映射分别是概念级到内部级的映射以及外部级到概念级的映射。这种三级模式与二级映射构成了数据库系统内部抽象结构体系。

14.单个用户使用的数据视图的描述称为(外模式)。索引属于(内模式)。 二、数据模型

1.数据模型的基本概念

数据模型是数据库设计的核心。其内容有三个部分:数据结构、数据操作和数据约束

数据模型按不同应用层次分3种类型,它们是概念数据模型、逻辑数据模型和物理数据模型。

概念数据模型简称概念模型,是面向客观世界、面向用户的模型;是整个数据模型的基础。与具体的数据库管理系统无关,着重于对客观事件的结构描述以及它们之间的内在联系的刻画。常用的有E-R模型、扩充的E-R模型等。

逻辑数据模型又称数据模型,是面向数据库系统的模型,着重于数据库系统一级的实现。概念模型只有在转换成数据模型后才有可能在数据库中得以表示。常见的有层次模型、网状模型和关系模型。 数据库管理系统常见的数据模型有层次模型、网状模型和 关系模型 3种。 15.下列数据模型中,具有坚实理论基础的是(C)。 A.层次模型 B.网状模型 C.关系模型 D.以上3个都是 16.下列说法中,不属于数据模型所描述的内容的是(C)。 A.数据结构 B.数据操作 C.数据查询 D.数据约束 2.E-R模型

17.实体是信息世界中广泛使用的一个术语,它用于表示(C)。 A.有生命的事物 B.无生命的事物 C.实际存在的事物 D.一切事物 18.E-R模型由 实体 、联系 和 属性 三个基本概念组成。

19.将E—R图转换到关系模式时,实体与联系都可以表示成(关系)。 20.下列叙述中,正确的是(A)。

A.用E—R图能够表示实体集间一对一的联系、一对多的联系和多对多的联系 B.用E—R图只能表示实体集之问一对一的联系 C.用E—R图只能表示实体集之间一对多的联系

D.用E—R图表示的概念数据模型只能转换为关系数据模型

21.公司中有多个部门和多名职员,每个职员只能属于一个部门,一个部门可以有多名职员,从职员到部门的联系类型是(多对一)。 3.层次模型和网状模型 4.关系模型

22.在关系模型中,把数据看成一个二维表,每一个二维表称为一个 关系 23.最常用的一种基本数据模型是关系数据模型,它的表示应采用(二维表)。 24.由关系数据库系统支持的完整性约束是指 实体完整性 和参照完整性。 25.关系模型允许定义3类数据约束,下列不属于数据约束的是(C)。

A.实体完整性约束 B.参照完整性约束 C.域完整性约束 D.用户自定义的完整性约束 26.“年龄在18岁一25岁之间”这种约束是属于数据库中的( C )。 A.原子性措施 B.一致性措施 C.完整性措施 D.安全性措施

27.关系模型的数据操纵是建立在关系上的数据操纵,一般有查询、增加、删除和修改四种操作。 28.下列4项中.必须进行查询优化的是( A)。

A.关系数据库 B.网状数据库 C.层次数据库 D.非关系模型

三、关系代数

29.关系操作的特点是 集合 操作。

30.关系数据库的关系演算语言是以 谓词演算 为基础的DML语言。 31.一个关系中属性个数为l时,称此关系为(一元关系)。 32.关系表中的每一横行称为一个(元组)。

33.下列关系模型中,能使经运算后得到的新关系中属性个数多于原来关系中属性个数的是(B)。A.选择 B.连接 C.投影 D.并

34.关系运算 是从二维表列的方向进行的运算。

35.关系数据库管理系统应能实现的专门的关系运算包括(选择、投影、连接)。 四、数据库设计与管理 数据库设计概述

36.数据库设计包括两个方面的设计内容,它们是(D)。A.概念设计和逻辑设计 B.模式设计和内模式设计 C.内模式设计和物理设计 D.结构特性设计和行为特性设计

37.数据库设计分为以下6个设计阶段:需求分析阶段、 概念设计阶段 、逻辑设计阶段、物理设计阶段、实施阶段、运行和维护阶段。 数据库设计的需求分析

38.对数据库设计来讲,数据字典 是进行详细的数据收集和数据分析所获得的主要结果。 数据库概念设计

39.数据库概念设计的目的是分析数据间内在语义联系,在此基础上建立一个数据的抽象模型。方法有以下两种:集中式模式设计法、视图集成设计法。

40.视图设计一般有3种设计次序,下列不属于视图设计次序的是(B)。 A.自顶向下 B.由外向内 C.由内向外 D.自底向上 数据库的逻辑设计

41.数据库的逻辑设计的主要工作是将E-R图转换成指定RDBMS(关系数据库管理系统)中的关系模式,另一个重要内容是关系视图的设计,又称外模式设计。

42.在数据库设计中,将E—R图转换成关系数据模型的过程属于(逻辑设计阶段)。 数据库的物理设计

43.数据库的物理设计主要目标是对数据库内部物理结构做出调整并选择合理的存取路径,以提高数据库访问速度及有效利用存储空间。大致包括:索引设计、集簇设计和分区设计。 数据库管理

44.数据库是一种共享资源,需要维护与管理,这种工作称为 数据库管理 。实施此项管理的人称为数据库管理员。数据库的建立包括两部分的内容:数据模式的建立和数据加载。

45.数据库在运行一段时间以后,性能会逐步下降,需要对数据库进行重新整理,重新调整存贮空间,这种工作叫数据库重组。

46.数据库的故障恢复一般是由DBA完成的

47.数据库保护分为:安全性控制、完整性控制、并发性控制和数据的恢复。 48.数据库恢复是将数据库从错误状态恢复到某一已知的正确状态。 SQL语句的循序渐进写法

二级VF考试中,SQL语言部分占了很大比例,可以说该部分掌握好坏直接关系到整个考试的成败。 在上机考试中,初学者在进行SQL语言查询时常常丢三拉四,或是标点符号的全角半角搞错了,或丢掉了某些必要步骤,导致很长时间也无法得到正确输入。 那么,如何能书写好的复杂SQL查询语句呢?

本人归纳了一套循序渐进的书写方法,对于初学者非常有效。 1) SQL语句的格式可以归纳为:

select 字段 from 表; where 筛选条件; group by 分组字段; having 分组条件;

order by 排序字段 asc,desc

2) 学习语言可以认为是一个学习填空的过程。语言的框架已经在设计语言编译器时就给定了,用户不可违背,必须遵守语言提供好的规范,用户做的就是把自己需要表达的东西以填空的方式填入其中。 2.1) 分析数据源,尝试在命令窗口运行基本框架直到正确。 单表可以在命令窗口中输入:select * from 表

双表可以在命令窗口中输入:select * from 表1,表2 where 表1.联接字段=表2.联接字段

三表需要分析表如何链接然后在命令窗口中输入:select * from 表1,表2,表3 where 表1.联接字段=表2.联接字段 and 表2.联接字段=表3.联接字段 如果采用超联接模式书写,

双表模式可以书写为:select * from 表1 join 表2 on 表1.联接字段=表2.联接字段

三表模式可以书写为:select * from 表1 join 表2 join 表3 on 表2.联接字段=表3.联接字段 and 表1.联接字段=表2.联接字段

2.2) 分析筛选条件,将其转换为逻辑表达式。

光标移动到上一步骤命令末尾,补充筛选条件,然后回车检查。

如果出现错误或同预期结果不同,说明刚才输入语句有问题,修改后继续回车检查。

2.3) 补充筛选字段,具体操作类似上一步,光标移动到上一步骤命令末尾,补充筛选条件,然后回车检查。 如果出现错误或同预期结果不同,说明刚才输入语句有问题,修改后继续回车检查。 2.4) 补充排序条件

以上操作看似烦琐,实则不然:每次增加的部分不是全部SQL语句重新输入,而是在已经成功的命令行基础上予以修订和补充。上一步骤已经正确完成了,出现错误的话只能是本步骤操作失误造成的,修改增加部分即可。

相反,由于初学者对SQL语法格式不熟悉,书写SQL语句巴不得一气呵成,一旦发生错误,往往会用大量时间去调试,反而欲速而不达。 根据题目要求还可以继续补充:

2.5) 补充分组字段,增加group by语句,查看能否正确分组,但这时一定注意,select * from 表 group by 分组字段弹出每一行记录除少数字段有意义外,因此最好随后修改显示字段 2.6) 在增加分组字段正确后,补充having条件

2.7) 最后补充其它信息,如top短语、into table等短语等 以下题为例采用循序渐进法予以说明:

例:以表employee.dbf和orders.dbf中数据为基础,使用SQL命令检索订单数最多的前三名男职工的职工号、姓名、订单数,检索结果按订单数降序存入表newcoun.dbf中。 employee(职工号,姓名,性别,年龄)

orders(订单号,订购物品,订购单位,订购日期,职工号)

分析:首先打开两表,发现两表属于1对多关系,一个职工对应多个订单。没有订单数字段,只能按照职工号分组然后通过COUNT计数后求出订单数量。 操作:

1) 搭建框架,在命令窗口中输入基本框架:select * from employee e join orders o on e.职工号=o.职工号 2) 补充筛选字段,光标移动到上一行末尾,补充为:select * from employee e join orders o on e.职工号=o.职工号 where 性别=\男\

3) 补充分组字段,光标移动到上一行末尾,补充为:select * from employee e join orders o on e.职工号

=o.职工号 where 性别=\男\职工号

4) 修改显示字段:select e.职工号,姓名,count(*) as 订单数 from employee e join orders o on e.职工号=o.职工号 where 性别=\男\职工号

5) 没有having分组条件,补充top短语:select top 3 e.职工号,姓名,count(*) as 订单数 from employee e join orders o on e.职工号=o.职工号 where 性别=\男\职工号

6) 补充查询去向:select top 3 e.职工号,姓名,count(*) as 订单数 from employee e join orders o on e.职工号=o.职工号 where 性别=\男\职工号 into table newcoun

大家可以把这种方法推广到其它方面,也可在查询设计器中套用该方法。总之,操作不可急于求成,要按部就班,循序渐进。

数据结构

数据结构是计算机存储、组织数据的方式。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率的算法。数据结构往往同高效的检索算法和索引技术有关。

数据结构在计算机科学界至今没有标准的定义。个人根据各自的理解而有不同的表述方法:

Sartaj Sahni 在他的《数据结构、算法与应用》一书中称:“数据结构是数据对象,以及存在于该对象的实例和组成实例的数据元素之间的各种联系。这些联系可以通过定义相关的函数来给出。”他将数据对象(data object)定义为“一个数据对象是实例或值的集合”。

Clifford A.Shaffer 在《数据结构与算法分析》一书中的定义是:“数据结构是 ADT(抽象数据类型 Abstract Data Type) 的物理实现。”

Lobert L.Kruse 在《数据结构与程序设计》一书中,将一个数据结构的设计过程分成抽象层、数据结构层和实现层。其中,抽象层是指抽象数据类型层,它讨论数据的逻辑结构及其运算,数据结构层和实现层讨论一个数据结构的表示和在计算机内的存储细节以及运算的实现。

一般认为,一个数据结构是由数据元素依据某种逻辑联系组织起来的。对数据元素间逻辑关系的描述称为数据的逻辑结构;数据必须在计算机内存储,数据的存储结构是数据结构的实现形式,是其在计算机内的表示;此外讨论一个数据结构必须同时讨论在该类数据上执行的运算才有意义。

在许多类型的程序的设计中,数据结构的选择是一个基本的设计考虑因素。许多大型系统的构造经验表明,系统实现的困难程度和系统构造的质量都严重的依赖于是否选择了最优的数据结构。许多时候,确定了数据结构后,算法就容易得到了。有些时候事情也会反过来,我们根据特定算法来选择数据结构与之适应。不论哪种情况,选择合适的数据结构都是非常重要的。

选择了数据结构,算法也随之确定,是数据而不是算法是系统构造的关键因素。这种洞见导致了许多种软件设计方法和程序设计语言的出现,面向对象的程序设计语言就是其中之一。

在计算机科学中,数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象(数据元素)以及它们之间的关系和运算等的学科,而且确保经过这些运算后所得到的新结构仍然是原来的结构类型。

“数据结构”作为一门独立的课程在国外是从1968年才开始设立的。 1968年美国唐·欧·克努特教授开创了数据结构的最初体系,他所著的《计算机程序设计技巧》第一卷《基本算法》是第一本较系统地阐述数据的逻辑结构和存储结构及其操作的著作。“数据结构”在计算机科学中是一门综合性的专业基础课。数据结构是介于数学、计算机硬件和计算机软件三者之间的一门核心课程。数据结构这一门课的内容不仅是一般程序设计(特别是非数值性程序设计)的基础,而且是设计和实现编译程序、操作系统、数据库系统及其他系统程序的重要基础。

计算机是一门研究用计算机进行信息表示和处理的科学。这里面涉及到两个问题:

信息的表示

信息的处理

而信息的表示和组又直接关系到处理信息的程序的效率。随着计算机的普及,信息量的增加,信息范围的拓宽,使许多系统程序和应用程序的规模很大,结构又相当复杂。因此,为了编写出一个“好”的程序,必须分析待处理的对象的特征及各对象之间存在的关系,这就是数据结构这门课所要研究的问题。众所周知,计算机的程序是对信息进行加工处理。在大多数情况下,这些信息并不是没有组织,信息(数据)之间往往具有重要的结构关系,这就是数据结构的内容。数据的结构,直接影响算法的选择和效率。

计算机解决一个具体问题时,大致需要经过下列几个步骤:首先要从具体问题中抽象出一个适当的数学模型,然后设计一个解此数学模型的算法(Algorithm),最后编出程序、进行测试、调整直至得到最终解答。寻求数学模型的实质是分析问题,从中提取操作的对象,并找出这些操作对象之间含有的关系,然后用数学的语言加以描述。计算机算法与数据的结构密切相关,算法无不依附于具体的数据结构,数据结构直接关系到算法的选择和效率。运算是由计算机来完成,这就要设计相应的插入、删除和修改的算法 。也就是说,数据结构还需要给出每种结构类型所定义的各种运算的算法。

数据是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并由计算机程序处理的符号的总称。

数据元素是数据的基本单位,在计算机程序中通常作为一个整体考虑。一个数据元素由若干个数据项组成。数据项是数据的不可分割的最小单位。有两类数据元素:一类是不可分割的原子型数据元素,如:整数\,字符 \等;另一类是由多个款项构成的数据元素,其中每个款项被称为一个数据项。例如描述一个学生的信息的数据元素可由下列6个数据项组成。其中的出身日期又可以由三个数据项:\年\、\月\和\日\组成,则称\出身日期\为组合项,而其它不可分割的数据项为原子项。

关键字指的是能识别一个或多个数据元素的数据项。若能起唯一识别作用,则称之为 \主\关键字,否则称之为 \次\关键字。

数据对象是性质相同的数据元素的集合,是数据的一个子集。数据对象可以是有限的,也可以是无限的。

数据处理是指对数据进行查找、插入、删除、合并、排序、统计以及简单计算等的操作过程。在早期,计算机主要用于科学和工程计算,进入八十年代以后,计算机主要用于数据处理。据有关统计资料表明,现在计算机用于数据处理的时间比例达到80%以上,随着时间的推移和计算机应用的进一步普及,计算机用于数据处理的时间比例必将进一步增大。

数据结构是指同一数据元素类中各数据元素之间存在的关系。数据结构分别为逻辑结构、存储结构(物理结构)和数据的运算。数据的逻辑结构是对数据之间关系的描述,有时就把逻辑结构简称为数据结构。逻辑结构形式地定义为(K,R)(或(D,S)),其中,K是数据元素的有限集,R是K上的关系的有限集。

数据元素相互之间的关系称为结构。有四类基本结构:集合、线性结构、树形结构、图状结构(网状结构)。

树形结构和图形结构全称为非线性结构。集合结构中的数据元素除了同属于一种类型外,别无其它关系。线性结构中元素之间存在一对一关系,树形结构中元素之间存在一对多关系,图形结构中元素之间存在多对多关系。在图形结构中每个结点的前驱结点数和后续结点数可以任意多个。

数据结构在计算机中的表示(映像)称为数据的物理(存储)结构。它包括数据元素的表示和关系的表示。数据元素之间的关系有两种不同的表示方法:顺序映象和非顺序映象,并由此得到两种不同的存储结构:顺序存储结构和链式存储结构。顺序存储方法:它是把逻辑上相邻的结点存储在物理位置相邻的存储单元里,结点间的逻辑关系由存储单元的邻接关系来体现,由此得到的存储表示称为顺序存储结构。顺序存储结构是一种最基本的存储表示方法,通常借助于程序设计语言中的数组来实现。链接存储方法:它不要求逻辑上相邻的结点在物理位置上亦相邻,结点间的逻辑关系是由附加的指针字段表示的。由此得到的存储表示称为链式存储结构,链式存储结构通常借助于程序设计语言中的指针类型来实现。索引存储方法:除建立存储结点信息外,还建立附加的索引表来标识结点的地址。散列存储方法:就是根据结点的关键字直接计算出该结点的存储地址。

数据结构中,逻辑上(逻辑结构:数据元素之间的逻辑关系)可以把数据结构分成线性结构和非线性结构。线性结构的顺序存储结构是一种随机存取的存储结构,线性表的链式存储结构是一种顺序存取的存储结构。线性表若采用链式存储表示时所有结点之间的存储单元地址可连续可不连续。逻辑结构与数据元素本身的形式、内容、相对位置、所含结点个数都无关。

算法的设计取决于数据(逻辑)结构,而算法的实现依赖于采用的存储结构。数据的运算是在数据的逻辑结构上定义的操作算法,如检索、插入、删除、更新的排序等。

数据结构的形式定义为:数据结构是一个二元组:

Data-Structure=(D,S)

其中:D是数据元素的有限集,S是D上关系的有限集。

数据结构不同于数据类型,也不同于数据对象,它不仅要描述数据类型的数据对象,而且要描述数据对象各元素之间的相互关系。

数据类型是一个值的集合和定义在这个值集上的一组操作的总称。数据类型可分为两类:原子类型、结构类型。一方面,在程序设计语言中,每一个数据都属于某种数据类型。类型明显或隐含地规定了数据的取值范围、存储方式以及允许进行的运算。可以认为,数据类型是在程序设计中已经实现了的数据结构。另一方面,在程序设计过程中,当需要引入某种新的数据结构时,总是借助编程语言所提供的数据类型来描述数据的存储结构。

计算机中表示数据的最小单位是二进制数的一位,叫做位。我们用一个由若干位组合起来形成的一个位串表示一个数据元素,通常称这个位串为元素或结点。当数据元素由若干数据项组成时,位串中对应于各个数据项的子位串称为数据域。元素或结点可看成是数据元素在计算机中的映象。

一个软件系统框架应建立在数据之上,而不是建立在操作之上。一个含抽象数据类型的软件模块应包含定

义、表示、实现三个部分。

对每一个数据结构而言,必定存在与它密切相关的一组操作。若操作的种类和数目不同,即使逻辑结构相同,数据结构能起的作用也不同。

不同的数据结构其操作集不同,但下列操作必不可缺:

1,结构的生成;

2.结构的销毁;

3,在结构中查找满足规定条件的数据元素;

4,在结构中插入新的数据元素;

5,删除结构中已经存在的数据元素;

6,遍历。

抽象数据类型:一个数学模型以及定义在该模型上的一组操作。抽象数据类型实际上就是对该数据结构的定义。因为它定义了一个数据的逻辑结构以及在此结构上的一组算法。抽象数据类型可用以下三元组表示:(D,S,P)。D是数据对象,S是D上的关系集,P是对D的基本操作集。ADT的定义为:

ADT 抽象数据类型名{

数据对象:(数据元素集合)

数据关系:(数据关系二元组结合)

基本操作:(操作函数的罗列)

} ADT 抽象数据类型名;

抽象数据类型有两个重要特性:

数据抽象

用ADT描述程序处理的实体时,强调的是其本质的特征、其所能完成的功能以及它和外部用户的接口(即外界使用它的方法)。

数据封装

将实体的外部特性和其内部实现细节分离,并且对外部用户隐藏其内部实现细节。

数据(Data)是信息的载体,它能够被计算机识别、存储和加工处理。它是计算机程序加工的原料,应用程序处理各种各样的数据。计算机科学中,所谓数据就是计算机加工处理的对象,它可以是数值数据,也可以是非数值数据。数值数据是一些整数、实数或复数,主要用于工程计算、科学计算和商务处理等;非数值数据包括字符、文字、图形、图像、语音等。数据元素(Data Element)是数据的基本单位。在不同的条件下,数据元素又可称为元素、结点、顶点、记录等。例如,学生信息检索系统中学生信息表中的一个记录等,都被称为一个数据元素。

有时,一个数据元素可由若干个数据项(Data Item)组成,例如,学籍管理系统中学生信息表的每一个数据元素就是一个学生记录。它包括学生的学号、姓名、性别、籍贯、出生年月、成绩等数据项。这些数据项可以分为两种:一种叫做初等项,如学生的性别、籍贯等,这些数据项是在数据处理时不能再分割的最小单位;另一种叫做组合项,如学生的成绩,它可以再划分为数学、物理、化学等更小的项。通常,在解决实际应用问题时是把每个学生记录当作一个基本单位进行访问和处理的。

数据对象(Data Object)或数据元素类(Data Element Class)是具有相同性质的数据元素的集合。在某个具体问题中,数据元素都具有相同的性质(元素值不一定相等),属于同一数据对象(数据元素类),数据元素是数据元素类的一个实例。例如,在交通咨询系统的交通网中,所有的顶点是一个数据元素类,顶点A和顶点B各自代表一个城市,是该数据元素类中的两个实例,其数据元素的值分别为A和B。 数据结构(Data Structure)是指互相之间存在着一种或多种关系的数据元素的集合。在任何问题中,数据元素之间都不会是孤立的,在它们之间都存在着这样或那样的关系,这种数据元素之间的关系称为结构。根据数据元素间关系的不同特性,通常有下列四类基本的结构:

⑴集合结构。该结构的数据元素间的关系是“属于同一个集合”。 ⑵线性结构。该结构的数据元素之间存在着一对一的关系。 ⑶树型结构。该结构的数据元素之间存在着一对多的关系。

⑷图形结构。该结构的数据元素之间存在着多对多的关系,也称网状结构。 从上面所介绍的数据结构的概念中可以知道,一个数据结构有两个要素。一个是数据元素的集合,另一个是关系的集合。在形式上,数据结构通常可以采用一个二元组来表示。 数据结构的形式定义为:数据结构是一个二元组 Data_Structure =(D,R)

其中,D是数据元素的有限集,R是D上关系的有限集。 线性结构的特点是数据元素之间是一种线性关系,数据元素“一个接一个的排列”。在一个线性表中数据元素的类型是相同的,或者说线性表是由同一类型的数据元素构成的线性结构。在实际问题中线性表的例子是很多的,如学生情况信息表是一个线性表:表中数据元素的类型为学生类型; 一个字符串也是一个线性表:表中数据元素的类型为字符型,等等。 线性表是最简单、最基本、也是最常用的一种线性结构。 线性表是具有相同数据类型的n(n>=0)个数据元素的有限序 列,通常记为:

(a1,a2,… ai-1,ai,ai+1,…an)

其中n为表长, n=0 时称为空表。 它有两种存储方法:顺序存储和链式存储,它的主要基本操作是插入、删除和检索等。

本文来源:https://www.bwwdw.com/article/y73x.html

Top