全国计算机等级考试辅导讲义 - 二级公共基础知识
更新时间:2024-05-31 19:37:01 阅读量: 综合文库 文档下载
全国计算机等级考试辅导讲义
二级公共基础知识 第一章 数据结构与算法
1.1 算法
1、算法是指解题方案的准确而完整的描述。
*:算法不等于程序,也不等于计算方法。程序的编制不可能优于算法的设计。 2、算法的基本特征
(1)可行性:针对实际问题而设计的算法,执行后能够得到满意的结果。
(2)确定性:每一条指令的含义明确,无二义性。并且在任何条件下,算法只有唯一的一条执行路径,即相同的输入只能得出相同的输出。
(3)有穷性:算法必须在有限的时间内完成。有两重含义,一是算法中的操作步骤为有限个,二是每个步骤都能在有限时间内完成。
(4)拥有足够的情报:算法中各种运算总是要施加到各个运算对象上,而这些运算对象又可能具有某种初始状态,这就是算法执行的起点或依据。因此,一个算法执行的结果总是与输入的初始数据有关,不同的输入将会有不同的结果输出。当输入不够或输入错误时,算法将无法执行或执行有错。
1
一般说来,当算法拥有足够的情报时,此算法才是有效的;而当提供的情报不够时,算法可能无效。
*:综上所述,所谓算法,是一组严谨地定义运算顺序的规则,并且每一个规则都是有效的,且是明确的,此顺序将在有限的次数下终止。
3、算法的基本要素:一是对数据对象的运算和操作,二是算法的控制结构。
基本运算和操作包括:算术运算、逻辑运算、关系运算、数据传输。
算法的控制结构:算法中各操作之间的执行顺序称为算法的控制结构,包括:顺序结构、选择结构、循环结构。 算法设计基本方法:列举法、归纳法、递推、递归、减半递推技术、回溯法。
4、算法复杂度主要包括时间复杂度和空间复杂度。 算法时间复杂度是指执行算法所需要的计算工作量,可以用执行算法的过程中所需基本运算的执行次数来度量。 算法空间复杂度是指执行这个算法所需要的内存空间。 真题讲解:2005年4月填空题第5题,2005年9月填空题第2题,2006年9月选择题第7题。 1.2 数据结构的基本概念
1、数据结构是指相互有关联的数据元素的集合。
2
2、数据结构主要研究和讨论以下三个方面的问题: (1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构。
(2)在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构。 (3)对各种数据结构进行的运算。
数据的逻辑结构包含:(1)表示数据元素的信息;(2)表示各数据元素之间的前后件关系。 数据的存储结构有顺序、链接、索引等。
*:数据的逻辑结构反映数据元素之间的逻辑关系,数据的存储结构是数据的逻辑结构在计算机存储空间中的存放形式。同一种逻辑结构的数据可以采用不同的存储结构,但影响数据处理效率。 3、数据结构的图形表示
一个数据结构除了用二元关系表示外,还可以直观地用图形表示。在数据结构的图形表示中,对于数据集合D中的每一个数据元素用中间标有元素值的方框表示,一般称之为数据结点,并简称为结点;为了进一步表示各数据元素之间的前后件关系,对于关系R中的每一个二元组,用一条有向线段从前件结点指向后件结点。
4、数据结构分为两大类型:线性结构和非线性结构。
3
线性结构(非空的数据结构)条件:(1)有且只有一个根结点;(2)每一个结点最多有一个前件,也最多有一个后件。
非线性结构:不满足线性结构条件的数据结构。
常见的线性结构有线性表、栈、队列和线性链表等;常用的非线性结构有树、二叉树和图等。 真题讲解:2005年9月选择题第4题。 1.3 线性表及其顺序存储结构
1、线性表由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。
2、线性表的顺序存储结构具有两个基本特点:(1)线性表中所有元素所占的存储空间是连续的;(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。 3、顺序表的插入、删除运算
(1)顺序表的插入运算:在一般情况下,要在第i(1≤i≤n)个元素之前插入一个新元素时,首先要从最后一个(即第n个)元素开始,直到第i个元素之间共n-i+1个元素依次向后移动一个位置,移动结束后,第i个位置就被空出,然后将新元素插入到第i项。插入结束后,线性表的长度就增加了1。
*:顺性表的插入运算时需要移动元素,在等概率情况下,平均需要移动n/2个元素。
4
(2)顺序表的删除运算:在一般情况下,要删除第i(1≤i≤n)个元素时,则要从第i+1个元素开始,直到第n个元素之间共n-i个元素依次向前移动一个位置。删除结束后,线性表的长度就减小了1。
*:进行顺性表的删除运算时也需要移动元素,在等概率情况下,平均需要移动(n-1)/2个元素。 1.4 栈和队列 1、栈及其基本运算
栈是限定在一端进行插入与删除运算的线性表。
在栈中,允许插入与删除的一端称为栈顶,不允许插入与删除的另一端称为栈底。栈顶元素总是最后被插入的元素,栈底元素总是最先被插入的元素。即栈是按照“先进后出”或“后进先出”的原则组织数据的。 栈具有记忆作用。
栈的基本运算:(1)插入元素称为入栈运算;(2)删除元素称为退栈运算;(3)读栈顶元素是将栈顶元素赋给一个指定的变量,此时指针无变化。
真题讲解:2005年4月选择题第2题,2005年9月选择题第3题,2006年4月选择题第4题,2006年9月填空题第4题。
2、队列及其基本运算
5
队列是指允许在一端(队尾)进入插入,而在另一端(队头)进行删除的线性表。尾指针(Rear)指向队尾元素,头指针(front)指向排头元素的前一个位置(队头)。 队列是“先进先出”或“后进后出”的线性表。
队列运算包括:(1)入队运算:从队尾插入一个元素;(2)退队运算:从队头删除一个元素。
循环队列:s=0表示队列空,s=1且front=rear表示队列满。 1.5 线性链表
1、线性表顺序存储的缺点:(1)插入或删除的运算效率很低。在顺序存储的线性表中,插入或删除数据元素时需要移动大量的数据元素;(2)线性表的顺序存储结构下,线性表的存储空间不便于扩充;(3)线性表的顺序存储结构不便于对存储空间的动态分配。
2、线性链表:线性表的链式存储结构称为线性链表,是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接来实现的。因此,在链式存储方式中,每个结点由两部分组成:一部分用于存放数据元素的值,称为数据域;另一部分用于存放指针,称为指针域,用于指向该结点的前一个或后一个结点(即前件或后件),如下图所示:
数据域data
指针域nextHEADa1a2?an-1an^(a)结点结构(b)一个非空的线性链表示意图6
*:数据结构中的每一个结点对应于一个存储单元,这种存储单元称为存储结点,简称结点。
线性链表分为单链表、双向链表和循环链表三种类型。 在单链表中,每一个结点只有一个指针域,由这个指针只能找到其后件结点,而不能找到其前件结点。因此,在某些应用中,对于线性链表中的每个结点设置两个指针,一个称为左指针,指向其前件结点;另一个称为右指针,指向其后件结点,这种链表称为双向链表,如下图所示:
左指针
数据域右指针HEAD^a1a2?an^(a)结点结构(b)一个非空的双向链表示意图3、线性链表的基本运算
(1)在线性链表中包含指定元素的结点之前插入一个新元素。
*:在线性链表中插入元素时,不需要移动数据元素,只需要修改相关结点指针即可,也不会出现“上溢”现象。 (2)在线性链表中删除包含指定元素的结点。
*:在线性链表中删除元素时,也不需要移动数据元素,只需要修改相关结点指针即可。
(3)将两个线性链表按要求合并成一个线性链表。 (4)将一个线性链表按要求进行分解。
7
(5)逆转线性链表。 (6)复制线性链表。 (7)线性链表的排序。 (8)线性链表的查找。 *:线性链表不能随机存取。 4、循环链表及其基本运算
在线性链表中,其插入与删除的运算虽然比较方便,但还存在一个问题,在运算过程中对于空表和对第一个结点的处理必须单独考虑,使空表与非空表的运算不统一。为了克服线性链表的这个缺点,可以采用另一种链接方式,即循环链表。 与前面所讨论的线性链表相比,循环链表具有以下两个特点:
(1)在链表中增加了一个表头结点,其数据域为任意或者根据需要来设置,指针域指向线性表的第一个元素的结点,而循环链表的头指针指向表头结点。
(2)循环链表中最后一个结点的指针域不是空,而是指向表头结点。即在循环链表中,所有结点的指针构成了一个环状链。
下图a是一个非空的循环链表,图b是一个空的循环链表:
8
循环链表的优点主要体现在两个方面:一是在循环链表中,只要指出表中任何一个结点的位置,就可以从它出发访问到表中其他所有的结点,而线性单链表做不到这一点;二是由于在循环链表中设置了一个表头结点,在任何情况下,循环链表中至少有一个结点存在,从而使空表与非空表的运算统一。
*:循环链表是在单链表的基础上增加了一个表头结点,其插入和删除运算与单链表相同,可以从任一结点出发来访问表中其他所有结点,并实现空表与非空表的运算的统一。 真题讲解:2005年4月选择题第5题。 1.6 树与二叉树 1、树的基本概念
树是一种简单的非线性结构。在树这种数据结构中,所有数据元素之间的关系具有明显的层次特性。
在树结构中,每一个结点只有一个前件,称为父结点。没有前件的结点只有一个,称为树的根结点,简称树的根。每一个结点可以有多个后件,称为该结点的子结点。没有后件的结点称为叶子结点。
在树结构中,一个结点所拥有的后件的个数称为该结点的度,所有结点中最大的度称为树的度。树的最大层次称为树的深度。
2、二叉树及其基本性质
9
(1)什么是二叉树
二叉树是一种很有用的非线性结构,它具有以下两个特点:1)非空二叉树只有一个根结点;2)每一个结点最多有两棵2(k?1)k?1子树,且分别称为该结点的左子树与右子树。 (2)二叉树的基本性质
性质1 在二叉树的第k层上,最多有 个结点。 性质2 深度为m的二叉树最多有个 个结点。 性质3 在任意一棵二叉树中,度数为0的结点(即叶子结[logn]?1[logn]logn2222?1m点)总比度为2的结点多一个。性质4 具有n个结点的二叉树,其深度至少为 ,其中 表示取 的整数部分。
3、满二叉树与完全二叉树
满二叉树:除最后一层外,每一层上的所有结点都有两个子结点。
完全二叉树:除最后一层外,每一层上的结点数均达到最大值;在最后一层上只缺少右边的若干结点。
下图a表示的是满二叉树,下图b表示的是完全二叉树: 00
7312124563456891011121314789(b)完全二叉树(a)满二叉树完全二叉树还具有如下两个特性:
性质5 具有n个结点的完全二叉树深度为 。
2[logn]?1 10
性质6 设完全二叉树共有n个结点,如果从根结点开始,按层序(每一层从左到右)用自然数1,2,?,n给结点进行编号,则对于编号为k(k=1,2,?,n)的结点有以下结论:
①若k=1,则该结点为根结点,它没有父结点;若k>1,则该结点的父结点的编号为int(k/2)。
②若2k≤n,则编号为k的左子结点编号为2k;否则该结点无左子结点(显然也没有右子结点)。
③若2k+1≤n,则编号为k的右子结点编号为2k+1;否则该结点无右子结点。
真题讲解:2005年4月填空题第1题,2005年9月填空题第4题,2006年4月选择题第7题。 4、二叉树的存储结构
在计算机中,二叉树通常采用链式存储结构。
与线性链表类似,用于存储二叉树中各元素的存储结点也由两部分组成:数据域和指针域。但在二叉树中,由于每一个元素可以有两个后件(即两个子结点),因此,用于存储二叉树的存储结点的指针域有两个:一个用于指向该结点的左子结点的存储地址,称为左指针域;另一个用于指向该结点的右子结点的存储地址,称为右指针域。
*:一般二叉树通常采用链式存储结构,对于满二叉树与完全二叉树来说,可以按层序进行顺序存储。
11
5、二叉树的遍历
二叉树的遍历是指不重复地访问二叉树中的所有结点。二叉树的遍历可以分为以下三种:
(1)前序遍历(DLR):若二叉树为空,则结束返回。否则:首先访问根结点,然后遍历左子树,最后遍历右子树;并且,在遍历左右子树时,仍然先访问根结点,然后遍历左子树,最后遍历右子树。
(2)中序遍历(LDR):若二叉树为空,则结束返回。否则:首先遍历左子树,然后访问根结点,最后遍历右子树;并且,在遍历左、右子树时,仍然先遍历左子树,然后访问根结点,最后遍历右子树。
(3)后序遍历(LRD):若二叉树为空,则结束返回。否则:首先遍历左子树,然后遍历右子树,最后访问根结点,并且,在遍历左、右子树时,仍然先遍历左子树,然后遍历右子树,最后访问根结点。
真题讲解:2006年4月选择题第6题,2006年9月选择题第10题。 1.7 查找技术
查找:根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素。
查找结果:(查找成功:找到;查找不成功:没找到。)
12
平均查找长度:查找过程中关键字和给定值比较的平均次数。 1、顺序查找
基本思想:从表中的第一个元素开始,将给定的值与表中逐个元素的关键字进行比较,直到两者相符,查到所要找的元素为止。否则就是表中没有要找的元素,查找不成功。 平均要与表中一半以上元素进行比较,最坏情况下需要比较n次。
下列两种情况下只能采用顺序查找:
(1)如果线性表是无序表(即表中的元素是无序的),则不管是顺序存储结构还是链式存储结构,都只能用顺序查找。
(2)即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。
真题讲解:2006年9月选择题第8题。 2、二分法查找
思想:先确定待查找记录所在的范围,然后逐步缩小范围,直到找到或确认找不到该记录为止。
前提:必须在具有顺序存储结构的有序表中进行。 查找过程:
(1)若中间项的值等于x,则说明已查到;
(2)若x小于中间项的值,则在线性表的前半部分查找;
13
(3)若x大于中间项的值,则在线性表的后半部分查找。 特点:比顺序查找方法效率高。最坏的情况下,需要比较log2n次。
*:二分法查找只适用于顺序存储的线性表,对于无序线性表和线性表的链式存储结构只能用顺序查找。 例:查找元素22的过程:
真题讲解:2005年9月选择题第2题。 1.8 排序技术
14
1717low17low212318422540656mid(a)初始状态212318mid422540high(b)第一次比较后212318422lowmid(c)第二次比较后540high656766879984108811946567668799841088119476687998410881194high排序是指将一个无序序列整理成按值非递减顺序排列的有序序列,即是将无序的记录序列调整为有序记录序列的一种操作。
1、交换类排序法
基本思想:两两比较待排序记录的关键字,发现两个记录的次序相反时即进行交换,直到没有反序的记录为止。 方法:冒泡排序,快速排序。 (1)冒泡排序
基本思想:对存放原始数据的数组,按从后往前的方向进行多次扫描,当发现相邻两个数据的次序与排序要求的“递增次序”不符合时,即将这两个数据进行互换。这样,较小的数据就会逐单元向前移动,好像气泡向上浮起一样。 性能分析:假设线性表的长度n,则在最坏情况下,需要的比较次数为n(n-1)/2。
【49 13 1313131313【38 49 27 2727 27 27【65 38 49 38 383838【97 65 38 49 494949【76 97 65 49494949【13 76 97 65 656565【27 27 76 97 76 767649】初始序列49】第一趟排序后49】第二趟排序后76 97 97】】】第第第三四五趟趟趟排排排序序序后后后97】第六趟排序后13273849496576【97】第七趟排序后
15
(2)快速排序
基本思想:任取待排序序列中的某个元素作为基准(一般取第一个元素),通过一趟排序,将待排元素分为左右两个子序列,左子序列元素的排序码均小于或等于基准元素的排序码,右子序列的排序码则大于基准元素的排序码,然后分别对两个子序列继续进行排序,直至整个序列有序。 快速排序的平均时间复杂度为O(nlog2n)。
基准元素初始序列第1次交换后第2次交换后第3次交换后第4次交换后【46 55 13 42 94 05 17 70 】i【17iijjjj13 42 94 55 70 】ij55 70 】j55 13 42 94 05 70 】【17 13 42 94 05 55 70 】i【17 05i【17 05 13 42 94ijj完成一趟排序【17 05 13 42】46【94 55 70 】
真题讲解:2005年4月选择题第3题,2006年4月填空题第1题。 2、插入类排序法
基本思想:每次将一个待排序的记录,按其关键字大小插入到前面已经排好序的子序列中的适当位置,直到全部记录插入完成为止。
方法:简单插入排序,希尔排序。 (1)简单插入排序法
16
基本思想:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有n-1个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表。 在最坏的情况下,需要n(n-1)/2次比较。
初始序列第1趟排序第2趟排序第3趟排序第4趟排序第5趟排序第6趟排序第7趟排序【49】38 65 97 76 13 27 49(38) 【38 49】65 97 76 13 27 49(65) 【38 49 65】97 76 13 27 49(97) 【38 49 65 97】76 13 27 49(76) 【38 49 65 76 97】13 27 49(13) 【13 38 49 65 76 97】27 49(27) 【13 27 38 49 65 76 97】49(49) 【13 27 38 49 4965 76 97】
(2)希尔排序
基本思想:先将整个待排元素序列分割成若干个子序列(由相隔某个增量h的元素组成的)分别进行直接插入排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下(接近最好情况),效率是很高的。
增量序列一般取 ,其中n为
2hi?n/2(k?1,2,?,[logkn])待排序序列的长度。
在最坏情况下,希尔排序的时间复杂度为 。
O(n1.5) 17
初始序列49 38 65 97 76 13 27 4949 13 38 27 65 4955 0497 55 76 04 第1趟排序结果13 27 4955 04 49 38 65 97 7613 55 38 7627 04 65 49第2趟排序结果第3趟排序结果13 04 4949 97 38 27 49 55 65 97 7604 13 27 38 49 49 55 65 76 97
3、选择类排序法
基本思想:每一趟从待排序的记录中选出关键字最小的记录,顺序放在已排好序的子序列的最后,直到全部记录排序完毕。
方法:简单选择排序,堆排序。 (1)简单选择排序法
基本思想:扫描整个线性表,从中选出最小的元素,将它交换到表的最前面;然后对剩下的子表采用同样的方法,直到子表空为止。
最坏情况下,需要比较n(n-1)/2次。
初始序列第1趟排序第2趟排序第3趟排序第4趟排序第5趟排序第6趟排序第7趟排序【49 38 65 97 76 13 27 49】13 【38 65 97 76 49 27 49】13 27 【65 97 76 49 38 49】13 27 38 【97 76 49 65 49】13 27 38 49 【76 97 65 49】13 27 38 49 49【97 65 76】13 27 38 49 4913 27 38 49 4965 【97 76】65 76 【97】
(2)堆排序法
18
堆的定义:具有n个元素的序列,当且仅当满足 ?h??hi?h2i?1i?h2i ① 或 ②
时称之为堆。①称为大根堆;②称为小根堆 。
建堆:在建堆的过程中,总是将根结点值与左、右子树的根结点值进行比较,若不满足堆的条件,则将左、右子树根结点值中的大者与根结点值进行交换。这个调整过程一直做到所有子树均为堆为止。 堆排序:
1)首先将一个无序序列建成堆。
2)然后将堆顶元素(序列中的最大项)与堆中最后一个元素交换(最大项应该在序列的最后)。不考虑已经换到最后的那个元素,只考虑前n-1个元素构成的子序列,将该子序列调整为堆。
反复做步骤2),直到剩下的子序列为空为止。
19
2556157010?hi?h2i??hi?h2i?130155610253070(a)大根堆(b)小根堆在最坏情况下,堆排序法需要比较的次数为O(nlog2n)。 总结:各种排序法比较:
第二章 程序设计基础
2.1 程序设计风格
要形成良好的程序设计风格,主要应注重和考虑下述一些因素:源程序文档化、数据说明的方法、语句的结构、输入和输出。
原则:清晰第一,效率第二。 *:注释分序言性注释和功能性注释。 真题讲解:2006年9月选择题第1题。
2.2 结构化程序设计(面向过程的程序设计方法) 结构化程序设计方法的主要原则可以概括为:自顶向下,逐步求精,模块化,限制使用goto语句。
1、自顶向下:程序设计时,应先考虑总体,后考虑细节;先考虑全局目标,后考虑局部目标。不要一开始就过多追求众多的细节,先从最上层总目标开始设计,逐步使问题具体
20
化。
2、逐步求精:对复杂问题,应设计一些子目标作过渡,逐步细化。
3、模块化:一个复杂问题,肯定是由若干稍简单的问题构成。模块化是把程序要解决的总目标分解为分目标,再进一步分解为具体的小目标,把每个小目标称为一个模块。 4、限制使用goto语句。 结构化程序的基本结构:
(1)顺序结构:一种简单的程序设计,即按照程序语句行的自然顺序,一条语句一条语句地执行程序,它是最基本、最常用的结构。
(2)选择结构:又称分支结构,包括简单选择和多分支选择结构,可根据条件,判断应该选择哪一条分支来执行相应的语句序列。
(3)重复结构:又称循环结构,可根据给定的条件,判断是否需要重复执行某一相同的或类似的程序段。 真题讲解:2006年4月选择题第1题。 2.3 面向对象的程序设计
客观世界中任何一个事物都可以被看成是一个对象,面向对象方法的本质就是主张从客观世界固有的事物出发来构造系统,提倡人们在现实生活中常用的思维来认识、理解和描述客观事物,强调最终建立的系统能够映射问题域。也就是
21
说,系统中的对象及对象之间的关系能够如实地反映问题域中固有的事物及其关系。
面向对象方法的主要优点:(1)与人类习惯的思维方法一致;(2)稳定性好;(3)可重用性好;(4)易于开发大型软件产品;(5)可维护性好。
对象是面向对象方法中最基本的概念,可以用来表示客观世界中的任何实体,对象是实体的抽象。面向对象的程序设计方法中的对象是系统中用来描述客观事物的一个实体,是构成系统的一个基本单位,由一组表示其静态特征的属性和它可执行的一组操作组成。
属性即对象所包含的信息,它在设计对象时确定,一般只能通过执行对象的操作来改变。
操作描述了对象执行的功能,操作也称为方法或服务。 *:一个对象由对象名、属性和操作三部分组成。 对象的基本特点:
(1)标识唯一性。指对象是可区分的,并且由对象的内在本质来区分,而不是通过描述来区分。
(2)分类性。指可以将具有相同属性的操作的对象抽象成类。
(3)多态性。指同一个操作可以是不同对象的行为。 (4)封装性。从外面看只能看到对象的外部特性,即只需知道数据的取值范围和可以对该数据施加的操作,根本无需
22
知道数据的具体结构以及实现操作的算法。对象的内部,即处理能力的实行和内部状态,对外是不可见的。从外面不能直接使用对象的处理能力,也不能直接修改其内部状态,对象的内部状态只能由其自身改变。
*:信息隐蔽是通过对象的封装性来实现的。
(5)模块独立性好。对象是面向对象的软件的基本模块,它是由数据及可以对这些数据施加的操作所组成的统一体,而且对象是以数据为中心的,操作围绕对其数据所需做的处理来设置,没有无关的操作。从模块的独立性考虑,对象内部各种元素彼此结合得很紧密,内聚性强。
类是指具有共同属性、共同方法的对象的集合。所以类是对象的抽象,对象是对应类的一个实例。
消息是一个实例与另一个实例之间传递的信息。
消息的组成包括:(1)接收消息的对象的名称;(2)消息标识符,也称消息名;(3)零个或多个参数。
继承是指能够直接获得已有的性质和特征,而不必重复定义他们。继承分单继承和多重继承。单继承指一个类只允许有一个父类,多重继承指一个类允许有多个父类。
*:类的继承性是类之间共享属性和操作的机制,它提高了软件的可重用性。
多态性是指同样的消息被不同的对象接受时可导致完全不同的行动的现象。
23
真题讲解:2005年4月填空题第2题,2006年4月填空题第2题。
第三章 软件工程基础
3.1 软件工程基本概念 1、软件的相关概念
计算机软件是包括程序、数据及相关文档的完整集合。 软件的特点包括:(1)软件是一种逻辑实体;(2)软件的生产与硬件不同,它没有明显的制作过程;(3)软件在运行、使用期间不存在磨损、老化问题;(4)软件的开发、运行对计算机系统具有依赖性,受计算机系统的限制,这导致了软件移植的问题;(5)软件复杂性高,成本昂贵;(6)软件开发涉及诸多的社会因素。
软件按功能分为应用软件、系统软件、支撑软件(或工具软件)。
2、软件危机与软件工程
所谓软件危机是泛指在计算机软件的开发和维护过程中所遇到的一系列严重问题。软件危机可以归结为成本、质量、生产率等问题。
*:软件工程源自软件危机。
软件工程是应用于计算机软件的定义、开发和维护的一整套方法、工具、文档、实践标准和工序。
24
*:软件工程的主要思想是将工程化原则运用到软件开发过程,它包括3个要素:方法、工具和过程。
软件工程过程是把软件转化为输出的一组彼此相关的资源和活动,包含4种基本活动:
(1)P(Plan)——软件规格说明。规定软件的功能及其运行时的限制。
(2)D(Do)——软件开发。产生满足规格说明的软件。 (3)C(Check)——软件确认。确认软件能够满足用户提出的要求。
(4)A(Action)——软件演进。为满足客户的变更要求,软件必须在使用的过程中演进。 3、软件生命周期
软件生命周期:软件产品从提出、实现、使用维护到停止使用退役的过程。
软件生命周期三个阶段:软件定义、软件开发、运行维护,主要活动阶段如下图:
可行性研究
初步项目计划定义阶段需求分析概要设计详细设计开发实现阶段测试25 使用
4、软件工程的目标和与原则
(1)软件工程目标:在给定成本、进度的前提下,开发出具有有效性、可靠性、可理解性、可维护性、可重用性、可适应性、可移植性、可追踪性和可互操作性且满足用户需求的产品。
(2)软件工程需要达到的基本目标应是:付出较低的开发成本;达到要求的软件功能;取得较好的软件性能;开发的软件易于移植;需要较低的维护费用;能按时完成开发,及
26
时交付使用。
(3)软件工程原则:抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性和可验证性。 5、软件开发工具与软件开发环境 (1)软件开发工具
软件开发工具的完善和发展将促使软件开发方法的进步和完善,促进软件开发的高速度和高质量。软件开发工具的发展是从单项工具的开发逐步向集成工具发展的,软件开发工具为软件工程方法提供了自动的或半自动的软件支撑环境。 (2)软件开发环境
软件开发环境(或称软件工程环境)是全面支持软件开发全过程的软件工具的集合。
计算机辅助软件工程(CASE,Computer Aided Software Engineering)将各种软件工具、开发机器和一个存放开发过程信息的中心数据库组合起来,形成软件工程环境。它将极大降低软件开发的技术难度并保证软件开发的质量。 真题讲解:2005年4月选择题第8题,2005年9月选择题第5题,2005年9月选择题第7题,2006年9月选择题第3题。
3.2 结构化分析方法
结构化方法的核心和基础是结构化程序设计理论。 1、需求分析
27
需求分析方法有:(1)结构化需求分析方法;(2)面向对象的分析方法。
*:需求分析的任务就是导出目标系统的逻辑模型,解决“做什么”的问题。
*:需求分析一般分为需求获取、需求分析、编写需求规格说明书和需求评审四个步骤进行。 2、结构化分析方法
结构化分析方法是结构化程序设计理论在软件需求分析阶段的应用。
结构化分析方法的实质:着眼于数据流,自顶向下,逐层分解,建立系统的处理流程,以数据流图和数据字典为主要工具,建立系统的逻辑模型。
结构化分析的常用工具:(1)数据流图;(2)数据字典;(3)判定树;(4)判定表。
数据流图:描述数据处理过程的工具,是需求理解的逻辑模型的图形表示,它直接支持系统功能建模。下图是数据流图的基本图形元素:
下图是一个数据流图的示例:
28
加工数据流存储文件源、潭
数据字典:对所有与系统相关的数据元素的一个有组织的列表,以及精确的、严格的定义,使得用户和系统分析员对于输入、输出、存储成分和中间计算结果有共同的理解。 *:数据字典的作用是对数据流图中出现的被命名的图形元素的确切解释。
*:数据字典是结构化分析方法的核心。
判定树:从问题定义的文字描述中分清哪些是判定的条件,哪些是判定的结论,根据描述材料中的连接词找出判定条件之间的从属关系、并列关系、选择关系,根据它们构造判定树。
判定表:与判定树相似,当数据流图中的加工要依赖于多个逻辑条件的取值,即完成该加工的一组动作是由于某一组条件取值的组合而引发的,使用判定表描述比较适宜。 3、软件需求规格说明书
软件需求规格说明书是需求分析阶段的最后成果,是软件开发中的重要文档之一。
软件需求规格说明书的特点:(1)正确性;(2)无歧义性;(3)完整性;(4)可验证性;(5)一致性;(6)可理解性;
29
(7)可追踪性。 3.3 结构化设计方法 1、软件设计的基础
*:需求分析主要解决“做什么”的问题,而软件设计主要解决“怎么做”的问题。
软件设计主要内容包括:软件结构设计、数据设计、接口设计、过程设计。(按技术观点划分)
软件设计分两步完成,即概要设计和详细设计。(按工程管理角度划分)
软件设计的基本原理包括:抽象、模块化、信息隐蔽和模块独立化。
*:模块的耦合性和内聚性是衡量软件的模块独立性的两个定性指标。
内聚性:是一个模块内部各个元素间彼此结合的紧密程度的度量。
偶合性:是模块间互相连接的紧密程度的度量。
*:一个设计良好的软件系统应具有高内聚、低耦合的特征。 2、总体设计(概要设计)和详细设计 (1)总体设计(概要设计)
软件概要设计的基本任务是:1)设计软件系统结构;2)数据结构及数据库设计;3)编写概要设计文档;4)概要设计文档评审。
30
常用的软件结构设计工具是结构图,也称程序结构图。经常使用的结构图有四种模块类型:传入模块、传出模块、变换模块和协调模块。 程序结构图的基本图符:
模块用一个矩形表示,箭头表示模块间的调用关系。在结构图中还可以用带注释的箭头表示模块调用过程中来回传递的信息。还可用带实心圆的箭头表示传递的是控制信息,空心圆箭心表示传递的是数据信息。
程序结构图的有关术语列举如下: 深度:表示控制的层数。
上级模块、从属模块:上、下两层模块a和b,且有a调用b,则a是上级模块,b是从属模块。
宽度:整体控制跨度(最大模块数的层)的表示。 扇入:调用一个给定模块的模块个数。 扇出:一个模块直接调用的其他模块数。 原子模块:树中位于叶子结点的模块。
一般模块数据信息控制信息 31
结构图的基本形式:基本形式、顺序形式、重复形式、选择形式。
面向数据流的设计方法:
*:面向数据流的设计就是将数据流图变换成结构图。 典型的数据流类型有两种:变换型和事务型。
变换型系统结构图由输入、中心变换、输出三部分组成。 事务型数据流的特点是:接受一项事务,根据事务处理的特点和性质,选择分派一个适当的处理单元,然后给出结果。 (2)详细设计
详细设计是为软件结构图中的每一个模块确定实现算法和局部数据结构,用某种选定的表达工具表示算法和数据结构的细节。
*:详细设计的任务是确定实现算法和局部数据结构,不同于编码或编程。
常用的过程设计(即详细设计)工具有以下几种: 图形工具:程序流程图、N-S(方盒图)、PAD(问题分析图)和HIPO(层次图+输入/处理/输出图)。
32
表格工具:判定表。
语言工具:PDL(伪码):过程设计语言,它是用正文形式表示数据和处理过程的设计工具。
真题讲解:2005年4月选择题第7题,2005年9月选择题第6题,2006年4月选择题第1题,2006年4月选择题第2题,2006年9月选择题第2题,2006年9月填空题第1题。 3.4 软件测试
1、软件测试定义:使用人工或自动手段来运行或测定某个系统的过程,其目的在于检验它是否满足规定的需求或是弄清预期结果与实际结果之间的差别。
*:软件测试的目的:尽可能地多发现程序中的错误,不能也不可能证明程序没有错误。
2、软件测试方法:静态测试和动态测试。
静态测试包括代码检查、静态结构分析、代码质量度量。不实际运行软件,主要通过人工进行。
动态测试:是基于计算机的测试,主要包括白盒测试方法和黑盒测试方法。 (1)白盒测试
白盒测试方法也称为结构测试或逻辑驱动测试。它是根据软件产品的内部工作过程,检查内部成分,以确认每种内部操作符合设计规格要求。
白盒测试的基本原则:保证所测模块中每一独立路径至少执
33
行一次;保证所测模块所有判断的每一分支至少执行一次;保证所测模块每一循环都在边界条件和一般条件下至少各执行一次;验证所有内部数据结构的有效性。
*:白盒测试法的测试用例是根据程序的内部逻辑来设计的,主要用软件的单元测试,主要方法有逻辑覆盖、基本路径测试等。 (2)黑盒测试
黑盒测试方法也称为功能测试或数据驱动测试。黑盒测试是对软件已经实现的功能是否满足需求进行测试和验证。 黑盒测试主要诊断功能不对或遗漏、接口错误、数据结构或外部数据库访问错误、性能错误、初始化和终止条件错误。主要方法有等价类划分法、边界值分析法、错误推测法等。 *:黑盒测试是程序功能的测试,主要用软件的确认测试。 3、软件测试过程一般按4个步骤进行:单元测试、集成测试、验收测试(确认测试)和系统测试。 (1)单元测试
单元测试是对软件设计的最小单位——模块(程序单元)进行正确性检测的测试。单元测试的目的是发现各模块内部可能存在的各种错误。
单元测试的依据是详细设计说明书和源程序。单元测试的技术可以采用静态分析和动态测试。对动态测试通常以白盒测试为主,辅之以黑盒测试。
34
*:在进行单元测试时,要用一些辅助模块去模拟与被测模块相联系的其他模块,即为被测模块设计和搭建驱动模块和桩模块。其中,驱动模块相当于被测模块的主程序,它接收测试数据,并传给被测模块,输出实际测试结果;而桩模块是模拟其他被调用模块,不必将子模块的所有功能带入。 (2)集成测试
集成测试是测试和组装软件的过程。它是把模块在按照设计要求组装起来的同时进行测试,主要目的是发现与接口有关的错误。
集成测试的依据是总体设计说明书。
集成测试所涉及的内容包括:软件单元的接口测试、全局数据结构测试、边界条件和非法输入的测试等。 (3)确认测试
确认测试的任务是验证软件的功能和性能及其他特性是否满足需求规格说明中确定的各种需求,以及软件配置是否完全、正确。 (4)系统测试
系统测试是将通过确认测试的软件,作为整个基于计算机系统的一个元素,与计算机硬件、外设、支持软件、数据和人员等其他系统元素组合在一起,在实际运行(使用)环境下对计算机系统进行一系列的集成测试和确认测试。
35
真题讲解:2005年4月选择题第6题,2005年9月填空题第3题,2006年4月填空题第4题。 3.5 程序的调试
程序调试的任务是诊断和改正程序中的错误,主要在开发阶段进行。(注意与软件测试区分)
程序调试的基本步骤:(1)错误定位;(2)修改设计和代码,以排除错误;(3)进行回归测试,防止引进新的错误。 软件调试可分为静态调试和动态调试。静态调试主要是指通过人的思维来分析源程序代码和排错,是主要的调试手段,而动态调试是辅助静态调试。
对软件主要的调试方法可以采用:(1)强行排错法;(2)回溯法;(3)原因排除法。
真题讲解:2005年4月填空题第3题,2006年9月填空题第2题。
第四章 数据库设计基础
4.1 数据库系统的基本概念 1、数据、数据库、数据管理系统 数据:实际上就是描述事物的符号记录。
数据的特点:有一定的结构,有型与值之分。数据的型给出了数据表示的类型,如整型、实型、字符型等。而数据的值给出了符合给定型的值,如整型(int)值15。
36
数据库(DB):是数据的集合,具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序所共享。
数据库存放数据是按数据所提供的数据模式存放的,具有集成与共享的特点。
数据库管理系统(DBMS):一种系统软件,负责数据库中的数据组织、数据操纵、数据维护、控制及保护和数据服务等,是数据库的核心。 数据库管理系统功能:
(1)数据模式定义,即为数据库构建其数据框架。 (2)数据存取的物理构建:为数据模式的物理存取与构建提供有效的存取方法与手段。
(3)数据操纵:为用户使用数据库的数据提供方便,如查询、插入、修改、删除等以及简单的算术运算及统计。 (4)数据的完整性、安生性定义与检查。 (5)数据库的并发控制与故障恢复。
(6)数据的服务,如数据拷贝、转存、重组、性能监测、分析等。
为完成以上六个功能,数据库管理系统提供以下的数据语言:
(1)数据定义语言:负责数据的模式定义与数据的物理存取构建。
37
(2)数据操纵语言:负责数据的操纵,包括查询及增、删、改等操作。
(3)数据控制语言:负责数据完整性、安全性的定义与检查以及并发控制、故障恢复等功能。
数据语言按其使用方式具有以下两种结构形式:
(1)交互式命令(又称自含型或自主型语言):它的语言简单,能在终端上即时操作。
(2)宿主型语言:它一般可嵌入某些宿主语言中,如C,C++等高级过程语言中。
数据库管理员(DBA):对数据库进行规划、设计、维护、监视等的专业管理人员。
数据库系统(DBS):由数据库(数据)、数据库管理系统(软件)、数据库管理员(人员)、硬件平台(硬件)、软件平台(软件)五个部分构成的运行实体。
数据库应用系统:由数据库系统、应用软件及应用界面三者组成。
*:数据库技术的根本目标是解决数据的共享问题。 2、数据库系统的发展
数据库管理发展至今已经历了三个阶段:人工管理阶段、文件系统阶段和数据库系统阶段。 下表是数据管理三个阶段的比较:
人工管理阶文件系统阶段 38
数据库系统阶段 段 应用背景 科学计算 科学计算、管理 大规模管理 大容量磁备盘 硬件背景 无直接存取磁盘、磁鼓 背 软件背景 没有操作系有文件系统 景 统 处理方式 批处理 存储设备 有数据库管理系统 联机实时处理、联机实时处理、分批处理 布处理、批处理 数据库管理系统 数据的管用户(程序文件系统 理者 员) 数据面向某一应用程某一应用 的对象 序 现实世界 数据的共无共享,冗共享性差,冗余共享性高,冗余度享程度 余度极大 度大 小 具有高度的物理独立性和一定的逻辑独立性 记录内有结构,整体结构化,用数整体无结构 据模型描述 由数据库管理系统提供数据安全性、完整性、并发控制
39
特 数据的独不独立,完独立性差 点 立性 全依赖于程序 数据的结无结构 构化 数据控制应用程序自应用程序自己能力 己控制 控制 和恢复能力 3、数据库系统的基本特点 (1)数据的集成性。
(2)数据的高共享性与低冗余性。
*:数据库系统可以减少数据冗余,但无法避免一切冗余。; (3)数据独立性。
数据独立性是数据与程序间的互不依赖性,即数据库中数据独立于应用程序而不依赖于应用程序。也就是说,数据的逻辑结构、存储结构与存取方式的改变不会影响应用程序。 数据独立性一般分为物理独立性与逻辑独立性两级。 物理独立性:物理独立性即是数据的物理结构(包括存储结构,存取方式等)的改变,如存储设备的更换、物理存储的更换、存取方式改变等都不影响数据库的逻辑结构,从而不致引起应用程序的变化。
逻辑独立性:数据库总体逻辑结构的改变,如修改数据模式、增加新的数据类型、改变数据间联系等,不需要相应修改应用程序,这就是数据的逻辑独立性。 (4)数据统一管理与控制
数据统一管理与控制主要包含以下三个方面:
1)数据的完整性检查:检查数据库中数据的正确性以保证数据的正确。
2)数据的安全性保护:检查数据库访问者以防止非法访问。
40
正在阅读:
令我自责的一件事作文600字07-06
领导干部在律师培训班上的讲话01-31
公路路基施工技术规范JTJ033—9512-10
学校打架思想汇报06-06
学习贯彻习近平总书记重要训词精神讲话材料09-08
苹果公司的营销渠道的选择和营销对策03-10
清明扫墓作文300字06-30
发挥统一战线优势服务新农村建设的意见11-30
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 考试辅导
- 讲义
- 基础知识
- 二级
- 等级
- 公共
- 计算机
- 全国
- 钢筋混凝土结构设计 第五章 单项选择
- 2016年江苏省化工工程师《基础知识》:杨氏双缝干涉考试试题
- 2012学年度第一学期金融与统计学院课程表
- 绿化工程施工组织设计
- 综合评价
- 家具制造业职业健康分级管控
- 2015-2016学年第二学期青云中学初三英语模拟试卷及答案
- 黑龙江省辐射污染防治条例
- 威宁县九林头至金斗公路改造工程实施性施工组织设计1
- 2009年-2013年内蒙古自治区及全国采矿专用设备产量数据统计报告
- 压实度的控制措施
- 数字图像处理实验报告(全答案)
- 建设工程监理文件材料归档
- 孟德尔豌豆杂交试验(二)第2课时学案
- 苏教版小学五年级语文下册期中试卷
- 五年级上品社教案
- 附着式升降脚手架检验报告JGJ305-2013附录
- 狠抓质量工作 促公司长足发展
- 10KV施工方案
- 广东引进高层次人才认定申报