数据结构考研习题-第四章串

更新时间:2024-05-31 07:56:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第四章 串

一、选择题

1.下面关于串的的叙述中,哪一个是不正确的?( )【北方交通大学 2001 一、5(2分)】

A.串是字符的有限序列 B.空串是由空格构成的串

C.模式匹配是串的一种重要运算 D.串既可以采用顺序存储,也可以采用链式存储 2 若串S1=‘ABCDEFG’, S2=‘9898’ ,S3=‘###’,S4=‘012345’,执行

concat(replace(S1,substr(S1,length(S2),length(S3)),S3),substr(S4,index(S2,‘8’),length(S2))) 其结果为( )【北方交通大学 1999 一、5 (25/7分)】

A.ABC###G0123 B.ABCD###2345 C.ABC###G2345 D.ABC###2345 E.ABC###G1234 F.ABCD###1234 G.ABC###01234

3.设有两个串p和q,其中q是p的子串,求q在p中首次出现的位置的算法称为( )

A.求子串 B.联接 C.匹配 D.求串长 【北京邮电大学 2000 二、4(20/8分)】【西安电子科技大学 1996 一、1 (2分)】 4.已知串S=‘aaab’,其Next数组值为( )。【西安电子科技大学 1996 一、7 (2分)】

A.0123 B.1123 C.1231 D.1211 5.串 ‘ababaaababaa’ 的next数组为( )。【中山大学 1999 一、7】

A.012345678999 B.012121111212 C.011234223456 D.0123012322345 6.字符串‘ababaabab’ 的nextval 为( )

A.(0,1,0,1,04,1,0,1) B.(0,1,0,1,0,2,1,0,1) C.(0,1,0,1,0,0,0,1,1) D.(0,1,0,1,0,1,0,1,1 ) 【北京邮电大学 1999 一、1(2分)】 7.模式串t=‘abcaabbcabcaabdab’,该模式串的next数组的值为( ),nextval数组的值为 ( )。

A.0 1 1 1 2 2 1 1 1 2 3 4 5 6 7 1 2 B.0 1 1 1 2 1 2 1 1 2 3 4 5 6 1 1 2 C.0 1 1 1 0 0 1 3 1 0 1 1 0 0 7 0 1 D.0 1 1 1 2 2 3 1 1 2 3 4 5 6 7 1 2 E.0 1 1 0 0 1 1 1 0 1 1 0 0 1 7 0 1 F.0 1 1 0 2 1 3 1 0 1 1 0 2 1 7 0 1 【北京邮电大学 1998 二、3 (2分)】

8.若串S=’software’,其子串的数目是( )。【西安电子科技大学 2001应用 一、2(2分)】

A.8 B.37 C.36 D.9

9.设S为一个长度为n的字符串,其中的字符各不相同,则S中的互异的非平凡子串(非空且不同于S本身)的个数为( )。【中科院计算所 1997 】

A.2n-1 B.n2 C.(n2/2)+(n/2) D.(n2/2)+(n/2)-1 E. (n2/2)-(n/2)-1 F.其他情况

10.串的长度是指( )【北京工商大学 2001 一、6 (3分)】

A.串中所含不同字母的个数 B.串中所含字符的个数

C.串中所含不同字符的个数 D.串中所含非空格字符的个数

二、判断题

1.KMP算法的特点是在模式匹配时指示主串的指针不会变小。( )【北京邮电大学 2002 一、4 (1分)】

2.设模式串的长度为m,目标串的长度为n,当n≈m且处理只匹配一次的模式时,朴素的匹

配(即子串定位函数)算法所花的时间代价可能会更为节省。( )【长沙铁道学院 1998 一、1 (1分)】

3.串是一种数据对象和操作都特殊的线性表。( )【大连海事大学 2001 1、L (1分)】

二、填空题

1.空格串是指__(1)__,其长度等于___(2)__。 【西安电子科技大学 2001软件 一、4(2分)】

2.组成串的数据元素只能是________。 【中山大学 1998 一、5 (1分)】

3.一个字符串中________称为该串的子串 。 【华中理工大学 2000 一、3(1分)】 4.INDEX(‘DATASTRUCTURE’, ‘STR’)=________。【福州大学 1998 二、4 (2分)】 5.设正文串长度为n,模式串长度为m,则串匹配的KMP算法的时间复杂度为________。

【重庆大学 2000 一、4】 6.模式串P=‘abaabcac’的next函数值序列为________。【西安电子科技大学 2001软件 一、6(2分)】

7.字符串’ababaaab’的nextval函数值为________。 【北京邮电大学 2001 二、4 (2分)】 8.设T和P是两个给定的串,在T中寻找等于P的子串的过程称为__(1)__,又称P为__(2)__。

【西安电子科技大学 1998 二、5 (16/6分)】 9.串是一种特殊的线性表,其特殊性表现在__(1)__;串的两种最基本的存储方式是__(2)__、__(3)__;两个串相等的充分必要条件是__(4)__。 【中国矿业大学 2000 一、3 (4分)】 10.两个字符串相等的充分必要条件是_______。 【西安电子科技大学 1999软件 一、1 (2分)】

11.知U=‘xyxyxyxxyxy’;t=‘xxy’;

ASSIGN(S,U);

ASSIGN(V,SUBSTR(S,INDEX(s,t),LEN(t)+1)); ASSIGN(m,‘ww’)

求REPLACE(S,V,m)= ________。 【东北大学 1997 一、1 (5分)】 12.实现字符串拷贝的函数 strcpy为:

void strcpy(char *s , char *t) /*copy t to s*/ { while (________)

} 【浙江大学 1999 一、5 (3分)】

13.下列程序判断字符串s 是否对称,对称则返回1,否则返回0;如 f(\返回1,f(\返回0;

int f((1)________) {int i=0,j=0;

while (s[j])(2)________;

for(j--; i

} 【浙江大学 1999 一、6 (3分)】

14.下列算法实现求采用顺序结构存储的串s和串t的一个最长公共子串。

程序(a)

PROCEDURE maxcomstr(VAR s,t : orderstring; VAR index,length : integer); VAR i,j,k,length1:integer; con:boolean; BEGIN

index :=0; length :=0; i :=1; WHILE(i<=s.len) DO [j:=1;

WHILE (j<=t.len) DO

[ IF (s[i]=t[j]) THEN

[ k:=1; length1:=1; con:=true;

WHILE con DO

IF (1)__THEN [length1:=length1+1;k:=k+1;] ELSE(2) _; IF (length1>length) THEN [index:=i; length:=length1; ] (3)____;

]

ELSE (4)____;

]

(5) ___; ] END; 程序(b)

void maxcomstr(orderstring *s,*t; int index, length) {int i,j,k,length1,con; index=0;length=0;i=1; while (i<=s.len) {j=1;

while(j<=t.len)

{ if (s[i]= =t[j])

{ k=1;length1=1;con=1;

while(con)

if (1) _ { length1=length1+1;k=k+1; } else (2) __; if (length1>length) { index=i; length=length1; } (3)____;

}

else (4) ___; } (5) __

} } 【上海大学 2000 一、2 (10分)】

15.完善算法:求KMP算法中next数组。

PROC get _next(t:string,VAR next:ARRAY[1..t.len] OF integer); BEGIN

j:=1; k:=(1)__; next[1]:=0; WHILE j

IF k=0 OR t.ch[j]=t.ch[k] THEN BEGIN j:=j+1; k:=k+1; next[j]:=k;END

ELSE k:=(2)___;

END;

【中山大学 1998 四、1 (4分)】

16.下面函数index用于求t是否为s的子串,若是返回t第一次出现在s中的序号(从1

开始计),否则返回0。

例如:s=‘abcdefcdek’,t=‘cde’,则indse(s,t)=3, index(s,’aaa’)=0 。已知t,s的串长分别是mt,ms

FUNC index(s,t,ms,mt); i:=1;j:=1;

WHILE (i

IF s[i]=t[j] THEN [ (1)__; (2)__] ELSE [ (3)___; (4)_ ]

IF j>mt THEN return (5)____; ELSE return (6)__ ENDF;

【南京理工大学 1999 三、2 (6分)】

17.阅读下列程序说明和pascal程序,把应填入其中的( )处的字句写在答题纸上。 程序说明:

本程序用于判别输入的字符串是否为如下形式的字符串:

W&M$ 其中,子字符串M是子字符串W的字符反向排列,在此假定W不含有字符&和字符$,字符&用作W与M的分隔符,字符$用作字符串的输入结束符。

例如,对输入字符串ab&ba$、11&12$、ab&dd$、&$,程序将分别输出Ok.(是),No.(不是)。 程序

PROGRAM accept(input,output); CONST midch=’&’; endch=’$’; VAR an:boolean; ch:char;

PROCEDURE match(VAR answer: boolean); VAR ch1,ch2:char; f:boolean; BEGIN

read(ch1); IF ch1<>endch THEN IF (1)__

THEN BEGIN match(f);

IF f THEN BEGIN read(ch2); answer:=(2)_ END ELSE answer:=false

END ELSE (3)___ ELSE (4)___ END; BEGIN

writeln(‘Enter String:’); match(an);

IF an THEN BEGIN

(5)__ IF (6)_ THEN writeln(‘Ok.’) ELSE writeln(‘No.’)

END

ELSE writeln(‘No.’)

END. 【上海海运学院 1998 七 (15分)】

18.试利用下列栈和串的基本操作完成下述填空题。

initstack(s) 置s为空栈; push(s,x) 元素x入栈; pop(s) 出栈操作;

gettop(s) 返回栈顶元素; sempty(s) 判栈空函数; setnull(st) 置串st为空串; length(st) 返回串st的长度;

equal(s1,s2) 判串s1和s2是否相等的函数; concat(s1,s2) 返回联接s1和s2之后的串; sub(s,i,1) 返回s中第i个字符; empty(st) 判串空函数

FUNC invert(pre:string; VAR exp:string):boolean; {若给定的表达式的前缀式pre正确,本过程求得和它相应的表达式exp并返回“true”,否则exp为空串,并返回“false”。已知原表达式中不包含括弧,opset为运算符的集合。}

VAR s:stack; i,n:integer; succ:boolean; ch: char; BEGIN

i:=1; n:=length(pre); succ:=true; (1)__; (2)__;

WHILE (i

IF (3)_ THEN (4)__ ELSE IF (5)__THEN (6)_

ELSE BEGIN

exp:=concat((7)___,(8)____); exp:=concat((9)___,(10)___); (11)__; END;

i:=i+1 END;

IF (12)___THEN

BEGIN exp:=concat(exp,sub(pre,n,1)); invert:=true END ELSE BEGIN setnull(exp); invert:=false END END;

注意:每个空格只填一个语句。 【清华大学 1996 八】

四、应用题

1.名词解释:串 【大连海事 1996 一、10 (1分) 】【河海大学 1998 二、5(3分)】 2.描述以下概念的区别:空格串与空串。【大连海事大学 1996 三、2、(1) (2分)】 3.两个字符串S1和S2的长度分别为m和n。求这两个字符串最大共同子串算法的时间复杂度为T(m,n)。估算最优的T(m,n),并简要说明理由。 【北京工业大学 1996 一、5 (6分)】

4.设主串S=‘xxyxxxyxxxxyxyx’,模式串T=‘xxyxy’。请问:如何用最少的比较次数找到T在S中出现的位置?相应的比较次数是多少? 【大连海事大学 2001 四 (8分)】

5.KMP算法(字符串匹配算法)较Brute(朴素的字符串匹配)算法有哪些改进?【大连海事大学1996三、1((2分)】

6.已知模式串t=‘abcaabbabcab’写出用KMP法求得的每个字符对应的next和nextval函数值。

【北京邮电大学 1997 三 (10分)】

7.给出字符串‘abacabaaad’在KMP算法中的next和nextval数组。【北京邮电大学 2000 三、1(5分)】

8.令t=‘abcabaa’,求其next 函数值和nextval函数值。 【北方交通大学 1994 一 (6分)】

9.已知字符串‘cddcdececdea’,计算每个字符的next和nextval函数的值。【南京邮电大学 2000 一 2】

10.试利用KMP算法和改进算法分别求p1=‘abaabaa’和p2=‘aabbaab’的next函数和nextval函数。

【东南大学 1999 一、6(8分)】 11.已知KMP串匹配算法中子串为babababaa,写出next数组改进后的next数组信息值(要求写出数组下标起点)。【西南交通大学 2000 二、2】

12.求模式串T=‘abcaabbac' 的失败函数Next(j)值。【西安交通大学 1996 四、4 (5分)】

13.字符串的模式匹配KMP算法中,失败函数(NEXT)是如何定义的?计算模式串p=‘aabaabaaabc’中各字符的失败函数值.【石油大学 1998 一、2 (10分)】 14.设字符串S=‘aabaabaabaac',P=‘aabaac'

(1)给出S和P的next值和nextval值;

(2)若S作主串,P作模式串,试给出利用BF算法和KMP算法的匹配过程。 【北方交通大学1998二(15分)】

15.设目标为t=‘abcaabbabcabaacbacba’,模式为p=‘abcabaa’

(1)计算模式p的naxtval函数值;(5分)

(2)不写出算法,只画出利用KMP算法进行模式匹配时每一趟的匹配过程。(5分) 【清华大学 1998 八(10分)】

16.模式匹配算法是在主串中快速寻找模式的一种有效的方法,如果设主串的长度为m,模式的长度为n,则在主串中寻找模式的KMP算法的时间复杂性是多少?如果,某一模式 P=’abcaacabaca’,请给出它的NEXT函数值及NEXT函数的修正值NEXTVAL之值。【上海交通大学 2000 一 (5分)】

17.设目标为S=‘abcaabbcaaabababaabca’,模式为P=‘babab’,

(1)手工计算模式P的nextval数组的值;(5分)

(2)写出利用求得的nextval数组,按KMP算法对目标S进行模式匹配的过程。 (5分)

【清华大学 1997 四(10分)】

18.用无回溯的模式匹配法(KMP法)及快速的无回溯的模式匹配法求模式串T的next[j]值,添入下面表中: j t kmp法求得的next[j]值 1 2 3 4 5 6 7 a a b b a a b 快速无回溯法求得的next[j]值 【北京邮电大学 1992 三、1(25/4分)】 19.在改进了的(无回溯)字符串模式匹配中,要先求next数组的值。下面是求nextval值的算法。

TYPE SAR=ARRAY[1..m] OF INTEGER; PTY=ARRAY[1..m] OF CHAR;

PROCEDURE next2(P:PTY;VAR NEXTVAL:SAR); {在模式P中求nextval数组的值} 1 BEGIN

2 J:=1;NEXTVAL[1]:=0;K:=0 3 REPEAT

4 IF (K=0) OR (P[J]=P[K]) 5 THEN [ J:=J+1;K:=K+1; 6 IF P[J]=P[K]

7 THEN NEXTVAL[J]:=NEXTVAL[K] 8 ELSE NEXTVAL[J]:=K ] 9 ELSE K:=NEXTVAL[K] 10 UNTIL J=m 11 END;

算法中第4行有P[J]=P[K],第六行中也有P[J]=P[K]。两处比较语句相同。请分析说明此两处比较语句的含义是什么?分析此算法在最坏情况下的时间复杂度是多少?【北京邮电大学 1993 二、2(6分)】

20.在字符串模式匹配的KMP算法中,求模式的next数组值的定义如下:

next[j]=

请问:

(1)当j=1时,为什么要取next[1]=0? (2)为什么要取max{K},K最大是多少?

(3)其它情况是什么情况,为什么取next[j]=1? 【北京邮电大学 1994 二(8分)】 21.给出KMP算法中失败函数f的定义,并说明利用f进行串模式匹配的规则,该算法的技术特点是什么?

【东南大学 1993 一、3 (9分) 1997 一、2 (8分) 2001 一、6 (6分)】

22. 在模试匹配KMP算法中所用失败函数f的定义中,为何要求p1p2??pf(j)为p1p2??pj两头匹配的真子串?且为最大真子串? 【东南大学 1996 一、3(7分)】

23.如果两个串含有相等的字符,能否说它们相等?【西安电子科技大学 2000软件 一、3 (5分)】

24.设S1,S2为串,请给出使S1//S2=S2//S1成立的所有可能的条件(//为连接符)。

【长沙铁道学院 1997 三、5 (3分)】【国防科技大学 1999 一 】

25.已知:s ='(xyz)+*',t ='(x+z)*y'。试利用联结、求子串和置换等基本运算,将 s 转化为 t 。

【北方交通大学 1996 一、3(5分)】【山东科技大学 2002 一、6 (5分)】

第五部分、算法设计

1.设s、t为两个字符串,分别放在两个一维数组中,m、n分别为其长度,判断t是否为s的子串。如果是,输出子串所在位置(第一个字符),否则输出0。(注:用程序实现)【南京航空航天大学 1997 九(10分)】

2.输入一个字符串,内有数字和非数字字符,如:ak123x456 17960?302gef4563,将其中连续的数字作为一个整体,依次存放到一数组a中,例如123放入a[0],456放入a[1],? ? 。编程统计其共有多少个整数,并输出这些数。【上海大学 1998 一 (13分)】

3. 以顺序存储结构表示串,设计算法。求串S中出现的第一个最长重复子串及其位置并分析算法的时间复杂度。【东南大学 2000 五 (15分)】 类似本题的另外叙述有:

(1)如果字符串的一个子串(其长度大于1)的各个字符均相同,则称之为等值子串。试设计一算法,输入字符串S,以“!”作为结束标志。如果串S中不存在等值子串,则输出信息“无等值子串”,否则求出(输出)一个长度最大的等值子串。

例如:若S=“abc123abc123!”,则输出“无等值子串”;若S=“abceebccadddddaaadd!”,则输出“ddddd”。

【华中科技大学 2001】

4.假设串的存储结构如下所示,编写算法实现串的置换操作。【清华大学 1995 五(15分)】

TYPE strtp =RECORD

ch: ARRAY[1..maxlen] OF char; curlen:0..maxlen END;

5.函数void insert(char*s,char*t,int pos)将字符串t插入到字符串s中,插入位置为pos。请用c语言实现该函数。假设分配给字符串s的空间足够让字符串t插入。(说明:不得使用任何库函数)

【北京航空航天大学 2001 六 (10分)】

6.设计一个二分检索的算法,在一组字符串中找出给定的字符串,假设所有字符串的长度为4。

(1)简述算法的主要思想;(3分)

(2)用PASCAL语言分别对算法中用到的类型和变量作出说明;(3分) (3)用类PASCAL语言或自然语言写算法的非递归过程; (8分) (4)分析该算法的最大检索长度;(3分) (5)必要处加上中文注释。(3分) 【山东工业大学 1995 八 (20分)】

7.设计一PASCAL 或C语言的函数 atoi(x).其中X 为字符串,由0--9十个数字符和表示正负数的‘-’组成,返回值为整型数值 。【浙江大学 1994 二 (7分)】

8.已知字符串S1中存放一段英文,写出算法format(s1,s2,s3,n),将其按给定的长度n格式化成两端对齐的字符串S2, 其多余的字符送S3。 【首都经贸大学 1998 三、8(15分)】 9.串以静态存储结构存储,结构如下所述,试实现串操作equal算法.

CONST maxlen=串被确认的最大长度 TYPE strtp=RECORD

ch:ARRAY[1..maxlen] OF char; curlen:0..maxlen END;

(以一维数组存放串值,并设指示器curlen指示当前串长)【北京轻工业大学 1998 一 (12分)】

10.编写程序,统计在输入字符串中各个不同字符出现的频度并将结果存入文件(字符串中的合法字符为A-Z这26个字母和0-9这10个数字)。【西北大学 2000 四 (10分)】 11.写一个递归算法来实现字符串逆序存储,要求不另设串存储空间。 【西南交通大学 2000 三、2】

12.已知三个字符串分别为s=’ab?abcaabcbca?a’,s’=’caab’, s’’=’bcb’。利用所学字符串基本运算的函数得到结果串为:s’’’=’caabcbca?aca?a’,要求写出得到上结果串S’’’所用的函数及执行算法。【东北大学 1998 一、1 (10分)】 13.S=“S1S2?Sn”是一个长为N的字符串,存放在一个数组中,编程序将S改造之后输出:

(1)将S的所有第偶数个字符按照其原来的下标从大到小的次序放在S的后半部分; (2)将S的所有第奇数个字符按照其原来的下标从小到大的次序放在S的前半部分; 例如:

S=‘ABCDEFGHIJKL’

则改造后的S为‘ACEGIKLJHFDB’。【中科院计算所 1995】 14.编一程序,对输入的一表达式(字符串),输出其TOKEN表示。表达式由变量A,B,C,常数(数字)0,1,?,9,运算符+,*和括号“(”,“)”组成。首先定义符号的类码:

符号 类码 变量 0 常量 1 * 2 + 3 ( 4 ) 5 其次定义符号的TOKEN表示:

其中NAMEL是变量名表(不允许有相同名),CONST是常量表(不允许有相同数)。 例如,假设有表达式(A+A*2)+2*B*3#,则将生成如下TOKENL:

【吉林大学 1995 一 (20分)】

第四章 串

一、选择题

1.B 2.E 3.C 4.A 5.C 6.A 7.1D 7.2F 8.B注 9.D 10.B 注:子串的定义是:串中任意个连续的字符组成的子序列,并规定空串是任意串的子串,任意串是其自身的子串。若字符串长度为n(n>0),长为n的子串有1个,长为n-1的子串有2个,长为n-2的子串有3个,??,长为1的子串有n个。由于空串是任何串的子串,所以本题的答案为:8*(8+1)/2+1=37。故选B。但某些教科书上认为“空串是任意串的子串”无意义,所以认为选C。为避免考试中的二意性,编者认为第9题出得好。 二、判断题

1.√ 2.√ 3.√

三.填空题

1.(1) 由空格字符(ASCII值32)所组成的字符串 (2)空格个数 2.字符 3.任意个连续的字符组成的子序列 4.5 5.O(m+n) 6.01122312 7.01010421 8.(1)模式匹配 (2)模式串

9.(1)其数据元素都是字符(2)顺序存储(3)和链式存储(4)串的长度相等且两串中对应位置的字符也相等

10.两串的长度相等且两串中对应位置的字符也相等。 11.’xyxyxywwy’ 12.*s++=*t++ 或(*s++=*t++)!=‘\\0’ 13.(1)char s[ ] (2) j++ (3) i >= j

14.[题目分析]本题算法采用顺序存储结构求串s和串t的最大公共子串。串s用i指针(1<=i<=s.len)。t串用j指针(1<=j<=t.len)。算法思想是对每个i(1<=i<=s.len,即程序中第一个WHILE循环),来求从i开始的连续字符串与从j(1<=j<=t.len,即程序中第二个WHILE循环)开始的连续字符串的最大匹配。程序中第三个(即最内层)的WHILE循环,是当s中某字符(s[i])与t中某字符(t[j])相等时,求出局部公共子串。若该子串长度大于已求出的最长公共子串(初始为0),则最长公共子串的长度要修改。

程序(a):(1)(i+k<=s.len)AND(j+k<=t.len) AND(s[i+k]=t[j+k])

//如果在s和t的长度内,对应字符相等,则指针k 后移(加1)。 (2)con:=false //s和t对应字符不等时置标记退出

(3)j:=j+k //在t串中,从第j+k字符再与s[i]比较 (4)j:=j+1 //t串取下一字符

(5)i:=i+1 //s串指针i后移(加1)。

程序(b):(1) i+k<=s.len && j+k<=t.len && s[i+k]==t[j+k] //所有注释同上(a) (2) con=0 (3) j+=k (4) j++ (5) i++ 15.(1)0 (2)next[k] 16.(1)i:=i+1 (2)j:=j+1 (3)i:=i-j+2 (4)j:=1; (5)i-mt(或i:=i-j+1) (6)0 17.程序中递归调用

(1)ch1<>midch //当读入不是分隔符&和输入结束符$时,继续读入字符 (2)ch1=ch2 //读入分隔符&后,判ch1是否等于ch2,得出真假结论。 (3)answer:=true (4)answer:=false (5)read(ch) (6)ch=endch 18.(1)initstack(s) //栈s初始化为空栈。

(2) setnull (exp) //串exp初始化为空串。

(3) ch in opset //判取出字符是否是操作符。

(4) push (s,ch) //如ch是运算符,则入运算符栈s。 (5) sempty (s) //判栈s是否为空。

(6) succ := false //若读出ch是操作数且栈为空,则按出错处理。

(7) exp (8)ch //若ch是操作数且栈非空,则形成部分中缀表达式。 (9) exp (10) gettop(s) //取栈顶操作符。 (11) pop(s) //操作符取出后,退栈。

(12) sempty(s) //将pre的最后一个字符(操作数)加入到中缀式exp的最

后。

四.应用题

1.串是零个至多个字符组成的有限序列。从数据结构角度讲,串属于线性结构。与线性表的特殊性在于串的元素是字符。

2.空格是一个字符,其ASCII码值是32。空格串是由空格组成的串,其长度等于空格的个数。空串是不含任何字符的串,即空串的长度是零。 3.最优的T(m,n)是O(n)。串S2是串S1的子串,且在S1中的位置是1。开始求出最大公共子串的长度恰是串S2的长度,一般情况下,T(m,n) =O(m*n)。 4.朴素的模式匹配(Brute-Force)时间复杂度是O(m*n),KMP算法有一定改进,时间复杂度达到O(m+n)。本题也可采用从后面匹配的方法,即从右向左扫描,比较6次成功。另一种匹配方式是从左往右扫描,但是先比较模式串的最后一个字符,若不等,则模式串后移;若相等,再比较模式串的第一个字符,若第一个字符也相等,则从模式串的第二个字符开始,向右比较,直至相等或失败。若失败,模式串后移,再重复以上过程。按这种方法,本题比较18次成功。

5.KMP算法主要优点是主串指针不回溯。当主串很大不能一次读入内存且经常发生部分匹配时,KMP算法的优点更为突出. 6.模式串的next函数定义如下: next[j]

=

根据此定义,可求解模式串t的next和nextval值如下:

j t串 next[j] nextval[j] 1 2 3 4 5 6 7 8 9 10 11 12 a b c a a b b a b c a b 0 1 1 1 2 2 3 1 2 3 4 5 0 1 1 0 2 1 3 0 1 1 0 5

7.解法同上题6,其next和nextval值分别为0112123422和0102010422。 8.解法同题6,t串的next和nextval函数值分别为0111232和0110132。 9.解法同题6,其next和nextval 值分别为011123121231和011013020131。 10.p1的next和nextval值分别为:0112234和0102102;p2的next和nextval值分别为:0121123和0021002。

11.next数组值为011234567 改进后的next数组信息值为010101017。

12.011122312。

13.next定义见题上面6和下面题20。串p的next函数值为:01212345634。 14.(1)S的next与nextval值分别为012123456789和002002002009,p的next与nextval值分别为012123和002003。

(2)利用BF算法的匹配过程: 利用KMP算法的匹配过程: 第一趟匹配: aabaabaabaac 第一趟匹配:aabaabaabaac aabaac(i=6,j=6) aabaac(i=6,j=6) 第二趟匹配: aabaabaabaac 第二趟匹配:aabaabaabaac aa(i=3,j=2) (aa)baac 第三趟匹配: aabaabaabaac 第三趟匹配:aabaabaabaac

a(i=3,j=1) (成功) (aa)baac

第四趟匹配: aabaabaabaac

aabaac(i=9,j=6)

第五趟匹配: aabaabaabaac

aa(i=6,j=2)

第六趟匹配: aabaabaabaac

a(i=6,j=1)

第七趟匹配: aabaabaabaac

(成功) aabaac(i=13,j=7) 15.(1)p的nextval函数值为0110132。(p的next函数值为0111232)。

(2)利用KMP(改进的nextval)算法,每趟匹配过程如下: 第一趟匹配: abcaabbabcabaacbacba abcab(i=5,j=5)

第二趟匹配: abcaabbabcabaacbacba abc(i=7,j=3) 第三趟匹配: abcaabbabcabaacbacba a(i=7,j=1)

第四趟匹配: abcaabbabcabaac bacba (成功) abcabaa(i=15,j=8) 16.KMP算法的时间复杂性是O(m+n)。

p的next和nextval值分别为01112212321和01102201320。 17.(1)p的nextval函数值为01010。(next函数值为01123)

(2)利用所得nextval数值,手工模拟对s的匹配过程,与上面16题类似,为节省篇

幅,故略去。

18.模式串T的next和nextval值分别为0121123和0021002。

19.第4行的p[J]=p[K]语句是测试模式串的第J个字符是否等于第K个字符,如是,则指针J和K均增加1,继续比较。第6行的p[J]=p[K]语句的意义是,当第J个字符在模式匹配中失配时,若第K个字符和第J个字符不等,则下个与主串匹配的字符是第K个字符;否则,若第K个字符和第J个字符相等,则下个与主串匹配的字符是第K个字符失配时的下一个(即NEXTVAL[K])。

2

该算法在最坏情况下的时间复杂度O(m)。 20.(1)当模式串中第一个字符与主串中某字符比较不等(失配)时,next[1]=0表示模式串中已没有字符可与主串中当前字符s[i]比较,主串当前指针应后移至下一字符,再和模式串中第一字符进行比较。

(2)当主串第i个字符与模式串中第j个字符失配时,若主串i不回溯,则假定模式串第k个字符与主串第i个字符比较,k值应满足条件1

(3)在上面两种情况外,发生失配时,主串指针i不回溯,在最坏情况下,模式串从第1个字符开始与主串第i个字符比较,以便不致丢失可能的匹配。

21.这里失败函数f,即是通常讲的模式串的next函数,其定义见本章应用题的第6题。

进行模式匹配时,若主串第i个字符与模式串第j个字符发生失配,主串指针i不回溯,和主串第i个字符进行比较的是模式串的第next[j]个字符。模式串的next函数值,只依赖于模式串,和主串无关,可以预先求出。

该算法的技术特点是主串指针i不回溯。在经常发生“部分匹配”和主串很大不能一次调入内存时,优点特别突出。

22.失败函数(即next)的值只取决于模式串自身,若第j个字符与主串第i个字符失配时,假定主串不回溯,模式串用第k(即next[j])个字符与第i个相比,有‘ p1?pk-1’=‘pj-k+1?pj-1’,为了不因模式串右移与主串第i个字符比较而丢失可能的匹配,对于上式中存在的多个k值,应取其中最大的一个。这样,因j-k最小,即模式串向右滑动的位数最小,避免因右移造成的可能匹配的丢失。

23.仅从两串含有相等的字符,不能判定两串是否相等,两串相等的充分必要条件是两串长度相等且对应位置上的字符相同(即两串串值相等)。 24.(1)s1和s2均为空串;(2)两串之一为空串;(3)两串串值相等(即两串长度相等且对应位置上的字符相同)。(4)两串中一个串长是另一个串长(包括串长为1仅有一个字符的情况)的数倍,而且长串就好象是由数个短串经过连接操作得到的。 25、题中所给操作的含义如下:

//:连接函数,将两个串连接成一个串 substr(s,i,j):取子串函数,从串s的第i个字符开始,取连续j个字符形成子串 replace(s1,i,j,s2):置换函数,用s2串替换s1串中从第i个字符开始的连续j个字符

本题有多种解法,下面是其中的一种:

(1) s1=substr(s,3,1) //取出字符:‘y’ (2) s2=substr(s,6,1) //取出字符:‘+’ (3) s3=substr(s,1,5) //取出子串:‘(xyz)’ (4) s4=substr(s,7,1) //取出字符:‘*’ (5) s5=replace(s3,3,1,s2)//形成部分串:‘(x+z)’ (6) s=s5//s4//s1 //形成串t即‘(x+z)*y’

五、算法设计

1、[题目分析]判断字符串t是否是字符串s的子串,称为串的模式匹配,其基本思想是对串s和t各设一个指针i和j,i的值域是0..m-n,j的值域是0..n-1。初始值i和j均为0。模式匹配从s0和t0开始,若s0=t0,则i和j指针增加1,若在某个位置si!=tj,则主串指针i回溯到i=i-j+1,j仍从0开始,进行下一轮的比较,直到匹配成功(j>n-1),返回子串在主串的位置(i-j)。否则,当i>m-n则为匹配失败。

int index(char s[],t[],int m,n)

//字符串s和t用一维数组存储,其长度分别为m和n。本算法求字符串t在字符串s中的第一次出现,如是,输出子串在s中的位置,否则输出0。

{int i=0,j=0;

while (i<=m-n && j<=n-1)

if (s[i]==t[j]){i++;j++;} //对应字符相等,指针后移。

else {i=i-j+1;j=0;} //对应字符不相等,I回溯,j仍为0。 if(i<=m-n && j==n) {printf(“t在s串中位置是%d”,i-n+1);return(i-n+1);}//匹配成功

else return(0); //匹配失败 }//算法index结束 main ()//主函数

{char s[],t[]; int m,n,i;

scanf(“%d%d”,&m,&n); //输入两字符串的长度 scanf(“%s”,s); //输入主串 scanf(“%s”,t); //输入子串 i=index(s,t,m,n); }//程序结束

[程序讨论]因用C语言实现,一维数组的下标从0开始,m-1是主串最后一个字符的下标,n-1是t串的最后一个字符的下标。若匹配成功,最佳情况是s串的第0到第n-1个字符与t匹配,时间复杂度为o(n);匹配成功的最差情况是,每次均在t的最后一个字符才失败,直到s串的第m-n个字符成功,其时间复杂度为o((m-n)*n),即o(m*n)。失败的情况是s串的第m-n个字符比t串某字符比较失败,时间复杂度为o(m*n)。之所以串s的指针i最大到m-n,是因为在m-n之后,所剩子串长度已经小于子串长度n,故不必再去比较。算法中未讨论输入错误(如s串长小于t串长)。

另外,根据子串的定义,返回值i-n+1是子串在主串中的位置,子串在主串中的下标是i-n。

2.[问题分析]在一个字符串内,统计含多少整数的问题,核心是如何将数从字符串中分离出来。从左到右扫描字符串,初次碰到数字字符时,作为一个整数的开始。然后进行拼数,即将连续出现的数字字符拼成一个整数,直到碰到非数字字符为止,一个整数拼完,存入数组,再准备下一整数,如此下去,直至整个字符串扫描到结束。 int CountInt()

// 从键盘输入字符串,连续的数字字符算作一个整数,统计其中整数的个数。 {int i=0,a[]; // 整数存储到数组a,i记整数个数 scanf(“%c”,&ch);// 从左到右读入字符串 while(ch!=‘#’) //‘#’是字符串结束标记 if(isdigit(ch))// 是数字字符 {num=0; // 数初始化

while(isdigit(ch)&& ch!=‘#’)// 拼数 {num=num*10+‘ch’-‘0’; scanf(“%c”,&ch); }

a[i]=num;i++; if(ch!=‘#’)scanf(“%c”,&ch); // 若拼数中输入了‘#’,则不再输入 }// 结束while(ch!=‘#’) printf(“共有%d个整数,它们是:”i); for(j=0;j

{printf(“m”,a[j]); if((j+1)%10==0)printf(“\\n”);} // 每10个数输出在一行上 }// 算法结束

[算法讨论]假定字符串中的数均不超过32767,否则,需用长整型数组及变量。 3、[题目分析]设以字符数组s表示串,重复子串的含义是由一个或多个连续相等的字符组成的子串,其长度用max表示,初始长度为0,将每个局部重复子串的长度与max相比,若比max大,则需要更新max,并用index记住其开始位置。

int LongestString(char s[],int n)

//串用一维数组s存储,长度为n,本算法求最长重复子串,返回其长度。

{int index=0,max=0; //index记最长的串在s串中的开始位置,max记其长度 int length=1,i=0,start=0; //length记局部重复子串长度,i为字符数组下标 while(i

if(s[i]==s[i+1]) {i++; length++;} else //上一个重复子串结束

{if(max

i++;start=i;length=1; //初始化下一重复子串的起始位置和长度

}

printf(“最长重复子串的长度为%d,在串中的位置%d\\n”,max,index); return(max); }//算法结束

[算法讨论]算法中用i

算法的时间复杂度为O(n),每个字符与其后继比较一次。

4、[题目分析]教材中介绍的串置换有两种形式:第一种形式是replace(s,i,j,t),含义是将s串中从第i个字符开始的j个字符用t串替换,第二种形式是replace(s,t,v),含义是将s串中所有非重叠的t串用v代替。我们先讨论第一种形式的替换。因为已经给定顺序存储结构,我们可将s串从第(i+j-1)到串尾(即s.curlen)移动t.curlen-j绝对值个位置(以便将t串插入):若j>t.curlen,则向左移;若j

int replace(strtp s,t,int i,j)

//s和t是用一维数组存储的串,本算法将s串从第i个字符开始的连续j个字符用t串置换,操作成功返回1,否则返回0表示失败。 {if(i<1 || j<0 || t.curlen+s.curlen-j>maxlen)

{printf(“参数错误\\n”);exit(0);} //检查参数及置换后的长度的合法性。 if(j=i+j-1;k--) s.ch[k+t.curlen-j]=s.ch[k]; else if (j>t.curlen) //s串中被替换子串的长度小于t串的长度。 for(k=i-1+j;k<=s.curlen-1;k++) s.ch[k-(j-t.curlen)]=s.ch[k];

for(k=0;kt.curlen) s.curlen=s.curlen-(j-t.curlen);else

s.curlen=s.curlen+(t.curlen-j); }//算法结束

[算法讨论]若允许使用另一数组,在检查合法性后,可将s的第i个(不包括i)之前的子串复制到另一子串如s1中,再将t串接到s1串后面,然后将s的第i+j直到尾的部分加到s1之后。最后将s1串复制到s。主要语句有:

for(k=0;k

for(k=0;k

for(k=s.curlen-1;k>i-1+j;k--);//将子串第i+j-1个字符以后的子串复制到s1

s1.ch[l--]=s.ch[k]

for(k=0;k

下面讨论replace(s,t,v)的算法。该操作的意义是用串v替换所有在串s中出现的和非空串t相等的不重叠的子串。本算法不指定存储结构,只使用串的基本运算。

void replace(string s,t,v)

//本算法是串的置换操作,将串s中所有非空串t相等且不重复的子串用v代替。 {i=index(s,t);//判断s是否有和t相等的子串 if(i!=0)//串s中包含和t相等的子串

{creat(temp,”); //creat操作是将串常量(此处为空串)赋值给temp。 m=length(t);n=length(s); //求串t和s的长度 while(i!=0)

{assign(temp,concat(temp,substr(s,1,i-1),v));//用串v替换t形成部分结果

assign(s,substr(s,i+m,n-i-m+1)); //将串s中串后的部分形成新的s串

n=n-(i-1)-m; //求串s的长度

i=index(s,t); //在新s串中再找串t的位置

}

assign(s,contact(temp,s)); //将串temp和剩余的串s连接后再赋值给s }//if结束 }//算法结束

5、[题目分析]本题是字符串的插入问题,要求在字符串s的pos位置,插入字符串t。首先应查找字符串s的pos位置,将第pos个字符到字符串s尾的子串向后移动字符串t的长度,然后将字符串t复制到字符串s的第pos位置后。 对插入位置pos要验证其合法性,小于1或大于串s的长度均为非法,因题目假设给字符串s的空间足够大,故对插入不必判溢出。

void insert(char *s,char *t,int pos)

//将字符串t插入字符串s的第pos个位置。

{int i=1,x=0; char *p=s,*q=t; //p,q分别为字符串s和t的工作指针 if(pos<1) {printf(“pos参数位置非法\\n”);exit(0);} while(*p!=’\\0’&&i

if(*p == '/0') {printf(\位置大于字符串s的长度\

else //查找字符串的尾 while(*p!= '/0') {p++; i++;} //查到尾时,i为字符‘\\0’的下标,p也指向‘\\0’。 while(*q!= '\\0') {q++; x++; } //查找字符串t的长度x,循环结束时q指向'\\0'。 for(j=i;j>=pos ;j--){*(p+x)=*p; p--;}//串s的pos后的子串右移,空出串t的位置。

q--; //指针q回退到串t的最后一个字符

for(j=1;j<=x;j++) *p--=*q--; //将t串插入到s的pos位置上

[算法讨论] 串s的结束标记('\\0')也后移了,而串t的结尾标记不应插入到s中。 6.[题目分析]本题属于查找,待查找元素是字符串(长4),将查找元素存放在一维数组中。二分检索(即折半查找或对分查找),是首先用一维数组的“中间”元素与被检索元素比较,若相等,则检索成功,否则,根据被检索元素大于或小于中间元素,而在中间元素的右方或左方继续查找,直到检索成功或失败(被检索区间的低端指针大于高端指针)。下面给出类C语言的解法

typedef struct node

{char data[4];//字符串长4 }node;

非递归过程如下:

int binsearch(node string [];int n;char name[4])

//在有n个字符串的数组string中,二分检索字符串name。若检索成功,返回name在string中的下标,否则返回-1。

{int low = 0,high = n - 1;//low和high分别是检索区间的下界和上界 while(low <= high)

{mid = (low + high) /2; //取中间位置

if(strcmp(string[mid],name) ==0) return (mid); //检索成功

else if(strcmp(string[mid],name)<0) low=mid+1; //到右半部分检索

else high=mid-1; //到左半部分检索 }

return 0; //检索失败 }//算法结束

最大检索长度为log2n。

7. [题目分析]设字符串存于字符数组X中,若转换后的数是负数,字符串的第一个字符必为 '-',取出的数字字符,通过减去字符零('0')的ASCII值,变成数,先前取出的数乘上10加上本次转换的数形成部分数,直到字符串结束,得到结果。

long atoi(char X[])

//一数字字符串存于字符数组X中,本算法将其转换成数 {long num=0;

int i=1; //i 为数组下标

while (X[i]!= '\\0') num=10*num+(X[i++]-'0');//当字符串未到尾,进行数的转

if(X[0]=='-') return (-num); //返回负数

else return ((X[0]-'0')*10+num); //返回正数,第一位若不是负号,则是数字 }//算法atoi结束

[算法讨论]如是负数,其符号位必在前面,即字符数组的x[0],所以在作转换成数时下标i从1 开始,数字字符转换成数使用X[i]-'0',即字符与'0'的ASCII值相减。请注意对

返回正整数的处理。

8.[题目分析]本题要求字符串s1拆分成字符串s2和字符串s3,要求字符串s2“按给定长度n格式化成两端对齐的字符串”,即长度为n且首尾字符不得为空格字符。算法从左到右扫描字符串s1,找到第一个非空格字符,计数到n,第n个拷入字符串s2的字符不得为空格,然后将余下字符复制到字符串s3中。 void format (char *s1,*s2,*s3)

//将字符串s1拆分成字符串s2和字符串s3,要求字符串s2是长n且两端对齐 {char *p=s1, *q=s2; int i=0;

while(*p!= '\\0' && *p== ' ') p++;//滤掉s1左端空格

if(*p== '\\0') {printf(\字符串s1为空串或空格串\\n\

while( *p!='\\0' && i

while(*p==' '&&*p!='\\0') p++;//往后查找一个非空格字符作串s2的尾字符 if(*p=='\\0') {printf(\串没有%d个两端对齐的字符串\\n\} *q=*p; //字符串s2最后一个非空字符 *(++q)='\\0'; //置s2字符串结束标记 }

*q=s3;p++; //将s1串其余部分送字符串s3。 while (*p!= '\\0') {*q=*p; q++; p++;} *q='\\0'; //置串s3结束标记 }

9.[题目分析]两个串的相等,其定义为两个串的值相等,即串长相等,且对应字符相等是两个串相等的充分必要条件。因此,首先比较串长,在串长相等的前提下,再比较对应字符是否相等。

int equal(strtp s,strtp t)

//本算法判断字符串s和字符串t是否相等,如相等返回1,否则返回0 {if (s.curlen!=t.curlen) return (0);

for (i=0; i

10.[问题分析]由于字母共26个,加上数字符号10个共36个,所以设一长36的整型数组,前10个分量存放数字字符出现的次数,余下存放字母出现的次数。从字符串中读出数字字符时,字符的ASCII代码值减去数字字符 ‘0’的ASCII代码值,得出其数值(0..9),字母的ASCII代码值减去字符‘A’的ASCII代码值加上10,存入其数组的对应下标分量中。遇其它符号不作处理,直至输入字符串结束。

void Count()

//统计输入字符串中数字字符和字母字符的个数。 {int i,num[36]; char ch;

for(i=0;i<36;i++)num[i]=0;// 初始化

while((ch=getchar())!=‘#’) //‘#’表示输入字符串结束。 if(‘0’<=ch<=‘9’){i=ch-48;num[i]++;} // 数字字符 else if(‘A’<=ch<=‘Z’){i=ch-65+10;num[i]++;}// 字母字符

for(i=0;i<10;i++) // 输出数字字符的个数 printf(“数字%d的个数=%d\\n”,i,num[i]); for(i=10;i<36;i++)// 求出字母字符的个数 printf(“字母字符%c的个数=%d\\n”,i+55,num[i]); }// 算法结束。

11.[题目分析]实现字符串的逆置并不难,但本题“要求不另设串存储空间”来实现字符串逆序存储,即第一个输入的字符最后存储,最后输入的字符先存储,使用递归可容易做到。

void InvertStore(char A[]) //字符串逆序存储的递归算法。 { char ch;

static int i = 0;//需要使用静态变量 scanf (\

if (ch!= '.') //规定'.'是字符串输入结束标志 {InvertStore(A);

A[i++] = ch;//字符串逆序存储 }

A[i] = '\\0'; //字符串结尾标记 }//结束算法InvertStore。

12. 串s'''可以看作由以下两部分组成:'caabcbca...a'和 'ca...a',设这两部分分别叫串s1和串s2,要设法从s,s' 和s''中得到这两部分,然后使用联接操作联接s1和s2得到s''' 。

i=index(s,s'); //利用串s'求串s1在串s中的起始位置 s1=substr(s,i,length(s) - i + 1); //取出串s1

j=index(s,s''); //求串s''在串s中的起始位置,s串中'bcb'后是'ca...a') s2=substr(s,j+3,length(s) - j - 2); //形成串s2 s3=concat(s1,s2); 13.[题目分析]对读入的字符串的第奇数个字符,直接放在数组前面,对第偶数个字符,先入栈,到读字符串结束,再将栈中字符出栈,送入数组中。限于篇幅,这里编写算法,未编程序。

void RearrangeString()

//对字符串改造,将第偶数个字符放在串的后半部分,第奇数个字符前半部分。 {char ch,s[],stk[]; //s和stk是字符数组(表示字符串)和字符栈 int i=1,j; //i和j字符串和字符栈指针 while((ch=getchar())!=’#’)// ’#’是字符串结束标志 s[i++]=ch; //读入字符串

s[i]=’\\0’; //字符数组中字符串结束标志 i=1;j=1;

while(s[i]) //改造字符串

{if(i%2==0) stk[i/2]=s[i]; else s[j++]=s[i];

i++; }//while

i--; i=i/2; //i先从’\\0’后退,是第偶数字符的个数 while(i>0) s[j++]=stk[i--] //将第偶数个字符逆序填入原字符数组

}

14.[题目分析]本题是对字符串表达式的处理问题,首先定义4种数据结构:符号的类码,符号的TOKEN 表示,变量名表NAMEL和常量表CONSL。这四种数据结构均定义成结构体形式,数据部分用一维数组存储,同时用指针指出数据的个数。算法思想是从左到右扫描表达式,对读出的字符,先查出其符号类码:若是变量或常量,就到变量名表和常量表中去查是否已有,若无,则在相应表中增加之,并返回该字符在变量名表或常量表中的下标;若是操作符,则去查其符号类码。对读出的每个符号,均填写其TOKEN表。如此下去,直到表达式处理完毕。先定义各数据结构如下。

struct // 定义符号类别数据结构 {char data[7]; //符号

char code[7]; //符号类码 }TYPL;

typedef struct //定义TOKEN的元素 {int typ; //符号码

int addr; //变量、常量在名字表中的地址 }cmp;

struct {cmp data[50];//定义TOKEN表长度<50 int last; //表达式元素个数

}TOKEN;

struct {char data[15]; //设变量个数小于15个 int last; //名字表变量个数 }NAMEL;

struct {char data[15]; //设常量个数小于15个 int last; //常量个数 }CONSL;

int operator(char cr) //查符号在类码表中的序号 {for(i=3;i<=6;i++)

if(TYPL.data[i]==cr) return(i); }

void PROCeString()

//从键盘读入字符串表达式(以‘#’结束),输出其TOKEN表示。

{NAMEL.last=CONSL.last=TOKEN.last=0; //各表元素个数初始化为0 TYPL.data[3]=‘*’;TYPL.data[4]=‘+’;TYPL.data[5]=‘(’; TYPL.data[6]=‘)’; //将操作符存入数组 TYPL.code[3]=‘3’;TYPL.code[4]=‘4’;TYPL.code[5]=‘5’; TYPL.code[6]=‘6’; //将符号的类码存入数组 scanf(“%c”,&ch); //从左到右扫描(读入)表达式。 while(ch!=‘#’) //‘#’是表达式结束符

{switch(ch)of

{case‘A’: case ‘B’: case ‘C’: //ch是变量

TY=0; //变量类码为0

for(i=1;i<=NAMEL.last;i++)

if(NAMEL.data[i]==ch)break;//已有该变量,i记住其位置

if(i>NAMEL.last){NAMEL.data[i]=ch;NAMEL.last++;}//变量加入

case‘0’: case‘1’: case‘2’: case‘3’: case‘4’: case‘5’://处理常量

case‘6’: case ‘7’:case‘8’: case‘9’: TY=1;//常量类码为1 for(i=1;i<=CONSL.last;i++)

if(CONSL.data[i]==ch)break;////已有该常量,i记住其位

if(i>CONSL.last){CONSL.data[i]=ch;CONSL.last++;}//将新常量加入

default: //处理运算符

TY=operator(ch);//类码序号

i=’\\0’; //填入TOKEN的addr域(期望输出空白) }//结束switch,下面将ch填入TOKEN表

TOKEN.data[++TOKEN.last].typ=TY;TOKEN.data[TOKEN.last].addr=i; scanf(“%c”,&ch); //读入表达式的下一符号。 }//while }//算法结束

[程序讨论]为便于讨论,各一维数组下标均以1开始,在字符为变量或常量的情况下,将其类码用TY记下,用i记下其NAMEL表或CONSL表中的位置,以便在填TOKEN表时用。在运算符(‘+’,‘*’,‘(’,‘)’)填入TOKEN表时,TOKEN表的addr域没意义,为了程序统一,这里填入了’\\0’。本题是表达式处理的简化情况(只有3个单字母变量,常量只有0..9,操作符只4个),若是真实情况,所用数据结构要相应变化。

TY=0; //变量类码为0

for(i=1;i<=NAMEL.last;i++)

if(NAMEL.data[i]==ch)break;//已有该变量,i记住其位置

if(i>NAMEL.last){NAMEL.data[i]=ch;NAMEL.last++;}//变量加入

case‘0’: case‘1’: case‘2’: case‘3’: case‘4’: case‘5’://处理常量

case‘6’: case ‘7’:case‘8’: case‘9’: TY=1;//常量类码为1 for(i=1;i<=CONSL.last;i++)

if(CONSL.data[i]==ch)break;////已有该常量,i记住其位

if(i>CONSL.last){CONSL.data[i]=ch;CONSL.last++;}//将新常量加入

default: //处理运算符

TY=operator(ch);//类码序号

i=’\\0’; //填入TOKEN的addr域(期望输出空白) }//结束switch,下面将ch填入TOKEN表

TOKEN.data[++TOKEN.last].typ=TY;TOKEN.data[TOKEN.last].addr=i; scanf(“%c”,&ch); //读入表达式的下一符号。 }//while }//算法结束

[程序讨论]为便于讨论,各一维数组下标均以1开始,在字符为变量或常量的情况下,将其类码用TY记下,用i记下其NAMEL表或CONSL表中的位置,以便在填TOKEN表时用。在运算符(‘+’,‘*’,‘(’,‘)’)填入TOKEN表时,TOKEN表的addr域没意义,为了程序统一,这里填入了’\\0’。本题是表达式处理的简化情况(只有3个单字母变量,常量只有0..9,操作符只4个),若是真实情况,所用数据结构要相应变化。

本文来源:https://www.bwwdw.com/article/fn06.html

Top