河北工业大学2012《编译原理》实验指导书

更新时间:2024-06-22 06:39:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《编译原理》实验指导书

实验目的和内容

编译原理实验的目的是使学生将编译理论运用到实际当中,实现一个简单语言集的词法、语法和语义分析程序,验证实际编译系统的实现方法,并加深对编译技术的认识。

实验内容共需实现编译器的词法、语法和语义分析程序三个组成部分。要求学生必须完成每个实验的基本题目要求,有余力的同学可尝试实验的扩展要求部分。

实验报告

要求每人针对所完成的实验内容上交一份实验报告,其中主要包括三方面内容: 1、实验设计:实验采用的实现方法和依据(如描述语言的文法及其机内表示,词法分析的单词分类码表、状态转换图或状态矩阵等,语法分析中用到的分析表或优先矩阵等,语法制导翻译中文法的拆分和语义动作的设计编写等);具体的设计结果(应包括整体设计思想和实现算法,程序结构的描述,各部分主要功能的说明,以及所用数据结构的介绍等)。 2、程序代码:实验实现的源程序清单,要求符合一般的程序书写风格,有详细的注释。 3、实验结果分析:自行编写若干源程序作为测试用例,对所生成的编译程序进行测试(编译程序的输入与输出以文件的形式给出);运行结果分析(至少包括一个正确和一个错误单词或语句的运行结果);以及改进设想等。

注意事项

1、电子版实验报告和源程序在最后一次机时后的一周内上交。(每个同学上交一个压缩文件,其命名格式为“学号_姓名.rar”,内含实验报告和一个命名为“源程序”的文件夹。注意提交的源程序应是经过调试、测试成功的较为通用的程序,并应有相应的注释、运行环境和使用方法简介。)

2、不接受不完整的实验报告和没有说明注释的源程序,或者说明与程序、运行结果不符合的作业。

特别鼓励:扩展题目

1、为亲身经历一个小型编译器的开发全过程,触摸一下与实际编译器开发相关的工作,大家可以自由组成3人左右的小组,推举组长,模拟一个团队分工协作开发大型软件的实战环境,融入软件工程的思想规范和一般理论方法,初步体验从系统分析设计、编码测试到交付维护的一个完整编译器软件的开发过程。要求组长为每个小组成员分配主要负责的任务,完成相应的分析设计员、程序员和测试员等角色的工作,并以小组为单位提交一份实验报告和源程序,在报告封面上写明每个同学主要完成和负责的部分。

2、以组为单位完成的实验内容至少必须整合词法、语法和语义三个部分的实验,对于选定的适当规模的文法(如C语言的一个大小适宜的子集),进行系统的总体设计、功能分析、编码测试等工作。完成一个从对源程序的词法分析开始,到中间代码生成的完整的编译器前端的开发,使所涉及到的编译系统的各个组成模块有机地衔接在一起,提交一份完整的实验报告和源程序,并将以下几个方面描述清楚:

1)任务概述 2)系统的设计

3)系统实现(包括必要的框图,各.h和.c文件说明,所有函数功能的说明,数据结构、各种表

格、变量等的说明,以及函数调用关系图等) 4)系统工作过程及运行说明(使用操作指南)

5)源程序清单(要求有详细注释)和实例程序运行结果 6)体会和讨论

3、实验题目

1)参考题目:在词法、语法和语义三个基本实验题目的基础上,完成以下扩展部分的要求:

实验一:

(1)扩充关键字的数目、增加单词类别(如分界符、逻辑运算符等)、将常数分成字符串常

量、整型常量和实型常量等;添加词法分析中单词出错的位置、加细错误类型的检查以及删除注释部分等;并考虑如何在词法分析阶段建立变量名表和常数表,以备后续的编译过程查询。

(2)选作:识别一个程序设计语言(如C语言)所有单词的词法分析程序设计。建议自学LEX系统。 实验二:

(1)完成以下文法G[<复合语句>]的两种典型的语法分析程序的设计与实现。

G[<复合语句>]:

<复合语句> → begin<语句表>end <语句表> → <语句>|<语句>;<语句表> <语句> → <赋值语句>

<赋值语句> → <变量>:=<算术表达式>

<算术表达式> → <项> | <算术表达式>+<项> | <算术表达式>-<项> <项> → <因式> | <项>*<因式> | <项>/<因式> <因式> → <变量> | <常数> | (<算术表达式>) <变量> → <标识符>

<标识符> → <标识符> <字母> | <标识符> <数字> | <字母> <常数> → <整数> | <浮点数> <整数> → <数字> | <数字> <整数> <浮点数> → ? <整数> | <整数> ? <整数> <字母> → A|B|C|…|X|Y|Z|a|b|c|…|x|y|z <数字> → 0|1|2|…|9

(2)在所给文法G[<复合语句>]的基础上,适当扩大分析对象,增加功能。如赋值语句的左

部不再只局限于简单变量,还可以是下标变量等;右部的算术表达式中可以包括函数调

用、数组元素等。除赋值语句外,还可进一步选择高级语言的其它语法结构类型,如流程控制语句、子程序结构语句、说明语句等。语法分析的结果以语法树的形式输出,并显示分析过程的信息(如分析栈、符号栈、当前应被归约的最左子串、归约后所得的符号等)。

(3)增强错误检查和处理能力。例如,当输入的源程序存在错误时,把所发现的每一处错误

的性质(错误编码)和位置填入一张表中,以备以后输出之用;同时再跳过错误所在的语法范畴(如单词、表达式、语句等),继续对输入串的后续部分进行编译。至于对错误的具体处理措施应结合所采用的语法分析方法,以LR分析为例,可对LR分析表中

的空白单元进行出错原因分析,填入一个指向出错处理子程序的指示字。

(4)选作:学习编译器的自动生成工具LEX、YACC(或其它类似工具)的使用方法,运用

LEX和YACC编写并生成以下文法G[<程序>]所定义语言的词法和语法分析程序。 G[<程序>]:

<程序> → PROGRAM<标识符>;<分程序> <分程序> → <变量说明>BEGIN<语句表>END.

<变量说明> → VAR<变量说明表>;

<变量说明表> → <变量表>:<类型> | <变量表>:<类型>;<变量说明表> <类型> → INTEGER | REAL

<变量表> → <变量> | <变量>,<变量表> <语句表> → <语句> | <语句>;<语句表>

<语句> → <赋值语句> | <条件语句> | | <复合语句> <赋值语句> → <变量>:=<算术表达式>

<条件语句> → IF<关系表达式>THEN<语句>ELSE<语句> → WHILE<关系表达式>DO<语句>

<复合语句> → BEGIN<语句表>END

<算术表达式> → <项> | <算术表达式>+<项> | <算术表达式>-<项> <项> → <因式> | <项>*<因式> | <项>/<因式> <因式> → <变量> | <常数> | (<算术表达式>)

<关系表达式> → <算术表达式> <关系符> <算术表达式> <变量> → <标识符>

<标识符> → <标识符> <字母> | <标识符> <数字> | <字母> <常数> → <整数> | <浮点数> <整数> → <数字> | <数字> <整数> <浮点数> → ? <整数> | <整数> ? <整数> <关系符> → < | <= | = | > | >= | <> <字母> → A|B|C|…|X|Y|Z|a|b|c|…|x|y|z <数字> → 0|1|2|…|9

实验三:

(1)增加语义分析的范围,如进一步完成布尔表达式(参见教材P200)、常见程序流程控制

语句(参见教材P205)等的翻译。

(2)语法制导翻译过程的可视化处理,选择编译各阶段用到的典型算法实现其动态演示。 (3)选作:完成实验二中文法G[<程序>]所定义的语言的语法制导翻译程序。

2)自拟题目:根据小组成员的兴趣自主选择或自定实验题目。要求先提交一份申请文档,说明所选题目、实现方案和技术路线;然后小组成员再与教师就题目的难易程度和工作量具体讨

论调整,细化课程设计内容,最终确定要完成的主要工作;在得到老师的认可之后方可继续进行。

实验一 词法分析程序实现

一、实验目的与要求

通过编写和调试一个词法分析程序,掌握在对程序设计语言的源程序进行扫描的过程中,将字符流形式的源程序转化为一个由各类单词符号组成的流的词法分析方法。

二、实现方法与环境

词法分析是编译程序的第一个处理阶段,可以通过两种途径来构造词法分析程序。其一是根据对语言中各类单词的某种描述或定义(如BNF),用手工的方式(例如可用C语言)构造词法分析程序。一般地,可以根据文法或状态转换图构造相应的状态矩阵,该状态矩阵连同控制程序一起便组成了编译器的词法分析程序;也可以根据文法或状态转换图直接编写词法分析程序。构造词法分析程序的另外一种途径是所谓的词法分析程序的自动生成,即首先用正规式对语言中的各类单词符号进行词型描述,并分别指出在识别单词时,词法分析程序所应进行的语义处理工作,然后由一个所谓词法分析程序的构造程序对上述信息进行加工。如美国BELL实验室研制的LEX就是一个被广泛使用的词法分析程序的自动生成工具。

总的来说,开发一种新语言时,由于它的单词符号在不停地修改,采用LEX等工具生成的词法分析程序比较易于修改和维护。一旦一种语言确定了,则采用手工编写词法分析程序效率更高。

三、实验内容

基本实验题目:若某一程序设计语言中的单词包括五个关键字begin、end、if、then、else;标识符;无符号常数;六种关系运算符;一个赋值符和四个算术运算符,试构造能识别这些单词的词法分析程序(各类单词的分类码参见表I)。

输入:由符合和不符合所规定的单词类别结构的各类单词组成的源程序文件。 输出:把所识别出的每一单词均按形如(CLASS,VALUE)的二元式形式输出,并将结果放到某个文件中。对于标识符和无符号常数,CLASS字段为相应的类别码的助记符;VALUE字段则是该标识符、常数的具体值;对于关键字和运算符,采用一词一类的编码形式,仅需在二元式的CLASS字段上放置相应单词的类别码的助记符,VALUE字段则为“空”。

扩展实验:试对基本实验内容进行扩充,例如:在词法分析过程中建立变量名表,以备后续的编译过程查询;扩充关键字的数目、增加逻辑运算符等单词类别、将常数再细分成字符串常量、整型常量和实型常量等;添加词法分析中单词出错的位置和错误类型,以及删除注释部分等。

表I 语言中的各类单词符号及其分类码表

单词符号 类别编码 类别码的助记符 begin end if then else 标识符 无符号常数 < <= = <> > >= := + - * / 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 BEGIN END IF THEN ELSE ID UCON LT LE EQ NE GT GE IS PL MI MU DI 单词值 字母打头的字母数字串 机内二进制表示 四、要求

1、上机前的准备:完成词法分析程序的程序流图,并选择好相应的数据结构。 2、编程:用C语言或你熟悉的其它高级程序设计语言编写扫描器程序。 3、调试:将各个模块连接成一个完整程序,并整体调试成功。

4、测试:用于测试扫描器的实例源文件中应有词法正确的,也应有错误的字符串,并至少应包含两行以上的源代码。

5、输出结果:对于输入的测试用例的源程序文件,以对照的形式将扫描器的分析结果在输出文件中表示出来,必要时给出错误提示信息。例如,若输入文件中的内容为:“if myid>=1.5E?2+100 then x:=y”,则输出文件中的内容应为:

(IF, ) 对应“if” (ID,’myid’) 对应“myid”

表II 包含语义处理过程的识别无符号数的状态矩阵

程序二 单词分类码为UCON的无符号数的识别程序

1 #include 2 #include 3 #include 4

5 #define DIGIT 1 6 #define POINT 2 7 #define OTHER 3 8 #define POWER 4 9 #define PLUS 5 10 #define MINUS 6

11 #define UCON 7 //Suppose the class number of unsigned constant is 7 12 #define ClassOther 200 13 #define EndState -1 14 int w,n,p,e,d;

15 int Class; //Used to indicate class of the word 16 int ICON; 17 float FCON;

18 static int CurrentState; //Used to present current state, the initial value:0 19

20 int GetChar (void); 21 int EXCUTE (int,int); 22 int LEX (void);

23 int HandleOtherWord (void) 24 {return ClassOther; 25 }

26 int HandleError (void)

27 {printf (\\n\28

29 int GetChar (void) 30 {

31 int c;

32 c=getchar ( );

33 if(isdigit(c)) {d=c-′0′;return DIGIT;} 34 if (c==′.′) return POINT;

35 if (c==′E′||c==′e′) return POWER; 36 if (c==′+′) return PLUS; 37 if (c==′-′) return MINUS; 38 return OTHER; 39 }

40 int EXCUTE (int state, int symbol) 41 {

42 switch (state) 43 {

44 case 0:switch (symbol) 45 {

46 case DIGIT: n=0;p=0;e=1;w=d;CurrentState=1;Class=UCON;break; 47 case POINT: w=0;n=0;p=0;e=1;CurrentState=3;Class=UCON;break; 48 default: HandleOtherWord( );Class=ClassOther; 49 CurrentState=EndState; 50 }

51 break;

52 case 1:switch (symbol) 53 {

54 case DIGIT: w=w*10+d;break; //CurrentState=1 55 case POINT: CurrentState=2;break; 56 case POWER: CurrentState=4;break; 57 default: ICON=w;CurrentState=EndState; 58 }

59 break;

60 case 2:switch (symbol) 61 {

62 case DIGIT: n++;w=w*10+d;break; 63 case POWER: CurrentState=4;break;

64 default: FCON=w*pow(10,e*p-n);CurrentState=EndState; 65 }

66 break;

67 case 3:switch (symbol) 68 {

69 case DIGIT: n++;w=w*10+d;CurrentState=2;break; 70 default: HandleError( );CurrentState=EndState; 71 }

72 break;

73 case 4:switch (symbol) 74 {

75 case DIGIT: p=p*10+d;CurrentState=6;break; 76 case MINUS: e=-1;CurrentState=5;break; 77 case PLUS: CurrentState=5;break;

78 default: HandleError( );CurrentState=EndState; 79 }

80 break;

81 case 5:switch (symbol) 82 {

83 case DIGIT: p=p*10+d;CurrentState=6;break; 84 default: HandleError( );CurrentState=EndState; 85 }

86 break;

87 case 6:switch (symbol) 88 {

89 case: DIGIT:p=p*10+d;break;

90 default: FCON=w*pow(10,e*p-n);CurrentState=EndState; 91 }

92 break; 93 }

94 return CurrentState; 95 }

96 int LEX (void) 97 {

98 int ch;

99 CurrentState=0;

100 while (CurrentState!=EndState) 101 {

102 ch=GetChar( );

103 EXCUTE (CurrentState,ch); 104 }

105 return Class; 106 }

实验二 语法分析程序实现

一、实验目的与要求

通过设计、编制、调试一个典型的语法分析程序(任选一种有代表性的语法分析方法,如算符优先法、递归下降法、LL(1)、SLR(1)、LR(1)等,作为编制语法分析程序的依据),对实验一所得扫描器提供的单词序列进行语法检查和结构分析,实现并进一步掌握常用的语法分析方法。

二、一般实现方法说明

为了在对源程序的一遍扫描过程中,同时完成词法和语法分析任务,应注意修改实验一中的词法分析程序,将它编写为子程序的形式,以便供语法分析程序调用。另外,应加强错误检查,对输入符号串中的词法、语法错误,给出必要的说明信息,尽可能多地、确切地指出错误的位置、原因和性质。例如,在词法分析阶段,对当前正在处理的字符ch,可进一步定义一些与该字符相关的信息row和col,分别表示该字符所在的行和列,这些内容在出错处理时用来提供和源程序位置相关的信息。即定义:

char ch; /*The current character*/

int row; /*The line number position of the current character*/ int col; /*The column number position of the current character*/

三、实验内容

基本实验题目:选择对各种常见高级程序设计语言都较为通用的语法结构——算术表达式的一个简化子集——作为分析对象,根据如下描述其语法结构的BNF定义G2[<算术表达式>],任选一种学过的语法分析方法,针对运算对象为无符号常数和变量的四则运算,设计并实现一个语法分析程序。

G2[<算术表达式>]:

<算术表达式> → <项> | <算术表达式>+<项> | <算术表达式>-<项> <项> → <因式> | <项>*<因式> | <项>/<因式> <因式> → <运算对象> | (<算术表达式>)

若将语法范畴<算术表达式>、<项>、<因式>和<运算对象>分别用E、T、F和i代表,则G2可写成:

G2[E]:E → T | E+T | E-T T → F | T*F | T/F F → i | (E)

输入:由实验一输出的单词串,例如:UCON,PL,UCON,MU,ID ······

输出:若输入源程序中的符号串是给定文法的句子,则输出“RIGHT”,并且给出每一步分析过程;若不是句子,即输入串有错误,则输出“ERROR”,并且显示分析至此所得的中间结果,如分析栈、符号栈中的信息等,以及必要的出错说明信息。

扩展实验:对所给算术表达式的文法G2,完成两种以上不同的语法分析程序的设计与实现;或在G2的基础上,适当增加功能,如进一步选择高级语言中的赋值语句、复合语句、流程控制语句等其它类型的语法结构作为分析对象。

四、要求

1、上机前的准备:结合题目的要求,确定语法分析程序的流程图,同时考虑相应的数据结构,用C或其它高级语言初步编写一个语法分析源程序。

2、调试:将词法、语法分析合在一起构成一个完整的程序,并调试成功。 3、测试:供测试的例子应包括符合语法规则的语句,及分析程序能判别的若干错例。 4、结果输出:对于所输入的字符串,不论对错,都应有明确的信息告诉外界。 5、编写的源程序中应有较为详细的说明和注释。例如,对文法机内表示的解释、数据结构的说明、函数的作用、全局变量的含义等等。

五、参考实现方法

下面分别简要给出基于递归下降法、预测分析法、算符优先法、SLR(1)四种语法分析程序的开发方法示例说明,仅供参考。

1、示例一:采用具有递归功能的高级语言编制递归下降法的语法分析程序。 运算对象i可以进一步定义为变量、常数等,例如,此处将i定义为:

i→<变量> <变量>→<标识符> <标识符>→<字母> <字母>→A|B|C|…|X|Y|Z

利用扩充的BNF消除G2[E]中E和T的直接左递归后,采用递归下降法分析上述算术表达式的框图见图3。其中ZC过程为总控程序,被设计成可以分析无穷多个算术表达式,主要完成:①通知外界键入算术表达式。②控制E过程分析算术表达式。③根据分析结果之正误,分别输出不同的信息。E、T和F三个过程分别对应<算术表达式>、<项>和<因式>三个产生式的处理。它们都利用到一个公共过程ADVANCE。ADVANCE过程负责从输入字符串ST中取出下一个字符,并存入SYM中等待分析;然后再剔除ST中的首字符,这可通过挪动字符串指针的办法来实现(而实际上是通过调用词法分析程序来实现ADVANCE功能的)。变量TZ之值标志分析的结果,表明表达式是否有错。

图3 递归下降法分析算术表达式的框图

(a) ZC过程 (b) E过程 (c) T过程 (d) F过程 (e) ADVANCE过程

2、示例二:基于预测分析法的语法分析程序。

参考教材P121例4.3,首先编写无二义性的简单算术表达式的文法(4.1),并通过消除左递归对其进行改写得到文法(4.1)’。然后求出如表4-1所示的各个FIRST集和FOLLOW集。再检查是不是LL(1)文法,并按照LL(1)文法构造如表4-2所示的预测分析表。最后根据预测分析器的工作流程,实现预测分析器的控制程序。

3、示例三:用C语言编制算符优先分析法的语法分析程序如程序三所示。其中使用了分析栈stack,用来在分析过程中存放当前句型的某一前缀,一旦句型的最左素短语在栈顶形成,便立即进行归约。

程序三 算符优先分析算法

#define RIGHT 1 #define ERROR 0

#define MAXINPUT 300 #define MAXSTACK 100 #define STARTSYMBOL ′S′

int stack[MAXSTACK],a[MAXINPUT]; /* a[ ] is input line */ int IsHigherThan (int, int); /* priority detection */ int IsLowerThan (int, int); /* priority detection */ int IsEqualTo (int, int); /* priority detection */ int Reduce (int begin, int end, int len);

int IsVt (int); /* determine if stack symbol is in Vt */ int parser (void) {

int i, k, r, NewVn; /* NewVn holds left side of a production */ i=0; k=0; /* i, k is index of a[ ] and stack[ ] separately */ stack[0]= ′#′; do {

int j; r=a[i++];

if (IsVt(stack[k])) j=k; else j=k-1; while (IsHigherThan(stack[j],r)) {

int q; do {

q=stack[j];

if (IsVt(stack[j-1])) j--; else j-=2; } while(!IsLowerThan(stack[j],q); NewVn=Reduce(stack[j+1],stack[k],k-j);

k=j+1; /* reduce the leftmost prime phrase */ stack[k]=NewVn; /* it is stack[j+1] stack[j+2] … stack[k] */ } /*end of while*/

if (IsLowerThan(stack[j],r)) || IsEqualTo(stack[j],r)) stack[++k]=r; else return ERROR; } while (r!=′#′); return RIGHT; }

程序三给出的仅是采用算符优先分析方法的示意性识别算法,还有许多工作要做。如:首先要确定一种合适的数据结构,以便构造所给文法G2[<算术表达式>]的机内表示。然后,构造该文法的算符优先关系矩阵,在此可以根据算术表达式中各算符的优先级和结合性,直接手工构造算符优先关系。最后,编写程序三中所用到的各个函数,完成整个算符优先语法分析器的开发。

4、示例四:SLR(1)分析器的开发。

首先,对于分析对象,即算术表达式的文法G2[E],引入一个新的开始符号E’,得到G2[E]的拓广文法G2’[E’]:

0. E’→E 1. E→E+T 2. E→E-T 3. E→T 4. T→T*F 5. T→T/F 6. T→F 7. F→(E) 8. F→i

求出文法中各个非终结符号的FOLLOW集如下:

Follow(E)={#,),+,-} Follow(T)={#,),+,-,*,/} Follow(F)={#,),+,-,*,/}

然后,根据文法G2’[E’]构造识别其全部活前缀的DFA,以便据此构造SLR(1)分析表,参见表III。

表III G2’[E’]的SLR(1)分析表

状态 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ( S4 S4 S4 S4 S4 S4 ) R3 R6 R8 S15 R1 R2 R4 R5 R7 + S6 R3 R6 R8 S6 R1 R2 R4 R5 R7 ACTION - * S7 R3 R6 R8 S7 R1 R2 R4 R5 R7 S8 R6 R8 S8 S8 R4 R5 R7 / S9 R6 R8 S9 S9 R4 R5 R7 i S5 S5 S5 S5 S5 S5 # Acc R3 R6 R8 R1 R2 R4 R5 R7 GOTO E T F 1 10 2 2 11 12 3 3 3 3 13 14 最后,编程实现SLR(1)分析表的驱动程序,即开发LR分析器的总控程序,完成对算术表达式的识别。

实验三 语义分析程序实现

一、实验目的与要求

在实现词法、语法分析程序的基础上,编写相应的语义子程序,进行语义处理,加深对语法制导翻译原理的理解,进一步掌握将语法分析所识别的语法范畴变换为某种中间代码(四元式)的语义分析方法,并完成相关语义分析器的代码开发。

二、一般实现方法

语法制导翻译模式是在语法分析的基础上,增加语义操作来实现的,实际上是对前后文无关文法的一种扩展。一般而言,首先需要根据进行的语义分析工作,完成对给定文法的必要拆分和语义动作的编写,从而为每一个产生式都配备相应的语义子程序,以便在进行语法分析的同时进行语义解释。即在语法分析过程中,每当用一个产生式进行推导或归约时,语法分析程序除执行相应的语法分析动作之外,还要调用相应的语义子程序,以便完成生成中间代码、查填有关表格、检查并报告源程序中的语义错误等工作。每个语义子程序需指明相应产生式中各个符号的具体含义,并规定使用该产生式进行分析时所应采取的语义动作。这样,语法制导翻译程序在对源程序从左到右进行的一遍扫描中,既完成语法分析任务,又完成语义分析和中间代码生成方面的工作。本实验要求从编译器的整体设计出发,重点通过对实验二中语法分析程序的扩展,完成一个编译器前端程序的编写、调试和测试工作,形成一个将源程序翻译为中间代码序列的编译系统。

三、实验内容

基本实验题目:对文法G2[<算术表达式>]中的产生式添加语义处理子程序,完成无符号数的四则运算的计值处理,将输入的四则运算转换为四元式形式的中间代码。

输入:包含测试用例(如由无符号数和+、?、*、/、(、)构成的算术表达式)的源程序文件。

输出:将源程序转换为中间代码形式表示,并将中间代码序列输出到文件中。若源程序中有错误,应指出错误信息。

扩展实验:在所给文法G2的基础上,增加语义分析的范围,如运算对象不再只局限于常量(和简单变量),还可以是函数调用、数组元素等。另外,可进一步选择赋

值语句、流程控制语句等其它语法结构类型进行语义分析。

四、要求

1、上机前的准备:完成语法制导翻译系统的程序流图设计,并编写语义动作。 2、调试:结合实验一和实验二中的相关内容,完成编译器前端程序的调试工作。 3、测试:对完成的编译系统要进行全面测试,供测试的例子应包括符合语义规则的语句,以及分析程序能够判别的若干错例,并给出执行结果。

4、结果输出:将所涉及到的分析过程中的信息,即词法、语法、语义分析的结果输出到文件中。对于有错误的输入字符串,应有较为明确的信息告诉外界。

五、参考实现方法

示例:对文法G2[<算术表达式>]在利用递归下降法进行语法分析的同时,生成四元式形式的中间代码序列。其语法制导翻译程序的核心部分(指表达式E、项T和因式F的处理)的算法思想,可用程序四所示的框架描述。

程序四 利用递归下降法生成简单算术表达式的四元式序列

E( ) /* 识别<算术表达式> */ {

E1_PLACE=T( ); /*调用T( )分析产生算术表达式计算的第一项E1*/ while (SYM=’+’ || SYM=’-’) {

ADVANCE; /*使输入串指针指向下一个输入符号,即调用扫描器读入下一个单词符号*/ E2_PLACE=T( ); /*调用T( )分析产生算术表达式计算的第二项*/ T1=NewTemp( ); /*分配一个新的临时变量,以便存储计算结果*/

GEN(±, E1_PLACE, E2_PLACE, T1); /*根据所给实参产生一个四元式,送入四元式表*/ E1_PLACE=T1; /*将计算结果作为下一次表达式计算的第一项*/ }

return E1_PLACE; }

T( ) /* 识别<项>*/ {

T1_PLACE=F( );

while (SYM=’*’ || SYM=’/’) {

ADVANCE;

T2_PLACE=F( ); T1=NewTemp( );

GEN(*/, T1_PLACE, T2_PLACE, T1); T1_PLACE=T1; }

return T1_PLACE; }

F( ) /* 识别<因式>*/ {

if (SYM=’标识符’) /*在此设运算对象i为标识符,即简单变量*/ {

ADVANCE;

return Entry(i.词文); /*以标识符的词文为名字查、填符号表,可理解为返回标识符的值*/ } else

if ( SYM=’(’ ) {

ADVANCE; PLACE=E( ); if ( SYM=’)’ ) {

ADVANCE; return PLACE; }

else ERROR; /*例如:输出“缺少‘)’错误”*/ }

else ERROR; /*例如:输出“算术表达式应以‘标识符’或‘(’开头”*/

}

说明:

① 程序四中出现的主要语义变量和辅助函数的功能为:

E1_PLACE:文法符号E1的一个语义属性,用于描述变量在符号表中登记项的序号(>0时)或临时变量的编号(<0时),可理解为代表其值。

void GEN(char *Op, char *Arg1, char *Arg2, char *Result):用来生成一个四元式,将其送到四元式表中。参考代码如下:

void GEN(char *Op, char *Arg1, char *Arg2, char *Result) {

strcpy (pQuad[NXQ].op, Op); /*pQuad为全局变量,是用于存放四元式的数组*/ strcpy (pQuad[NXQ].arg1, Arg1); strcpy (pQuad[NXQ].arg2, Arg2); strcpy (pQuad[NXQ].result, Result);

NXQ++; /*全局变量NXQ用于指示所要产生的下一个四元式的编号*/ }

char *NewTemp(void):产生临时变量的函数,每调用一次都产生一个新的临时变量,并返回这个新的临时变量名,临时变量名产生的顺序依次为T1、T2、T3、……。例如:

char *NewTemp(void) /*产生一个临时变量*/ {

char *TempID=(char *)malloc(MAXLENGTH);

sprintf (TempID, “T%d”, NXTemp++); /*整型变量NXTemp指示临时变量的编号*/ return TempID; }

② 注意修改已在前面两个实验中完成的词法、语法分析器,以便在此基础上进行语义分析。如有必要,从总体设计的角度出发,重新定义整个系统所需要的一些数据结构、宏和全局变量等。例如:

/*定义与词法分析器的接口*/

union WORDCONTENT /*存放单词词文内容的联合*/

{

char Val1[MAXLENGTH]; /*对于标识符、关键字或由一个以上字符组成的复合单词结构的

词文(如:=、<=、<>等),采用字符串作为其值的内部表示*/

int Val2; /*对于数值常量采用其二进制值作为它们的内部表示*/ float Val3;

char Val4; /*记录由一个字符组成的单词的词文(如+、-、*、/ 等)*/ };

struct WORD /*单词的二元式形式表示*/ {

int Sym; /*单词的类别编码*/

union WORDCONTENT value; /*单词的值*/

}word; /*word存放由词法分析程序扫描得到的二元式形式的单词*/

/*定义语法(语义)分析器的接口*/

struct QUATERNION /*四元式表的结构*/ {

char op[MAXLENGTH]; /*操作符*/

char arg1[MAXLENGTH]; /*第一个操作数*/ char arg2[MAXLENGTH]; /*第二个操作数*/ char result[MAXLENGTH]; /*运算结果*/ }*pQuad; /*存放四元式的数组*/

这样用于处理表达式、项和因式的函数原型可分别写为char *E(void)、char *T(void)和char *F(void)。在此仅给出处理表达式的函数的参考代码:

char *E(void) {

char opp[2], *E1_place, *E2_place, *Temp_place; E1_place=T( );

while (word.Sym==PL || word.Sym==MI) /*单词为’+’或’?’*/ {

sprintf(opp, ”%c”, word.value.Val4);

scanner( ); /*调扫描器读下一个单词,并将其二元式形式的表示送入全局变量word中*/ E2_place=T( );

Temp_place=NewTemp( );

GEN(opp, E1_place, E2_place, Temp_place); E1_place=Temp_place; }

return E1_place; }

本文来源:https://www.bwwdw.com/article/luh3.html

Top