计算机组成与结构试卷 - 一

更新时间:2024-04-07 21:26:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

计算机组成与结构试卷 一

问答题

1、把十进制数0.15表示成32位规格化浮点数形式,浮点数的格式如下:

尾数:23位(另外有1个隐尾数符号1阶码:8位,用整数、 移藏位),用小数、 原码表示,位 码表示,基值为2 基值为2 尾数符号1位 阶码:8位,用整数、 移码表示,基值为2 尾数:23位(另外有1个隐藏位),用小数、 原码表示,基值为2

(1)用16进制分别写出这个规格化浮点数的阶码、尾数和完整的浮点数。 (2)如果采用恒置\舍入法,这个规格化浮点数的相对误差是多少?

2、在一台采用指令取消技术的RISC处理机上执行下面一段程序。每条指令的执行过程都要经过\取指令\和\执行\两个周期,每个周期的延迟时间均为10ns。

MOVE R1,#50000 ;R1←常数50000

LOOP:MOVE R2,A(R1) ;R2←从内存中取一个数 ADD R0,R2 ;R0←(R0)+(R2)

DNE R1,LOOP ;R1←(R1)-1,若(R1)≠0,则转向LOOP (1)为了采用指令取消技术,改写上面的程序。

(2)计算采用指令取消技术执行上面的程序能够节省多少时间?

3、用16M字×8位的存储芯片构成一个64M字×16位的主存储器。要求既

1

能够扩大存储器的容量,又能够缩短存储器的访问周期。 (1)计算需要多少个存储器芯片。

(2)存储器芯片和主存储器的地址长度各需要多少位? (3)画出用存储器芯片构成主存储器的逻辑示意图。

(4)用16进制表示的地址1234567,其体内地址和体号是多少?

4、在页式虚拟存储器中,一个程序由P1~P6共6个页面组成,系统分配给这个程序的主存只有4个页面。在程序开始执行之前,P1至P4已经装入主存。程序执行过程中依次访问到的页面如下:P1,P2,P3,P4,P5,P3,P6,P5,P2,P1,P5,P2,P4,P1。分别采用LRU和OPT页面替换算法对这4页主存进行调度。

(1)画出主存页面替换和命中的情况表。 (2)计算两种页面替换算法的页命中率。

(3)假设每个数据平均被访问10次,采用LRU页面替换算法,为了使页面失效率小于10,计算页面大小至少应该为多少?

5、在一个采用组相联映象方式的Cache系统中,主存和Cache均按字节编址,按字访问,字长为64位。Cache的容量为256KB,主存的容量为64MB。Cache的每一组有8块,每块有8个字。要求采用按地址访问方式构成相联目录表,实现主存地址到Cache地址的变换,并采用8个相等比较电路。 (1)给出主存和Cache的地址格式,并标出各字段的长度。 (2)计算相联目录表的地址个数。

(3)设计相联目录表每个地址中所存内容的格式,并标出每一个字段的长度。

2

-5

(4)计算每个比较电路的位数。

(5)Cache地址的哪些字段可从主存地址直接得到?哪些字段必须从相联目录表得到?

6、在一台单流水线处理机上执行下面的程序。每条指令都要经过\取指令\、\译码\、\执行\和\写结果\个流水段,每个流水段的延迟时间都是5ns。执行部件的输出端有直接数据通路与它的输入端相连接,执行部件产生的条件码也直接送入控制器。

K1: MOVE R1, #4 ;R1←向量长度4

K2:LOOP:MOVE R2, A(R1) ;R2←A向量的一个元素 K3: ADD R0, R2 ;R0←(R0)+(R2)

K4: DNE R1, LOOP ;R1←(R1)-1,若(R1)≠0转向LOOP K5: MOVE SUN,R0 ;SUN←(R0),保存结果

(1)列出指令之间的所有数据相关,包括读写、写读和写写数据相关。 (2)采用预测转移不成功的静态分支预测技术,画出指令流水线的时空图(可用指令序号表示),并计算流水线的吞吐率、加速比和效率。

(3)采用预测转移成功的静态分支预测技术,计算指令流水线的吞吐率、加速比和效率。

7、一条3个功能段的非线性流水线的预约表如下:

段\\周期 S1

1 X 2 3 X 4 5 6 X 3

S2 S3

X X X (1)写出禁止向量和初始冲突向量。 (2)画出调度流水线的状态图。

(3)求最小启动循环和最小平均启动距离。 (4)求启动距离最小的恒定循环。 (5)画出流水线各功能段之间的连接图。

(6)通过插入非计算延迟使流水线达到最优调度,计算该流水线的最佳启动循环。

(7)画出插入非计算延迟使流水线达到最优调度的流水线预约表。

8、在下列不同类型的处理机上做向量运算:D=(A+B)*C,向量长度均为4,每个周期的时间为10ns。分别计算所需的最短时间,写出简要计算过程。 (1)SISD单处理机,有一个通用运算部件,每3个周期做完一次加法,或每4个周期做完一次乘法。

(2)流水线处理机,有一条两功能静态流水线,加法经过其中的3段,乘法经过其中的4段,每段的延迟时间均为一个周期。

(3)向量处理机,有独立的加法器和乘法器,加法器采用3段流水线,乘法器采用4段流水线,每段的延迟时间均为一个周期,采用向量链接方式工作。 (4)SIMD并行计算机,有4个PE,每个PE有一个通用运算部件,每3个周期做完一次加法,或每4个周期做完一次乘法。不计PE之间传送数据所用的时间。

4

问答第1题 解:

[0.15]10=[0.0010011001……]2 2分

(1)16进制规格化浮点数的阶码为7E 2分 尾数为999999 2分 完整的浮点数为3F199999 2分

(2)采用衡置\法,这个规格化浮点数的相对误差是 -2-2-2-2… 2分 或 -(0.6)×2 = 3.58×10

问答第2题 解:

(1)采用指令取消技术,程序如下: 4分 MOVE R1,#50000 ;R1←常数50000 MOVE R2,A(R1) ;R2←从内存中取一个数 LOOP: ADD R0,R2 ;R0←(R0)+(R2)

DNE R1,LOOP ;R1←(R1)-1,若(R1)≠0,则转向 LOOP

MOVE R2,A(R1) ;R2←从内存中取一个数 (2)采用指令取消技术执行上面的程序能够节省:10ns×(50000-1)=0.4999ms 2分

问答第3题 解:

-24

-8

-25

-28

-29

-32

5

(1)需要存储器芯片:

(2)存储器芯片的地址长度为24位 2分 主存储器的地址长度为26位 2分

2分

(3)用存储器芯片构成主存储器的逻辑示意图如下: 4分

(4)用16进制表示的地址1234567,其体内地址为:48D159,体号为3 2分

问答第4题 解:

(1)主存页面的替换和命中情况如下表: 2分+2分 时间1 2 3 4 5 6 7 8 9 10 11 12 13 14 t 页地P1 P2 P3 P4 P5 P3 P6 P5 P2 P1 P5 P2 P4 P1 址流 1 1 1 1 5 5 5 5 5 5 5 5 5 5 2 2 2 2 2 2 6 6 6 6 6 6 4 4 LRU3 3 3 3 3 3 3 3 3 1 1 1 1 1 算法

6

4 4 4 4 4 4 4 4 2 2 2 2 2 2 命命命命替命替命替替命命替命 中 中 中 中 换 中 换 中 换 换 中 中 换 中 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 4 4 OPT3 3 3 3 3 3 6 6 6 6 6 6 6 6 算法 4 4 4 4 5 5 5 5 5 5 5 5 5 5 命命命命替命替命替替命命替命 中 中 中 中 换 中 换 中 换 换 中 中 换 中 (2)LRU页面替换算法的页命中率为9/14, 2分 OPT页面替换算法的页命中率为11/14 2分 (3)

问答第5题 解:

(1)主存地址的格式: 2分 8位 区号E 9位 区内组号G 3位 组内块号B 6位 块内地址W ,把HP=9/14代入,解得页面大小至少为P > 3571字 2分

Cache地址格式: 2分

9位 组号g

3位 组内块号b 6位 块内地址w 7

(2)相联目录表的地址个数是512 2分

(3)相联目录表每个地址的格式:共8组,每组3个字段 2分

11 E, B 3 1 b e 11 E, B 3 1 b e …… 11 E, B 3 1 b e (4)每个比较电路的位数是11位。 2分

(5)Cache地址组号g字段和块内地址w可从主存地址直接得到 组内块号字段必须从相联目录表得到 2分

问答第6题

解: 3分(每个0.5分)

(1)指令K1与指令K2之间关于R1的写读数据相关(第1次循环) 指令K1与指令K4之间关于R1的写读数据相关(第1次循环) 指令K1与指令K4之间关于R1的写写数据相关(第1次循环) 指令K2与指令K3之间关于R2的写读数据相关(每次循环内) 指令K2与指令K4之间关于R1的读写数据相关(第次循环内) 指令K3与指令K5之间关于R0的写读数据相关(最后一次循环) 另外,相邻循环体之间的数据相关还有: 以下共计1分 指令K4与下一循环的指令K2之间关于R1的写读数据相关 指令K3与下一循环的指令K2之间关于R2的读写数据相关 指令K2与下一循环的指令K2之间关于R2的写写数据相关 指令K3与下一循环的指令K3之间关于R0的写读数据相关 指令K3与下一循环的指令K3之间关于R0的读写数据相关

8

指令K3与下一循环的指令K3之间关于R0的写写数据相关 指令K4与下一循环的指令K4之间关于R1的写读数据相关 指令K4与下一循环的指令K4之间关于R1的读写数据相关 指令K4与下一循环的指令K4之间关于R1的写写数据相关 (2)采用预测转移不成功的静态分支预测技术 2分 3分(每个1分)

(3)采用预测转移成功的静态分支预测技术 3分(每个1分)

问答第7题 解:

(1)禁止向量为:(2,3,5) 2分 初始冲突向量为:10110

9

(2)调度流水线的状态图 2分

简单循环 平均启动距离 (1,6) 3.5 (4,6) 5 (4) 4 (6) 6

(3)流水线的最小启动循环为(1,6) 2分 最小平均启动距离为3.5 (4)启动距离最小的恒定循环为4 2分 (5)画出流水线各功能段之间的连接图。 2分

(6)插入非计算延迟后,流水线的最佳启动循环(3) 2分 (7)插入非计算延迟后的流水线预约表如下: 2分

1 2 3 4 5 6 7 8 S1 X X X S2 X X 10

S3 D1 D2

X X X 问答第8题 解:

(1)10ns×4×(3+4)= 280ns,4次加法和4次乘法串行执行 2分 (2)10ns×(6+7)= 130ns,流水线执行4次加法需要6个周期,流水线执行4次乘法需要7个周期 2分

(3)10ns×(7+3)= 100ns,得到第1个结果需要7个周期,另外3个结果需要3个周期 2分

(4)10ns×(3+4)= 70ns,每个PE同时执行1次加法和1次乘法 2分 问答题

1、(14分)一种16位短浮点数的格式如下。已知二进制数A=0.0101,十进制数B=0.2。

尾数符阶码:6位,用整数、尾数:9位(另外有1个隐藏位),号1位 移码表示,基值为2 用小数、 原码表示,基值为2 (1)

写出这种浮点数能表示的最大规格化正数、最大规格化负数、表示数的精度和效率。

11

(2)把A表示成规格化浮点数形式(最终结果用16进制表示)。 (3)把B表示成规格化浮点数形式(最终结果用16进制表示)。

(4)按照浮点数加法规则计算A-B。保留1个警戒位,写出主要计算过程。

2、(12分)某RISC处理机的工作主频为500MHz,有一个Cache和一个主存储器,Cache的存取周期为2ns,主存储器的存取周期为20ns,Cache的命中率为99%,有20%的LOAD/STORE指令,并假设处理机速度的瓶颈完全在存储系统。

(1)求理想情况(Cache的命中率为100%)下的CPI。 (2)计算该RISC处理机的实际MIPS速率。

(3)如果处理机的工作主频提高到1GHz,计算实际CPI和MIPS速率。

3、(14分)在一个Cache存储系统中,Cache的访问周期、存储容量和价格分别为5ns、256KB和50元/MB,主存储器的访问周期、存储容量和价格分别为30ns、128MB和5元/MB,当块的大小为1个字时,存储系统的命中率为0.8。当把块大小增加到4个字时,存储系统的访问效率达到0.95。

(1)计算这个Cache存储系统的等效存储容量和单位容量的等效价格。 (2)当块的大小为1个字时,计算这个存储系统的等效访问周期和访问效率。

(3)当存储系统的访问效率达到0.95时,命中率和等效访问周期提高到多

12

少?

(4)为了使存储系统的访问效率达到0.95,Cache中每个字的平均访问次数至少为几次?

4、(12分)一个虚拟存储系统最多运行64个用户程序,每个用户程序最大不超过4096页,每页16KB,主存储器的容量为128MB。为了加快地址变换过程,采用快慢表结构,快表的容量为32个存储字,快表地址经散列函数变换得到。为检测散列冲突,采用一个相等比较器。 (1)写出虚拟地址的格式,标出各字段的名称和长度。 (2)写出主存地址的格式,标出各字段的名称和长度。 (3)相等比较器的位数是多少?

(4)写出快表每个字的格式,标出各字段的名称和长度。

5、(12分)一个磁盘存储器的存储容量为16GB(1GB=2Byte),有8个盘片(16个数据面),每条磁道有512个扇区,每个扇区512个字节,每分钟8000转,定位时间(寻道时间)为4.25ms。 (1)计算这个磁盘存储器的数据传输率。 (2)这个磁盘存储器有多少个柱面(磁道)?

(3)这个磁盘存储器的寻址时间(包括定位时间和等待时间)是多少?

13

30

6、(12分)某处理机共有4个中断源,这4个中断源D1、D2、D3、D4的中断优先级从高到低分别是1级、2级、3级和4级。当4个中断源同时申请中断服务时,请针对下列各题的要求为4个中断源设置中断屏蔽码。\表示对应的中断源被屏蔽,\表示开放;如果与对应的中断源无关,务必用\

(1)处理机响应中断服务请求和实际为各中断源服务的先后次序均为D1、D2、D3、D4。

(2)处理机响应中断服务请求的次序为D1、D2、D3、D4,而处理机实际为各中断源服务的先后次序为D4、D3、D2、D1。

(3)处理机响应中断服务请求的次序为D1、D3、D2、D4,而处理机实际为各中断源服务的先后次序为D2、D4、D3、D1。

7、(12分)在一台单发射流水线处理机中,指令ADD经过IF、ID、ADD和WR共4个流水段,指令MUL经过IF、ID、MUL1、MUL2、MUL3和WR共6个流水段,两条指令均在ID流水段读源操作数,在WR流水段写结果。采用顺序发射乱序完成调度方式。

(1)采用三地址R-R-R型指令,指令ADD和MUL之间的哪几种数据相关可能造成流水线停顿?写出典型指令序列。

(2)采用两地址R-R型指令,指令ADD和MUL之间的哪几种数据相关可能造成流水线停顿?写出典型指令序列。

(3)对于造成流水线停顿的数据相关,给出解决的方法。

14

8、(12分)分别在下列几种不同类型的处理机上计算表达式 ,

求最短执行时间。取指令、取操作数、译码和写结果等时间均忽略不计。 (1)向量处理机,有独立的加法器和乘法器,加法器的延迟时间为5ns,乘法器采用4段流水线,每段的延迟时间均为5ns。

(2)向量处理机,有独立的加法器和乘法器,加法器采用3段流水线,乘法器采用4段流水线,每段的延迟时间均为5ns。

(3)SIMD并行处理机,每个PE内有一个ALU,完成一次加法需要10ns,或完成一次乘法需要20ns。8个PE连接成单向环结构,在相邻PE之间传送一个数据需要5ns。操作数Ai和Bi最初始存放在PEi mod 8中,其中i=0,1,…,19。 (4)分布存储器的MIMD多处理机,每个CPU内有一个ALU,完成一次加法需要10ns,或完成一次乘法需要20ns。8个CPU连接成超立方体网,在相邻CPU之间传送一个数据需要5ns,操作数Ai和Bi最初存放在PEi mod 8中,其中i=0,1,…,19。 问答题答案 问答第1题 解答:

(1) 4分=1+1+1+1

能表示的最大规格化正数为:0.1111111111x2或(1-2)x 2 能表示的最大规格化负数为:-0.5x2 表示数的精度:2

-10

-32

31

-10

31

表示数的效率:100%

15

(2) 3分 符号0,阶码011111(即-1),尾数010000000(已经去掉隐藏位) 用16进制表示的规格化浮点数A为:3E80

(3) 3分 [0.2]10=[0.00110011…]2 符号0,阶码011110(即-2),尾数100110011(已经去掉隐藏位)

用16进制表示的规格化浮点数B为:3D33 (4) 4分=1+1+1+1

对阶:B的尾数右移1位,阶码加1,并恢复隐藏位; 0 011111 0110011001 1 最后1位为警戒位 尾数加:

A的尾数:0 1010000000 恢复隐藏位 B的补码:1 1001100110 1 A-B的尾数:0 0011100110 1

规格化:尾数左移2位,阶码减2,去掉隐藏位

0 011101 110011010 表示成16进制规格化浮点数:3B9B

问答第2题 解答:

(1) 3分 CPI=2nsx(2nsx20%)x500MHz=1.2

(2) 3分 MIPS=1/(2nsx99%+20nsx1%+2nsx20%x99%+20nsx20%x1%) =1/2.616ns=382.3 (3) 6分=3+3

CPI=(2nsx99%+20nsx1%+2nsx20%x99%+20nsx20%x1%)x1GHz =2.616nsx1GHz=2.616

16

MIPS=1/2.616ns=382.3

问答第3题 解答:

(1) 4分=2+2 等效存储容量:S=128MB

单位容量的等效价格: C=(Cc Sc + Cm Sm)/(Sc + Sm) =(50×0.25+5×128)/(0.25+128) =5.088(元/MB) (2) 4分=2+2

等效访问周期: T=Tc H + Tm(1-H) =5ns×0.8 + 30ns×(1-0.8) =10ns

访问效率: e=Tc/T =5/10 =0.5 (3)4分=2+2 命中率:

等效访问周期为:

(4) 2分 Cache中每个字的平均访问次数至少为:

问答第4题 解答:

(1)虚拟地址的格式,各字段的名称和长度 3分

17

解得:H=0.9895

6位 用户程序号 12位 虚页号 14位 页内地址 (2)主存地址的格式,各字段的名称和长度 3分

13位 主存实页号 14位 页内地址 (3)相等比较器的位数:6+12=18(位) 3分

(4)快表每个存储字的格式,标出各字段的名称和长度 3分

6位 用户程序号

问答第5题 解答: (1) 4分

这个磁盘存储器的数据传输率为: 512B x 512x 8000/60=33.3MB/S 或:512B x 512x 8000/60=35MB/S

(2) 4分 这个磁盘存储器的柱面数为: N = 16MB/(512Bx 16x 512)= 4096 (3) 4分 这个磁盘存储器的寻址时间为: 等待时间为:60/8000/2=3.75ms

寻址时间为:定位时间+等待时间=4.25ms+3.75ms=8ms

问答第6题 解答:

18

12位 虚页号 13位 主存实页号

(1) 4分=0.25x16 (2) 4分=0.25x16 (3) 4分=0.25x16 中中断优先断级 源 D1 1级(最高) D2 D3 2级 3级 x 1 1 1 x x 1 1 x x x 1 x x x x x 0 x x x x 0 x x x x 0 x x x x x 1 0 x x x x 1 x 0 x 0 x x x x (1)D1 D2 D3 D4 (2)D1 D2 D3 D4 (3)D1 D2 D3 D4 中断源被屏蔽中断源被屏蔽中断源被屏蔽D4 4级(最低)

问答第7题 解答:

(1) 4分=2+2 由于采用顺序发射调度方式,因此,读写数据相关不会造成流水线停顿。 可能造成流水线停顿的有写读数据相关和写写数据相关,指令序列如下:

19

(2) 4分=2+2 由于采用顺序发射调度方式,因此,读写数据相关不会造成流水线停顿。 由于写写数据相关必然伴随有写读数据相关,只要满足了写读数据,写写数据相关也就不存在了。 因此,可能造成流水线停顿的只要考虑写读数据相关,指令序列如下:

指令MUL的流水段ID由于写读数据相关要延迟2个周期,写写数据相关不会造成流水线停顿。

写数据相关必然伴随有写读数据相关,由于写读数据相关,指令ADD的流水段ID要延迟4个周期,因此,写数据相关就不会造成流水线停顿。

(3) 4分=2+1+1

方法1:增加专用数据通路。 对于\写读数据相关指令序列1\,在流水段ADD

20

的输出端增加一条专用数据通路到MUL1,这个写读数据相关就不会造成流水线停顿。 对于\写读数据相关指令序列2\,在流水段MUL3的输出端增加一条专用数据通路到ADD,可以使ADD操作少延迟2个流水段,但仍然有两个流水段的停顿。

方法2:发生数据相关的指令推后执行(需要退后的2个周期或4个周期)。 方法3:通过编译器在发生数据相关的两条指令之间插入不发生数据相关的其他指令(需要插入2条或4条指令)。

问答第8题 (1) 3分

20个乘法和20个加法,流水线链接装入时间5个流水段,以后每个流水段输出一个加法结果。 T=5ns(1+4+19)=120ns 或

20个乘法和19个加法,完成开始两个乘法用5个流水段,输出第一个加法结果用6个流水段,以后每个流水段输出一个加法结果。 T=5ns(6+18)=120ns (2) 3分

由于20个乘法之间没有数据相关,因此,从第4个流水段开始,每个流水段输出一个乘法结果。共有20个加数需要求和,从第5个流水段开始进行加法,加法的时空图如下

21

T=5nsx31=165ns (3) 3分

PE0~PE3做3次乘法、2次加法,PE4~PE7做2次乘法、1次加法,共用80ns; PE7→PE6、PE5→PE4、PE3→PE2、PE1→PE0,并做加法,共用15ns; PE6→PE4、PE2→PE0,并做加法,共用20ns; PE4→PE0,并做加法,共用30ns。

T=20nsx3+10nsx2+(5ns+10ns)+(10ns+10ns)+(20ns+10ns) =145ns

(4) 3分 CPU4~CPU7做2次乘法、1次加法,用50ns,CPU7→CPU6、CPU5→CPU4,并做加法,用15ns,CPU6→CPU4,并做加法,用15ns;共用80ns。同时,CPU0~CPU3做3次乘法、2次加法,也用80ns。这时,共有5个结果分布于CPU0~CPU4中,共用时80ns。

CPU1→CPU0、CPU2→CPU3,并做加法,同时CPU4→CPU0,用15ns。 CPU0做加法,同时CPU3→CPU0,用10ns。

CPU0做加法,用10ns。 T=80ns+15ns+10ns+10ns =115ns 问答题

1、一种短浮点数的字长共16位(二进制),从高位到低位分别是:符号1位,阶码7位(包括符号位),尾数8位。尾数用原码、小数表示,阶码用

22

移码、整数表示。尾数和阶码的基值都是2。有如下两个浮点数:A=1.0001x2和B=-0.11001x2。

(1)把这两个数分别表示成规格化浮点数形式。

(2)按照浮点数加法运算规则,计算这两个浮点数的和。

-1

2

2、一台实验计算机共有5种指令、8个通用数据寄存器,这5种指令的使用频度分别为35%、25%、20%、10%、10%。

(1)要求操作码的平均长度最短,请设计操作码编码,并计算所设计操作码的实际平均长度。

(2)要求设计8位字长的两地址寄存器-寄存器型指令3种,16位字长的寄存器-存储器型指令两种,其中,存储器地址采用直接寻址方式。请设计指令格式,给出5种指令的操作码编码、各个字段的长度和名称。

3、在一个Cache存储系统中,主存储器的访问周期、存储容量和单位价格分别为60ns、64MB和10元/MB,Cache的访问周期、存储容量和单位价格分别为10ns、512KB和100元/MB,Cache的命中率为0.98。

(1)计算这个Cache存储系统的等效访问周期、存储容量和单位价格。 (2)计算这个Cache存储系统的访问效率。

4、一个虚拟存储系统最多有64个用户,每个用户程序最大不超过8192页,每页4KB,主存储器的容量为64MB。为了加快地址变换过程,采用快慢表结

23

构,快表的容量为64个存储字,快表地址经散列函数变换得到。为避免散列冲突,采用一个相等比较器。

(1)写出虚拟地址的格式,标出各字段的名称和长度。 (2)写出主存地址的格式,标出各字段的名称和长度。 (3)相等比较器的位数是多少?

(4)写出快表每个存储字的格式,标出各字段的名称和长度。

5、有4个中断源D1、D2、D3、D4,它们的中断优先级和中断屏蔽码见下表,表中,\表示该中断源被屏蔽,\表示该中断源开放。假设从处理机响应中断源的中断服务请求到运行中断服务程序中第一次开中断所用的时间为1微秒,其它中断服务时间为10微秒。 中断源 D1 D2 D3 D4

(1)当4个中断源同时申请中断服务时,写出处理机响应各中断源的中断请求的先后顺序和处理机实际为各中断源服务的先后顺序。

(2)处理机在0时刻开始响应中断请求,这时4个中断源都已经申请中断服务,写出处理机开始响应各中断源的中断请求和处理机为各中断源完成中断服务的时间。

24

中断优先级 1(最高) 2(第二) 3(第三) 4(最低) 中断屏蔽码D1 D2 D3 D4 1 1 0 0 0 1 0 1 1 0 1 0 1 0 1 1

(3)处理机在0时刻开始响应中断请求,这时中断源D3和D4已经申请中断服务,在6微秒时中断源D1和D2同时申请中断服务,写出处理机开始响应各中断源的中断请求和处理机为各中断源完成中断服务的时间。

6、一个磁盘存储器共有6个盘片(12个存储面),每面有4096条磁道,每条磁道有256个扇区,每个扇区512个字节,每分钟7200转,定位时间(寻道时间)为8ms。

(1)计算这个磁盘存储器的存储容量。

(2)磁盘存储器的寻址时间(包括定位时间和等待时间)是多少? (3)在寻址完成之后,磁盘存储器的数据传输率是多少?

7、一条浮点加法流水线由对阶、尾数加和规格化三个流水段组成,每个流水段的时间均为2ns。流水线的输出端有直接数据通路与输入端相连,并且设置有缓冲寄存器用以保存中间运算结果。用这条流水线计算8个浮点数的和:S=A1+A2+A3+A4+A5+A6+A7+A8。画出流水线的时空图,并计算流水线的吞吐率、加速比和效率。

8、在一台每个时钟周期发射两条指令的超标量处理机上运行下面一段程序,所有指令都要经过\取指令\、\译码\、\执行\和\写结果\个阶段,其中,\取指令\、\译码\和\写结果\三个阶段各为一个流水段,其延迟时间都为2ns。

25

在\执行\阶段,LOAD操作和AND操作各延迟2ns,ADD操作延迟4ns,MUL操作延迟6ns,4种操作部件各设置一个。ADD部件和MUL部件都采用流水线结构,每一级流水线的延迟时间都为2ns。

(1)列出这个程序中所有的数据相关,包括写读数据相关、读写数据相关和写写数据相关。

(2)如果所有运算型指令都在\译码\流水段读寄存器,在\写结果\流水段写寄存器,采用顺序发射顺序完成调度方法,画出流水线的时空图,并计算执行这个程序所用的时间。 (3)如果所有运算型指令都在\译码\流水段读寄存器,在\写结果\流水段写寄存器,采用顺序发射乱序完成调度方法,画出流水线的时空图和各条指令完成的时间图,并计算执行这个程序所用的时间。 (4)如果每个操作部件的输出端都有直接数据通路与输入端相连,采用顺序发射乱序完成调度方法,画出流水线的时空图和各条指令完成的时间图,并计算执行这个程序所用的时间

问答第1题

(1)浮点数A的规格化形式:0 1000011 10001000 浮点数B的规格化形式:1 0111111 11001000

(2)对阶,浮点数B的尾数右移4位,阶码加4,最右边一位是警戒位: 1 1000011 11110011 1

26

尾数加:

规格化,尾数左移1位,阶码减1,两个浮点数之和的规格化形式为: 0 1000010 11110111

问答第2题

(1)采用Huffma编码法 操作码平均长度: H=(0.35+0.25+0.20)×2+(0.10+0.10)×3=2.20

指令序号 1 2 3 4 5 指令使用频度 0.35 0.25 0.20 0.10 0.10 操作码编码 00 01 10 110 111 (2) 5种指令的格式、操作码编码、各字段的长度和名称

R-R型指令

目的寄存器(3操作码(2位) 源寄存器(3位) 位) 00 Rd Rs 27

1 R-R型指令01 Rd Rs 2 R-R型指令10 Rd Rs 3 操作码(3位) 寄存器(3位) 主存地址(10位) R-M型指令110 R A 1 R-M型指令111 R A 1

问答第3题

(1)这个Cache存储系统的等效访问周期: T=Tc H + Tm(1-H)

=10ns×0.98 + 60ns×(1-0.98) =11ns 等效存储容量: S=64MB 等效单位价格:

C=(Cc Sc + Cm Sm)/(Sc + Sm) =(100×0.5+10×64)/(0.5+64) =10.7(元/MB)

28

(2)这个Cache存储系统的访问效率: e=Tc/T =10/11 =0.91

问答第4题

(1)虚拟地址的格式,各字段的名称和长度

6位 13位 12位 用户号 虚页号 页内地址 (2)主存地址的格式,各字段的名称和长度

14位 12位 主存实页号 页内地址 (3)相等比较器的位数:6+13=19(位)

(4)快表每个存储字的格式,标出各字段的名称和长度

6位 13位 14位 用户号 虚页号 主存实页号

问答第5题

(1)处理机响应各中断源的中断请求的先后顺序是:D1、D3、D2、D4 处理机实际为各中断源服务的先后顺序是:D2、D4、D3、D1 (2)处理机开始响应D1中断源中断请求的时间为:0微秒 处理机开始响应D2中断源中断请求的时间为:2微秒

29

处理机开始响应D3中断源中断请求的时间为:1微秒 处理机开始响应D4中断源中断请求的时间为:13微秒 处理机为D1中断源完成中断服务的时间为:44微秒 处理机为D2中断源完成中断服务的时间为:13微秒 处理机为D3中断源完成中断服务的时间为:34微秒 处理机为D4中断源完成中断服务的时间为:24微秒 (3)处理机开始响应D1中断源的中断请求的时间为:7微秒 处理机开始响应D2中断源的中断请求的时间为:6微秒 处理机开始响应D3中断源的中断请求的时间为:0微秒 处理机开始响应D4中断源的中断请求的时间为:1微秒 处理机为D1中断源完成中断服务的时间为:18微秒 处理机为D2中断源完成中断服务的时间为:28微秒 处理机为D3中断源完成中断服务的时间为:44微秒 处理机为D4中断源完成中断服务的时间为:34微秒

问答第6题

(1)这个磁盘存储器的存储容量为: C = 512Bx12 x 4096x 256 = 6.0GB 或:

C = 6.44GB

(2)磁盘存储器的寻址时间(包括定位时间和等待时间)是多少?等待时间为:60/7200/2=4.2ms

寻址时间为:定位时间+等待时间=8ms+4.2ms=12.2ms

30

(3)在寻址完成之后,磁盘存储器的数据传输率为 数据传输率:512B x 256 x 7200/60=15MB/S 或:

512B x 256 x 7200/60=15.7MB/S

问答第7题

S=A1+A2+A3+A4+A5+A6+A7+A8 =[(A1+A2)+(A3+A4)]+[(A5+A6)+(A7+A8)]

流水线的吞吐率为:流水线的加速比为:流水线的效率为:

问答第8题

(1)指令n1与n2之间有关于寄存器R0的写读数据相关, 指令n3与n6之间有关于寄存器R2的写读数据相关, 指令n4与n5之间有关于寄存器R4的读写数据相关, 指令n3与n6之间有关于寄存器R2的写写数据相关。 (2)采用顺序发射顺序完成调度方法的流水线时空图。

31

(3)采用顺序发射乱序完成调度方法的流水线时空图。

各条指令完成的时间图 时钟周期 4 5 6 7 8 9 流水线1 n1 n3 n5 流水线2 n4 n2 n6 各条指令完成的时间图执行这个程序共用18ns。 (4)采用顺序发射乱序完成调度方法的流水线时空图。

各条指令完成的时间图 时钟周期 4 5 6 7 流水线1 n1 n3 n5 n6 流水线2 n2 n4 执行这个程序共用14ns。

32

(3)在寻址完成之后,磁盘存储器的数据传输率为 数据传输率:512B x 256 x 7200/60=15MB/S 或:

512B x 256 x 7200/60=15.7MB/S

问答第7题

S=A1+A2+A3+A4+A5+A6+A7+A8 =[(A1+A2)+(A3+A4)]+[(A5+A6)+(A7+A8)]

流水线的吞吐率为:流水线的加速比为:流水线的效率为:

问答第8题

(1)指令n1与n2之间有关于寄存器R0的写读数据相关, 指令n3与n6之间有关于寄存器R2的写读数据相关, 指令n4与n5之间有关于寄存器R4的读写数据相关, 指令n3与n6之间有关于寄存器R2的写写数据相关。 (2)采用顺序发射顺序完成调度方法的流水线时空图。

31

(3)采用顺序发射乱序完成调度方法的流水线时空图。

各条指令完成的时间图 时钟周期 4 5 6 7 8 9 流水线1 n1 n3 n5 流水线2 n4 n2 n6 各条指令完成的时间图执行这个程序共用18ns。 (4)采用顺序发射乱序完成调度方法的流水线时空图。

各条指令完成的时间图 时钟周期 4 5 6 7 流水线1 n1 n3 n5 n6 流水线2 n2 n4 执行这个程序共用14ns。

32

本文来源:https://www.bwwdw.com/article/wg8r.html

Top