中国海洋大学 考研 期末 20061计算机系统结构B李海涛 - 图文

更新时间:2023-11-03 18:02:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中 国 海 洋 大 学 命 题 专 用 纸 (首页)

2006学年第 1 学期 试题名称:计算机系统结构 (B卷) 课程号: 共 2 页 第 1 页

专业年级__________________ 学号___________ 姓名____________ 考试日期(考生填写)_______年____月__日 分数_________ 1. (8分)在一台40MHz处理机上运行20,000条指令的目标代码,程序由4种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的周期数如下表所示。 1) 计算在单处理机上用上述跟踪数据运行程序的平均CPI。 2) 根据1)所得的CPI,计算相应的MIPS速率。 CPI 指令类型 指令混合比 1 60% 算术和逻辑 2 18% 高速缓存命中的加载/存储 4 12% 转移 8 10% 高速存储缺失的存储器访问 2. (8分)一台模型机有7条指令,各指令的使用频度分别为35%,25%,20%,10%,5%,3%,2%,有8个通用数据寄存器,2个变址寄存器,共有两种指令格式,其中,8位字长的寄存器-寄存器型指令3条。16位字长的寄存器-存储器型变址寻址方式指令4条,变址范围不大于正、负127。请设计指令格式,并给出各字段的长度和操作码的编码。 3. (8分)在一个Cache存储系统中,Cache的访问周期为10ns,主存储器的访问周期为60ns,每个数据在Cache中平均重复使用4次。当块的大小为一个字时,存储系统的访问效率为0.5。 1) 计算此时存储系统的命中率和等效访问周期; 2) 可以通过增加块大小的方案来提高系统的访问效率。那么,当块大小至少增加到几个字时,存储系统的访问效率才能从0.5提高到0.94? 4. (6分)一台计算机系统有两个选择通道,两个数组多路通道,一个字节多路通道带有3个子通道。各通道的工作速度如下表所示,分别计算各通道和子通道的实际流量和工作周期。 通道名称 连接在这个通道上的设备的数据传送速率(KB/s) 子通道1 100,50,50,25,20,5 字节多路通道 子通道2 60,60,60,45,15,10 子通道3 100,100,80,80,80,60 数组多路通道1 4000,4000,4000,3000,3000 数组多路通道2 4000,4000,4000,3500,3000 选择通道1 5000,5000,5000,4500,4000 选择通道2 6000,6000,5000,5000,5000 5. (8分)一条有4个功能段的非线性流水线,每个功能段的延迟时间都为10ns,预约表如下: 1 2 3 4 5 6 7 S1 × × S2 × × S3 × S4 × × 1) 画出调度该流水线的状态转换图; 2) 求流水线的最小启动循环和最小平均启动距离; 3) 按照最小启动循环连续输入10个任务,求流水线的实际吞吐率。 授课教师 命题教师或命题负责人 签 字 院系负责人 签 字 年 月 日 6. (10分)在下列不同结构的处理机上运行8×8的矩阵乘法C=A×B,计算所需要的最短时间,只计算乘法指令和加法指令的执行时间,不计算取操作数、数据传送和程序控制等指令的执行时间。加法部件和乘法部件的延迟时间都是3个时钟周期,另外,加法指令和乘法指令还要经过一个“取指令”和“指令译码”时钟周期,每个时钟周期为10ns,C的初始值为“0”。各操作部件输出端有直接数据同路连接到有关操作的输入端,在操作部件的输出端设置有足够多的缓冲寄存器。 1) 处理机只有一个通用操作部件,采用顺序方式执行指令; 2) 单流水线标量处理机,有一个两个功能的静态流水线,流水线每个功能段的延迟时间均为一个时钟周期,加法操作和乘法操作各经过3个功能段; 3) 超标量处理机,每个时钟周期同时发射一条乘法指令和加法指令,处理机内有两条独立的操作流水线,流水线每个功能段的延迟时间均为一个时钟周期; 4) 超流水线处理机,把一个时钟周期分成两个流水级,加法部件和乘法部件的延迟时间都为6个流水级,每个时钟周期能够分时发射两条指令; 5) 超标量超流水线处理机,把一个时钟周期分成两个流水级,加法部件和乘法部件的延迟时间都为6个流水级,每个流水级能够同时发射一条乘法指令和一条加法指令。 7. (8分)一台向量处理机1次只能以下述两种方式中的一种运动:一种是向量方式,执行速度Rv为10MFLOPS;另一种是标量方式,执行速度Rs为1MFLOPS。设α是该计算机的典型程序代码中可向量化部分的百分比。 1) 推导出该计算机平均执行速度Ra的公式; 2) 要使Ra达到7.5MFLOPS,问向量化百分比α应为多少? 8. (6分)设16个处理器编号分别为0、1、?、15,要用单级互连网络,当互连函数分别为: (1)Cube3 ;(2)PM2+3 ;(3)PM2–0 ;(4)β ;(5)Shuffle ;(6)Shuffle(Shuffle) 时,第14号处理器与哪一个处理器相连(要求写出互连函数表达式)? 9. (8分)分别确定在下列各计算机系统中,计算表达式S??(A?B),需要的最少时间。 iii?071) 通用PE的串行SISD系统; 2) 有8个处理器的SIMD系统; 3) 有8个处理器的MIMD系统。 设访存取指和取数的时间可以忽略不计;加与乘分别需要2拍和4拍;在SIMD和MIMD系统中处理器之间每进行一次数据传送的时间为1拍,而在SISD的串行系统中可忽略;在SIMD系统中,PE采用线性环网互连, 而在MIMD系统中,PE采用立方体网络互连。 10. (10分)在一个多处理机系统中,有8个计算结点用环网互连。现在要使用这个多处理机系统完成一个计算任务,该计算任务已经被分割成了100个子任务,所有子任务均可并行执行,且每个子任务的执行时间均为R个单位时间,在实际的处理过程中,任意两个子任务均需交换一次数据。当两个子任务不在同一计算结点时,在忽略网络线长的前提下,其通信开销均为C个单位时间(假定子任务A与B交换数据,其过程为:A请求获得令牌,获得网络控制权后,向B发送数据,B接收到数据后,向A发送确认信息,附带将想要发送给A的数据放在确认帧中一同发送,A收到后发确认信息,释放令牌。整个过程的平均时间花费为C),子任务以独占的方式访问网络,并且在通信期间不能执行计算任务;当两个子任务在同一个计算结点上时,忽略其通信开销。 1) 若R=200,C=5,计算任务的最短执行时间并给出对应的子任务分配方案。 2) 若R=60,C=1,计算任务的最短执行时间并给出对应的子任务分配方案。 3) 比较(1)和(2)的结果,你能得到什么结论?

本文来源:https://www.bwwdw.com/article/pfo2.html

Top