2024年2月12日发(作者:一无所为)
2022年大连民族大学计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案)
一、选择题
1、计算机系统结构不包括( )。
A.主存速度
B.机器工作状态
C.信息保护
D.数据
2、从计算机系统结构上讲,机器语言程序员所看到的机器属性是(A.计算机软件所要完成的功能
B.计算机硬件的全部组成
C.编程要用到的硬件组织
D.计算机各部件的硬件实现。
3、IBM360/91属于( )
A.向量流水机 B.标量流水机 C.阵列流水机 D.并行流水机
4、Cache存贮器常用的地址映象方式是( )。
A.全相联映象
B.页表法映象
C.组相联映象
D.段页表映象
)
5、1TFLOPS计算机能力,1TBYTE/S的I/O带宽和( )称为计算机系统的3T性能目标。
A,1TBYTE 硬盘容量
B.1TBYTE 软盘容量
C.1TBYTE 主存容量
D.A和B
6、CRAY-I的流水线是( )
A.多条单功能流水线B.一条单功能流水线C.多条多功能流水线D.一条多功能流水线
7、下列说法中不正确的是( )
A.软件设计费用比软件重复生产费用高
B.硬件功能只需实现一次,而软件功能可能要多次重复实现
C.硬件的生产费用比软件的生产费用高
D.硬件的设计费用比软件的设计费用低
8、计算机系统结构不包括( )
A.主存速度
B.机器工作状态
C.信息保护
D.数据表示
9、虚拟存储器常用的地址映象方式是( )
A.全相联
B.段相联
C.组相联
D.直接
10、对系统程序员不透明的应当是( )
存储器
B.系列机各档不同的数据通路宽度
C.指令缓冲寄存器
D.虚拟存储器
11、设16个处理器编号分别为0,1,2,...,15用Cube,互联函数时,第10号处理机与第( )号处理机相联。
A.11 B.8 C.14 D.2
12、计算机组成设计不考虑( )
A.专用部件设置
B.功能部件的集成度
C.控制机构的组成
D.缓冲技术
13、计算机系统的层次结构按照由高到低的顺序分别为( )。
A.高级语言机器级,汇编语言机器级,传统机器语言机器级,微程序机器级
B.高级语言机器级,应用语言机器级,汇编语言机器级,微程序机器级
C.应用语言机器级,传统机器语言机器级,汇编语言机器级,操作系统机器级
D.应用语言机器级,操作系统机器级,微程序机器级,传统机器语言机器级
14、指令间“一次重叠”说法有错的是( )
A.仅“执行k”与“分析k+1”重叠
B."分析k”完成后立即开始“执行k”
C.应尽量使“分析k+1”与“执行k”时间相等
D.只需要一套指令分析部件和执行部件
15、在尾数下溢处理方法中,平均误差最大的是( )
A.截断法
B.舍入法
C.恒置"1"法
查表法
二、填空题
16、存储器速度可以用________、________、频宽来描述。
17、层次存储系统的设计的目的是使有效存取时间接近于________的存取时间,使总体的平均每字成本接近于________的每字成本,容量接近于最大存储器的容量。
18、Amdahl定律定义了用加速比来衡量改进措施对________提高的程度。加速比S的定义为________
19、基于寄存器-寄存器的向量指令是指________来自________或把操作后的结果写入向量寄存器。这类指令是向量指令集中最重要的指令。
20、系列机软件兼容必须做到向________兼容,尽可能争取向________兼容。
21、所谓链接技术是指把________链接起来成为________
22、虚拟存贮器按映象算法不同,存贮管理方式有段式、________ 和________式3种。
23、在虚拟存储器中有三种地址空间,一种是应用程序员用来编写程序的地址空间,称为________,第二种是________的地址空间,第三种是辅存地址空间,也就是磁盘存储器的地址空间。它们对应的三种地址分别是________、________主存地址和________。
24、消息寻径方式可以分为两大类:________和________
25、衡量向量处理机性能的主要参数是________和________
三、判断题
26、主存空间数相关是相间隔的两条指令之间出现对主存同一单元要求先写而后读的关联。( )
27、对操作码进行优化编码时,在了解每种指令在程序中出现的概率后,使用Huffman
算法构造Huffman树,这样获得的Huffman编码是唯一的。( )
28、Cache组相联映象的块冲突概率比直接映象的高。( )
29、经常用的基本单元功能,宜于用软件实现,以降低实现费用。( )
30、能做为评价其它置换算法标准的置换算法是RAND。( )
31、OPT是STACK型替换算法。( )
32、软硬功能分配时,提高软件功能的比例会提高系统灵活性,也会提高解题速度。( )
33、异构机群的负载均衡任务优化调度问题可以描述为:寻找一个映射关系,将任务图TG映射到机群图PC,使作业时间最短。( )
34、计算机仿真用微程序解释,计算机模拟用机器语言解释。( )
35、低速打印机,在总线上传送数据时,其"数据宽度"宜用可变长块。( )
四、名词解释
36、紧密耦合系统:
37、存储程序计算机:
38、寻址方式:
39、控制相关:
40、定向:
41、存储体冲突:
五、简答题
42、根据CPU性能公式简述RISC指令集结构计算机和CISC指令集结构计算机的性能特点。
43、表示寻址方式的主要方法有哪些?简述这些方法的优缺点。
44、 试比较三种通道的优缺点及适用场合。
45、通常有哪几种指令格式,请简述其适用范围。
46、机群系统有什么特点?
六综合题
47、某向量处理机有16个向量寄存器,其中V0~V5中分别放有向量A、B、C、D、E、F,向量长度均为8,向量各元素均为浮点数;处理部件采用两条单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。采用类似于CARY-1的链接技术,先计算(A+B)*C,在流水线不停流的情况下,接着计算(D+E)*F。
(1)求此链接流水线的通过时间?(设寄存器入、出各需1拍)
(2)假如每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此处理部件的实际吞吐率为多少MFLOPS?
48、采用排队锁和fetch-and-increment重新实现栅栏同步,并将它们分别与采用旋转锁实现的栅栏同步进行性能比较。
49、在相同的条件下,如果展开7遍循环,求:
(1)每遍循环的平均时钟周期;
(2)每个时钟周期流出指令数;
(3)操作槽(功能部件)的使用效率;
(4)如果展开10遍,会出现哪些问题?
50、设指令流水线由取指令、分析指令和执行指令3个部件构成,每个部件经过的时间为△t,连续流入12条指令。分别画出标量流水处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们相对于标量流水处理机的加速比。
参考答案
一、选择题
1、【答案】A
2、【答案】C
3、【答案】B
4、【答案】C
5、【答案】C
6、【答案】A
7、【答案】D
8、【答案】A
9、【答案】A
10、【答案】D
11、【答案】D
12、【答案】B
13、【答案】A
14、【答案】B
15、【答案】A
二、填空题
16、【答案】访问时间 存储周期
17、【答案】最内层存储器 最外层存储器
18、【答案】系统性能,Sn= To/Tn
19、【答案】参加运算操作的向量 向量寄存器
20、【答案】后 上
21、【答案】两条功能部件流水线 一条功能较强的流水线
22、【答案】页式 段页
23、【答案】虚拟地址空间 主存储器 虚拟地址 辅存地址
24、【答案】线路交换 包交换
25、【答案】向量指令的处理时间 向量长度为无穷量处理机的最大性能
三、判断题
26、【答案】错
27、【答案】错
28、【答案】错
29、【答案】错
30、【答案】对
31、【答案】对
32、【答案】错
33、【答案】对
34、【答案】对
35、【答案】错
四、名词解释
36、答:又称直接耦合系统。在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。
37、答:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
38、答:寻址方式指令系统中如何形成所要访问的数据的地址。一般来说,寻址方式可以指明指令中的操作数是一个常数、一个寄存器操作数或者是一个存储器操作数。
39、答:控制相关是指由分支指令引起的相关。它需要根据分支指令的执行结果来确定后面该执行哪个分支上的指令。
40、答:用来解决写后读冲突的。在发生写后读相关的情况下,在计算结果尚未出来之前,后面等待使用该结果的指令并不见得是马上就要用该结果。如果能够将该计算结果从其产生的地方直接送到其它指令需要它的地方,那么就可以避免停顿。
41、答:多个请求要访问同一个体。
五、简答题
42、答:CPU性能公式:CPU时间=IC×CPI×T其中,IC为目标程序被执行的指令条数,CPI为指令平均执行周期数,T是时钟周期的时间。相同功能的CISC目标程序的指令条数ICCISC 少于RISC的ICRISC,但是CISC的CPICISC和TCISC都大于RISC的CPIRISC和TRISC,因此,CISC目标程序的执行时间比RISC的更长。
43、答:表示寻址方式有两种常用的方法:
(1)将寻址方式编于操作码中,由操作码在描述指令的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU对指令译码的难度。
(2)为每个操作数设置一个地址描述符,由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢,但操作码和寻址独立,易于指令扩展。
44、答:(1)字节多路通道。一种简单的共享通道,主要为多台低速或中速的外围设备服务。(2)数组多路通道。适于为高速设备服务。(3)选择通道。为多台高速外围设备(如磁盘存储器等)服务的。
45、答:
(1)变长编码格式。如果系统结构设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采用变长编码格式。
(2)固定长度编码格式。如果感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。
(3)混合型编码格式。需要兼顾降低目标代码长度和降低译码复杂度时,可以采用混合型编码格式。
46、答:(1)系统开发周期短。由于机群系统大多采用商品化的PC机、工作站作为结点,并通过商用网络连接在一起,系统开发的重点在于通信子系统和并行编程环境上,这大大节省了研制时间。
(2)可靠性高。机群中的每个结点都是独立的PC机或工作站,某个结点的失效并不会影响其它结点的正常工作,而且它的任务还可以传递给其它结点完成,从而有效地避免由于单结点失效引起的系统可靠性降低的问题。
(3)可扩放性强。机群的计算能力随着结点数量的增加而增大。这主要是得益于机群结构的灵活性,由于结点之间以松耦合方式连接,机群的结点数量可以增加到成百上千。另外,机群系统的硬件容易扩充和替换,可以灵活配置。
(4)性能价格比高。由于生产批量小,传统并行计算机系统的价格均比较昂贵,往往要几百万到上千万美元。而机群的结点和网络都是商品化的计算机产品,能够大批量生产,成本相对较低,因而机群系统的性能价格比更好。与相同性能的传统并行计算机系统相比,机群的价格要低1~2个数量级。
(5) 用户编程方便。机群系统中,程序的并行化只是在原有的C、C++或Fortran串行程序中插入相应的通信原语,对原有串行程序的改动有限。用户仍然使用熟悉的编程环境,无需适用新的环境。
六综合题
47、解:(1)我们在这里假设A+B的中间结果放在V6中,(A+B)×C地最后结果放在V7中,D+E地中间结果放在V8中,(D+E)×F的最后结果放在V9中。具体实现参考下图:
V0AV1BV6V2CV7向量加向量乘V3D
V4EV8V5FV9
通过时间应该为前者((A+B)×C)通过的时间:
T通过= (1+2+1)+(1+3+1) =9(拍)
(2)在做完(A+B)×C之后,作(C+D)×E就不需要通过时间了。
V6←A+B
V7←V6×C
V8←D+E
TT通过+(8-1)824(拍)1200(ns)32TP26.67MFLOPSTV9←V8×F
48、解:fetch-and-increment(count);
if (count=total){
count=0;
relea=1;
}
el{
spin(relea=1);
//还有进程未到达
//等待信号
//进程全部到达
//重置计数器
//释放进程
}
当有N个处理器时,上述代码执行fetch-and-increment操作N次,当访问释放操作的时候,有N个Cache未命中。当最后一个处理器到达栅栏条件后,relea被置为“1”,此时有N-1个Cache未命中(对于最后一个到达栅栏的处理器,当它读relea的时候,将在主存中命中)。所以,共有3N-1次总线传输操作。如果有10个处理器,则共有29次总线传输操作,总共需要2900个时钟周期。
49、解:展开7遍循环
访存指令1
L.D F0,0(R1)
访存指令2
L.D F6,-8(R1)
浮点指令1
浮点指令2
整数/转移指令
L.D F10,-16(R1) L.D F14,-24(R1)
L.D F18,-32(R1) L.D F22,-40(R1)
L.D F26,-48(R1)
ADD.D F4,F0,F2 ADD.D F8,F6,F2
ADD.D F12,F10,F2 ADD.D F16,F14,F2
ADD.D F20,F18,F2 ADD.D F24,F22,F2
S.D F4,0(R1) S.D F8,-8(R1) ADD.D F28,F26,F2
S.D F12,-16(R1) S.D F16,–24(R1)
S.D F20,-32(R1) S.D F24,–40(R1)
S.D F28,8(R1)
DADDIU R1,R1,# -56
BNE R1,Loop
这段程序的运行时间为9个时钟周期,每遍循环平均约1.28个时钟周期。9个时钟周期内流出了23条指令,每个时钟周期2.55条。9个时钟周期共有操作槽95=45个,有效槽的比例为51.1%。
50、解:标量流水处理机的时空图:
执行
分析
取指
14
时间
执行完12条指令需T1=14△t。
超标量流水处理机与超长指令字处理机的时空图:
执行
执行
分析
分析
取指
5
时间
取指
超长指令字处理机时空图
5
时间
超标量处理机时空图
超标量流水处理机中,每一个时钟周期同时启动4条指令。执行完12条指令需T2=5△t,相对于标量流水处理机的加速比为:
T14tS212.8
T25t超长指令字处理机中,每4条指令组成一条长指令,共形成3条长指令。执行完12条指令需T3=5△t,相对于标量流水处理机的加速比为:
S3T114t2.8
T35t
超流水处理机的时空图:
执行
分析
取指
4
5
5.75
时间
超流水处理机中,每1/4个时钟周期启动一条指令。执行完12条指令需T4=5.75△t,相对于标量流水处理机的加速比为:
S4T114t2.435
T45.75t
本文发布于:2024-02-12 11:23:54,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1707708234265090.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:2022年大连民族大学计算机科学与技术专业《计算机系统结构》科目期末.doc
本文 PDF 下载地址:2022年大连民族大学计算机科学与技术专业《计算机系统结构》科目期末.pdf
留言与评论(共有 0 条评论) |