体系结构复习题docWord下载.docx
- 文档编号:5816255
- 上传时间:2023-05-05
- 格式:DOCX
- 页数:19
- 大小:128.19KB
体系结构复习题docWord下载.docx
《体系结构复习题docWord下载.docx》由会员分享,可在线阅读,更多相关《体系结构复习题docWord下载.docx(19页珍藏版)》请在冰点文库上搜索。
2.流水线处理机中常见的三种相关是结构相关、_数据相关—和—控制
相关O
3.存储器的三个主要指标是速度、容量和价格。
4.当组相联的路数n变为1时,组相联就变成了—直接映像_,当组数G变为1时,组相联就变成了_全相联映像—o
5.输入输出系统包括输入输出设备、_集中式共享存储器结构—及与输入输出操作有关的_分布式存储器结构
6.在基于总线互连的多处理机中,采用_总线监听协议来解决cache
一致性问题。
总线监听
1•计算机系统中提高并行性的技术途径有_时间重叠—、资源重复和资源共享三种。
在高性能单处理机的发展中,它的实现基础是流水线。
2.衡量流水线性能通常有三种主要指标,它们是吞吐率、加速比和效率。
3.伪相联Cache中,确定另一块的一种简单的方法是将索引字段的最高位取反。
4.大小为N的直接映像Cache的失效率约等于大小为N/2的两路组相联Cache的失效率。
5.非专用总线控制方式中确定优先序可有—菊花链_、_计数器_和独立请求等三种
方式。
6.现有的MIMD机器可以分为_集中式共享存储器结构—和_分布式存储器结构_两类。
每一类代表了一种存储器的结构和互联策略。
7.在基于总线互连的多处理机中,采用—总线监听_协议来解决cache一致性问题。
7.相联存储器CAM是按访问的存储器。
8.从计算机体系结构的发展来看,早期的计算机是以为中心的系统结
构,而近代的是以为中心的系统结构。
5.计算机系统性能常用—衡屋,而CPU性能常用衡星。
1.一条DLX指令最多需要工个时钟周期,它们分别是—周期、—周期、执行/
有效地址计算周期、—周期和—周期。
2.DLX流水线寄存器的作用是把—和—信息从一个流水段传送到下一个流水段。
1.向量处理方式有水平处理,垂育■处理,分组处理方式三种。
6.Amdahl定律表明系统的加速比依赖于可改进比例、和部件加速比个因素。
1.透明性一一在计算机技术中,对本来存在的事物或属性,从某一角度来看乂好像不存在的概念称为透明性。
2.旁路(定向)一一将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。
3.VictimCache位于Cache和存储器之间的又一级Cache,容量小,采
用全相联策略。
用于存放由于失效而被丢弃(替换)的那些块。
每当失效发生时,在访问卜•一级存储器之前,先检查VictimCache中是否含有所需块。
4•同步总线——同步总线上所有设备通过统一的总线系统时钟进行同步。
5.计算/通信比——反映并行程序性能的一个重要的度量。
在并行计算中,它是指每次数据通信要进行的计算与通信开销的比值。
5.大概率事件优先原则一一对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。
6.Amdahl定律——加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重耍性。
7.程序的局部性原理一一程序在执行时所访问地址的分布不是随机的,而是相对地簇聚;
这种簇聚包拾指令和数据対部分。
1•软件兼容——同一•个软件可以不加修改地运行于体系结构和同的各档机器上,而且它们所获得的结果一样,差別只在于运行的时间不同。
2.数据相关一一当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。
3.伪相联Cache种既能获得多路组相联Cache的低失效率,乂能获得
直接映象Cache的命中速度的相联办法。
4.开步总线——界步总线上的设备之间没有统一的系统时钊「,设备口己内部定时。
设备之间的信息传送用总线发送器和接收器控制。
5.机群一一由多台同构或者异构的独立计算机通过高性能网络连接在一起而构成的高性能并行计算机系统•构成机群的计算机都拥有自己的存储器、I/O设备和操作系统,他们在机群操作系统的控制下协同完成特定的并行计算任务。
1.简述指令集结构中采用多种寻址方式的优缺点。
2.当前指令集结构屮所使用的一些操作数寻址方式有哪些?
1)1•计算机指令集结构设计所涉及的内容有哪些?
2.常见的三种通用寄存器型机器的优缺点各有哪些?
指令集结构类型
优点
缺点
寄存器一寄存器型
(0,3)
简单,指令字长固定,是一种简单的代码生成模型,各种指令的执行时钟周期数相近。
和指令中含有对存储器操作数访问的结构相比,指令条数多,因而其目标代码较大。
寄存器一存储器型
(1,2)
可以直接对存储器操作数进行访问,容易对指令进行编码,且其口标代码较小。
指令中的操作数类型不同o在一条指令中同时对一个寄存器操作数和存储器操作数进行编码,将限制指令所能够表示的寄存器个数。
由于指令的操作数可以存储在不同类型的存储器单元,所以每条指令的执行时钟周期数也不尽相同。
存储器一存储黠型
(3,3)
是一种最紧密的编码方式,无需“浪费”寄存器保存变量。
指令字长多种多样。
每条指令的执行时钟周期数也人不-样,对存储器的频繁访问将导致存储器访问瓶颈问题。
三、有哪几种向量处理方式?
它们対向量处理机的结构要求有何不同?
3.简述通道完成一次数据传输的主要过程。
3.简述流水线技术的特点。
1)流水过程由多个相联系的子过程组成,每个过程称为流水线的“级”或“段”;
2)每个子过程由专用的功能段实现;
3)各个功能段所需时间应尽量相等,否则,时间长的功能段将成为流水线的瓶颈,会造成流水线的“堵塞”和“断流”;
4)流水线需要有“通过时间”(第一个任务流出结果所需的时间),在此之后流水过程才进入稳定工作状态,每一个时钟周期(拍)流出一个结果;
5)流水技术适合于大量重复的时序过程,只有在输入端能连续地提供任务,流水线的效率才能充分发挥。
4.在“Cache—主存”层次中,主存的更新算法有哪几种?
?
它们各有什么特点?
1)写直达法;
易于实现,而且下一级存储器中的数据总是最新的。
2)写回法;
速度块,“写”操作能以Cache存储器的速度进行。
而且对于同一单元的多个写最后只需一次写冋下一级存储器,有些“写”只到达Cache,不到达主存,因而所使用的存储器频带较低。
1.通常有哪几种指令格式?
简述其适用范围。
答:
1)变长编码格式。
如果体系结构设计者感兴趣的是程序的冃标代码大小,而不是性能,就可以采用变长编码格式。
2)固定长度编码格式。
如果感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。
3)混合型编码格式。
需耍兼顾降低冃标代码长度和降低译码复杂度时,可以采用混合型编码格式。
2.简述RISC结构的设计原则。
1)选取使用频率最高的指令,并补充一些最有用的指令;
2)每条指令的功能应尽可能简单,并在一个机器周期内完成;
3)所有指令长度均相同;
4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器Z间进行;
5)以简单有效的方式支持高级语言。
3.按设备定时方式分类,总线可分为哪两类?
它们各有何特点?
1)同步总线;
同步总线上所有设备通过统一的总线系统时钟进行同步。
同步总线成木低,因为它不需要设备之间互相确定时序的逻辑。
但是同步总线也有缺点,总线操作必须以相同的速度运行。
2)异步总线;
异步总线上的设备Z间没有统一的系统时钟,设备自己内部定时。
设备Z间的信息传送用总线发送器和接收器控制。
异步总线容易适应更广泛的设备类型,扩充总线时不用担心吋钟时序和时钟同步问题。
但在传输时,异步总线需要额外的同步开销。
4.降低Cache失效率有哪儿种方法?
简述其基木思想。
常川的降低Cache失效率的方法有下而儿种:
1)增加Cache块大小。
增加块大小利用了程序的空间局部性。
2)提高相联度,降低冲突失效。
3)VictimCache,降低冲突失效。
4)
5)
6)
7)
伪相联Cache,降低冲突失效。
硬件预取技术,指令和数据都可以在处理黠提出访问请求前进行预取。
由编译器控制的预取,硬件预取的替代方法,在编译时加入预取的指令,在数据被用到Z前发出预取请求。
编译器优化,通过对软件的优化来降低失效率。
1•如果某一计算任务川向量化方式求解比用标量方式求解要快20倍,称可川向量方式求解部分所花费的时间占总的时间的白分比为可向量化白分比。
请画出加速比与可向量化百分比Z间的关系曲线。
解:
设向量化百分比为了,那么根据Amdahl法则,系统的加速比为:
—1一20
1丄20-19/
20
加速比与可向量化百分比之间的关系曲线如下图所示。
2.动态多功能流水线由6个功能段组成,如下图:
其屮,SI、S4、S5、S6组成乘法流水线,SI、S2、S3、S6组成加法流水线,各个功能段时间均为假设该流水线的输出结果可以直接返回输入端,而且
5
设置有足够地缓冲寄存器,若以最快的方式用该流水计算:
(1).画出时空图;
(2).计算实际的吞吐率、加速比和效率。
本题解题的关键是弄清楚机器一共要做10次乘法,4次加法,而且应进行适当的指令调度,以得到最大的吞吐率。
(1)
3.给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。
由计算结果能得出什么结论?
(3).理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次;
\)/\)/\)7\)/
45678/(\/(X/{\/(\/(X
两者Cache容量均为64KB,块大小都是32字节;
组相联Cache中的多路选择器使CPU的时钟周期增加了10%;
这两种Cache的失效开销都是80ns;
命中时间为1个时钟周期;
.64KB直接映象Cache的失效率为1.4%,64KB两路组相联Cache的失效
率为1.0%。
平均访问时间=命屮时间+失效率X失效开销
平均访问时间1-^=2.0+1.4%*80=3.12ns平均访问时间2■路二2.0*(1+10%)+1・0%*80=3.0ns两路组相联的平均访问时间比较低
CPU说二(CPU执行+存储等待周期)*时钟周期
CPUliDt=IC(CPI执行+总失效次数/指令总数*失效开销)*时钟周期
=IC((CPI执行*时钟周期)+(每条指令的访存次数*失效率*失效开销*时钟周期))
CPU呎F二ic(2.0*2+1.2*0.014*80)=5.344TCCPUt“ay=IC(2.2*2+1.2*0.01*80)=5.36TC
CPU
和对性能比:
=5.36/5.344二1.003
CPU(imc-1way
直接映彖cache的访问速度比两路组相联cache耍快1.04倍而两路组相联Cache的平均性能比直接映彖cache要高1.003倍。
因此这里选择两路组相联。
3・假定要在一个时钟速率为40MHz的标量处理机上执行一个典型
测试程序,该程序中含有4种类型指令,每种指令的条数和每种指令
的CPI如下所示:
指令类型
指令数
CPI
ALU
120000
1
Load/Store指令(Cache命中时)
36000
2
转移指令
24000
4
访存指令(Cache不命中吋)
20000
8
(1)计算在单处理机上执行该程序的平均CPIo
⑵根据⑴所得的CPI值,计算相应的MIPS速率。
解:
CPl^^xCPl^/lC
CPI=
120000x1+36000x2+24000x4+20000x§
_?
茁
MBS速率=
CPZxlO4
_40x10'
=2.24x10'
=17.36MIPS
200000
1.计算机系统有三个部件可以改进,这三个部件的加速比如下:
部件加速比1=30;
部件加速比2=20;
部件加速比3=10;
(1)如果部件1和部件2的可改进比例为30%,那么当部件3的可改进比例为多少时,系统的加速比才可以达到10?
(2)如果三个部件的可改进比例为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?
在多个部件可改进情况下Amdahl定理的扩展:
■■
—(1一於)+£
d)+#
式中,fi为可加速部件i在未优化系统中所占的比例;
Si是部件i的加速比。
s={[ip+/2+Q]+#+魯+£
}
[1-(0.3+0.3+0.2)]丁卩_~~03T~~02T
-+—+^-+0.27
302010
().2
+0.2
0.30.30.2
—I1
3()201()
二0・2
=0.60.91.212
"
+1F
60606060
有一条流水线如下所示。
(1)求连续输入10条指令,该流水线的实际吞吐率和效率;
(2)该流水线的瓶颈在哪一段?
请采取三种不同的措施消除此
“瓶颈”。
对于你所给出的新流水线,计算连续输入10条指令时,
其实际吞吐率和效率。
(1)
HL
Tpipeline=Ati+(fl—l)Atmax
i-1
=(50+50+100+200)+9x200
=2200(ns)
=/4pipe^=%20*)
m
另乩4005
E=TP-—=TP——=—«
45.45%m411
⑵瓶颈在3、4段。
〉变成八级流水线(细分)
*31—32—41
入l—
50ns50ns50ns50ns50ns50ns
Tp5»
eline=Ati+(fl-l)Atni®
:
i-1
=50x8+9x50
=850(ns)
TAti
E=TP-耳一=IT-—=—«
58.82%m817
》变成两级流水线(合并)
123
4—
200ns200ns
T=〉[Ati+〔Il—1)AtxiLix
=200x2+9x200
E=TP・—
=/4p^line=%20*)
、重复设置部件
%戸昨=%5血"
)
2.伪相联中,假设在直接映像位逍没有发现匹配,而在另一个位置才找到数
据(伪命中)时,需要1个额外的周期,而且不交换两个Cache中的数据,失效开销为50个时钟周期。
试求:
(1)推导出平均访存的时间公式。
(2)利用
(1)中得到的公式,对于2KBCache和128KBCache,重新计算伪相联的平均访存时间。
请问哪一种伪相联更快
假设2KB直接映像Cache的总失效率为0.098,2路相联的总失效率为0.076;
128KB直接映像Cache的总失效率为0.010,2路相联的总失效率为
0.007o
不管作了何种改进,失效开销相同。
不管是否交换内容,在同一“伪相联”组中的两块都是用同一个索引得到的,因此失效率相同,即:
失效率伪相联=失效率2路。
伪相联cache的命中时间等于直接映象cache的命中时间加上伪相联查找过程中的命中时间*该命中所需的额外开销。
命屮时间伪相联=命中时间1路+伪命中率伪相联X1
交换或不交换内容,伪相联的命中率都是由于在第一次失效时,将地址取反,再在第二次查找带來的。
因此伪命中率伪相联=命中率2路一命中率1賂=(1—失效率2路)一(1—失效率2
=失效率I賂一失效率2珞。
交换内容需要增加伪相联的额外开销。
平均访存时间伪相联=命中时间1路+(失效率1路一失效率2路)XI+失效率2路X失效开销'
将题设中的数据带入计算,得到:
平均访存时间2Kb=l+(0・098-0・076)*1+(0.076*50)=4.822平均访存时间128沪1+(0・010-0.007)*1+(0.007*50)=1.353显然是128KB的伪相联Cache要快一些。
3.有一个流水线由四段组成,其屮每当流经第三段时,总要在该段循环一次才能流到第四段。
如果每段经过一次的时间都是问:
(1)当在流水线的输入端每△!
时间输入任务时,该流水线会发生什么情况?
(2)此流水线的实际吞吐率为多少?
如果每2At输入一个任务,连续处理10个任务的实际吞吐率和效率是多少?
(3)当侮段时间不变时,如何提高该流水线的呑吐率?
仍连续处理10个任务时,其呑吐率提高多少?
(1)会发生流水线阻塞情况。
ft
It
fostr.l
sta^2
insir.2
insir.3
a
務1
4t
戈
&
sta^3
^agp2
^3
st^p3
sta^
垮1
W2
W3
Stag
3
q
6
T
9
10
g
Q
7
S
Tim
►
23A/
Stage
X
Z
E
Ti^e
z
233
2Az
pipeline=?
3加
AE=IY-
対543%
Tp=£
(3)重复设置部件
△t
△tAt肛
毒=%p輕毗二1%4•&
=勞•&
吞吐率提高倍数=呀汕=1.64
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 体系结构 复习题 doc