计算机标准体系结构课后答案.docx
- 文档编号:17521929
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:20
- 大小:24.68KB
计算机标准体系结构课后答案.docx
《计算机标准体系结构课后答案.docx》由会员分享,可在线阅读,更多相关《计算机标准体系结构课后答案.docx(20页珍藏版)》请在冰点文库上搜索。
计算机标准体系结构课后答案
计算机体系结构课后答案
【篇一:
计算机体系结构习题(含答案)】
1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包含符号位),阶码字长q=6(不包含符号位),为数基值rm=16,阶码基值re=2。
对于规格化浮点数,用十进制表示式写出以下数据(对于前11项,还要写出16进值编码)。
(1)最大尾数(8)最小正数
(2)最小正尾数(9)最大负数
(3)最小尾数(10)最小负数
(4)最大负尾数(11)浮点零
(5)最大阶码(12)表数精度
(6)最小阶码(13)表数效率
(7)最大正数(14)能表示规格化浮点数个数
2.一台计算机系统要求浮点数精度不低于10-7.2,表数范围正数大于1038,且正、负数对称。
尾数用原码、纯小数表示,阶码用移码、整数表示。
(1)设计这种浮点数格式
(2)计算
(1)所设计浮点数格式实际上能够表示最大正数、最大负数、表数精度和表数效率。
3.某处理机要求浮点数在正数区积累误差小于2-p-1,其中,p是浮点数尾数长度。
(1)选择适宜舍入方法。
(2)确定警戒位位数。
(3)计算在正数区误差范围。
4.假设有a和b两种不一样类型处理机,a处理机中数据不带标志符,其指令字长和数据字长均为32位。
b处理机数据带有标志符,每个数据字长增加至36位,其中有4位是标志符,它指令数由最多256条降低到不到64条。
假如每实施一条指令平均要访问两个操作数,每个存放在存放器中操作数平均要被访问8次。
对于一个由1000条指令组成程序,分别计算这个程序在a处理机和b处理机中所占用存放空间大小(包含指令和数据),从中得到什么启发?
5.一台模型机共有7条指令,各指令使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。
(1)要求操作码平均长度最短,请设计操作码编码,并计算所设计操作码平均长度。
6.某处理机指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字
段长度均为6位。
(1)假如双地址指令有15条,单地址指令和零地址指令条数基础相同,问单地址指令和零地址指令各有多少条?
而且为这3类指令分配操作码。
(2)假如要求3类指令百分比大致为1:
9:
9,问双地址指令、单地址指令和零地址指令各有多少条?
而且为这3类指令分配操作码。
7.别用变址寻址方法和间接寻址方法编写一个程序,求c=a+b,其中,a和b全部是由n个元素组成一维数组。
比较两个程序,并回复下列问题:
(1)从程序复杂程度看,哪一个寻址方法愈加好?
(2)从硬件实现代价看,哪一个寻址方法比较轻易实现?
(3)从对向量运算支持看,哪一个寻址方法愈加好?
8.假设x处理机数据不带标志符,其指令字长和数据字长均为32位。
y处理机数据带有标志符,每个数据字长增加至35位,其中有3位是标志符,其指令字长由32位降低至30位。
并假设一条指令平均访问两个操作数,每个操作数平均被访问r次。
现有一个程序,它指令条数为i,分别计算在这两种不一样类型处理机中程序所占用存放空间,并加以比较。
9.一个浮点数表示方法精度不低于10-19,能表示最大正数大于104000,而且正负数对称。
尾数用原码、小数表示,阶码用移码、整数表示,尾数和阶码基值全部是2。
(1)设计这种浮点数格式,给出各字段名称和长度。
(2)计算
(1)所设计浮点数格式能够表示最大正数、最大负数和表示数精度。
(3)假如在运算器中没有设置硬件警戒位,则这种浮点数可能采取了哪一个舍入方法?
给出这种舍入方法舍入规则,在正数区误差范围和积累误差。
10.有研究人员指出,假如在采取通用寄存器结构计算机里加入寄存器-存放器寻址方法可能提升计算机效率。
做法是用:
addr2,0(rb)
替换指令序列
loadr1,0(rb)
addr2,r2,r1
假定使用新指令能使时钟周期增加10%,而且假定只对时钟产生影响,而不影响cpi那么:
(1)采取新指令,要达成和原来一样性能需要去掉load操作所占百分比?
(假定load指令占总指令22.8%)
(2)举出一个多指令序列,该序列不能使用上述寄存器-存放器寻址方法。
即使得loadr1后面紧接着实施对r1操作(该操作能够是任意某一操作码),但这一指令序列不能被一条指令(假定存在
这条指令)替换。
11.试比较下面4种不一样类型指令结构存放效率:
(1)累加型:
全部操作全部在单个寄存器和单个内存地址之间进行
(2)存放器-存放器型:
每个指令3个操作数全部在内存中进行
(3)堆栈型:
全部操作全部在栈顶进行。
只有push和pop操作会访问内存,其它指令实施时全部会删除栈中操作数,然后写入实施结果。
(4)通用寄存器型:
全部操作全部在寄存器中进行。
这些寄存器-寄存器指令中每个指令全部包含3个操作数。
通用寄存器一共有16个,寄存器标志符占4位长。
为比较存放效率,我们对以上4种指令集作了以下约定:
操作码占一个字节(8位)
内存地址占2个字节(16位)
操作数占4字节(32位)
全部指令长度全部以整数个字节计算
另外,还假定访问内存不使用其它优化方法,变量a、b、c和d初值全部已经放在内存中。
针对以上4种不一样指令系统,回复下列问题:
(1)分别用汇编指令写出下面3个赋值语句:
a=b+c;
b=a+c;
d=a–b;
(2)分别计算所实施指令字节数和转移内存数据字节数,并指出假如依据代码大小来计算话,哪种结构效率是最高?
假如按需要总内存带宽(代码+数据)来计算,又是哪种结构效率最高?
12.考虑为dlx结构计算机增加一个新寻址模式。
即使得地址模式增加两个寄存器和一个11位长带符号偏移量来得到有效地址。
这么,编译器就会用新寻址模式来替换
addr1,r1,r2
lwrd,0(r1)(或是store指令)
假如已知在dlx结构计算机上对测得部分程序load和store指令分别平均占26%和9%,在此基础上,计算:
(1)假定10%load和store指令能够用新寻址模式替换,那么采取新寻址模式后指令计数和采取前之比为多少?
(2)假如新寻址模式使得时钟周期增加5%,那么采取了新寻址模式机器和未采取新寻址模式机器相比,哪种机器会愈加快部分,快多少?
1、解答:
在尾数采取补码、小数表示且p=6,阶码采取移码、整数表示且q=6,尾数基rm为16,阶码基re为2情况下:
(1)最大尾数为:
1-rm-p=1-16-6,0.ffffff
(2)最小正尾数为:
1/rm=1/16,0.100000
(3)最小尾数为:
-1,1.000000
(4)最大负尾数为:
-(rm-1+rm-p)=(16-1+16-6),1.efffff
(5)最大阶码为:
req-1=26-1=63,7f,包含符号位共7个1
(6)最小阶码为:
-req=-26=-64,00,包含符号位共7个0
(7)最大正数为:
(1-16-6)1663,7fffffff
(8)最小正数为:
16-65,00100000
(9)最大负数为:
-(16-1+16-6)16-64,80efffff
(10)最小负数为:
-1663,ff000000
(11)浮点零为:
00000000
(12)表数精度为:
16-5/2=2-21
(13)表数效率为:
15/16=93.75%
2、解答:
(1)取尾数和阶码基全部为2,即:
rm=2且re=2
依据表示数精度要求:
于是能够取p=24;
依据表示数范围要求:
即
所以能够取q=7
数据格式能够表示以下(尾数采取隐藏位):
-24
(2)能够表示最大正数:
(1-2
能够表示最大负数:
-2
表示数精度:
2-24-129)2127,,,
表数效率:
100%。
3、解答:
(1)舍入方法:
下舍上入法、查表法
(2)警戒位位数:
2位
(3)正数区误差范围:
-2-p-1(1-2-g+1)~2-p-1
4、解答:
我们能够计算出数据大致数量:
1000条指令访问数据总数为1000*2=个;
对于a处理机,所用存放空间大小为:
由此我们能够看出,因为数据平均访问次数要大于指令,所以,经过改善数据格式来降低指令长度,能够降低总存放空间大小。
5、解答:
(1)要使得到操作码长度最短,应采取huffman编码,结构huffman树以下:
由此能够得到7条指令编码分别以下:
【篇二:
计算机体系结构课后习题原版答案_张晨曦著】
s=txt>1.1解释下列术语
计算机系统结构:
传统机器程序员所看到计算机属性,即概念性结构和功效特征。
计算机组成:
计算机系统结构逻辑实现,包含物理机器级中数据流和控制流组成和逻辑设计等。
计算机实现:
计算机组成物理实现,包含处理机、主存等部件物理结构,器件集成度和速度,模块、插件、底板划分和连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:
对系统中某部分进行改善时,改善后系统性能提升倍数。
amdahl定律:
当对一个系统中某个部件进行改善后,所能取得整个系统性能提升,受限于该部件实施时间占总实施时间百分比。
并行性:
计算机系统在同一时刻或同一时间间隔内进行多个运算或操作。
只要在时间上相互重合,就存在并行性。
它包含同时性和并发性两种含义。
1.2试用实例说明计算机系统结构、计算机组成和计算机实现之间相互关系。
答:
如在设计主存系统时,确定主存容量、编址方法、寻址范围等属于计算机系统结构。
确定主存周期、逻辑上是否采取并行主存、逻辑设计等属于计算机组成。
选择存放芯片类型、微组装技术、线路设计等属于计算机实现。
计算机组成是计算机系统结构逻辑实现。
计算机实现是计算机组成物理实现。
一个体系结构能够有多个组成。
一个组成能够有多个实现。
1.6某台主频为400mhz计算机实施标准测试程序,程序中指令类型、实施数量和平均时钟周期数以下:
1.7将计算机系统中某一功效处理速度加紧10倍,但该功效处理时间仅为整个系统运行时间40%,则采取此增强功效方法后,能使整个系统性能提升多少?
解由题可知:
可改善百分比=40%=0.4部件加速比=10依据amdahl定律可知:
1
系统加速比?
?
1.5625
0.4
?
1?
0.4?
?
10
采取此增强功效方法后,能使整个系统性能提升到原来1.5625倍。
1.8计算机系统中有三个部件能够改善,这三个部件部件加速比为:
部件加速比1=30;部件加速比2=20;部件加速比3=10
(1)假如部件1和部件2可改善百分比均为30%,那么当部件3可改善百分比为多少时,系统加速比才能够达成10?
(2)假如三个部件可改善百分比分别为30%、30%和20%,三个部件同时改善,那么系统中不可加速部分实施时间在总实施时间中占百分比是多少?
解:
(1)在多个部件可改善情况下,amdahl定理扩展:
sn?
(1?
1
?
fi)?
?
fi
si
已知s1=30,s2=20,s3=10,sn=10,f1=0.3,f2=0.3,得:
10?
1
1(-0.3?
0.3?
f3)?
(0.3/30?
0.3/20?
f3/10)
得f3=0.36,即部件3可改善百分比为36%。
(2)设系统改善前实施时间为t,则3个部件改善前实施时间为:
(0.3+0.3+0.2)t=0.8t,不可改善部分实施时间为0.2t。
已知3个部件改善后加速比分别为s1=30,s2=20,s3=10,所以3个部件改善后实施时间为:
tn?
0.3t0.3t0.2t
?
?
?
0.045t30
改善后整个系统实施时间为:
tn=0.045t+0.2t=0.245t
那么系统中不可改善部分实施时间在总实施时间中占百分比是:
0.2t
?
0.82
0.245t
1.9假设某应用程序中有4类操作,经过改善,各操作取得不一样性能提升。
具体数据以下表所表示:
(2)各类操作单独改善后,程序取得加速比分别是多少?
(3)4类操作均改善后,整个程序加速比是多少?
解:
依据amdahl定律sn?
1fe
(1?
fe)?
se
可得
4类操作均改善后,整个程序加速比:
1
sn?
?
2.16
fi
(1?
?
fi)?
?
si
第2章指令集结构分类
2.1解释下列术语
堆栈型机器:
cpu中存放操作数单元是堆栈机器。
累加器型机器:
cpu中存放操作数单元是累加器机器。
通用寄存器型机器:
cpu中存放操作数单元是通用寄存器机器。
2.2区分不一样指令集结构关键原因是什么?
依据这个关键原因可将指令集结构分为哪3类?
答:
区分不一样指令集结构关键原因是cpu中用来存放操作数存放单元。
据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。
2.4指令集应满足哪多个基础要求?
答:
对指令集基础要求是:
完整性、规整性、高效率和兼容性。
完整性是指在一个有限可用存放空间内,对于任何可解问题,编制计算程序时,指令集所提供指令足够使用。
规整性关键包含对称性和均匀性。
对称性是指全部和指令集相关存放单元使用、操作码设置等全部是对称。
均匀性是指对于多种不一样操作数类型、字长、操作种类和数据存放单元,指令设置全部要相同对待。
高效率是指指令实施速度快、使用频度高。
2.7简述risc指令集结构设计标准。
答
(1)选择使用频率最高指令,并补充部分最有用指令;
(2)每条指令功效应
尽可能简单,并在一个机器周期内完成;(3)全部指令长度均相同;(4)只有load和store操作指令才访问存放器,其它指令操作均在寄存器之间进行;(5)以简单有效方法支持高级语言。
2.10通常有哪多个指令格式,请简述其适用范围。
答:
(1)变长编码格式。
假如系统结构设计者感爱好是程序目标代码大小,而不是性能,就能够采取变长编码格式。
(2)固定长度编码格式。
假如感爱好是性能,而不是程序目标代码大小,则能够选择固定长度编码格式。
(3)混合型编码格式。
需要兼顾降低目标代码长度和降低译码复杂度时,能够采取混合型编码格式。
第3章流水线技术
3.1解释下列术语
流水线:
将一个反复时序过程,分解成为若干个子过程,而每一个子过程全部可有效地在其专用功效段上和其它子过程同时实施。
吞吐率:
在单位时间内流水线所完成任务数量或输出结果数量。
流水线加速比:
使用次序处理方法处理一批任务所用时间和按流水处理方法处理同一批任务所用时间之比。
数据相关:
考虑两条指令i和j,i在j前面,假如下述条件之一成立,则称指令j和指令i数据相关:
(1)指令j使用指令i产生结果;
(2)指令j和指令k数据相关,而指令k又和指令i数据相关。
数据冲突:
当指令在流水线中重合实施时,因需要用到前面指令实施结果而发生冲突。
定向:
用来处理写后读冲突。
在发生写后读相关情况下,在计算结果还未出来之前,后面等候使用该结果指令并不见得是立即就要用该结果。
假如能够将该计算结果从其产生地方直接送到其它指令需要它地方,那么就能够避免停顿。
链接技术:
含有先写后读相关两条指令,在不出现功效部件冲突和vi冲突情况下,能够把功效部件链接起来进行流水处理,以达成加紧实施目标。
分段开采:
当向量长度大于向量寄存器长度时,必需把长向量分成长度固定段,然后循环分段处理,每一次循环只处理一个向量段。
3.3简述先行控制基础思想。
答:
先行控制技术是把缓冲技术和预处理技术相结合。
缓冲技术是在工作速度不固定两个功效部件之间设置缓冲器,用以平滑它们工作。
预处理技术是指预取指令、对指令进行加工和预取操作数等。
采取先行控制方法处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算器三者之间工作。
这么不仅使它们全部能独立地工作,充足忙碌而不用相互等候,而且使指令分析部件和运算器分别能快速地取得指令和操作数,大幅度地提升指令实施速度和部件
效率。
这些缓冲站全部按优异先出方法工作,而且全部是由一组若干个能快速访问存放单元和相关控制逻辑组成。
采取先行控制技术能够实现多条指令重合解释实施。
3.4设一条指令实施过程分成取指令、分析指令和实施指令三个阶段,每个阶段所需时间分别为△t、△t和2△t。
分别求出下列多种情况下,连续实施n条指令所需时间。
(1)次序实施方法;
(2)只有“取指令”和“实施指令”重合;(3)“取指令”、“分析指令”和“实施指令”重合。
解:
(1)每条指令实施时间为:
△t+△t+2△t=4△t
连续实施n条指令所需时间为:
4n△t
(2)连续实施n条指令所需时间为:
4△t+3(n-1)△t=(3n+1)△t(3)连续实施n条指令所需时间为:
4△t+2(n-1)△t=(2n+2)△t
3.5简述流水线技术特点。
答:
流水技术有以下特点:
(1)流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门功效部件来实现。
所以,流水线实际上是把一个大处理功效部件分解为多个独立功效部件,并依靠它们并行工作来提升吞吐率。
(2)流水线中各段时间应尽可能相等,不然将引发流水线堵塞和断流。
(3)流水线每一个功效部件前面全部要有一个缓冲寄存器,称为流水寄存器。
(4)流水技术适合于大量反复时序过程,只有在输入端不停地提供任务,才能充足发挥流水线效率。
(5)流水线需要有经过时间和排空时间。
在这两个时间段中,流水线全部不是满负荷工作。
3.6处理流水线瓶颈问题有哪两种常见方法?
答:
细分瓶颈段和反复设置瓶颈段
3.10简述三种向量处理方法,它们对向量处理机结构要求有何不一样?
答
(1)横向处理方法:
若向量长度为n,则水平处理方法相当于实施n次循环。
若使用流水线,在每次循环中可能出现数据相关和功效转换,不适合对向量进行流水处理。
(2)纵向处理方法:
将整个向量按相同运算处理完成以后,再去实施其它运算。
适合对向量进行流水处理,向量运算指令源/目向量全部放在存放器内,使得流水线运算部件输入、输出端直接和存放器相联,组成m-m型运算流水线。
(3)纵横处理方法:
把长度为n向量分为若干组,每组长度为n,组内按纵向方法处理,依次处理各组,组数为「n/n」,适合流水处理。
可设长度为n向量寄存器,使每组向量运算源/目向量全部在向量寄存器中,流水线运算部件输入、输出端和向量寄存器相联,组成r-r型运算流水线。
3.11可采取哪些方法来提升向量处理机性能?
答:
可采取多个方法:
(1)设置多个功效部件,使它们并行工作;
(2)采取链接技术,加紧一串向量指令实施;
【篇三:
计算机体系结构课后详解王志英】
=txt>1.1解释下列术语层次机构:
根据计算机语言从低级到高级次序,把计算机系统按功效划分成多级层次结构,每一层以一个不一样语言为特征。
这些层次依次为:
微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:
用软件实现机器。
翻译:
先用转换程序把高一级机器上程序转换为低一级机器上等效程序,然后再在这低一级机器上运行,实现程序功效。
解释:
对于高一级机器上程序中每一条语句或指令,全部是转去实施低一级机器上一段等效程序。
实施完后,再去高一级机器取下一条语句或指令,再进行解释实施,如此反复,直到解释实施完整个程序。
计算机系统结构:
传统机器程序员所看到计算机属性,即概念性结构和功效特征。
在计算机技术中,把这种原来存在事物或属性,但从某种角度看又仿佛不存在概念称为透明性。
计算机组成:
计算机系统结构逻辑实现,包含物理机器级中数据流和控制流组成和逻辑设计等。
计算机实现:
计算机组成物理实现,包含处理机、主存等部件物理结构,器件集成度和速度,模块、插件、底板划分和连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:
对系统中某部分进行改善时,改善后系统性能提升倍数。
amdahl定律:
当对一个系统中某个部件进行改善后,所能取得整个系统性能提升,受限于该部件实施时间占总实施时间百分比。
程序局部性原理:
程序实施时所访问存放器地址不是随机分布,而是相对地簇聚。
包含时间局部性和空间局部性。
cpi:
每条指令实施平均时钟周期数。
测试程序套件:
由多种不一样真实应用程序组成一组测试程序,用来测试计算机在各个方面处理性能。
系列机:
由同一厂家生产含有相同系统结构、但含有不一样组成和实现一系列不一样型号
计算机。
软件兼容:
一个软件能够不经修改或只需少许修改就能够由一台计算机移植到另一台计算机上运行。
差异只是实施时间不一样。
向上(下)兼容:
按某档计算机编制程序,不加修改就能运行于比它高(低)档计算机。
向后(前)兼容:
按某个时期投入市场某种型号计算机编制程序,不加修改地就能运行于在它以后(前)投入市场计算机。
兼容机:
由不一样企业厂家生产含有相同系统结构计算机。
模拟:
用软件方法在一台现有计算机(称为宿主机)上实现另一台计算机(称为虚拟机)指令系统。
仿真:
用一台现有计算机(称为宿主机)上微程序去解释实现另一台计算机(称为目标机)指令系统。
并行性:
计算机系统在同一时刻或同一时间间隔内进行多个运算或操作。
只要在时间上相互重合,就存在并行性。
它包含同时性和并发性两种含义。
时间重合:
在并行性概念中引入时间原因,让多个处理过程在时间上相互错开,轮番重合地使用同一套硬件设备各个部分,以加紧硬件周转而赢得速度。
资源反复:
在并行性概念中引入空间原因,以数量取胜。
经过反复设置硬件资源,大幅度地提升计算机系统性能。
资源共享:
这是一个软件方法,它使多个任务按一定时间次序轮番使用同一套硬件设备。
耦合度:
反应多机系统中各计算机之间物理连接紧密程度和交互作用能力强弱。
紧密耦合系统:
又称直接耦合系统。
在这种系统中,计算机之间物理连接频带较高,通常是经过总线或高速开关互连,能够共享主存。
松散耦合系统:
又称间接耦合系统,通常是经过通道或通信线路实现计算机之间互连,能够共享外存设备(磁盘、磁带等)。
计算机之间相互作用是在文件或数据集一级上进行。
异构型多处理机系统:
由多个不一样类型、最少担负不一样功效处理机组成,它们根据作业要求次序,利用时间重合原理,依次对它们多个任务进行加工,各自完成要求功效动作。
同构型多处理机系统:
由多个同类型或最少担负相同功效处理机组成,它们同时处理同一作业中能并行实施多个任务。
计算机组成是计算机系统结构逻辑实现。
计算机实现是计算机组成物理实现。
一个体系结构能够有多个组成。
一个组成能够有多个实现。
1.3计算机系统结构flynn分类法是按什么来分类?
共分为哪几类?
答:
flynn分类法是根据指令流和数据流多倍性进行分类。
把计算机系统结构分为:
(1)单指令流单数据流sisd
(2)单指令流多数据流simd(3)多指令流单数据流misd
(4)多指令流多数据流mimd
1.5分别从实施程序角度和处理数据角度来看,计算机系统中并行性等级从低到高可分为哪几级?
答:
从处理数据角度来看,并行性等级从低到高可分为:
(1)字串位串:
每次只对一个字一位进行处理。
这是最基础串行处理方法,不存在并行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 标准 体系结构 课后 答案