统计题库答案.docx
- 文档编号:18013257
- 上传时间:2023-08-05
- 格式:DOCX
- 页数:19
- 大小:91.53KB
统计题库答案.docx
《统计题库答案.docx》由会员分享,可在线阅读,更多相关《统计题库答案.docx(19页珍藏版)》请在冰点文库上搜索。
统计题库答案
题库1
一、选择题(每题2分,共20分)
1.B2.C3.D4.D5.A6.D7A8.B9.D10.C
二、多项选择题(每题2分,共10分)
1.ABCE2.ACE3.ADE4.AB5.ADE
三、填空题(每空2分,共20分)
1.分组标志、组矩
2.4元、0.01
3.参数估计、假设检验
4.弃真错误、纳伪错误
5.-1,1
四、简答题(每题5分,共20分)
1.答:
(1)众数是一组数据分布的峰值,是一种位置代表值。
其优点是不受极端值影响。
其缺点是具有不唯一性。
(1分)
(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。
(1分)
(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中
趋势测度值。
其主要缺点是易受数据极端值的影响。
(1分)
应用场合:
当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应
选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择
众数或中位数等位置代表值,这时它们的代表性要比均值好。
此外,均值只适用于定距或定
比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。
(2分)
2.答:
拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。
pfi检验:
若p--•,不能拒绝Ho;若pv>,拒绝Ho(3分)。
3.答:
标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平
高低的影响,也就是与变量的均值大小有关。
(2分)。
因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散
程度的测度值直接进行比较的。
为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数(3分)。
4、答:
方差分析的步骤:
首先,计算出总离差平方和(SST)、误差项离差平方和(SSE)、水
平项离差平方和(SSA)。
SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA
反映随机误差和系统误差的大小,三者之间的关系:
SST=SSA+SSE。
第二,计算SSE的
均方MSE,SSA的均方MSA。
将MSA和MSE进行对比,即得到所需要的F检验统计量。
第三,将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作出对原假设H0的决策。
五、计算题(每题10分,共30分)
1•解:
(全对,给10分,错一空扣1分)
考分
人数
比率
向上累计
向下累计
人数(人)
比率(%)
人数(人)
比率(%)
60以下
2
5.0
2
5.0
40
100.0
60-70
7
17.5
9
22.5
38
95.0
70-80
11
27.5
20
50.0
31
77.5
80-90
12
30.0
32
80.0
20
50.0
90以上
8
20.0
40
100.0
8
20.0
合计
40
100.0
一
一
一
一
2•解:
根据题意:
提出假设:
HoiuA’Hru4(2分)
检验统计量z=x—u。
=4「4=2(3分)
由。 =0.05,查表临界值Zj=Z0.o5=1.645 由于Z=2>Z=1.645,所以应拒绝H0而接受H1,即北京市家庭每天上网的时间确有显著 提高。 (5分) 3.解: 2XY-'X、Y1003-10202(4分) 2naX2X)21001.5-102 打「Y/n-X/n=Y--应20=0(4分) 100100 样本回归方程: Y=2X(2分) 题库2 一、选择题(每题2分,共20分) 2.C2.D3.D4.A5.D6.B7B8.B9.B10.A 二、多项选择题(每题2分,共10分) 1.ABCD2.ABD3.ADE4.AB5.ADE 三、填空题(每空2分,共20分) 6.统计设计、统计调查、统计整理、统计分析 7.右偏、左偏 8.无偏性、有效性、一致性 9.线性相关 四、简答题(每题5分,共20分) 1.答: 离中趋势的常用指标包括: 全距、平均差、标准差与标准差系数(2分)。 (1)全距: 计算简单、但容易受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差(2分)。 (2)平均差: 不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点: 用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算(2分)。 (3)标准差: 不易受极端数值的影响,能综合反映全部 单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算(2分)。 (4)离散系数: 用来对比不同水平的同类 现象,特别是不同类现象总体平均数代表性的大小(2分)。 2•答: 总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差 越大(4分);样本单位数的多少,样本单位数越大,抽样误差越小(2分);抽样方法: 不 重复抽样的抽样误差比重复抽样的抽样误差小(2分);抽样组织方式: 简单随机抽样的误 差最大(2分)。 3•答: 相关分析,就是用一个指标来表明现象相互依存关系的密切程度。 回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系(2 分)。 (1)两者有密切的联系。 它们不仅有共同的研究对象,而且在具体应用时,必须互相 补充。 相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要 依靠相关分析来表明现象数量变化的相关程度(4分)。 (2)相关分析与回归分析在研究目的和方法上是有明显区别的。 相关分析研究变量之 间相关的方向和相关的程度。 但是相关分析不能指出变量间相互关系的具体形式,也无法从 一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间相互关系的具体 形式,确定一个相关的数学方程式,根据这个数学方程式从已知变量推测未知量,从而为估 算和预测提供了一个重要的方法(4分)。 4、答: 基本步骤: 1•提出原假设和备择假设(2分) 2•确定适当的检验统计量(2分) 3•规定显著性水平a,确定临界值(2分) 4•计算检验统计量的值(2分) 5•作出统计决策(2分) 五、计算题(每题10分,共30分) 1•解: Txf3750 (1)乙班的平均分数: X乙3750=75(5分) f50 979 乙班平均分数的标准差系数: 匚乙13.05%(3分) 75 (2)比较哪个班的平均分数更有代表性: 99979 因为二甲=•=12.22%小于二乙=•=1395% 8175 所以甲班的平均分数更有代表性(2分)。 2•解: 已知: =P(1-P)=0.020.98,: p=4%。 (5分) 1-: =95.45%即卩Z: ./2=2。 必要的抽样数目: “冒=春理49(件)(5分) 乂心-原喘一2^0 样本回归方程: Y=2X(6分) 将有关数据代入回归方程,得: Y=2X=20.5=1(亿元) 置信度为95.45%的利润额的预测区间为: 1-20.05乞丫乞120.05,即0.9(元)^<1.1(元)(4分)。 题库3 一、选择题(每题2分,共20分) 1.B2.A3.D4.A5.A6.A7.D8.B9.B10.A 二、多项选择题(每题2分,共10分) I.ABC2.BDE3.CE4.ACDE5.ACD 三、填空题(每空2分,共20分) 10.描述统计学、推断统计学 II.等距式分组、异距式分组 12.矩形 13.标准差、均值 14•总体均值、总体比例、总体方差 四、简答题(每题5分,共20分) 1.答: 完整的统计调查方案包括: (1)确定调查目的,即为什么调查(2分); (2)确定调查对象和调查单位,即向谁调查(2分); (3)确定调查项目和调查表,即调查什么(2分); (4)其他内容,包括调查的时间与组织安排等(4分)。 2.答: 数据的计量尺度由低级到高级、由粗略到精确分为四个层次,即定类尺度、定序尺度、定距尺度和定比尺度。 定类尺度,是最粗略、计量层次最低的计量尺度,它是按照事物的某种属性对其进行平 行的分类或分组。 各类别之间是平等的并列关系,无法区分优劣或大小。 (1分) 定序尺度,它是对事物之间等级差或顺序差别的一种测度。 该尺度不仅可以将事物分成 不同的类别,而且还可以确定这些类别的优劣或顺序。 该尺度的计量结果只能比较大小,不 能进行加、减、乘、除数学运算。 (1分) 定距尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间 的差距是多少。 该尺度的计量结果表现为数值,并可以计算差值,因而,其结果可以进行加 减运算。 定距尺度没有一个绝对零点,不能进行乘、除运算。 (1分) 定比尺度,与定距尺度属于同一层次,其计量的结果也表示为数值。 由于有绝对的零点,可以进行加、减、乘、除运算。 (1分) 上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。 高层 次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。 (1分) 3•答: 标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身 水平高低的影响,也就是与变量的均值大小有关。 变量值绝对水平越高,离散程度的测度值 自然也就大,绝对水平越低,离散程度的测度值自然也就小;另一方面,它们与原变量值的 计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。 (2分) 标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离 散程度。 (1分) 因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散 程度的测度值直接进行比较的。 为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。 (2分) 4、答: 必要抽样数目受以下因素影响: 2 (1)总体方差匚。 其他条件不变的条件下,总体单位的差异程度大,则应多抽,反之 可少抽一些(1分)。 (2)允许误差范围「匚或‘卩。 允许误差增大,意味着推断的精度要求降低,在其他条 件不变的情况下,必要的抽样数目可减少;反之,缩小允许误差,就要增加必要的抽样数目 (1分)。 (3)置信度(1-g)。 在其他条件不变的情况下,要提高推断的置信程度,就必须增加抽样数目(1分)。 (4)抽样方法。 相同条件下,采用重复抽样应比不重复抽样多抽一些样本单位(1分)。 (5)抽样组织方式。 由于不同抽样组织方式有不同的抽样误差,在误差要求相同的情 况下,不同抽样组织方式所必需的抽样数目也不同(1分)。 五、计算题(每题10分,共30分) 1•解: 1.解: 品种 价格(元/斤) 甲市场 乙市场 成交额(m) 成交量 (m/x) 成交量(f) 成交额(xf) 甲 1.2 1.2 1 2 2.4 乙 1.4 2.8 2 1 1.4 丙 1.5 1.5 1 1 1.5 合计 — 5.5 4 4 5.3 55一 1.375(兀)(3分) 4 -yxf53 乙市场平均价格x1.325(元)(3分) 送f4 说明: 两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价格高低不同 的原因就在于各种价格的农产品在两个市场的成交量不同。 甲市场销售价格较高的乙产品最 多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。 这就是 权数在平均数形成中所起的权衡轻重的作用(4分)。 2•解: 根据题意: 提出假设: H。 : u=50,已: u=50 检验统计量t=X二U—50.2二50=0.9733 S/亦0.65/怖 由G=0.05,查表临界值t瘦2=t0.025=2.2622 由于t=0.9733 ./2=2.2622,所以不应拒绝H0,即每袋重量符合要求。 a=y-bx=12.2-0.91547.3: 2.9765(4分) yc=abx二12.97560.195x 当x=5时y=abx二2.97560.19553.95元(2分) 题库4 一、选择题(每题2分,共20分) 1.B2.B3.D4.C5.A6.D7.A8.C9.C10.B 二、多项选择题(每题2分,共10分) 1.CE2.ABCD3.ADE4.ABC5.AB 三、填空题(每空2分,共20分) 15.全面调查、非全面调查 16.正态曲线、平顶曲线、尖顶曲线 17.各组权数相等 18.越大,越小 19.右偏、左偏 四、简答题(每题5分,共20分) 1.答: (1)是一门搜集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。 (3分) (2)统计学与统计数据有密不可分的关系。 统计学是由一套收集和处理统计数据的方法所 组成,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。 统计数据不用统 计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。 (2分) 2•答: 任意两个总体平均数的代表性比较,应当用标准差系数。 标准差系数是标准差与均值 的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。 (2分) 因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散 程度的测度值直接进行比较的。 为了消除变量值水平高低和计量单位不同对离散程度测度值 的影响,而需要计算标准差系数。 (3分) 3•答: 影响因素包括: 总体各单位的差异程度(即标准差的大小),总体各单位的差异程度 越大,抽样误差越大(2分);样本单位数的多少,样本单位数越大,抽样误差越小(1分);抽样方法: 不重复抽样的抽样误差比重复抽样的抽样误差小(1分);抽样组织方式: 简单随机 抽样的误差最大(1分)。 4、答: 拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。 pfi检验: 若p--•,不能拒绝Ho;若pv>,拒绝Ho(3分) 五、计算题(每题10分,共30分) 1•解: ^l^f=1083=10.83(百元/人)(4分) 送f100 '、(x.-x)2 s=J=1.44(百元/人)(4分) Vzf-1 s八 v13.3%(2分) x s0.073 -x 2.解: 解: 抽样平均误差山10=0.0073,(3分) 已知F⑺=95.45%,z=2, ."■: -cxz=20.0073=0.0146(3分) 区间的下限是: X-.1=1.65-0.0146=1.6354(米) 区间的上限是: X*=1.65+0.0146=1.6646(米) 故可以95.45%的概率保证这些初中生的身高在1.6354米-1.6646米之间。 (4分) 3.解: 计算估计的回归方程: 4. Y=0.0727+0.0273x 题库5 一、选择题(每题2分,共20分) 1.D2.D3.B4.B5.B6.C7.B8.C9.C10.D 二、多项选择题(每题2分,共10分) 1.DE2.CDE3.BC4.ACDE5.BE 三、填空题(每空2分,共20分) 20.定性数据、定量数据 21.定类尺度、定序尺度、定距尺度、定比尺度 22.各组权数相等 23.矩估计法、极大似然估计法 24.-1,1 四、简答题(每题5分,共20分) 1.答: (1)众数: 不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。 (2)中位数: 不受极端值影响,数据分布偏斜程度较大时应用(2分)。 (3)平均数: 易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(2分)。 2•答: 随机原则,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样 本单位,每个总体单位能否入样是随机的(2分)。 遵循随机原则抽样,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。 3•答: 以标准差系数为例。 标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。 (2分) 因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散 程度的测度值直接进行比较的。 为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。 (3分) 4、答: 拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。 pfi检验: 若p--•,不能拒绝Ho;若pv>,拒绝Ho(3分) 五、计算题(每题10分,共30分) 2•解: 根据题意: 提出假设: H0: u=4,Hj: u4 由。 =0.05,查表临界值Zh=Z0.05=1.645 由于Z=2>z_.=1.645,所以应拒绝H0而接受Hl,即西安市家庭每天看电视的时间确有显著提高。 (5分) xy-乞y八 3•解: b25.2(4分) 22 n'x-'x a=y—bx=20.4(4分) yc=abx=20.45.2x 当x=5时y=abx=20.45.28=62分(2分)题库6 一、选择题(每题2分,共20分) 1.B2.A3.B4.B5.B6.B7.A8.A9.C10.C 二、多项选择题(每题2分,共10分) 1.ABC2.AB3.ADE4.AB5.AB 三、填空题(每空2分,共20分) 25.统计工作、统计数据、统计学 26.变量水平、权数 27.各组权数相等 28.所有单位、全面调查 29.无线性相关、完全负相关 四、简答题(每题5分,共20分) 1.答: 有关数据均值的计算。 当数据呈较严重偏态分布时,用平均数则代表性很差(2分)。 正确使用的原则: (1)众数: 不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。 (2)中位数: 不受极端值影响,数据分布偏斜程度较大时应用(1分)。 (3)平均数: 易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(1分)。 2.答: 随机原则,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样 本单位,每个总体单位能否入样是随机的(1分)。 遵循随机原则抽样,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。 3.答: 标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。 (2分) 因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散 程度的测度值直接进行比较的。 为了消除变量值水平高低和计量单位不同对离散程度测度值 的影响,而需要计算标准差系数。 (3分) 4、答: SST----总离差平方和,反映全部数据总的误差程度;SSE一-误差项离差平方和, 反映随机误差的大小;SSA-----水平项离差平方和,反映随机误差和系统误差的大小;(3分) 三者之间的关系: SST=SSA+SSE。 (2分) 五、计算题(每题10分,共30分) 1.解: 「浮=詈"83(百元/人)(4分) S「(Xi"” VZf-1 (百元从) (4分) s v13.3% x (2分) 2•解: n=49是大样本, 已知: x=12.6,S=2.8 二0.0455 则有: Z一.=Z0.02275=2 2 平均误差 理0.4 乂S2=20.—0.8 2\ 据公式 x_Z (4 代入数据,得该快餐店顾客的总体平均花费数额 3.解: 计算估计的回归方程: 95.45%的置信区间为(11.8, En瓦xy—52x瓦y5汇42430—290汉7213060 r22=0.567 nx-Cx)517900-2905400 rTEy -01144.2-0.567X58=111.314 nn 估计的回归方程为: y=111.314+0.567x (3分) (3分) 13.4)元。 (4分) (4分) (2分)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 题库 答案