非参数统计部分课后习题参考答案.docx
- 文档编号:18446082
- 上传时间:2023-08-18
- 格式:DOCX
- 页数:13
- 大小:71.33KB
非参数统计部分课后习题参考答案.docx
《非参数统计部分课后习题参考答案.docx》由会员分享,可在线阅读,更多相关《非参数统计部分课后习题参考答案.docx(13页珍藏版)》请在冰点文库上搜索。
非参数统计部分课后习题参考答案
课后习题参考答案
第一章p23-25
2、
(2)有两组学生,第一组八名学生的成绩分别为x1:
100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x2:
75,87,60。
我们对这两组数据作同样水平a=的t检验(假设总体均值为u):
H0:
u=100H1:
u<100。
第一组数据的检验结果为:
df=7,t值为,单边p值为,结论为“拒绝H0:
u=100。
”(注意:
该组均值为);第二组数据的检验结果为:
df=2,t值为,单边p值为;结论为“接受H0:
u=100。
”(注意:
该组均值为)。
你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。
答:
这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)
第三章p68-71
3、在某保险种类中,一次关于1998年的索赔数额(单位:
元)的随机抽样为(按升幂排列):
4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分)
(2)利用符号检验来回答
(1)的问题(利用精确的和正态近似两种方法)。
(10分)
(3)找出基于符号检验的95%的中位数的置信区间。
(8分)
解:
(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。
如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。
(4分)
(2)符号检验(5分)
设假设组:
H0:
M=M0=5064
H1:
M≠M0=5064
符号检验:
因为n+=11,n-=3,所以k=min(n+,n-)=3
精确检验:
二项分布b(14,,
,双边p-值为,大于a=,所以在a水平下,样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。
查二项分布表得a=的临界值为(3,11),同样不足以拒绝零假设。
正态近似:
(5分)
np=14/2=7,npq=14/4=
z=(3+/
≈>Za/2=
仍是在a=的水平上无法拒绝零假设。
说明两年的中位数变化不大。
(3)中位数95%的置信区间:
(5064,21240)(8分)
7、一个监听装置收到如下的信号:
0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。
能否说该信号是纯粹随机干扰(10分)
解:
建立假设组:
H0:
信号是纯粹的随机干扰
H1:
信号不是纯粹的随机干扰(2分)
游程检验:
因为n1=42,n2=34,r=37。
(2分)根据正态近似公式得:
U=
(2分)
(2分)
取显著性水平a=,则Za/2=,故接受零假设,可以认为信号是纯粹的随机干扰的。
(2分)
第四章p91-94
1、在研究计算器是否影响学生手算能力的实验中,13个没有计算器的学生(A组)和10个拥有计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:
A组:
28,20,20,27,3,29,25,19,16,24,29,16,29
B组:
40,31,25,29,30,25,16,30,39,25
能否说A组学生比B组学生算得更快利用所学的检验来得出你的结论.(12分)
解、利用Wilcoxon两个独立样本的秩和检验或Mann-WhitneyU检验法进行检验。
建立假设组:
H0:
两组学生的快慢一致;
H1:
A组学生比B组学生算得快。
(2分)
两组数据混合排序(在B组数据下划线):
3,16,16,16,19,20,20,24,25,25,25,25,27,28,29,29,29,29,30,30,31,39,40(2分)
A组秩和RA=1+3*2+5+*2+8++13+14+*3=120;
B组秩和RB=3+*3++*2+21+22+23=156(2分)
A组逆转数和UA=120-(13*14)/2=29
B组逆转数和UB=156-(10*11)/2=101(2分)
当nA=13,nB=10时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。
计算
(2分)
当显著性水平a取时,正态分布的临界值Za/2=(1分)
由于Z (1分) 4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。 记下损坏前延迟的时间名次(数目越大越耐久)如下: 方法: ABBABABAABAAABABAAAA 序: 1234567891011121314151617181920 用Mann-Whitney秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良(10分) 解、设假设组: H0: 两种工艺在提高耐用性方面的优良性一致; H1: A工艺比B工艺更优良(1分,假设也可用符号表达式) 根据样本数据知nA=13;nB=7(1分),计算 A工艺的秩和RA=1+4+6+8+9+11+12+13+15+17+18+19+20=153;(1分) B工艺的秩和RB=2+3+5+7+10+14+16=57(1分) A工艺的Mann-Whitney秩和UA=RA-nA(nA+1)/2=153-(13*14)/2=62(1分) B工艺的Mann-Whitney秩和UB=RB-nB(nB+1)/2=57-(7*8)/2=29(1分) 当nA=13,nB=7时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。 计算 (2分) 当显著性水平a取时,正态分布的临界值Za/2=(1分) 由于Z (1分) 第五章p118-121 1、对5种含有不同百分比棉花的纤维分别做8次抗拉强度试验,试验结果如表4所示(单位: g/cm2): 表4 棉花纤维百分比(%) 15 20 25 30 35 抗拉强度 411 1268 1339 1480 986 705 846 1198 1198 775 493 1057 1339 1268 493 634 916 1198 1480 775 634 1057 1339 1268 352 846 1127 916 986 352 564 775 1480 1127 564 705 634 1268 1480 423 试问不同百分比纤维的棉花其平均抗拉强度是否一样,利用Kruskall—Wallis检验法。 (14分) 解: 建立假设组: H0: 不同百分比纤维的棉花其平均抗拉强度一样; H1: 不同百分比纤维的棉花其平均抗拉强度不一样。 (2分) 已知,k=5,n1=n2=n3=n4=n5=8(2分)。 混合排序后各观察值的秩如表4所示: 表4 棉花纤维百分比(%) 15 20 25 30 35 抗拉强度 3 35 28 28 15 35 10 28 15 10 35 15 10 4 R 166 nj 8 8 8 8 8 根据表4计算得: (6分) 由于自由度k-1=5-1=4,nj=8>5,是大样本,所以根据水平a=,查X2分布表得临界值C=,(2分) 因为Q>C,故以5%的显著水平拒绝H0假设,不同百分比纤维的棉花其平均抗拉强度不一样。 (2分) 7、按照一项调查,15名顾客对三种电讯服务的态度(“满意”或“不满意”)为(15分) 服务 消费者(爱好用“1”表示,不爱好用“0”表示) 合计 A 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 13 B 1 0 0 0 1 1 0 1 0 0 0 1 1 1 1 8 C 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 2 合计 2 1 1 2 2 2 1 2 0 1 1 3 2 2 1 23 解: 建立假设组: H0: 顾客对3种服务的态度无显著性差异; H1: 顾客对3种服务的态度有显著性差异。 (2分) 本例中,k=3,n=15。 (2分)又因 (5分)自由度k-1=3-1=2,(2分)取显著性水平a=,查X2分布表得临界值c=,(2分)因为Q>C,故以5%的显著水平拒绝H0假设,即顾客对3种服务的态度有显著性差异。 (2分) 8、调查20个村民对3个候选人的评价,答案只有“同意”或“不同意”两种,结果见表1: 表1 候选人 20个村民的评价(“同意”为1,“不同意”为0) A 1 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 1 1 1 B 0 1 1 0 1 0 1 1 0 0 0 1 0 0 0 1 0 0 0 1 C 0 0 1 1 1 1 0 0 0 0 1 0 1 1 1 1 1 0 1 0 试检验村民对这三个候选人的评价有没有区别 解: 建立假设组: H0: 三个候选人在村民眼中没有区别 H1: 三个候选人在村民眼中有差别(2分) 数据适合用CochranQ检验(2分)。 而且已知n=20,k=3,∑xi=∑yj=28。 (2分) 计算结果见表3: 表3 3个候选人 20个村民的评价(“同意”为1,“不同意”为0) Xi A 1 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 1 1 1 9 B 0 1 1 0 1 0 1 1 0 0 0 1 0 0 0 1 0 0 0 1 8 C 0 0 1 1 1 1 0 0 0 0 1 0 1 1 1 1 1 0 1 0 11 Yj 1 2 2 1 2 1 2 1 0 0 2 1 1 2 2 2 1 1 2 2 28 根据表2计算得: (2分) 则 (2分) 取显著性水平a=,查卡方分布表得卡方临界值C=,由于Q (2分) 第八章P170-171 2.下面是某车间生产的一批轴的实际直径(单位: mm): 能否表明该尺寸服从均值为10,标准差为的正态分布(分别用K-S拟合检验和卡方拟合检验)。 当n=10,a=时查表得K-S拟合检验的临界值为。 (24分) 解: 建立假设组: H0: 该车间生产的轴直径服从均值为10,标准差为的正态分布; H1: 该车间生产的轴直径服从均值为10,标准差为的正态分布(2分) 首先将样本数据按升序排列,并对数据进行标准化处理,即Zi=(xi-10)/(1分),并列在计算表中。 (1)K-S正态拟合检验见表1: 表1K-S拟合检验计算表 样本数据xi 标准化值 Zi 正态区间 正态累计概率 实际累计频率 离差 (1) (2) (3) (4) (5) (6)=(4)-(5) (-∞,-3) [-3, [, [, [, [, [, [, [, [, - - [,∞) K-S拟合检验统计量取最大的绝对离差Dn=(5分),由于检验统计量小于临界值,所以无法拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。 (2)卡方正态拟合检验见表2: 表2卡方拟合检验计算表 样本数据xi 标准化值 Zi 正态区间 正态概率 预期频数Еi =(4)×10 小预期频数合并 实际频数Oi (Oi-Еi)2/Еi (1) (2) (3) (4) (5) (6) (7) (8) (-∞,-3) 5 [-3, [, [, [, [, [, 2 [, [, 1 [, 1 - - [,∞) 1 合计 - - 10 由于存在小预期频数,所以要合并,直到预期频数都大于1(见第(6)列),同时计算合并后的实际频数(该步正确2分)。 从表2得卡方检验统计量Q=(6分),自由度df=k-1=5-1=4(2分),查卡方分布表得a=的临界值C=(左尾),右尾临界值(2分),说明检验统计量Q落在肯定域,不能拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。 第九章p184-186 1、美国在1995年因几种违法而被捕的人数按照性别为: 表1 性别 男 女 谋杀 13927 1457 抢劫 116741 12068 恶性攻击 328476 70938 偷盗 236495 29866 非法侵占 704565 351580 偷盗机动车 119175 18058 纵火 11413 2156 从这些罪行的组合看来,是否与性别无关如果只考虑谋杀与抢劫罪,结论是否一样(20分) 解: 本题适合用独立性卡方检验。 建立假设组H0: 犯罪类型与性别无关 H1: 犯罪类型与性别有关 r=7,c=2.自由度df=(7-1)(2-1)=6 a=,查表得X2,6)= Eij=ni.。 n 计算结果见下表: 男(Qi1) 女(Qi2) 合计 Ei1 Ei2 (Qij-Eij)^2/Eij 谋杀 13927 1457 15384 抢劫 116741 12068 128809 恶性攻击 328476 70938 399414 303146 偷盗 236495 29866 266361 非法侵占 704565 351580 1056145 偷盗机动车 119175 18058 137233 纵火 11413 2156 13569 X^2= 合计 1530792 486123 2016915 由于X2=>X2,6)=,所以拒绝零假设,说明罪行与性别有关。 如果只考虑谋杀与抢劫,则 男(Qi1) 女(Qi2) 合计 Ei1 Ei2 (Qij-Eij)^2/Eij 谋杀 13927 1457 15384 抢劫 116741 12068 128809 116727 X^2= 合计 130668 13525 144193 由于X2= (20分)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 统计 部分 课后 习题 参考答案