应用统计真题.docx
- 文档编号:18146530
- 上传时间:2023-08-13
- 格式:DOCX
- 页数:31
- 大小:239.87KB
应用统计真题.docx
《应用统计真题.docx》由会员分享,可在线阅读,更多相关《应用统计真题.docx(31页珍藏版)》请在冰点文库上搜索。
应用统计真题
论述题:
1-解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。
2.试述均匀试验设计的特点,对均匀试验设计和正交试验设计两种方法进行比较,指出各自的优缺点。
3.试述费歇判别的基本思想方法及主要步骤。
4.试述多元线性回归解决实际问题的基本思想方法及主要步骤。
6•解释正交试验设计的特点及理论依据。
7•试论述一元线性回归的基本思想及主要方法步骤。
一、(任选两题,每题1o分,共20分)1・解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。
2•解释正交试验设计的特点及理论依据。
3•试述一元线性回归的基本思想及主要方法步骤。
答案:
1・假设原理运用了小概率原理,在原假设Ho正确的前提下,根据样本观察值和运用统计方法检验由此将导致什么结果,如果导致小概率事件在依次试验中发生了,则认为原假设可能不正确,从而拒绝原假设;反之,如果未导致小概率事件发生,则没有理由拒绝原假设。
第一类错误:
弃真错误即Ho为真时,作出拒绝H。
的判断;第二类错误:
纳伪错误即Ho不真时,作出接受Ho的判断。
通常限制犯第一类错误的概率,增大样本容量使犯第二类错误的概率尽可能地小。
为了简化检验过程,更多的应用是只控制犯第一类错误的概率,而不考虑犯第二类错误的概率。
2.正交试验设计是研究多因素多水平的又一种设计方法,它有多、快、好、省的特点。
“多”是指可以考虑多因素、多指标;“快”是指试验次数少、周期短、见效快;
“好”是指可以很快找到优秀方案和可能最优方案;“省”是指省时间、省耗费、省资金、省劳力等。
正交性原理是正交实验设计的理论依据,它主要表现在均衡分散性和整齐可比性两个方面。
均衡分散性是指正交表安排的实验方案均衡地分散在配合完全的水平组合的方案之中。
整齐可比性是指对于每列因素,在各个水平导致的结果之和中,其它因素的各个水平出
现的次数是相同的。
3.一元线性回归是研究两个变量之间的相尖尖系,且两个变量有着密切的尖系,它们的这种相矣尖系不能用完全确切的函数形式表示,但在平均意义下有一定的定量尖系表达式。
1)先进行相尖性分析,看两个变量间是否有线性矣系,确定回归方程中的因变量与自变量,对线性模型进行假设;
2)从样本数据出发对线性回归方程进行参数估计,确定回归方程;
3)对回归方程进行各种统计检验:
回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差正态检验。
4)利用回归方程进行解释或预测现象。
4•在某新产品开发试验中需要考虑四个因素A、B、C、D对产品质量的影响。
根据专业知识和实践经验知道,A与C之间存在着交互作用,D与A、B及C之间的交互作用可以忽
略不计。
(1)
(2)
解:
假设每个因子只取两个水平,试选择适当的正交表安排该实验;指出第2号及第5号试验的实验条件。
(1)根据题意,A与B、B与C之间的交互作用还不能肯定,需要通过试验考察。
这样,需要考察的因子及交互作用为A,B,C,D,AXB,AXC,BXC。
因此可以选
(2)
用1_8(2?
)正交表。
差矩阵、相尖矩阵R的矩估计
表U表头设计
列号
1
2
3
4
5
6
7
因子
A
B
AB
c
AC
BC
D
试验方案列入表1-2
1010001(000012)2101024
3•下面记录了三位操作工分别在四台不同机器上操作二天的日产量:
机器
操作工
甲
乙
丙
A
15
17
16
16
18
21
B
16
17
15
15
22
19
C
15
16
P18
17
18
18
D
18
20
15
17
17
17
试用方差分析法检验:
(D操作工之间的差异是否显著;
(2)机器之间的差异是否显著;
(3)交互影响是否显著(0.05)解:
由题意知k3,r4,n2,又由题目给出数据可得:
134,T2gg129,T3gg150,TA103"创104”疯102,臥104,Tgggw,Tjg见
上表中两数之和。
Tg2gg
krn
7189413
342
81.9583
k
sA"I"2iggrni1
T:
57097
4132
30.0833
krn
1rT2
Tg2gg
4132
Iigjgj
kn1
krn
42645
0.4583
Tg2gg
44-3,,
k
SaSD
14345
30.08330.458334.9167
krn
342
S误二S总・SaSbsAB81.958330.08330.458334.916716.5
将计算的有尖结果列入方差分析表(表3・1)中。
表3-1方差分析表
方差来源
平方和
自由度
平均平方和
F值
操作工
P30.0833
2
15.0417
P10.9394
机器
0.4583
3
0.1528
0.1111
父互作用
34.9167
6
5.8195
4.2323
误差
16.5
12
1.375
总和
81.9583
23
对于给定水平0.05,由PF0.05分别查(附表5)得3.89,23.49,
33.00,由表3-1可知:
(D操作工之间的差异显著。
(3)机器之间的差异不显著。
(4)
操作工与机器交互影响显著。
判别法判别样品Xi2及X2
1.1所属的类i。
若出现不一致结果,请提出你的判别建议。
解:
1,EX10,对于2,EX23o
(1)贝叶斯判别法:
e2(2°)
Pi⑵
e20.054
P2
(2)
;(23)
1
*0.242
±(1.10)
121
5(1.1)
•2-o
2
1200
2-e
0.218
1
361
Pa(1.1)
1L
-(1-13)
200
0.066
5
(2)cn
0.054
0.036
P2
(2)q2
0.2423°-081
0.145
p2(1.1)q20.066-0.022
3
(2)距禺判别法:
di
(2)d(2,i)
20
2
23
1
ch
(2)d(2,2)
J22
2
显然d(2,0d(2,
2),故Xi2属于
2°
1.1
0
di(1.1)d(1.1,i)
1.1
所以'Xi
2属于2
X21.1属于1O
1.123d2(1.1)d(1.1>2)0.95
显然d(1.1,d(1.1,2)故X21.1属于2。
(3)结果不一致分析。
5•已知四个样品分别为(2,5》,(2,3)・,(4,3),,(6,2),,试用重心法和离差平方和法进行聚类分析。
若分成两类,请您提出您的分类建议。
解:
(1)重心法:
首先将四个样品分别看做一类,计算距离矩阵d(2»o
D(o)
G1
G2
®3
G4
gi
0
G2
4
0
Gs
8
4
0
G4
25
17
5
0
由D(。
)可以看出,色和G3之间距离最短,因此可以合并为一个新类GsG2,G3,
然后计算G、G4、G5之间的距离,得相应的D:
)如下
DF)
Gi
G4
G5
G
0
G4
25
0
Gs
5
25
0
由D:
)可以看出,G和G5之间距离最短,因此可以合并为一个新类G6G「G5,然后计算G4、G6之间的距离,得相应的D;如下
d
(2)
G4
G6
G4
0
G6
16.25
0
最后将G4与G6合为一类G7G,G2,Gs,G-上述聚类过程用聚类图表示为图5・1
(2)离差平方和法:
由
(1)中已计算的重心法的距离平方及DpqnwDpq(C)计算距离矩阵D(0>。
%%
D(o)
G
G2
G3
G4
G
0
G2
2
0
G3
4
2
0
G4
12.5
8.5
2.5
0
由D(0)可以看出,色和G3之间距离最短,因此可以合并为一个新类GsG2,G3,然后计算G、G4、G5之间的距离,得相应的D
(1)如下
D
(2)
G1
G4
Gs
G1
0
G4
12.25
0
G5
3.3333
16.6667
0
由D21)可以看出,G和G5之间距离最短,因此可以合并为一个新类GeG,G5,
然后计算G4、G6之间的距离,得相应的D⑵如下
临⑵
G4
Ge
G4
0
G6
12.1875
0
最后将G4与G6合为一类G7G5G2,G3,G4。
上述聚类过程用聚类图表示为图5-2
6•在有尖合成纤维的强度y与其拉伸倍数x的试验中得试验数据如下:
序八变量・、
X.
2
Xi
2yi
Xiyi
1
2
1.3
4
1.69
2.6
2
2.5
2.5
6.25
6.25
6.25
3
2.7
2.5
7.29
6.25
6.75
4
3.5
2.7
12.25
7.29
9.45
5
4
3.5
16
12.25
14
6
4.5
4.2
20.25
17.64
18.9
7
5.2
5
27.04
25
26
8
6.3
6.4
39.69
40.96
40.32
9
7.1
6.3
50.41
39.69
44.73
10
8
7
64
49
56
11
9
8
81
64
72
12
10
8.1
100
65.61
81
yj
64.8
57.5
428.18
335.63
378
(1)试利用上述数据表建立合成纤维的强度y与其拉伸倍数x的回归方程;
(2)检验所见方程是否有意义(0.05);
(3)预测当拉伸倍数x=6时,强度y的置信度为95%的置信区间。
(D由于
一Ada-57.5〜
n=12,乂B4,v47917
1212
122122
X212x428.1812(5.4)278.26
Ixy
(XiX)(Vi
12
y)Xiyi12xy378125.44.791767.4978
解:
于是得
b
-
弘坯0.8625:
x78.26
$x
4.79170.86255.40.1342
故所求回归方程为
0.13420.8625X
(2)
12
2
12
yy
(y
i1
y)
y212y335.6312(4.7917)260.1053
filxy
0.8625
67.497858.2169
S回1.8884
由PF0.05»查F(1,10)分布表(附■表5)得4.96,而
fS^/(122)30828694.96
所以回归方程有意义。
(3)x6时,y的估计值为
$0.13420.862565.3092
2.2281,故得y的置信度为95%的预测区间为
(0.1342O.8625xo2.22810.434Q1—区空LV1278.26
0.13420.8625X02.22810.4346^1—-)
V1278.26
从而得x6时,y的置信度为95%的预测区间为(4.29926.3192)
1•某厂有三条生产线,从三条生产线生产的纤维中分别抽取了一些样品,纤维强度数据见下表,试考察它们生产的纤维在强度上是否有显著差异?
自动生产线
纤维强度
甲
7.0
7.4
6.1
6.5
7.5
乙
5.5
6.7
7.2
5.8
丙
6.7
7.2
8.2
7.3
7.5
6.9
解:
三条生产线可以看做三个水平,即k3,以n(i1,2,3)表分别示各水平所做的重复试
验次数,即仃5上4上6,由上表计算得Tgg103.5,Tg34.5,Tag25.2,%43.8
k「i
2
i1j1
Tg%下
103.52
721.21
7.06
6
Ti:
Tg2g
34.52
25・2243.82103.5224
riri
b5
46546.
2.4=4.66
s且间=7.06
2.4
12
将有尖结果列入方差分析表(表)
方差来源
平方和
自由度
平均平方和
F值
因素A(组间)
2.4
2
1.2
3.0901
误差(组内)
4.66
12
0.3883
总和
7.06
14
对于给定,由PF
查F(2,12)表可得,则F,所以三条生产线上的
纤维强度差异。
2•设有来自不同总体的四个样本分别为(2,5),(2,3),(5,1),(6,2),试用重心法和离差平方和法进行聚类,并提出您的分类建议。
解:
(1)重心法:
首先将四个样品分别看做一类,计算距离矩阵D(2»o
D(o)
Gi
G2
G4
Gi
0
G2
4
0
G3
25
13
0
G4
25
17
2
0
由D(0)可以看出,G3和G4之间距离最短,因此可以合并为一个新类Gs63,64,然后计算G、G2、G5之间的距离,得相应的D
(1)如下
D
(2)
S1
G2
G5
gi
0
G2
4
0
G5
24.5
14.5
0
由6)可以看出,Gi和&之间距离最短,因此可以合并为一个新类G6Gi,G2,
然后计算G5、G6之间的距离,得相应的D⑵如下
D
(2)
Gs
G6
G5
0
Ge
18.5
0
最后将G5与G6合为一类G70,02,03,04。
上述聚类过程用聚类图表示为图2-1
(2)离差平方和法:
由
(1)中已计算的重心法的距离平方及D:
q叱Dpq(C)计算距离矩阵D(0)ripllq
D(0)
61
G2
°3
G4
Gi
0
G2
2
0
G3
12.5
6.5
0
G4
12.5
8.5
1
0
由D(0)可以看出,G3和G4之间距离最短,因此可以合并为一个新类GsG®G4,
然后计算G、G2、G5之间的距离,得相应的D:
)如下
G1
G2
Gs
G1
0
G2
2
0
G5
16.3333
9.6667
0
由D:
)可以看出,G和Q之间距离最短,因此可以合并为一个新类GeGi,G2,
然后计算Gs、G6之间的距离,得相应的D⑵如下
D
(2)
G5
G6
G5
0
G6
18.5
0
最后将G5与G6合为一类G7G,G2,G3,G4。
上述聚类过程用聚类图表示为图2-23•设有总体2,且分别服从均匀分布U(-1,1),U(0,3),试:
分别用贝叶斯判别法(取Q'Q2,C(112)C(2|1))和距禺(米用马氏距离)判别法判别样品Xi0.7及x?
1.1所属的类心
解:
(1)贝叶斯判别法:
由题意得,Pi(0.7)
P2(0.7)-,故Xi°・7所属的类为2
3
Pi(1.1)
1故X2所属的类为20
PpH.n3
(2)距禺判别法:
1lx2dx
对于总体
Dli2
/I0.7i.d0.533
d2(0.7)d(0.7,2)1(—=
虑
显然d(0.7,i)
v/4
d(0.7,2),故Xi0.7属于2°
di(1.1)d(1.1,i)1・1、、3
显然d(1.1,1)d(1.1,2)故X21.1属于2。
4•在异乡试验中测得尖于Xi,X2,y的部分数据如下:
Xi
■4
■3
■3
■1
2
0
1
4
6
5
X
■7
■7
・3
3
7
6
5
3
y
-10
・8
■4
■1
2
4
8
9
10
11
(1)试建立y与人兴的回归方程。
并就
0.05检验所的回归方程是否有意义;
(2)检验人,"对y的影响是否显著(0.05):
解:
(1)建立数据预处理表
表数据预处理计算
Xi
y
2
Xi
2
X2
X1X2
X”
X2y
2y
1
・4
・7
-10
16
49
28
40
70
100
2
・3
・7
・8
9
49
21
24
56
64
3
・3
・3
・4
9
9
9
12
12
16
4
・1
・1
1
1
1
1
1
1
5
2
2
4
1
・2
4
・2
4
6
0
3
4
0
9
0
0
12
16
7
1
7
8
1
49
7
8
56
64
8
4
6
9
16
36
24
36
54
81
9
6
5
10
36
25
30
60
50
100
10
5
3
11
25
9
15
55
33
121
刀
7
5
21
117
237
133
240
342
567
由表4-1得
10
>12
22
•2y
yy
X210xf1177
AlXi21OX!
X2
102
X;10X2
10
ViXil
10
yiXi2
10
(y
112.1
10
133
237
10x-jy240
10x2y
210
342
y)
2
Vi
解正规方程
112.b
129.5b
得$11.0406,
b2
0.8390
$o
$-
blX-i
$2X2
21
10
得回归方程
气0.9521
—129.5I21
10
52
10
234.5
21
225.3
10
过331.5
10
10y
567竺
10
522.9
129.5b2
234.5b
225.3
331.5
7
1.04060.8390
10
5
0.9521
10
1.0406%0.8390X2
hyg
l2yb2225.31.0406331.50.8390512.5757
lyyS回522.9512.575710.3243
S残/(1021)1737663
对于给定的
0.05'查F(2,7)表(附表5)得临界值4.74,
F173.76634.74,
所以检验效果显著,即回归方程有意
(3)检验Xi,X2詮y的影响的显著
性。
IIII12112.1129.5
I21L2129.5234.5
L1
取统计量
计算得Fi2.9797,F2
界值5.59由于
112.234.5129.52
1
F
1S残/(102
40.5196。
对给定的
234.5129.5
129.5
112
1
i1,2
I
0.10‘查表F(1,7)(附表
得临
Fi2.97975.59
F240.51965.59
二、(每题10分,共20分)
1•设X!
(0,1,1),X2(2,0,1),Xs(1,2,4),为来自总体X的一个样本,求的协方差矩阵、相尖矩阵R的矩估计。
1
解:
X(-Xm.任
X3)(3(o
2严1°)叫14))(1,1,2)
(,(XiX)(XiX)
1
1-(0(1,0,1)
21
1(1,U)1(0,1,2))
1U1
000
1
10
2
13
6
012)
—
1
0
0
024
2
3
2
0
3
2
RG)33,其中1j=
(M1,2,3)
所以
i23
显然d(0.7,i)d(0.7,2),故Xi0.7属于2。
di(1.1)d(1.1,i)“。
1.1.3
0.27^3
显然d(1.1,1)d(1.1,2)故X21.1属于2。
、(20分)下面记录了三位操作工分别在四台不同机器上操作二天的日产量:
机器
操
作
工
甲
乙
丙
A
15
17
16
16
18
21
B
16
17
15
15
22
19
C
15
16
18
17
18
18
D
18
20
15
17
17
17
试用方差分析法检验:
(1)操作工之间的差异是否显著;
(2)机器之间的差异是否显著;
(3)交互影响是否显著。
(=0.05)
解:
由题意知k3,r4,n2,又由题目给出数据可得:
krn
s2
i1j1i1krn
2门
TAAQ2
仝718981.9583
342
表中每个操作工在每个机器上操作二天的日产量之和。
方差分析表
方差来源
平方和
自由度
平均平方和
F值
操作工
P30.0833
2
15.0417
P10.9394
机器
0.4583
3
0.1528
0.1111
交互作用
34.9167
6
5.8195
4.2323
误差
16.5
12
1.375
总和
81.9583
23
对于给定水平0.05,由PF0.05分别查表得13.89,23.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计