多元统计伦的结课作业Word格式.docx
- 文档编号:7930123
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:34
- 大小:243.98KB
多元统计伦的结课作业Word格式.docx
《多元统计伦的结课作业Word格式.docx》由会员分享,可在线阅读,更多相关《多元统计伦的结课作业Word格式.docx(34页珍藏版)》请在冰点文库上搜索。
.765
.171
8
.963
.839
x1
.101
.907
.189
.926
.406
.201
.908
.337
a.Lilliefors显著水平修正
*.这是真实显著水平的下限。
上述两个表给出了对每一个变量进行正态检验的结果,由表可以看出血红蛋白浓度和红细胞计数的显著性水平均大于0.05,即接受原假设,所以这两个变量均遵从正态分布。
方差齐性检验
Levene统计量
df1
df2
显著性
1.418
2
27
.260
.220
.804
上表是对协方差阵相等的检验,检验统计量是Box’s
M,由Sig.值可以看出,0.670显著的大于0.05,所以在0.05的显著性水平下接受协方差阵相等的原假设。
即可以认为三组的协方差阵是相等的,符合方差齐性.
题目二:
检验三组贫血患者的指标x1,x2间是否有显著差异,进行多元方差分析。
多变量检验c
效应
值
F
假设df
误差df
截距
Pillai的跟踪
.987
1001.859a
2.000
26.000
.000
Wilks的Lambda
.013
Hotelling的跟踪
77.066
Roy的最大根
.566
5.323
4.000
54.000
.001
.503
5.335a
52.000
.853
5.333
50.000
.642
8.662b
27.000
a.精确统计量
b.该统计量是F的上限,它产生了一个关于显著性级别的下限。
c.设计:
截距+fz
以上的结果为多元方差的组间比较的结果,F=5.323,P=0.001拒绝H0,接受H1,故无论从哪个统计量来看,三组不同患者的血红蛋白浓度和红细胞计数这两个指标间均存在显著差异。
ANOVA
平方和
均方
组间
7.926
3.963
7.302
.003
组内
14.653
.543
总数
22.579
29
13753.958
6876.979
3.915
.032
47426.042
1756.520
61180.000
由上表GROUP行可以看到:
血红蛋白浓度和红细胞计数这两个指标的显著性水平分别为0.003和0.002均小于0.05,这说明三个组在血红蛋白浓度和红细胞计数这两个指标上均有显著差异。
题目三:
最后进行两两比较,给出更具体的分析结果。
多重比较
因变量
(I)fz
(J)fz
均值差(I-J)
标准误
95%置信区间
下限
上限
LSD
-1.1033*
.3154
.002
-1.751
-.456
-.0333
.3362
.922
-.723
.657
1.1033*
.456
1.751
1.0700*
.3494
.005
.353
1.787
.0333
-.657
.723
-1.0700*
-1.787
-.353
-35.833
17.945
.056
-72.65
.99
-50.208*
19.130
.014
-89.46
-10.96
35.833
-.99
72.65
-14.375
19.880
.476
-55.17
26.42
50.208*
10.96
89.46
14.375
-26.42
55.17
*.均值差的显著性水平为0.05。
题目四:
画出三组患者x1,x2两指标的均值图。
由f1可以看出,A组与B组、C组与B组的红蛋白浓度有显著差异,而A组与C
组的血红蛋白浓度没有显著差别,大致在一水平线上。
由f3也可以看出A组与C组的红细胞计数差异显著。
B组与C组、A组与B组的差别相对较小。
作业2聚类分析作业
1.为研究不同公司的运营特点,调查了15个公司的组织文化、组织氛围、领导角色和员工发展4个方面的内容。
请将这15个公司按照其各自的特点划分成4种类型。
数据如下表所示。
公司
组织文化
组织氛围
领导角色
员工发展
MICROSOF
80
85
75
90
IBM
DELL
60
APPLE
联想
99
98
78
NPP
88
89
北京电子
79
95
97
清华紫光
81
82
北大方正
96
TCL
65
娃哈哈
87
50
51
ANGEL
76
HUSSAR
56
世纪飞扬
100
84
VINDA
61
64
1、用系统聚类法聚类,聚类方法采用组间联结法,距离采用平方欧式距离计算,给出树状图和冰柱图,给出聚合系数图,并分析聚成几类比较合适。
2、用快速聚类法给出聚类结果并对结果进行分析,聚类类数和系统聚类法相同。
问题1:
平均联结(组之间)
下图反映了每一阶段的聚类结果
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
1
7
9
.131
6
3
5
14
.511
11
13
.692
.785
.800
1.515
1.578
2.957
15
4.560
5.141
5.642
10.965
19.258
下图为垂直冰状图,也是反映样品聚类的情况图,在类数的行上从左到右可以找到各类所包含的样品
下图为树状聚类图,从图中由分类得到的分类情况
*******************HIERARCHICALCLUSTERANALYSIS*******************
DendrogramusingAverageLinkage(BetweenGroups)
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
北京电子7-+
北大方正9-+-+
ANGEL12-++---+
IBM2-+-+|
NPP6-++-----+
MICROSOF1-+-+||
APPLE4-++---++-+
清华紫光8---+||
联想5-+-----------++-------------+
世纪飞扬14-+||
DELL3---------------++-------------------+
TCL10-+---------+||
HUSSAR13-++-----------------+|
VINDA15-----------+|
娃哈哈11-------------------------------------------------+
聚合系数图:
根据聚合系数图可以分成2类;
题目2:
用快速聚类法给出聚类结果并对结果进行分析,聚类类数和系统聚类法相同。
选择analyze--classify--k-meanscluster,进入“K-均值聚类”对话框,将上面的4各变量选入“变量”一栏,将公司用于“标志”,分类数”定位4“。
在”选项“中选择最初分类中心,方差分析表,样品分类信息,得到下
F检验应仅用于描述目的,因为选中的聚类将被用于最大化不同聚类中的案例间的差别。
观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。
输出结果中,我们可以看到快速聚类法将四个公司分为四类:
{1:
哇哈哈};
{2:
北京电子,北大方正,TCL,ANGEL,HUSSAR,VINDA};
{3:
DELL,清华紫光};
{4:
MICROSOF,IBM,APPLE,联想,NPP,北京电子,清华紫光,北大方正,ANGEL,世纪飞扬}。
通过最后的方差分析表可以看出,四个变量对分类贡献显著。
作业3判别分析作业----中小企业的破产模型
为研究中小企业的破产模型,选定4个经济指标:
X1总负债率(现金收益/总负债)
X2收益性指标(纯收入/总财产)
X3短期支付能力(流动资产/流动负债)
X4生产效率性指标(流动资产/纯销售额)
对17个破产企业(1类)和21个正常运行企业(2类)进行调查,得如下资料
总负债率
收益性指标
短期支付能力
生产效率指标
类别
-.45
-0.41
1.09
0.45
-.56
-0.31
1.51
0.16
.06
0.02
1.01
0.4
-0.07
-0.09
1.45
0.26
-0.1
1.56
0.67
-0.14
0.71
0.28
-0.23
-0.3
0.22
0.18
0.07
1.31
0.25
0.01
2.15
0.7
-0.28
1.19
0.66
0.15
0.05
1.88
0.27
0.37
0.11
1.99
0.38
-0.08
0.42
0.03
1.68
0.95
1.26
0.6
0.12
1.14
0.17
-0.27
1.27
0.51
0.1
2.49
0.54
0.08
2.01
0.53
3.27
0.55
0.19
2.25
0.33
0.32
4.24
0.63
0.31
4.45
0.69
2.52
-0.02
2.05
0.35
2.35
1.8
0.52
2.17
-1.01
2.5
0.58
0.14
-0.03
0.46
2.61
-0.33
3.01
0.47
0.48
0.09
1.24
0.56
4.29
0.2
0.3
2.92
0.04
2.45
5.06
0.13
1.50
待判
-0.06
1.37
进行判别分析,要求:
1、给出判别变量的显著性检验结果(方差分析表),如果存在不显著的变量,进行剔除。
2、给出费歇判别函数的表达式及对待判样品的费歇判别结果
3、给出贝叶斯判别函数的表达式及对待判样品的贝叶斯判别结果
4、给出分类结果矩阵,包括交叉验证的结果
5、用逐步判别分析判别效果是否有显著改善?
问题1:
协方差矩阵的均等性的箱式检验
检验结果
箱的M
40.184
近似。
3.523
5562.171
对相等总体协方差矩阵的零假设进行检验。
这是对协方差矩阵是否相等的统计检验,由F值以及其显著性水平,检验结果在0.01水平下,可以近似认为两组的协方差矩阵相等即Sig=0.01<
0.05.变量显著.
问题2:
给出费歇判别函数的表达式及对待判样品的费歇判别结果
典型判别式函数系数
函数
2.947
-1.291
.767
生产效率性指标
-.590
(常量)
-1.648
非标准化系数
组质心处的函数
分类
-.987
.799
在组均值处评估的非标准化典型判别式函数
费歇判别函数的表达式:
Y=-1.823+2.321*x1+0.777*x3这里的X1,X3表示X1,X3标准变化量
-.960
.777
4.给出贝叶斯判别函数的表达式及对待判样品的贝叶斯判别结果
分类函数系数
-2.961
2.303
-.509
-2.815
1.533
2.902
9.397
8.344
-3.887
-6.664
Fisher的线性判别式函数
分类结果b,c
预测组成员
合计
初始
计数
17
16
21
未分组的案例
%
88.2
11.8
100.0
23.8
76.2
.0
交叉验证a
28.6
71.4
a.仅对分析中的案例进行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b.已对初始分组案例中的81.6%个进行了正确分类。
c.已对交叉验证分组案例中的78.9%个进行了正确分类。
作业4因子分析作业:
全国30个省市的8项经济指标如下:
省份
国内生产
居民消费
固定资产
职工工资
货物周转
消费价格
商品零售
工业产值
北京
1394.89
2505
519.01
8144
373.9
117.3
112.6
843.43
天津
920.11
2720
345.46
6501
342.8
115.2
110.6
582.51
河北
2849.52
1258
704.87
4839
2033.3
115.8
1234.85
山西
1092.48
1250
290.9
4721
717.3
116.9
115.6
697.25
内蒙
832.88
1387
250.23
4134
781.7
117.5
116.8
419.39
辽宁
2793.37
2397
387.99
4911
1371.7
116.1
114
1840.55
吉林
1129.2
1872
320.45
4430
497.4
114.2
762.47
黑龙江
2014.53
2334
435.73
4145
824.8
114.3
1240.37
上海
2462.57
5343
996.48
9279
207.4
118.7
113
1642.95
江苏
5155.25
1926
1434.95
5943
1025.5
2026.64
浙江
3524.79
2249
1006.39
6619
754.4
116.6
113.5
916.59
安徽
2003.58
1254
474
4609
908.3
114.8
112.7
824.14
福建
2160.52
2320
553.97
5857
609.3
114.4
433.67
江西
1205.11
1182
282.84
4211
411.7
115.9
571.84
山东
5002.34
1527
1229.55
5145
1196.6
117.6
2207.69
河南
3002.74
1034
670.35
4344
1574.4
116.5
114.9
1367.92
湖北
2391.42
571.68
4685
849
120
1220.72
湖南
2195.7
1408
422.61
4797
1011.8
119
115.5
843.83
广东
5381.72
2699
1639.83
8250
656.5
111.6
1396.35
广西
1606.15
1314
382.59
5105
556
118.4
116.4
554.97
海南
364.17
1814
198.35
5340
232.1
111.3
64.33
四川
3534
1261
822.54
4645
902.3
118.5
117
1431.81
贵州
630.07
942
150.84
4475
301.1
121.4
117.2
324.72
云南
1206.68
334
5149
310.4
121.3
118.1
716.65
西藏
55.98
1110
17.87
7382
5.57
陕西
1000.03
1208
300.27
4396
500.9
600.98
甘肃
553.35
1007
114.81
5493
507
119.8
468.79
青海
165.31
1445
47.76
5753
61.6
118
116.3
105.8
宁夏
169.75
1355
61.98
5079
121.8
117.1
115.3
新疆
834.57
1469
376.95
5348
339
119.7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计 作业
![提示](https://static.bingdoc.com/images/bang_tan.gif)