应用多元统计分析习题解答第七章Word下载.docx
- 文档编号:7813852
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:21
- 大小:158.84KB
应用多元统计分析习题解答第七章Word下载.docx
《应用多元统计分析习题解答第七章Word下载.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析习题解答第七章Word下载.docx(21页珍藏版)》请在冰点文库上搜索。
7.4在进行因子分析时,为什么要进行因子旋转?
最大方差因子旋转的基本思路是什么?
因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。
但有时直接
根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。
这种因子模型反而是不
利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。
这时需
要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因
子上的载荷比较小。
最大方差旋转法是一种正交旋转的方法,其基本思路为:
①
A
***4p
其中令A二A『二佝)pm,dij=aij/hidj=—工djj2pi=t
*1pc一c
A的第j列元素平方的相对方差可定义为Vj=-x(dj-di)2
pj
②V認V2川Vm
最大方差旋转法就是选择正交矩阵r,使得矩阵A*所有m个列元素平方的相对方差之和达
到最大。
7.5试分析因子分析模型与线性回归模型的区别与联系。
通过具体指标测评抽象因子的统
因子分析模型是一种通过显在变量测评潜在变量,
计分析方法的模型。
而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,
用函数关系式表达出来。
因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。
即
XiWiFi•ai2F2amFm•,(i刼,HIp)该模型可用矩阵表示为:
X=AF-£
而回归分析模型中多元线性回归方程模型为:
)'
来描述,在因子分析时,从约相
所以找前两个特
征值所对应的公共因子即可,又知对应的正则化特征向量分别为(0.707,-0.316,0.632)
及(0,0.899,0.4470)'
要求:
(1)计算因子载荷矩阵A,并建立因子模型。
7.6设某客观现象可用关阵出发计算出特征值为
「:
-由于
是常数项,
是偏回归系数,
11213
(2)计算共同度。
(3)计算第一公因子对X的“贡献”。
(
0,9360\
10.4130.8991
0.8370.4470/
I建立因子模型为
(2)
(3)因为是从约相关阵计算的特征值,所以公共因子对X的“贡献”为
7.7利用因子分析方法分析下列30个学生成绩的因子构成,并分析各个学生较适合学文科
还是理科。
序号
数学
物理
化学
语文
历史
英语
1
65
61
72
84
81
79
2
77
76
64
70
55
3
67
63
49
57
4
80
69
75
74
5
6
78
62
71
7
66
52
8
86
9
83
100
41
50
10
94
97
51
11
88
73
12
53
58
56
13
14
15
96
89
16
17
90
68
60
18
19
85
20
21
91
22
87
23
82
24
25
95
59
26
27
98
47
28
29
54
30
解:
令数学成绩为Xi,物理为X2,化学为X3,语文为X4,历史为X5,英语为Xi,用SPSS
分析学生成绩的因子构成的步骤如下:
1.在SPSS窗口中选择Analyze^DataReduction^Factor,调出因子分析主界面,并将六个变量移入Variables框中。
图7.1因子分析主界面
2•点击Descriptives按钮,展开相应对话框,见图7.2。
选择Initialsolution复选项。
这
个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。
单击
Continue按钮,返回主界面。
園FactorAnalysis:
:
Descriptives
rStatistics-
Univariatedescriptives
0Initialsolution
rCorrelationMatrix
Coefficients□Inverse
Significancelevels|ReproducedDeterminant□Anti-image
□KMOandBartlett'
stestofsphericity
ContinueCancelHelp
图7.2Descriptives子对话框
3•点击Extraction按钮,设置因子提取的选项,见图7.3。
在Method下拉列表中选择
因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法”。
在Analyze栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。
在Display
栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。
在Extract栏
中指定因子提取的数目,有两种设置方法:
一种是在Eigenvaluesover后的框中设置提取的
因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;
第二种
设置方法是直接在Numberoffactors后的矩形框中输入要求提取的公因子的数目。
这里我们
均选择系统默认选项,单击Continue按钮,返回主界面。
图7.3Extraction子对话框
4.点击Rotation按钮,设置因子旋转的方法。
这里选择Varimax(方差最大旋转),并选
择Display栏中的Rotatedsolution复选框,在输出窗口中显示旋转后的因子载荷阵。
单击Continue按钮,返回主界面。
图7.4Rotation子对话框
5•点击Scores按钮,设置因子得分的选项。
选中Saveasvariables复选框,将因子得分
作为新变量保存在数据文件中。
选中Displayfactorscorecoefficientmatrix复选框,这样在
结果输出窗口中会给出因子得分系数矩阵。
单击Continue按钮返回主界面。
图7.5Scores子对话框
6.单击0K按钮,运行因子分析过程。
结果分析:
表7.1旋转前因子载荷阵表7.2旋转后因子载荷阵
成份矩阵a
成份
x1
-.662
.503
x2
-.530
.478
x3
-.555
.605
x4
.900
.233
x5
.857
.357
|x6|
.816I
.498I
旋转成份矩阵a
提取方法
主成分分析法。
-.245
.795
-.152
.698
-.099
.815
.867
-.335
.904
-.209
x6
.953
-.072
从表7.1中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,为了便于对因子进行命名,需要对因子载荷阵进行旋转,得表7.2。
经过旋转后的载荷系数已经明显地两
极分化了。
第一个公共因子在后三个指标上有较大载荷,说明这三个指标有较强的相关性,可以归为一类,属于文科学习能力的指标;
第二个公共因子在前三个指标上有较大载荷,同
样可以归为一类,这三个指标同属于理科学习能力的指标。
根据表7.3易得:
F1=0.064X10.085X20.137X30.332X40.378X50.432X6
F2=0.439X10.400X20.484X30.014X40.073X50.169X6
表7.3因子得分系数矩阵
成枱
X1
.064
.439
.005
400
137
.4S4
X4
332
^.014
.378
.073
X6
432
169
将每个学生的六门成绩分别代入F1、F2,比较两者的大小,F1大的适合学文,
F2大的适合学理。
计算结果为学号是1、16、24的学生适合学文,其余均适合学理。
7.8某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系
影响预测结果,需首先进行因子分析来简化指标系统。
下表是抽查欧洲某汽车市场7个品牌
不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。
品牌
价格
发动机
功率
轴距
宽
长
燃料容量
燃料
效率
21500
1.8
140
101.2
67.3
172.4
2.639
13.2
28400
3.2
225
108.1
70.3
192.9
3.517
17.2
42000
3.5
210
114.6
71.4
196.6
3.850
18.0
B
23990
150
102.6
68.2
178.0
2.998
16.4
33950
2.8
200
108.7
76.1
192.0
3.561
18.5
62000
4.2
310
113.0
74.0
198.2
3.902
23.7
C
26990
2.5
1/0
107.3
33400
193
38900
111.4
D
21975
3.1
175
109.0
25300
3.8
240
31965
205
113.8
27885
112.2
E
39895
4.6
275
115.3
39665
108.0
31010
3.0
107.4
46225
5.7
255
117.5
F
13260
2.2
115
104.1
16535
170
107.0
18890
107.5
19390
3.4
180
110.5
24340
101.1
45705
345
104.5
13960
120
97.1
9235
1.0
93.1
G
19840
163
103.7
24495
168
106.0
22245
2.7
16480
2.0
132
28340
253
29185
68.4
176.0
3.1/9
16.6
—26
68.5
3.197
70.9
188.0
3.472
72.7
194.6
3.368
17.5
196.2
3.543
74.7
206.8
3.778
73.5
200.0
3.591
74.5
207.2
3.978
75.5
200.6
3.843
19.0
194.8
3.770
77.0
201.2
5.572
30.0
67.9
180.9
2.676
14.3
69.4
190.4
3.051
15.0
72.5
200.9
3.330
197.9
3.340
17.0
74.1
193.2
3.500
16.8
73.6
179.7
3.210
19.1
66.7
174.3
2.398
33
62.6
149.4
1.895
10.3
45
73.0
3.389
69.7
190.9
2.967
15.9
69.2
193.0
3.332
16.0
74.4
209.1
3.452
71.0
186.0
2.911
207.7
3.564
197.8
3.567
解:
令价格为X1,发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X7,燃
料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7。
此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个
成分贡献了90.9%,因此重复因子分析过程,并在第三步Extraction子对话框中的Numberof
factors后的矩形框中输入3,即为要提取的公因子的数目。
因子分析结果如下:
表7.4旋转后的因子得分系数矩阵
咸常揖分系数矩阵
-3S9
.342
X2
*015
.525
-.278
-.060
.700
-.409
K4
305
-.344
.241
X5
354
J95
-336
sgg
-JOO
-.332
x7
.036
-.291
.494
xe
-1B6
-.221
.651
xS
-.071
0G2
-.239
其简化了指标体系为F1、F2、F3,从旋转后的因子得分系数矩阵得:
F1=-0.399X1-0.015X2-0.060X30.305X40.354X50.599X6-0.036X^0.186X^0.071X9F2=0.289X1-0.525X20.700X3-0.344X40.195X5-0.100X6-0.291X7-0.221X80.082X9F3=0.342X1-0.278X2-0.409X30.241X4-0.338X5-0.332X60.494X7-0.651X8-0.239X9
7.9根据人均GDP、第三产业从业人员占全部从业人员的比重、第三产业增加值占GDP的比
重、人均铺装道路面积、万人拥有公共汽电车、万人拥有医生、百人拥有电话机数、万人拥
有高等学校在校学生人数、人均居住面积、百人拥有公共图书馆藏书、人均绿地面积等十一项指标对目前我国省会城市和计划单列市的城市化进行因子分析,并利用因子得分对其进行
排序和评价。
(数据可从《中国统计年鉴》查获)
(略)
7.10根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用因子分析法对其进行排序和分类,并与聚类分析的结果进行比较。
对其进行因子分析的步骤与7.7相同,结果如下:
表7.5特征根与方差解释分析表
解释的聽右差
成祖
提取平方和臥
旨+
专差的%
累槟%
合计
有差的%
右差的%
5.059
56.199
56199
5056
56J99
3.972
44.138
44.130
2390
2G551
02750
2390
26.551
82750
3475
36.612
62.750
.814
9.041
91790
341
3794
95.675
.248
2.759
99.333
.100
1.100
99.441
.027
.304
99.744
.020
.219
Q9.Q64
g
003
100.000
由表7.5可知,提取的两个因子方差贡献达到了82.75%。
表7.6旋转后的因子得分系数矩阵
成常得分系数描阵
-093
.315
-.100
316
.1S7
-103
.25E
-.097
.017
.249
-.022
-.057
.282
ose
X9
-.009
由上面的因子得分矩阵可知:
F1-£
.093X1-0.100X20.167X30.258X40.219X50.248X6-0.057X70.086X80.233X9
F2=0.315X10.316X2-0.103X3-0.097X40.017X5-0.022X60.282X70.169X8-0.008X9
与主成分分析中计算综合得分同理,用F-F1^F2进行加权,得排序:
F1
F2
深圳
382417.42
392989.93
385811.19
上海
157848.03
52892.05
124157.16
厦门
114461.78
107589.61
112255.81
广州
125604.86
49740.69
101252.46
杭州
94835.17
45211.64
78906.02
宁波
91203.35
43854.84
76004.48
北京
102885.84
17864.73
75594.07
南宁
天津
89055.66
32589.70
70930.09
海口
南京
82495.01
39893.01
68819.77
青岛
79248.60
22497.55
61031.51
大连
71586.92
27254.60
57356.24
济南
56561.73
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 习题 解答 第七