主成份数据分析报告Spss和R语言.docx
- 文档编号:9407722
- 上传时间:2023-05-18
- 格式:DOCX
- 页数:11
- 大小:684.80KB
主成份数据分析报告Spss和R语言.docx
《主成份数据分析报告Spss和R语言.docx》由会员分享,可在线阅读,更多相关《主成份数据分析报告Spss和R语言.docx(11页珍藏版)》请在冰点文库上搜索。
主成份数据分析报告Spss和R语言
1、实验题目
主成份分析实验
二、实验目的
通过本次实验对数据的处理,掌握主成份分析的原理,熟悉主成份分析在SPSS软件和R语言中的实现。
三、实验原理
四、实验数据
如下给出中国近年国民经济主要指标统计,用主成分分析法对这些指标提取主成份,写出提取的主成份与这些指标之间的表达式。
原始数据如下:
年份
全国人口
农林牧渔业总产值
工业总产值
国内生产总值
油料
全社会投资总额
棉花
粮食
1998
124810
24516.7
119048
78345
2313.9
28406.2
450.1
51230
1999
125909
24519.1
126111
82067
2601.2
29854.7
389.2
50839
2000
126743
24915.8
85673.7
89442
2955
32917.7
442
46218
2001
127627
26179.6
95449
97315
2864.9
37213.5
532.4
45264
2002
128453
27390.8
110776
105172
2897.2
43499.9
491.6
45706
2003
129227
29691.8
142271
117390.2
2811
5566.6
486
43069.5
2004
229988
36239
201722
135875.9
3065.9
70477.4
632.4
46946.9
2005
130756
39450.9
251619.5
183084.8
3077.1
88773.6
571.4
48402.2
四、SPSS实验步骤
、定义变量
②、输入数据
③在菜单栏中选择“分析”→“降维”→“因子分析”。
④、除了“年份”选项都选入变量列表。
⑤、单击“描述”→选中“原始分析结果”复选框→“度”设为线性;选中“系数”
⑥单击“抽取”,选中“未旋转的因子解”复选框。
其余默认
⑦、选中“得分”→“保存为变量”
⑧、选中“转换”→“计算变量”,数字表达式中分别输入“a9=b9/SQR(3.849)”“a10=b10/SQR(1.808)”,由载荷矩阵得到主成份特征向量矩阵(a9a10),(变量视图中改变增加的变量b9、b10、a9、a10的小数位数为3)
五、SPSS实验结果与分析
1、运行结果图如下所示:
2、spss结果分析:
由成分矩阵可以得到各个变量的线性组合表达的主成份:
F1=0.322*全国人口+0.448*农林牧渔业总产值+0.497*工业总产值+0.475*国内生产总值+0.392*油料+0.432*全社会投资总额+0.458*棉花-0.093*粮食;
F2=-0.021*全国人口+0.267*农林牧渔业总产值+0.062*工业总产值+0.027*国内生产总值-0.368*油料+0.261*全社会投资总额-0.126*棉花+0.719*粮食。
在第一主成份中,除了粮食以外的变量的系数比较大,可以看成反映那些变量的综合指标;在第二主成份中,变量粮食的系数比较大,可以看成反映粮食的综合指标。
主成分分析是一种矩阵变换,各个主成分并不一定有实际意义,本题目中的主成份含义不明确。
由系数相关矩阵,各个变量之间都有一定的相关关系,一些相关系数接近于1,适合用主成分分析。
方差贡献率和累计贡献率得出,前两个进行主成分分析,足够代替原来的变量,几乎涵盖了原变量所有的信息。
成分矩阵给出了主成份与标准化形式的变量之间的表达式。
数据窗口中,因子得分作为变量保存,
六、R语言实验结果与分析
①输入命令:
②输出结果如下:
③主成分分析,求出x的相关系数矩阵
④第四步,求相关系数矩阵的特征值以及特征向量:
⑤特征值碎石图:
⑥结果分析:
相关系数的特征值前两个都大于一,远大于其余的特征值,因此有第一主成分和第二主成份,F1=0.279*全国人口+0.430*农林牧渔业总产值+0.388*工业总产值+0.410*国内生产总值+0.339*油料+0.374*全社会投资总额+0.396*棉花-0.080*粮食;
F2=-0.023*全国人口+0.069*农林牧渔业总产值+0.296*工业总产值+0.03*国内生产总值-0.409*油料+0.289*全社会投资总额-0.14*棉花+0.797*粮食。
⑦R语言程序运行结果与spss运行结果的比较
同样第一主成分不包含粮食,第二主成份中粮食占主要影响,主成份表达式接近,误差很小。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成份 数据 分析 报告 Spss 语言