转载聚类判别分析作业.docx
- 文档编号:17057281
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:12
- 大小:73.86KB
转载聚类判别分析作业.docx
《转载聚类判别分析作业.docx》由会员分享,可在线阅读,更多相关《转载聚类判别分析作业.docx(12页珍藏版)》请在冰点文库上搜索。
转载聚类判别分析作业
人文地理学
20111108031
汪章飞
聚类分析与判别分析
一:
研究意义
省市的经济类型和众多因素比如地理位置、国民生产总值、人口素质等本文所进行的分析结果在一定程度上反映了这些省市的经济类型和经济特点。
二:
数据来源
本文所用的数据全来自2009年出版的《中国统计年鉴》,从中提取了有关京、津、冀、辽、苏等13省2008年的五种数据。
地区
地区生产总值
人均地区生产值
第一产业
第二产业
第三产业
北京
12153.03
70452
1
23.5
75.5
天津
7521.85
62574
1.7
53
45.3
河北
17235.48
24581
12.8
52
35.2
山西
7358.31
21522
6.5
54.3
39.2
内蒙古
9740.25
40282
9.5
52.5
38
辽宁
15212.49
35239
9.3
52
38.7
吉林
7278.75
26595
13.5
48.7
37.9
黑龙江
8587
22447
13.4
47.3
39.3
上海
15046.45
78989
0.8
39.9
59.4
江苏
34457.3
44744
6.6
53.9
39.6
三、分析过程
1.聚类分析
案例处理汇总a
案例
有效
缺失
总计
N
百分比
N
百分比
N
百分比
10
100.0
0
.0
10
100.0
近似矩阵
案例
平方Euclidean距离
1:
北京
2:
天津
3:
河北
4:
山西
5:
内蒙古
1:
北京
.000
83512494.972
2.130E9
2.417E9
9.161E8
2:
天津
83512494.972
.000
1.538E9
1.685E9
5.019E8
3:
河北
2.130E9
1.538E9
.000
1.069E8
3.027E8
4:
山西
2.417E9
1.685E9
1.069E8
.000
3.576E8
5:
内蒙古
9.161E8
5.019E8
3.027E8
3.576E8
.000
6:
辽宁
1.249E9
8.063E8
1.177E8
2.498E8
55377260.398
7:
吉林
1.947E9
1.295E9
1.032E8
25741740.844
1.934E8
8:
黑龙江
2.317E9
1.611E9
79350201.570
2365400.736
3.194E8
9:
上海
81252776.506
3.261E8
2.965E9
3.362E9
1.526E9
10:
江苏
1.158E9
1.043E9
7.031E8
1.274E9
6.308E8
近似矩阵
案例
平方Euclidean距离
6:
辽宁
7:
吉林
8:
黑龙江
9:
上海
10:
江苏
1:
北京
1.249E9
1.947E9
2.317E9
81252776.506
1.158E9
2:
天津
8.063E8
1.295E9
1.611E9
3.261E8
1.043E9
3:
河北
1.177E8
1.032E8
79350201.570
2.965E9
7.031E8
4:
山西
2.498E8
25741740.844
2365400.736
3.362E9
1.274E9
5:
内蒙古
55377260.398
1.934E8
3.194E8
1.526E9
6.308E8
6:
辽宁
.000
1.377E8
2.075E8
1.914E9
4.607E8
7:
吉林
1.377E8
.000
18917425.993
2.805E9
1.068E9
8:
黑龙江
2.075E8
18917425.993
.000
3.239E9
1.166E9
9:
上海
1.914E9
2.805E9
3.239E9
.000
1.550E9
10:
江苏
4.607E8
1.068E9
1.166E9
1.550E9
.000
这是一个不相似矩阵
平均联结(组之间)
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
群集1
群集2
1
4
8
2365400.736
0
0
2
2
4
7
22329583.418
1
0
5
3
5
6
55377260.398
0
0
7
4
1
9
81252776.506
0
0
6
5
3
4
96486305.907
0
2
7
6
1
2
2.048E8
4
0
9
7
3
5
2.357E8
5
3
8
8
3
10
8.838E8
7
0
9
9
1
3
1.808E9
6
8
0
树状图为:
由图可以得到:
4,7,8,3,5,6为一类,10单独一类,1,9,2一类。
即:
山西,吉林,黑龙江,河北,内蒙古和辽宁一类,江苏一类,北京,上海和天津三个直辖市一类。
这于我们的认识是一致的。
2.判别分析
分析案例处理摘要
未加权案例
N
百分比
有效
10
100.0
排除的
缺失或越界组代码
0
.0
至少一个缺失判别变量
0
.0
缺失或越界组代码还有至少一个缺失判别变量
0
.0
合计
0
.0
合计
10
100.0
组统计量
分类
均值
标准差
有效的N(列表状态)
未加权的
已加权的
1.00
地区生产总值
11573.7767
3795.59641
3
3.000
人均地区生产总值
70671.6667
8209.70440
3
3.000
第一产业
1.1667
.47258
3
3.000
第二产业
38.8000
14.78073
3
3.000
第三产业
60.0667
15.11103
3
3.000
2.00
地区生产总值
10902.0467
4268.20478
6
6.000
人均地区生产总值
28444.3333
7596.44563
6
6.000
第一产业
10.8333
2.84511
6
6.000
第二产业
51.1333
2.60819
6
6.000
第三产业
38.0500
1.51360
6
6.000
3.00
地区生产总值
34457.3000
.a
1
1.000
人均地区生产总值
44744.0000
.a
1
1.000
第一产业
6.6000
.a
1
1.000
第二产业
53.9000
.a
1
1.000
第三产业
39.6000
.a
1
1.000
合计
地区生产总值
13459.0910
8237.58211
10
10.000
人均地区生产总值
42742.5000
21066.23127
10
10.000
第一产业
7.5100
5.04126
10
10.000
第二产业
47.7100
9.53210
10
10.000
第三产业
44.8100
12.77049
10
10.000
a.数据不足
汇聚的组内矩阵
地区生产总值
人均地区生产总值
第一产业
第二产业
第三产业
相关性
地区生产总值
1.000
.434
.052
-.204
.189
人均地区生产总值
.434
1.000
-.239
-.175
.248
第一产业
.052
-.239
1.000
-.157
-.137
第二产业
-.204
-.175
-.157
1.000
-.957
第三产业
.189
.248
-.137
-.957
1.000
按照案例顺序的统计量
案例数目
实际组
最高组
预测组
P(D>d|G=g)
P(G=g|D=d)
到质心的平方Mahalanobis距离
p
df
初始
1
1
1
.918
2
1.000
.171
2
1
1
.522
2
1.000
1.302
3
2
2
.133
2
1.000
4.041
4
2
2
.971
2
1.000
.058
5
2
2
.260
2
1.000
2.691
6
2
2
.433
2
1.000
1.672
7
2
2
.417
2
1.000
1.748
8
2
2
.503
2
1.000
1.372
9
1
1
.624
2
1.000
.944
10
3
3
1.000
2
1.000
.000
单独组图表
判别函数图为:
三.分类结果分析
北京,上海和天津的经济结构相差不大但经济比例中有差异,同一种类型的经济。
山西,吉林,黑龙江,河北,内蒙古和辽宁同为国内农业和重工业大省,它们的经济结构相同,而江苏单独分为一类。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 转载 判别分析 作业