实验五 聚类分析.docx
- 文档编号:17976996
- 上传时间:2023-08-05
- 格式:DOCX
- 页数:32
- 大小:127.57KB
实验五 聚类分析.docx
《实验五 聚类分析.docx》由会员分享,可在线阅读,更多相关《实验五 聚类分析.docx(32页珍藏版)》请在冰点文库上搜索。
实验五聚类分析
实验五聚类分析
1.下表是1999年我国省、自治区的城市规模结构特征的一些数据,请通过聚类分析将这些省、自治区进行分类。
省、自治区首位城市规模(万人)城市首位度四城市指数基尼系数城市规模中位值(万人)
京津冀699.701.43710.93640.780410.880
山西179.461.89821.00060.587011.780
内蒙古111.131.41800.67720.515817.775
辽宁389.601.91820.85410.576226.320
吉林211.341.78801.07980.456919.705
黑龙江259.002.30590.34170.507623.480
苏沪923.193.73502.05720.620822.160
浙江139.291.87120.88580.453612.670
安徽102.781.23330.53260.379827.375
福建108.501.72910.93250.468711.120
江西129.203.24541.19350.451917.080
山东173.351.00180.42960.450321.215
河南151.541.49270.67750.473813.940
湖北434.467.13282.44130.528219.190
湖南139.292.35010.83600.489014.250
广东336.543.54071.38630.402022.195
广西96.121.22880.63820.500014.340
海南45.432.19150.86480.41368.730
川渝365.011.68011.14860.572018.615
云南146.006.63332.37850.535912.250
贵州136.222.82791.29180.598410.470
西藏11.794.15141.17980.61187.315
陕西244.045.11941.96820.628717.800
甘肃145.494.75151.93660.580611.650
青海61.368.26950.85980.80987.420
宁夏47.601.50780.95870.48439.730
新疆128.673.85351.62160.490114.470
解:
(1)计算五个指标之间的相关系数
clearall
clc
x=load('data.txt');
r=corrcoef(x)
运行结果:
r=
1.0000
0.0329
0.3398
0.3654
0.4037
0.0329
1.0000
0.7038
0.4459
-0.2261
0.3398
0.7038
1.0000
0.2127
-0.0750
0.3654
0.4459
0.2127
1.0000
-0.3613
0.4037
-0.2261
-0.0750
-0.3613
1.0000
定性考察反映城市规模结果的五大特征指标数据,可以看出,某些指标之间存在着很强的相关性,因此可以从这些指标中选取几个有代表性的指标进行聚类分析。
(2)对原始数据进行标准化处理,变量间相近性度量采用相关系数,类间相近性度量计算类平均距离
d=1-r;%进行数据变换,把相关系数转换为距离
d=tril(d);%取出矩阵d的下三角元素
d=nonzeros(d);%取出非零元素
d=d';%化成行向量
z=linkage(d,'average')%计算类平均距离
dendrogram(z)%作聚类图
T=cluster(z,'maxclust',3)%把变量划分成3类
fori=1:
3
tm=find(T==i);%求第i类的对象
tm=reshape(tm,1,length(tm));%变成行向量
fprintf('第%d类的有指标%s\n',i,int2str(tm))%显示分类结果
end
运行结果:
z=
2.0000
3.0000
0.2962
1.0000
5.0000
0.5963
4.0000
6.0000
0.6707
7.0000
8.0000
0.9874
T=[32213]’
第1类的有指标:
4;第2类的有指标:
23;第3类的有指标:
15;
从聚类图中可以看出,如果将5各指标分为3类,城市首位度、四城市指数两个指标之间具有较大相关性,最先被聚到一起,其次首位城市规模和城市规模中位值也具有一定相关性,被聚为第二类,基尼指数单独为一类。
这样就可以从五个指标中选定三个指标进行分析:
:
城市规模,
:
城市首位度,
:
基尼指数。
(3)根据这三个指标对27个地区进行聚类分析。
首先对每个变量的数据分别进行标准化处理,样本间相似性采用欧氏距离度量,类间距离的计算选用类平均距离。
clearall
clc
x=load('data.txt');
x(:
5:
5)=[];
x(:
3:
3)=[];
x1=zscore(x);%数据标准化
y=pdist(x1);%求对象间的欧氏距离,每行是一个对象
z=linkage(y,'average');%计算类平均距离
dendrogram(z);%作聚类图
T=cluster(z,'maxclust',3);%把样本点划分成3类
fori=1:
3
tm=find(T==i);%求第i类的对象
tm=reshape(tm,1,length(tm));%变成行向量
fprintf('第%d类的有:
%s\n',i,int2str(tm));%显示分类结果
end
运行结果:
第1类的有:
17
第2类的有:
23456891011121314151617181920212223242627
第3类的有:
25
将五个指标分三类的结果为:
第一类:
京津冀、苏沪第二类:
青海第三类:
其他地区
2.2009年我国31个省、市废气排放情况如表2所示,请解决以下问题:
表2.2009年各地区废气排放情况
工业二氧生活二氧工业烟尘生活烟尘工业粉尘
编号地区化硫排放量化硫排放量排放量排放量排放量
(万吨)(万吨)(万吨)(万吨)(万吨)
0全国1865.9348.5604.4243.3523.6
1北京6.05.91.92.51.7
2天津17.36.45.91.30.8
3河北104.321.133.018.942.7
4山西101.025.943.820.942.8
5内蒙古120.419.532.117.316.4
6辽宁91.913.340.121.122.7
7吉林30.06.327.710.76.6
8黑龙江41.97.131.911.410.1
9上海23.914.03.66.50.8
10江苏101.26.230.12.916.4
11浙江67.72.418.01.016.8
12安徽48.75.223.05.028.5
13福建39.92.07.14.315.7
14江西49.07.413.92.526.3
15山东136.622.430.211.522.1
16河南117.617.952.17.624.9
17湖北52.711.617.93.718.3
18湖南64.916.227.66.657.5
19广东101.35.824.85.310.5
20广西83.55.524.71.346.7
21海南2.10.10.80.20.9
22重庆58.616.010.98.210.8
23四川94.618.919.68.911.4
24贵州62.455.211.832.29.9
25云南41.88.112.45.510.2
26西藏0.200.10.20.1
27陕西74.26.315.15.214.8
28甘肃40.19.99.27.08.4
29青海12.70.85.42.26.9
30宁夏27.83.67.91.83.6
31新疆51.57.522.09.718.5
(1)计算各指标间的欧式距离、马氏距离和加权平方距离;
(2)运用谱系聚类法进行聚类,对我国的空气污染区域按照污染程度的不同进行划分;
(3)运用Kmean聚类法进行聚类,对我国的空气污染区域按照污染程度的不同进行划分;
(4)对上述两种聚类法得到的结果进行分析,能得到什么结论?
解:
(1)程序如下:
clearall,clc
A=[data];
X=zscore(A);%标准化
d1=tril(squareform(pdist(X,'euclidean')))%d1为欧氏距离
d2=tril(squareform(pdist(X,'mahalanobis')))%d2为马氏距离
d3=tril(squareform(pdist(X,'seuclidean')))%d3为加权平方距离
计算结果:
d1=
Columns1through18
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0.4626
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
5.2320
5.0529
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
5.8428
5.6488
0.9690
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
4.5982
4.3357
1.8956
2.2345
0
0
0
0
0
0
0
0
0
0
0
0
0
0
4.7342
4.5212
1.7141
1.8601
1.3151
0
0
0
0
0
0
0
0
0
0
0
0
0
2.3476
2.1373
3.6759
4.0753
2.9533
2.6928
0
0
0
0
0
0
0
0
0
0
0
0
2.7925
2.5548
3.2615
3.6272
2.5625
2.2311
0.5239
0
0
0
0
0
0
0
0
0
0
0
1.0529
1.0261
4.6048
5.1848
3.8481
4.1262
2.0745
2.4538
0
0
0
0
0
0
0
0
0
0
3.4675
3.0929
3.1569
3.6976
2.3640
2.6976
2.2869
2.0117
3.1904
0
0
0
0
0
0
0
0
0
2.3313
2.0048
3.7838
4.4492
3.2364
3.4234
1.9730
1.9854
2.3439
1.3497
0
0
0
0
0
0
0
0
2.7203
2.5135
3.0744
3.7006
3.0618
2.9035
1.8134
1.6996
2.6413
1.7470
1.1909
0
0
0
0
0
0
0
1.4528
1.3324
4.1601
4.8761
3.7276
3.8157
1.9419
2.1839
1.6303
2.4224
1.1956
1.5397
0
0
0
0
0
0
2.2525
2.0616
3.4729
4.1733
3.3530
3.4421
2.1066
2.1382
2.2030
1.9800
1.0187
0.8041
1.0833
0
0
0
0
0
4.7505
4.4517
1.9614
2.3937
1.0243
2.0924
3.4034
3.0260
4.0422
2.1613
3.1373
3.0579
3.8014
3.2402
0
0
0
0
5.2404
4.8910
2.4748
2.4293
2.0847
2.1923
3.4365
2.9554
4.7458
2.2049
3.3969
3.1245
4.3074
3.6121
1.8593
0
0
0
2.1547
1.8776
3.3235
3.9372
2.8879
3.0832
1.6448
1.6637
1.8486
1.6750
1.0186
1.0225
1.2702
0.7666
2.8423
3.2328
0
0
4.7380
4.5959
2.3000
2.8266
3.5551
3.3374
3.8101
3.5286
4.4718
3.1995
3.2759
2.3359
3.6176
2.6287
3.2448
3.2472
2.8952
0
3.1588
2.7955
3.2825
3.8720
2.2301
2.6700
2.0716
1.8713
2.8086
0.6577
1.3026
1.8882
2.1774
1.9992
2.1888
2.6007
1.6095
3.5510
4.1261
3.9111
2.9181
3.5975
3.4730
3.4382
3.3858
3.1410
4.0412
2.2059
2.1971
1.6522
2.8307
1.8906
3.0776
3.0687
2.2925
1.5361
0.6390
0.8235
5.6508
6.2819
5.0283
5.1221
2.6717
3.1160
1.6672
3.6729
2.4550
2.9418
1.6247
2.4923
5.1599
5.5613
2.5123
5.0312
2.0763
1.8729
3.3861
4.0147
2.6523
3.0628
1.7869
1.8881
1.3161
2.2078
1.7499
1.8984
1.5562
1.5831
2.7616
3.6159
1.0529
3.4878
3.1701
2.8778
2.7685
3.3366
1.6629
2.4438
2.2141
2.0420
2.4244
1.6810
2.0410
2.2102
2.4437
2.1522
1.6365
2.6948
1.5670
3.3760
6.3437
6.3275
4.7190
4.6717
4.4737
4.8355
5.5988
5.5215
5.3432
6.2910
6.5047
6.1331
6.2702
6.1055
4.8661
5.9574
5.6436
6.1177
1.4470
1.2000
3.8746
4.5007
3.2336
3.3973
1.4156
1.6701
1.1884
2.1527
1.2316
1.5364
0.8097
1.2113
3.3660
3.8688
0.8586
3.6143
0.6726
0.8823
5.7299
6.3599
5.1004
5.1953
2.7367
3.1867
1.7008
3.7590
2.5449
3.0310
1.7083
2.5807
5.2377
5.6455
2.5975
5.1156
2.2966
2.0042
3.3942
4.0932
2.7098
3.0126
1.7802
1.7753
2.0117
1.3788
0.7413
1.3168
1.1757
1.1150
2.7015
3.2927
0.8476
3.2587
1.3625
1.1869
3.9347
4.5663
3.2577
3.4661
1.5436
1.8293
0.8908
2.4232
1.5699
1.8276
0.9772
1.4658
3.4325
4.0702
1.1120
3.7844
0.6772
0.6945
5.0126
5.6512
4.4651
4.5101
2.1445
2.5512
1.4604
3.1222
1.8928
2.2883
1.0059
1.8827
4.6030
4.9817
1.9249
4.4140
0.7846
0.4602
4.8048
5.4279
4.0978
4.2594
1.9402
2.3197
1.2213
2.7404
1.6061
2.1904
0.9747
1.7729
4.2074
4.6234
1.6341
4.3562
2.4676
2.2594
2.9399
3.5352
2.5085
2.3995
1.1080
1.0068
2.1260
1.7364
1.3760
0.9699
1.4765
1.2692
2.7581
3.0755
0.9467
2.9101
Columns19through31
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2.6146
0
0
0
0
0
0
0
0
0
0
0
0
3.3904
4.2843
0
0
0
0
0
0
0
0
0
0
0
1.8576
3.0908
2.5858
0
0
0
0
0
0
0
0
0
0
1.3823
2.9745
3.6178
1.1994
0
0
0
0
0
0
0
0
0
6.0276
6.8221
6.9706
4.8785
4.7307
0
0
0
0
0
0
0
0
1.8572
2.9835
1.8357
0.9431
1.8749
5.6992
0
0
0
0
0
0
0
3.4708
4.3746
0.0923
2.6519
3.6893
7.0010
1.9141
0
0
0
0
0
0
1.0717
2.4022
2.5680
1.1530
1.4463
5.8516
0.9614
2.6514
0
0
0
0
0
2.0675
3.2458
1.8373
0.7984
1.8834
5.4520
0.3801
1.9049
1.1821
0
0
0
0
2.8631
3.6789
0.6712
2.0994
3.1130
6.6360
1.2629
0.7561
1.9912
1.3289
0
0
0
2.4441
3.5785
0.9722
1.7482
2.6840
6.4029
0.9428
1.0520
1.6467
1.0316
0.5673
0
0
1.5827
2.4342
2.8095
1.2979
1.6560
5.4718
1.1153
2.8901
1.0413
1.3010
2.1666
1.9651
0
d2=
Columns1through18
0
0
0
0
0
0
0
0
0
0
0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验五 聚类分析 实验