聚类分析.docx
- 文档编号:10377440
- 上传时间:2023-05-25
- 格式:DOCX
- 页数:11
- 大小:976.88KB
聚类分析.docx
《聚类分析.docx》由会员分享,可在线阅读,更多相关《聚类分析.docx(11页珍藏版)》请在冰点文库上搜索。
聚类分析
西北农林科技大学实验报告
学院名称:
理学院专业年级:
信计111
姓名:
学号:
2011014816
课程:
多元统计分析报告日期:
2014.5.12
实验四聚类分析
一.实验目的
练习利用spss软件进行聚类分析,分析不同的聚类方法所得到的谱系图的不同之处。
二.实验要求
利用SPSS软件解决以下题目:
题目:
.利用2001年全国31个省市自治区各类小康和现代化指数的数据,对地区分别作分层聚类和K-Means聚类分析。
数据见:
聚类分析数据(小康指数).sav
三.实验内容
(一)采用系统聚类法
(1)步骤:
“分析”—>“分类”—>“系统聚类”:
图一
选择聚类方法为:
组间联接,度量采用区间度量中的欧氏距离:
图二
进而得到:
表一:
聚类表
如下所示表二—表五分别取聚类分析方法为:
组建联接、组内联接、质心聚类法、中位数聚类法、ward法的谱系图:
表二:
组间联接法得到的谱系图
表三:
组内联接法得到的谱系图
表四:
质心聚类法得到的谱系图
表五:
ward法得到的谱系图
表六:
(2)问题分析:
由以上比较可得:
表六:
不同聚类分析方法的谱系图比较的结果
聚类结果
聚类方法
第一类
第二类
第三类
组间联接法
北京、上海、天津
江苏、山东、辽宁、浙江
广东、福建
其他
组内联接法
北京、上海、天津
江苏、山东、辽宁、浙江
广东、福建、黑龙江、吉林、新疆
其他
质心聚类法
北京、上海、天津
江苏、山东、辽宁、浙江
广东、福建、黑龙江、吉林、新疆
其他
Ward聚类法
北京、上海、天津
江苏、山东、辽宁、浙江
广东、福建、黑龙江、吉林、新疆
其他
(二)采用K-Means聚类分析法
1.步骤
“分析”—>“分类”—>“K-均值聚类分析”:
其中:
得到的结果如下:
图三
图四
图五
图六
图七
图八
图九
2.问题分析
图三表示的是初始聚类的中心,也就是种子点。
图四为迭代历史记录;
图五是聚类表,表示的是每个个案的分类情况:
第3列“聚类”表示的是该案例属于哪一类,第4列“距离”表示该案例与其所属类别重心之间的距离。
图六表示的是最终聚类中心,可以看出,第二类的小康水平指数在四个类中最高,第四类在最低的。
图七表示的是最总聚类中心的距离,观察出:
第三类和第四类的最终聚类中心的距离最小。
图八表示的方差分析表,其中的F检验仅用于描述性目的,选中你的聚类将用来最大化不同聚类中的案例间的差别。
图九表示的是每个聚类中的案例数,可以看出,第1类有6个样本,第2类中有3个样本……
3.两种方法的比较
比较系统聚类法和K-均值聚类法(快速聚类法)的输出结果,可以看出,其聚类结果大致相同。
四、存在问题与解决情况
利用SPSS进行聚类分析,具体实验步骤在查询资料和老师的指导下完成了;有关一些结果中的图表的分析,是通过老师的提点和查询网上资料的途径解决的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析
![提示](https://static.bingdoc.com/images/bang_tan.gif)