欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    聚类分析与判别分析操作及案例.docx

    • 资源ID:6350468       资源大小:78.39KB        全文页数:11页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    聚类分析与判别分析操作及案例.docx

    1、聚类分析与判别分析操作及案例北京航空航天大学研究生课程数理统计B论文地区生产总值的聚类分析与判别分析姓名:王青云学号:SY1001243授课教师:冯伟日期:2011-1-2地区生产总值的聚类分析与判别分析姓名:王青云 学号:SY1001243摘要:为了了解全国各地区的经济类型,需要对地区进行分类,可以利用社会科学统计软件包(简称SPSS)对地区经济情况进行聚类分析和判别分析。该工作依据地区生产总值、第一产业、工业、建筑业、交通运仓储及邮电通讯业、批发零售贸易及餐饮业、金融保险业、房地产业八个指标对2009年全国31个省和直辖市的经济类型进行了聚类分析,将不同地区的经济类型划分类别;并随机抽取了

    2、北京、福建、山东三省进行判别分析。关键词:经济类型,聚类分析,判别分析,SPSS一 引言人们认识事物时往往先把被认识的对象进行分类,以便寻找其中同与不同的特征,因而分类学是人们认识世界的基础科学。统计学中常用的分类统计方法主要是聚类分析与判别分析。聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。判别分析则先根据已知类别的事物的性质,利用某种技术建立函数式,然后对未知类别的新事物进行判断以将之归入已知的类别中。聚类分析与判别分析有很大的不同,聚类分析事先并不知道对象类别的面貌,甚至连共有几个类别也不确定;判别分析事先已知对象的类别和类别数,它正是从这样的情

    3、形下总结出分类方法,用于对新对象的分类1。二 分析方法问题:根据地区各行业收入对全国各地区经济类型进行分类。方法:先进行聚类分析,再进行判别分析,采用SPSS软件进行。2009年全国31个省市的地区总产值、第一产业、工业、建筑业、交通运仓储及邮电通讯业、批发零售贸易及餐饮业、金融保险业、房地产业、其他行业表1所示2。2.1聚类分析(1)在SPSS数据编辑窗口中输入表1中数据:表1 2009年地区生产收入地 区地区生产总值第一产业第二产业第三产业工 业建筑业交通运输和邮政业批发和零售业住宿和餐饮业金融业房地产业其 他北 京12153.03118.292303.08552.47556.641525

    4、.03262.511603.631062.474168.91天 津7521.85128.853622.11365.73471.01836.84131.84461.2308.731195.54河 北17235.482207.347983.86975.971491.921157.8247.14525.67612.42033.38山 西7358.31477.593518.88474.92523.38557.86203.58361.64173.311067.15内蒙古9740.25929.64503.33610.67773.29915.89294.73291.1286.651134.99辽 宁1521

    5、2.491414.96925.63980.71790.561410.33318.8560.2605.272206.09吉 林7278.75980.573054.6487.32341.76673.12157.73180.83200.141202.68黑龙江85871154.333549.73510.99433.55757.36211227.54301.181441.32上 海15046.45113.825408.75593.03635.012183.85238.361804.281237.562831.79江 苏34457.32261.8616464.942101.431423.253579.8

    6、1678.361596.982025.394325.28浙 江22990.351163.0810518.211390.28888.022119.39416.841899.331316.833278.36安 徽10062.821495.454064.72840.5467.92733.19157.14359.6497.941446.36福 建12236.531182.745106.38898.92751.421043.42235.98612.2656.611748.86江 西7655.181098.663196.56722.89394.9553.89167.59165.1305.91049.69山

    7、 东33896.653226.6416896.142005.691742.333106.24594.51044.91329.593950.63河 南19480.462769.059900.271110.23823.571057.81526.51499.92622.982170.12湖 北12961.11795.95183.68854.4642.72979.14337.81479.11546.112142.23湖 南13059.691969.694819.4867.79704.831221.2304.93402.57400.112369.17广 东39482.562010.2718091.561

    8、328.141595.343907.43945.762283.292470.636850.14广 西7759.161458.492863.84517.7378.75551.14208336.82348.981095.45海 南1654.21462.19300.63142.888.68168.7560.2265.73121.76243.45重 庆6530.01606.82917.4531.37347.98524.36132.88389.97229.09850.16四 川14151.282240.615678.241033.63520.71868.98405.45524.63548.142330.

    9、89贵 州3912.68550.271252.67223.95399.77293.53153.41194.44136.15708.49云 南6169.751067.62088.17494.36179.45571.03162.1351.74205.141050.16西 藏441.3663.8833.11103.5221.1927.0614.723.1713.28141.45陕 西8169.8789.643501.25735.17423.24707.39175.01336.21239.921261.97甘 肃3387.56497.051203.7323.54213.64231.2188.5288.

    10、27101.37640.26青 海1081.27107.4470.3310549.3266.1314.5445.6323.05199.87宁 夏1353.31127.25520.38141.94114.7774.5225.5975.5447.56225.76新 疆4277.05759.741555.84373.75209.095253.662.25198.87115.23748.67(2)定义聚类类型:在“Analyze”菜单“Classify”中选择Hierarchical命令,在弹出的Hierarchical Cluster Analysis 对话框中,从对话框左侧的变量列表中选择地区变量

    11、,使之添加到Lable Cases by框中,同样将指标第一产业,工业,建筑业,交通运仓储及邮电通讯业,批发零售贸易及餐饮业,金融保险业,房地产业,其他行业添加到Variable(s)框中。在Cluster栏中选择聚类类型“Cases”,在Display中选择显示内容,为系统默认选项。(3)设置统计量的值:单击Statistics按钮,打开Statistics对话框,同时选中对话框上方的聚类进度“Agglomeration schedule”和相似性矩阵“Proximity matrix”选项,同时选中Cluster Membership中的Range of solutions,选择3到5。(

    12、4)设置输出图表:单击Plots按钮,打开Plots对话框,选中树枝图。(5)选择聚类方法:单击Method按钮,打开Method对话框,选择默认的Between-groups linkage(即组间连接法),Interval中也选择默认选项(二元变量欧氏距离)。Transform Values中的Standardize 选择z-cores。(6)单击OK,即可得到SPSS聚类分析的分析结果。表2为数据汇总表,是Processing过程中的输出信息,即数据的基本信息。31个样本参与分析,没有缺失值。表2 数据汇总表案例处理摘要a案例有效缺失合计N百分比N百分比N百分比31100.0%00.0%

    13、31100.0%a. 平方 Euclidean 距离 已使用表3是使用两组间的连接统计量进行聚类的详细过程。有31个样本,经30步聚类。Stage:聚类步骤;Cluster 1,Cluster 2:该步被合并的两类中的样品号或类号,合并结果取小的序号。Stage Cluster first appears:非零数值表示合并两项前一次出现的聚类步序号,而0表示第一次出现。Next Stage:表示合并结果在下一步合并时的步序号2。表4、5为聚类结果,分别为分类表(表4)和树状图(表5)。由以上树状图可以看出,如若将全国各省和直辖市的经济类型分为三类,则分类如下:()北京、上海、浙江;()辽宁、湖

    14、北、湖南、福建、四川、青海、宁夏、海南、西藏、贵州、甘肃、重庆、新疆、云南、安徽、黑龙江、山西、内蒙古、吉林、江西、陕西、广西、天津、河北、河南;()江苏、山东、广东。若将全国各省和直辖市的经济类型分为四类,则分类如下:()北京、上海、浙江;()辽宁、湖北、湖南、福建、四川、青海、宁夏、海南、西藏、贵州、甘肃、重庆、新疆、云南、安徽、黑龙江、山西、内蒙古、吉林、江西、陕西、广西、天津、河北、河南;()江苏、山东;()广东。而若将全国各省和直辖市的经济类型分为五类,则分类如下:()北京、上海、浙江;()青海、宁夏、海南、西藏、贵州、甘肃、重庆、新疆、云南、安徽、黑龙江、山西、内蒙古、吉林、江西、

    15、陕西、广西、天津;()河北、辽宁、福建、河南、湖南、湖北、四川;()江苏、山东;()广东。表3 数据聚类表聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 212629.02000222630.06010732831.1690010478.23400951718.256001561427.28100972126.28902178422.35900139714.4024612102428.4490317112025.554001212720.580911161324.621081814613.6690019151723.7645019167121.05512018172124

    16、1.1307102218271.443131620196171.49314152320251.6871802221191.9490026222213.635201727236164.0881902424364.543023272510154.5640028261118.09821029272310.35522242928101914.49825030291218.5382627303011061.97829280表4 分类表群集成员案例5 群集4 群集3 群集1:北京市 1112:天津市 2223:河北省 3224:山西省 2225:内蒙古自治区 2226:辽宁省 3227:吉林省 2228:

    17、黑龙江省 2229:上海市 11110:江苏省 43311:浙江省 11112:安徽省 22213:福建省 32214:江西省 22215:山东省 43316:河南省 32217:湖北省 32218:湖南省 32219:广东省 54320:广西壮族自治区 22221:海南省 22222:重庆市 22223:四川省 32224:贵州省 22225:云南省 22226:西藏自治区 22227:陕西省 22228:甘肃省 22229:青海省 22230:宁夏回族自治区 22231:新疆维吾尔自治区222表5 树枝图2.2判别分析判别分析也是一种数据的分析方法。在生产活动、经济管理、科学实验甚至日常活动中,人们常常需要判定所研究问题的归属问题。例如经济分析中根据一个国家或地区的若干经济指标,判断该国家或地区经济发展的程度和状态。在事先已经建立了样品分类,需要将新样本归入到已知分类的样本组中时,就可以使用判别分析。判别分析是先根据已知类别的事物的性质(自变量),建立函数式(自变量的线性组合,即判别函数),然后对未知类别的新事物进行判断以将之归入已知的类别中。


    注意事项

    本文(聚类分析与判别分析操作及案例.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开