聚类分析.docx
- 文档编号:17446615
- 上传时间:2023-07-25
- 格式:DOCX
- 页数:20
- 大小:949.82KB
聚类分析.docx
《聚类分析.docx》由会员分享,可在线阅读,更多相关《聚类分析.docx(20页珍藏版)》请在冰点文库上搜索。
聚类分析
我们在对房地产市场进行分析研究的时候,首先对其几个具有代表性的省份的平均的房价(元/平方米)进行聚类分析,先将每个省份的房价各自看成是一个群体,将最相近的两个群合并在一起,重新计算出它们之间的距离。
再将最相近的两群合并在一起,就这样逐步减少群的数量,直到所有的个体聚成一个群为止。
研究房价的变化情况,考虑到实证研究的需要和数据的可获得性。
在这里,我们选取了对房价影响最明显的几个因素来进行研究分析各个省份的房价是否可以归为更加有意义的类别。
对于各个省份的房价的影响因素,我们主要研究以下几个因素的影响情况:
(1)人均消费性支出(元)(变量pay);一个地区的人均消费性支出,也体现出了这个地区的居民的生活水平,人均消费性支出越高,说明他们在物质上的花费比较多,那么也有一部分居民会选择购买房子来做些投资或是对物质的更好的要求等等。
因此,人均消费性支出越高,说明有一部分支出是会流入房地产市场的,这也会促使房屋价格的上涨。
可以知道,人均消费性支出与房屋价格存在着正相关性。
(2)人均可支配收入(元)(变量income);一个地区的人均可支配收入,一定程度上代着这个地区的人民的经济实力,当这个地区的人均可支配的收入越多的时候,那么这个地区的人民想要提高他们的生活质量和进行投资的欲望也就会更加的强烈。
现在,相比于其它的商品而言,房子就具有保值性和增值性的明显的特点,也就是因为这种保值性和增值性的特点,使得大部分市民都会拿出大量的可支配的资金来进行购房投资,这就会促使房价的上升。
从理论上来讲,人均可支配收入与房价之间存在着正相关性。
(3)人口密度(人/平方公里)(变量density);人口的密度就是单位面积上面居住的人口的数量,现在城市化的趋势日渐强烈,也使得土地资源变得具有稀缺性的特点。
因此,我们可以知道单位面积的土地上面的人口数量越多,那么这些人口对土地的需要量就会增加,这也是促使房屋价格上涨的一个因素。
从理论上说,人口的密度与房屋的价格呈现正相关的关系。
(4)房屋造价(元/平方米)(变量cost);在房地产市场中,对于房屋的造价是影响房屋价格的一个重要的因素,因为房屋造价直接关系着房屋的建筑成本,当然,房屋的建筑成本越高,则这套房屋的销售的价格也就会比较高,这样才能保证开发商的利益不至于受损。
对于房屋造价,包括了很多的费用,比如土地的购置价格和施工过程中的一些费用等等都包括在房屋的造价里面。
从理论上讲,房屋造价与房价呈现正相关性。
(5)土地购置费(元/平方米)(变量purchase)。
就像前面所说的,城市化的加剧,导致现在的土地资源比较稀缺,那么,对于开发商而言,拿到这块土地的费用就会不断地上涨。
同样的,土地的购置费用增加的情况下,开发商只能采取增加房屋的销售价格来保证他们的自己的利益不受损害。
随着开发商开发的商品房的数量不断地增加,那么土地资源就会变得更加的紧缺,则拿到土地的费用也会不断上涨,这也直接导致房屋的价格不断地上涨。
因此,土地的购置费用也在很大程度上面影响着房屋的价格。
他们之间也存在着正相关性。
除此之外,各个省份的平均房价(元/平方米)(变量price)也是我们在分析过程中需要加入的一个不可缺少的变量。
接下来,我们对以上的数据进行聚类分析,来研究各个省份的房价是否可以归为更加有意义的类别。
我们分别对六个变量进行聚类分析,然后研究每个变量在聚类之后的结果之间的差异或者说是联系,找到对房价影响最大的因素在进行之后的分析。
一,对房价进行聚类分析
表1数据信息汇总表
聚类进度表
上面表中所反映出来的信息就显示了聚类的过程,从中我们可以看出,聚类的过程一共进行了17步,第一步首先合并的是11号样品和15号样品,形成类G1,依此类推,另外,我们还可以看出,第一、二、三、四、八、十步所进行的都是样品和样品之间的合并;第一次出现样品和类的合并是在第五步,是在第二步进行的6号样品和17号样品合并形成的新类G2又与13号样品形成复聚类;第一次出现类与类合并是在第七步,Cluster1和Cluster2分别等于4和5,这就说明,第四步合并形成的类和第五步合并的类在第七步合并;其余的聚类方式均与这些是类似的,在这里就不过多的叙述。
另外,Coefficients(表示聚类的距离测度值)的值随着聚类的进行也在逐步的增大,在开始的时候,距离测度值增加的慢些,之后增加的越来越快,这就说明,聚类开始的时候类与类之间的差异比较小,一点一点的类与类之间的差异逐渐增大,在聚类结束的时候,类与类之间的差异最大,这也恰好是系统聚类方法所表现出来的特征。
树状聚类图
根据以上对房价的研究,我们得到的聚类树状图和聚类进度表,都可以清晰的看出聚类的过程,经过分析研究之后,现在决定将以上所涉及的省份划分为3个类别,如下所示:
第一类:
北京、上海、浙江;
第二类:
天津、辽宁、江苏、广东、福建、山东;
第三类:
山西、吉林、河北、海南、湖南、湖北、四川、陕西、重庆。
以上是对房价进行聚类分析出来的结果,对于我们分出来的三类,还有比较合理的,在第一类里面,包括北京、上海、浙江这三个中国经济发达的省市,鉴于他们的经济发达,所以相应的房屋的价格也就会相较于其他的城市高,这是合情合理的。
对于第二类,这些省份都是经济比较发达的地区,虽然房屋的价格可能较第一类的低些,但是相比于其它省份还是要高些。
对于第三类里面的海南或许会有一些疑问,因为海南的旅游业比较好,相应的经济也很繁荣,为什么房屋价格的聚类分析之后会排在第三类里面?
在这里,我们给出的结论就是,虽然海南的旅游业比较好,但就是因为旅游业比较好,这就说明了海南的外来人口的暂住比较多,也间接的可以理解为海南的租房或是酒店的入住率比较好,并不能因此而判断房价的高低。
根据以上的分析可以知道,对于房价的聚类分析是比较合理的。
二,对人均消费性支出进行聚类分析
表数据信息汇总表
聚类进度表
以上聚类进度表所反映出来的信息就是聚类的过程,从表中我们可以看出,聚类的过程一共分为17步,第一步合并的是13号样品和16号样品,形成类G1,以此类推下去,第二、六、八、九、十二步所进行的都是样品与样品之间的合并,在第三步是5号样品与类G1合并形成复聚类;在第十四步时是进行的类与类之间的聚类,也就是第八步中4号与6号样品形成的类与第十步合成的类在第十四步进行合并;其余的聚类过程也类似如此。
树状聚类图
根据以上的聚类树状图与聚类进度表的结果,我们可以将以上的18个省份划分为3个类别,如下所示:
第一类:
北京、上海;
第二类:
天津、广东、浙江;
第三类:
辽宁、山西、吉林、河北、江苏、海南、福建、湖南、湖北、四川、陕西、重庆、山东。
以上是关于人均消费性支出的聚类分析结果,是比较合理的。
在第一类中,包含北京和上海这两个政治和文化的中心城市,显而易见的,这两个城市的人均消费性支出很高。
第二类三个都是沿海省份,人均消费性支出也比较多。
第三类里面基本上都是二线省份,所以以上对于人均消费性支出的聚类也是比较合理的。
三,对人均可支配收入进行聚类分析
表数据信息汇总表
聚类进度表
从以上的聚类进度表中,我们可以看出,从第一步到第八步,除去第四、五步以外,剩下的均是样品与样品之间的聚类,并且第十四步也是样品与样品之间的聚类;第一个样品与类之间的聚类是发生在第四步,主要是第二步形成的类与15号样品合并;第一次出现类与类之间的聚类是在第九步,是第五步形成的类与第四步中形成的类再次聚类;其余的情况均是这样的,再次不做多说。
树状聚类图
根据以上的聚类树状图和聚类的进度表,我们可以得出聚类的一步一步的过程,进过适当的分析之后,我们将本文所提到的18个省份划分为三个类别,如下所示:
第一类:
北京、浙江;
第二类:
天津、江苏、上海、广东、福建、山东;
第三类:
辽宁、山西、吉林、河北、海南、湖南、湖北、四川、陕西、重庆。
以上是关于人均可支配收入的聚类分析结果,针对以上得出的聚类结果,我们可以给出如下的解释。
对于第一类划分为北京和浙江,都是经济发达的省市,人均可支配收入较多。
北京市中国的首都,政治经济文化的中心,因此人均可支配收入的水平较高。
对于浙江,商人较多,并且手工作坊比较盛行,因此,人均可支配收入也自然较高。
第二类所有的省市均是沿海的,可以划分为一类,人均可支配收入也相对比较高。
对于第三类,就是一些二线省份。
根据上面的分析,可以知道,对于人均可支配收入的聚类分析师比较合理的。
四,对人口密度进行聚类分析
表数据信息汇总表
聚类进度表
根据以上的聚类进度表,我们可以得出聚类的过程,第一步进行的是3号样品与12号样品的聚类,在接下来的聚类过程中,第二、四、五、六、七步都是样品与样品之间的聚类;第一次出现类与样品之间的聚类是出现在第三步,进行的是13号样品与第一步形成的类进行合并;第一次出现类与类之间的聚类是在第十一步中,主要进行的是第五步形成的类与第八步形成的类再次进行合并;剩下的聚类的过程都和上面提到的几个聚类的过程是相似的,在此不作过多的赘述。
树状聚类图
类似上面的分类结果,在此,我们还是根据聚类树状图和聚类进度表来进行划分,进过研究之后,我们将聚类的18个省份划分为3个类别。
如下所示:
第一类:
北京、天津;
第二类:
辽宁、山西、吉林、河北、江苏、广东、浙江、海南、福建、湖南、湖北、四川、陕西、重庆、山东;
第三类:
上海。
以上是对人口密度进行聚类分析之后得出的结果,在第一类里面,包含北京和天津,北京是中国的首都,政治文化的中心,外来人口较多,因此北京的人口多,而天津临近北京,譬如很多在北京工作的外来人口,由于北京高额的花费情况,他们宁愿选择在天津居住,就因为这样类似的一系列原因,也导致天津的人口密度较密集。
对于第二类就是中国一些省份。
第三类只含有上海一个经济发达的城市,上海市是中国人口最高的城市,因此,在聚类分析出来的结果,它由于人口密度远远高于其他省市,所以也就单独的划分成一类。
根据以上的简单的分析得知,对人口密度的聚类的分析是合情合理的。
五,对房屋造价进行聚类分析
表数据信息汇总表
聚类进度表
以上的聚类进度表中,我们可以得出第一步进行的是6号样品与17号样品进行的聚类,另外,从第一步到第五步,包括第七步在内所进行的都是样品与样品之间的聚类过程;第一次出现样品与类的聚类出现在第六步,进行的是第三步形成的类与12号样品进行聚类过程;同样的,第一次出现类与类的聚类过程是出现在第八步,也就是说在第六步形成的类与第一步形成的类在第八步合并;其余的聚类的过程同样与上面的聚类过程类似,在这里就不一一说明。
树状聚类图
根据上面得出的聚类的树状图和聚类的进度表,我们可以得出聚类的详细过程,根据聚类的过程,通过研究,我们可以讲聚类的结果划分为3个类别,如下所示:
第一类:
北京、天津、广东;
第二类:
辽宁、山西、吉林、河北、江苏、浙江、海南、福建、湖南、湖北、四川、陕西、重庆、山东;
第三类:
上海。
以上就是对房屋造价做的聚类分析的结果,第一类,是中国的几个一线省市。
第二类是二线省份。
第三类中只有上海这个经济中心城市,由于上海的经济较其他的省份要发达很多,因此,这里的房屋的造价也就会较其他的省份高出很多很多,这和上海的消费水平以及经济的发展情况是密切联系在一起的。
这个聚类结果也是合理的。
六,对土地购置费进行聚类分析
表数据信息汇总表
聚类进度表
以上的聚类进度表可以看出聚类的过程,第一步所进行的是3号样品与15号样品进行的聚类,另外,第二、四、五、七、九、十二步所进行的都是样品与样品之间的合并;第一次出现样品与类之间的聚类是在第三步,进行的是第二步形成的类与14号样品的合并;另外,第一次出现类与类之间的聚类是在第六步,即是第一步形成的类与第三步形成的类在第六步进行合并。
剩下的聚类过程都是与上面的聚类过程所类似的,因此就不做出过多的赘述。
树状聚类图
在对土地购置费进行聚类的过程里,通过聚类树状图和聚类的进度表,我们看出了聚类的步骤,经过研究分析,我们将所涉及的18个省份划分为3个类别,如下所示:
第一类:
北京、上海;
第二类:
天津、辽宁、山西、吉林、河北、江苏、广东、海南、湖南
湖北、四川、重庆、山东;
第三步:
浙江、福建、陕西。
以上是关于土地购置费的聚类分析划分结果,对于各个省份的土地购置费用,是与政府的宏观调控紧密联系着的,是关系到这个省份的整体的发展和稳定来控制的,对于上面的聚类结果,我们认为是有其合理性的意义的。
根据以上得出的六个聚类结果,我们接下来作回归分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析