聚类分析和因子分析在股票研究中的应用.docx
- 文档编号:18417158
- 上传时间:2023-08-16
- 格式:DOCX
- 页数:10
- 大小:27.74KB
聚类分析和因子分析在股票研究中的应用.docx
《聚类分析和因子分析在股票研究中的应用.docx》由会员分享,可在线阅读,更多相关《聚类分析和因子分析在股票研究中的应用.docx(10页珍藏版)》请在冰点文库上搜索。
聚类分析和因子分析在股票研究中的应用
上海理工大学学报
第24卷第4期J.UniversityofShanghaiforScienceandTechnologyVol.24No.42002
文章编号:
1007-6735(200204-0371-04
聚类分析和因子分析在股票研究中的应用
柯冰,钱省三
(上海理工大学管理学院,上海200093
摘要:
选取9项主要财务指标,对汽车及配件行业19家上市公司进行了聚类分析和因子分析.研究结果表明,两种分类方法都能把上市公司区分为蓝筹股、绩优股、一般股和劣质股,与公司的实际情况相符;而且因子分析将财务指标综合为规模效益综合因子、投资效率和主营业务因子3个综合变量,为公司的分类和评估提供了很好的依据.关键词:
聚类分析;因子分析;股票研究中图分类号:
O212.4文献标识码:
A
Applicationofclusterandfactoranalysistostockresearch
KEBing,QIANXing-san
(CollegeofManagement,UniversityofShanghaiforScienceandTechnology,Shanghai200093,China
Abstract:
9financialratiosfrom19automanufacturinglistedcorporationshavebeenstudiedbymeansofclusterandfactoranalysis.Itpointedoutthatgoodresultsinclassificationcanbegotbyanyoneofthebothmothodsandtheyareingoodagreementwiththepracticalsituations.Moreover,3syntheticfactorsareextractedfromthetenvariables:
thefirstisrelatedtothescaleandbenefitofthecorporation,thesecondisrelatedtoinvestmentefficiency,andthethirdistheprincipaloperationfactor.Theyprovidegoodreferencesforclassificationandassessmentofthecorporations.
Keywords:
clusteranalysis;factoranalysis;stockresearch
中国股市迅速发展壮大是有目共睹的.随着中国的股市正在逐步走向完善,走向规范化,价格向其内在价值回归是未来股市发展的重要方向.股票的档次将不断拉开,成长率高的绩优股会越来越受到投资者的追捧.过去那种高投机、高市盈率、价格严重偏离其价值的现象将逐步纠正.理智的股票投资者,将会更加重视上市公司的经营业绩,重视股票自身的品质,即重视投资对象的选择.但是,随着股市发展、投资手法和证券监管方法的成熟,以及上市公司数量的不断增多,如何科学合理地进行股票的分析和选择是每一个投资
者所要解决的首要问题.
笔者选取19家汽车及配件行业的上市公司,根据2001年度证券中期报告中的信息及数据,选择每股收益、投资收益、净利润等9项财务指标,对这些汽车制造公司进行了聚类分析和因子分析,试图将它们进行分类,为股票的分析和选择提供依据.
1样本的引入
根据2001年度证券中期报告中的有关信息,19个上市汽车制造公司的各项指标及其数据如表1所示(见下页.
372上海理工大学学报2002年第24卷
表1样本原始数据
Tab.1Originaldataofsamples
序号股票
代码
股票名称
每股
收益
(元
每股
净资产
(元
净资产
收益率
(%
流通
股本
(万元
主营业务
收入
(万元
主营业务
利润
(万元
投资
收益
(万元
利润
总额
(万元
净利润
(万元江铃汽车
2000559万向钱潮0.243.776.291358161279128131608.099788688
3000710天兴仪表-0.061.29-4.574410261
458-4.9-892-889
4000738南方摩托-0.311.88-16.60136001320
5-5215-76.7-12433-12433
5000800一汽轿车0.042.901.535460014231
620361049227232
6000883飞彩股份0.092.5
73.369100480705611407.630852603
7000927天津汽车0.052.492.112180016436025503089237599
8000957中通控股0.121.936.23810017347458751.434302869
9600066宇通客车0.226.343.4893727018314247700.040443011
10600099林海股份0.032.541.3691207111672188.4742630
11600104上海汽车0.183.275.54756001579355097420108.04998045610
12600262北方股份0.033.320.99550065911665533.7661562
13600609金杯汽车0.112.294.763640029527541114770.01263911913
14600676交运股份0.125.472.2173401526053281163.023572038
15600686厦门汽车0.252.1711.4057604779676672327.047363746
16600698济南轻骑-0.042.52-1.62306712995932960-3981-3963
17600742一汽四环0.354.887.191031911919418158308.4118837412
18600877中国嘉陵0.022.920.672196013189512985-230.01069926
19600890长春长铃0.112.035.6220510160325588-36.642754251注:
资料来源.
2聚类分析[1]
聚类分析中采用离差平方和法聚类,相似性统计量选用欧氏距离系数.离差平方和法是由Ward提出来的,又称Ward法.其具体思想是:
先将n个样本各自成一类,然后每次缩小一类,每缩小一类离差平方和就要增大,选择使类内离差平方和增加最小的两类合并,直至全部样本归类完毕.具体的计算过程如下.
a.原始数据标准化,构成标准化数据矩阵.
b.计算欧氏距离矩阵,选出最小距离样本组.计算两两样本间欧氏距离,构成距离矩阵,从中选出具有最小距离的样本组.将具有最小距离的样本组归并为一类,当计算新类与其他样本类之间的距离时,采用离差平方和法计算类之间的距离,计算完毕后再从中选择具有最小距离的两类.
c.用新的样本类代替原来的一对样本类.
d.对新形成的样本数据与其余样本数据重新计算欧氏距离矩阵,以代替原矩阵,再找出新矩阵中最小距离的对应样本类,如此重复c到d的步骤,直到把所有样本都归为一类为止.
e.最后按下列原则连接成谱系图:
a.若两个样本在已经归并成类的类中未出现过,则它们归为一个新类;b.若两个样本中有一个在某类中出现过,则另一个就加入该类;c.若两个样本都在同一类中,则这对样本不再归类;d.若两个都已在不同类中出现过,则把两类归并在一起.
上述计算过程用SPSS统计分析软件[2]进行,并通过对聚类图的分析,划分为4类较合适,分类结果见表5中的第2栏.
3因子分析[3]
因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法.因子分析的基本思想是根据相关性大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低.通过因子分析,有可能用较少的不相关的综合指标来描述原来观察的每一分量,在尽可能少的信息损失情况下,降低分析问题的复杂性.
3.1相关矩阵的特征分析
在对原始数据进行标准化处理,求出指标间的相关系数矩阵之后,求出该矩阵的5个特征根
第4期柯冰等:
聚类分析和因子分析在股票研究中的应用373的大小、贡献率及累积贡献率,其结果参见表2.
表2特征值与贡献率
Tab.2Eigenvalueandcontribution
特征根序号特征值贡献率
(%
累积贡献率
(%
14.90854.53354.533
21.86920.76475.297
31.03011.44586.742
40.7788.64395.385
50.2472.74498.129
从表2中可以发现,最主要的特征根有3个,其贡献率分别是54.5%、20.8%和11.4%,累积贡献率达到86.7%.说明通过数据变换之后,这3个特征根所反映出来的信息量占全部信息量的86.7%.所以,只取前3个特征根来进行分析.经过因子旋转后,这3个特征根所对应的特征向量见表3.从表3中可以发现,第1个特征向量即第1个主成分与4个指标的相关系数都很大,并且都为正数,说明第1个主成分所反映的内容与企业的利润和规模有关,因此,称其为“规模效益综合因子”.此外,第2个主成分与每股收益、净资产收益率和每股净资产有关,而且还与流通股本负相关,说明了第2个主成分反映的是投资效率,因此称之为“投资效率因子”;第3个主成分与主营业务收入和主营业务利润高度有关,称之为“主营业务因子”.
表3特征向量
Tab.3Eigenvector
主成分
指标
第1向量第2向量第3向量投资收益
净利润0.860.300.37
利润总额0.850.340.37
流通股本0.78-0.200.41
每股收益0.200.960.12
净资产收益率0.250.850.09
每股净资产-0.110.640.09
主营业务收入0.170.130.96
主营业务利润0.480.220.82
3.2分类
从9个指标的性质看,它们彼此之间都存在一定程度的相关性,因此用3个综合指标是可以代替的,这3个综合指标所代表的信息量占全部信息量的86.7%.根据因子分析,可以对汽车制造企业进行分类.最直观最简单的分类方法是根据因子的得分值,在因子轴所构成的空间进行分类.每个因子的得分见表4.
表4因子得分
Tab.4Factorscore
主成分
指标
123
每股收益-0.0230.435-0.076
每股净资产-0.1310.3110.035
净资产收益率0.0190.382-0.099
流通股本0.248-0.2030.083
主营业务收入-0.242-0.0520.661
主营业务利润-0.060-0.0180.446
投资收益0.445-0.055-0.311
利润总额0.2500.055-0.027
净利润0.2590.038-0.026
每个上市公司在各主成分上的得分可以根据上表中的因子得分与相应的财务指标值相乘累加得到,具体的数值见表5.
表5聚类分析和因子分析结果
Tab.5Resultsofclusterandfactoranalysis
序号聚类分类因子1因子2因子3
-0.61-0.15
22-0.041.0
3-0.17
33-0.19-1.10-0.83
43-0.66-2.72-0.42
51-0.01-0.651.41
63-0.260.12-0.36
71-0.43-0.321.63
83-0.100.30-0.79
92-0.731.390.16
103-0.19-0.18-0.87
1143.48-0.011.17
123-0.290.01-0.85
1331.78-0.14-1.35
142-0.420.85-0.69
152-0.061.08-0.66
163-0.22-0.89-0.33
172-0.561.690.65
181-0.62-0.420.98
1930.100.12-0.70
将3个因子作为3个轴,每个上市公司在各个轴上的得分就决定了其在空间中的位置,根据这种作散点图的方法来将公司划分为不同的类型(图略.对表5进行具体分析,并将聚类分析的结果与因子分析的得分比较,可以发现如下现象.
a.在聚类分析中的第4类(11号,其第1个主成分上的得分最高,并且非常显著.11号对应的上海汽车,地处上海,有着得天独厚的投资环境;从上市近4年时间来看,上海汽车已经从当初总股本10亿股扩张到现在的25.2亿股,企业的经营业绩保持稳步增长,是市场公认的蓝筹股.
374上海理工大学学报2002年第24卷
b.第2类公司在第2主成分上数值很大,从股东的角度来看,投资效率高.对应的财务指标为每股收益、每股净资产、净资产收益率,这3个指标是投资者最为关注的指标,它们是衡量公司获利能力和成长性最好的指标.例如净资产收益率,在一定的净资产条件下,能够产生更高的利润,而当公司将利润留存用作发展时,就可使公司的净资产大幅度增加;如果较高的净资产收益率能够维持,公司后续年度的收益将呈几何级数地增长,相应股东的财富也同步增加.
c.在第2类公司中,如万向钱潮(2号,近5年的主营收入和净利润平均增长幅度分别达到了54%和32%,这在行业内是很少见的.公司从原来只生产十字万向节,发展到现在的万向节、减振器等5大类产品,并正在进一步扩大产品品种,仅2001年就投入11多亿元进行扩大再生产和生产新产品.公司从一家不出名的乡镇企业一举跃为中国汽配行业最大的制造企业之一.宇通客车(9号客车产量已列全国同行业第二,经济效益列第一,而且公司一向倾向于高比例的现金分红.在最近的一次研讨会上,专家们将宇通客车这样一个7年中利润额增长500倍的企业的迅速发展,称为“宇通”现象.从第2类公司的实际情况来看,这些公司是经营业绩骄人,发展迅速的一类公司,可以称为绩优股.
d.聚类分析中划分为第3类的公司,在第1和第3主成分上为负值,表现出这类公司既没有规模效益,也没有在主营业务上业绩突出,在投资效益上略为赢利或亏损,这类股票表现为劣质股的特征.
e.聚类分析中划分为第1类的公司,在第3主成分上得分很高,在第1和第2主成分得分为负值,表明这类公司在主营业务上业绩突出,但在规模效益和投资效率上表现欠佳,呈现为一般股的特征.
4结束语
应用聚类分析和因子分析对汽车及配件行业的上市公司进行了综合分析,把上市公司区分为蓝筹股、绩优股、一般股和劣质股,与公司的实际情况相符.因子分析将财务指标综合为规模效益综合因子、主营业务因子和投资效率3个综合变量,为分类和评估公司的优劣提供了很好的依据.实证表明,本文采用的分析方法为股票的分析和选择提供了一条很好的途径.
参考文献:
[1]罗积玉,邢瑛.经济统计分析方法与预测[M].北京:
清华大学出版社,1990,102~180.
[2]卢纹岱.SPSSforWindows统计分析[M].北京:
电
子工业出版社,2000,340~429.
[3]方开泰.实用多元统计分析[M].上海:
华东师范大
学出版社,1989,215~338.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 因子分析 股票 研究 中的 应用