两广地区股票价格相关性分析.docx
- 文档编号:16264284
- 上传时间:2023-07-12
- 格式:DOCX
- 页数:23
- 大小:364.42KB
两广地区股票价格相关性分析.docx
《两广地区股票价格相关性分析.docx》由会员分享,可在线阅读,更多相关《两广地区股票价格相关性分析.docx(23页珍藏版)》请在冰点文库上搜索。
两广地区股票价格相关性分析
两广地区股票价格相关性分析
摘要
典型相关分析是主成分分析和因子分析的进一步发展,是研究两组变量间的相互依赖关系,把两组变量之间的相互关系变为研究两个新的变量之间的相关,而且又不抛弃原来变量的信息,这两个新的变量分别由第一组变量和第二组变量的线性组合构成,并且两组变量的个数可以是不同的,两组变量所代表的内容也可以是不同的。
因此,典型相关分析在实际问题中应用是十分广泛的。
我国的证券市场经过了二十余年的发展和完善,已经初具规模,股票也成为了一个重要的投资工具,人们也开始对证券市场中关联程度较大的股票进行关联研究,探寻证券市场运行的内在规律。
本文以广西和广东的股票价格为研究对象,运用SAS典型相关分析原理来比较两者的相关程度,探究两个地域的股票价格是否具有相关性。
本文借助股票分析软件获取股票的收盘价,并对这些数据进行初步处理,借助SAS软件先将这些数据进行典型相关分析,对广西、广东的股票价格进行分析,找出了主要影响一个地域股市的股票,以指导股票投资。
最后我们得出如下结论:
一、第一对典型变量中,V1主要受股票南宁百货的影响,W1主要受股票万家乐的影响;二、第二对典型变量中,V2主要受股票索芙特的影响,W2主要受股票广深铁路的影响;三、第三对典型变量中,V3主要受股票索芙特的影响,W3主要受股票深物业A的影响;四、广西和广东的股票价格之间存在重要影响,具有很强的相关性。
关键词:
地域股票价格相关性典型相关分析SAS
目录
摘要2
关键词2
1引言4
2理论基础5
2.1典型相关分析基本思想5
2.2典型相关过程5
3两广地区股票价格相关分析的实证研究6
3.1符号说明6
3.2模型的建立与求解7
3.2.1典型相关系数8
3.2.2相关系数的显著性检验9
3.2.3Var变量、With变量的标准化的典型系数9
3.2.4相关系数矩阵11
3.2.5VAR变量与With变量、With变量与VAR变量的典型变量间的相关系数12
3.3主要结论13
4参考文献14
5附录15
1引言
1990年12月19日上海证券交易所、1991年4月3日深圳证券交易所的成立,揭开了中国证券市场的序幕。
在将近二十年的时间里,中国证券市场随着本国经济的发展而不断规范进步,证券市场不但已经成为中国经济不可分割的一个部分,而且已经成为中国经济发展的晴雨表——衡量证券市场价格变化的上证指数与深证指数的波动不仅能从一个侧面反映了我国国民经济的走势,投资者也可以据此预测国民经济前景,因此也会影响广大股票投资者的投资信心和对经济的乐观程度。
我国股民在股市中冲浪,辛苦几年没有赚到什么钱,究其原因有三:
一、由于我国股市目前还不规范,一些上市公司信息渠道不够畅通,缺乏良好的企业经营理念,漠视股东利益,在财务上造假帐,欺骗了广大投资者,致使股价大大超过其自身价值。
二、由于主力机构和庄家兴风作浪,误导股民,使绩优个股受冷落,ST、PT股成为股市追逐的热点。
三、最直接的原因是广大股民的投资理念有问题,投机风盛行,急于暴富,热衷于短线,冷淡了长线,盲目跟庄。
这些问题汇集在一起,导致绝大多数股民赔钱,少数人暴利,极大地挫伤了广大股民的积极性,严重影响了股票市场健康有序地发展,尽管目前中国股市还不够成熟,西方一些价值型投资方法还难以广泛应用,但是未来中国股市必然要走上了理性发展的道路,如何改变目前的困境,不仅是政府部门需要规范管理,而且广大股民也需要向理性投资方向努力,共同促进市场的健康发展。
随着计算机技术的发展,整个证券市场完整交易的数据的正确采集成为可能,对证券市场中关联程度较大的股票进行市场运行的关联研究,在错综复杂的个股走势中,将个股归为相应的板块,进而根据各板块变化规律来指导投资实践就变得越来越有时效性和指导意义。
本文以广西和广东的股票价格为研究对象,运用SAS典型相关分析来比较两者的相关程度,探究两个地域的股票价格是否具有相关性,找出影响一个地域股市的股票,以指导股票投资。
2理论基础
2.1典型相关分析基本思想
典型相关分析是研究两组变量间相关关系的一种多元统计分析方法,是一种降维技术。
研究两组随机变量间(
,
,…,
)和(
,
,…,
)的相关系数。
(
,
,…,
)和(
,
,…,
)可能是完全不同的,但是它们间的线性函数可能存在密切的关系,这种关系能反映它们间的相关关系。
找出(
,
,…,
)的一个线性组合u及(
,
,…,
)的一个线性组合v,希望找到的u和v之间有最大可能的相关系数以充分反映两组变量的关系。
如果(u,v)不能完全刻划两组变量间的相关关系时,可以找第二对变量、第三对变量,…直到找不到相关变量对时为止。
第一对典型相关包含有最多的有关两组变量间的相关信息,第二对其次,其他对依次递减,各对典型相关所包含的信息互不重复。
2.2典型相关过程
描述两组变量之间的相关性,可以用典型相关过程cancorr完成。
对于两组变量,如果一组变量用x表示,另一组变量用y表示,那么典型相关分析就是找出p(>1)个x变量的线性组合值与q个(>1)个y变量的线性组合值,使两者之间的相关达到最大。
使用proccancorr过程进行典型相关分析,其主要语句格式如下:
proccancorrdata=数据集<选项列表>var变量列表;with变量;partial变量列表;freg变量;weight变量;run;proccancorr语句的<选项列表>:
(1)有关输出数据集选项out=输出数据集-命名一个输出SAS数据集,其中包含原始数据以及各主成分得分(即各主成分的观测值);outstat=输出数据集-命名一个包含各变量的均值、标准差、相关矩阵或协方差矩阵、特征值和特征向量的SAS数据集。
。
(2)有关输出结果选项all-所有输出项;noprint-不输出分析结果;
short-只输出典型相关系数和多元分析统计数;simple-简单统计数;corr-相关系数;vname=变量名-为var语句的变量定义名称;vprefix=前缀名-为var的语句典型变量定义前缀;wname-变量名-为with语句的变量定义名称;wprefix=前缀名-为with语句的典型变量定义前缀
3两广地区股票价格相关分析的实证研究
3.1符号说明
符号
说明
V
广西股票价格
W
广东股票价格
x1
南宁百货
x2
南宁糖业
x3
柳工
x4
柳钢股份
x5
桂林旅游
x6
桂林三金
x7
北海国发
x8
*ST银河
x9
索芙特
x10
ST河化
y1
广州友谊
y2
广州发展
y3
奥飞动漫
y4
深物业A
y5
广深铁路
y6
中兴通讯
y7
珠海港
y8
中顺洁柔
y9
万家乐
y10
美的电器
3.2模型的建立与求解
为了讨论广西和广东两地域的股票价格之间是否相联系,我们分别在广西和广东各市、各行业中选取了有代表性的10只股票作为样本,以2012年1月1日到2012年6月30日的股票收盘价为数据,采用的方法是典型相关分析。
对于典型相关过程,我们在SAS软件上输入以下程序:
dataa;
inputx1-x10y1-y10;
cards;
此处为数据,限于篇幅未将给出,详情见附录
;
proccancorrdata=aall;
varx1-x10;
withy1-y10;
run;
运行上述程序后,我们得到了下面的输出的结果,并对它们进行了详细合理的分析。
3.2.1典型相关系数
图一
由图一知:
各组典型相关系数为:
3.2.2相关系数的显著性检验
图二
由图二知,用似然比法检验典型相关系数与零的差别是否显著,其零假设为小于此对的典型变量典型相关系数的所有典型相关系数都为0,其P值依次为<0.0001,<0.0001,<0.0001,<0.0001,0.6823,0.9932,1.0000,1.0000,0.9998,0.9934,0.9481,说明只有第一、第二和第三对典型相关系数通过显著性检验,具有显著性意义,所以我们只保留前三对典型变量。
3.2.3Var变量、With变量的标准化的典型系数
Var变量的标准化的典型系数
图三
With变量的标准化的典型系数
图四
由图三、图四可得到用标准化指标来线性表达典型变量的线性方程,由于我们只保留前三对典型变量,下面只给出用标准化指标来线性表达第一、第二和第三对典型变量的线性方程:
序号
典型变量
1
V1=0.4851x1+0.2793x2+0.3662x3+0.1863x4+0.0767x5-0.0185x6+0.0013x7
+0.1501x8+0.0635x9-0.0426x10
W1=0.0824y1-0.1224y2+0.2245y3-0.0235y4+0.3495y5-0.0234y6+0.0818y7
+0.1171y8+0.6406y9+0.0565y10
2
V2=-0.0441x1-0.1365x2+0.3603x3-0.7095x4+0.0385x5+0.0596x6-0.1196x7
+0.6491x8-0.3065x9+0.0503x10
W2=-0.0284y1+0.0956y2+0.0501y3-0.3333y4-0.8307y5+0.0065y6+0.0620y7
-0.0003y8+0.6050y9-0.0699y10
3
V3=-0.5275x1-0.1691x2+0.4308x3-0.1926x4+0.0529x5+0.0199x6+0.2020x7
+0.2460x8+0.7644x9+0.1128x10
W3=-0.0560y1+0.1307y2-0.3134y3+0.7778y4+0.0426y5-0.1100y6-0.0391y7
+0.0912y8+0.3816y9-0.2176y10
表一
3.2.4相关系数矩阵
图五
图六
从图五、图六的相关系数矩阵可看出:
第一对典型变量中:
x1与V1之间的相关系数最大,为0.7831,即在V1所提取的相关信息中,x1的贡献最大,另外V1与x2、x3、x4和x8有较大的相关系数,说明V1主要代表了南宁百货、南宁糖业、柳工、柳钢股份和*ST银河等股票的价格。
而y9与W1之间的相关系数最大,为0.7858,即在W1所提取的相关信息中,y9的贡献最大。
另外W1与y1、y3、y5和y8有较大的相关系数,说明W1主要代表了广州友谊、奥飞动漫、广深铁路、中顺洁柔和万家乐等股票的价格。
第二对典型变量中:
x9与V2之间的相关系数最大,为0.5579,即在V2所提取的相关信息中,x9的贡献最大,另外V2与x2、x3、x4和x8有较大的相关系数,说明V2主要代表了南宁糖业、柳工、柳钢股份、*ST银河和索芙特等股票的价格。
而y5与W2之间的相关系数最大,为0.6866,即在W2所提取的相关信息中,y5的贡献最大。
另外W2与y2、y8和y9有较大的相关系数,说明W2主要代表了广州发展、广深铁路、中顺洁柔和万家乐等股票的价格。
第三对典型变量中:
x9与V3之间的相关系数最大,为0.6970,即在V3所提取的相关信息中,x9的贡献最大,另外V3与x1、x3和x10有较大的相关系数,说明V3主要代表了南宁百货、柳工、索芙特和ST河化等股票的价格。
而y4与W3之间的相关系数最大,为0.8367,即在W3所提取的相关信息中,y4的贡献最大。
另外W3与y2、y3和y9有较大的相关系数,说明W3主要代表了广州发展、奥飞动漫、深物业A和万家乐等股票的价格。
3.2.5VAR变量与With变量、With变量与VAR变量的典型变量间的相关系数
VAR变量与With变量的典型变量间的相关系数
图七
With变量与VAR变量的典型变量间的相关系数
图八
3.3主要结论
(1)第一、第二和第三对典型相关系数通过显著性检验,具有显著性意义,所以我们只保留前三对典型变量。
(2)典型相关系数通过显著性检验的各组典型变量标准化后的线性表达式如下表二:
典型变量对号
典型相关系数
典型变量
1
0.876895
V1=0.4851x1+0.2793x2+0.3662x3+0.1863x4+0.0767x5-0.0185x6
+0.0013x7+0.1501x8+0.0635x9-0.0426x10
W1=0.0824y1-0.1224y2+0.2245y3-0.0235y4+0.3495y5-0.0234y6
+0.0818y7+0.1171y8+0.6406y9+0.0565y10
2
0.863734
V2=-0.0441x1-0.1365x2+0.3603x3-0.7095x4+0.0385x5+0.0596x6
-0.1196x7+0.6491x8-0.3065x9+0.0503x10
W2=-0.0284y1+0.0956y2+0.0501y3-0.3333y4-0.8307y5+0.0065y6
+0.0620y7-0.0003y8+0.6050y9-0.0699y10
3
0.775529
V3=-0.5275x1-0.1691x2+0.4308x3-0.1926x4+0.0529x5+0.0199x6
+0.2020x7+0.2460x8+0.7644x9+0.1128x10
W3=-0.0560y1+0.1307y2-0.3134y3+0.7778y4+0.0426y5-0.1100y6
-0.0391y7+0.0912y8+0.3816y9-0.2176y10
表二
(3)根据典型变量的重要程度及系数大小,从建立的典型相关变量可以看出,两广地区股票价格的相关性可以用三对典型相关变量予以综合描述。
第一对典型变量中:
x1与V1之间的相关系数最大,为0.7831,即在V1所提取的相关信息中,x1的贡献最大,所以V1主要受股票南宁百货的影响。
而y9与W1之间的相关系数最大,为0.7858,即在W1所提取的相关信息中,y9的贡献最大,所以W1主要受股票万家乐的影响。
第二对典型变量中:
x9与V2之间的相关系数最大,为0.5579,即在V2所提取的相关信息中,x9的贡献最大,所以V2主要受股票索芙特的影响。
而y5与W2之间的相关系数最大,为0.6866,即在W2所提取的相关信息中,y5的贡献最大,所以W2主要受股票广深铁路的影响。
第三对典型变量中:
x9与V3之间的相关系数最大,为0.6970,即在V3所提取的相关信息中,x9的贡献最大,所以V3主要受股票索芙特的影响。
而y4与W3之间的相关系数最大,为0.8367,即在W3所提取的相关信息中,y4的贡献最大,所以W3主要受股票深物业A的影响。
(4)广西和广东的股票价格存在重要影响,具有很强的相关性。
4参考文献
[1]杜强,贾丽艳.SAS统计分析标准教程[M].北京:
人民邮电出版社,2010.
[2]余锦华,杨维权.多元统计分析与应用[M].广州:
中山大学出版社,2005:
269-282.
[3]于秀林,任雪松.多元统计分析[M].北京:
中国统计出版社,1999:
216-236.
[4]何超琴.典型相关分析在我国财政支出与居民支出分析中的应用[J].西安电子科技大学学报,2008,18(5):
96-101.
[5]钟蓉萨,顾岚.中国股票市场实证统计分析[M].北京:
中国财政经济出版社,1999.
[6]时光,罗晓芹.中国证券市场概述[M].成都:
西南财经大学出版社,2000.
[7]刘冬喜.两组变量间相关关系的统计分析方法[J].高等数学研究.2011.
[8]王芳.城镇居民消费结构影响因素的典型相关分析[J].统计与决策.2007.
[9]谢冰,邹伟.证券市场与货币市场、国民经济的相关性实证分析——股指与货币供应量、国民生产总值的相关性分析[J].湖南财经高等专科学校学报.2002.
[10]夏怡凡.SPSS统计分析精要与实例详解.北京:
电子工业出版社.2010.
5附录
SAS程序如下:
dataa;
inputx1-x10y1-y10;
cards;
6.811.4211.293.517.712.185.053.014.563.9215.57.0726.186.063.4316.87.923.584.6312.08
6.8912.111.123.447.4911.414.922.894.183.7215.2025.785.463.4716.77.5921.614.4212.17
6.7611.7411.243.527.4511.594.742.914.23015.126.7525.625.593.4616.277.6321.294.4412.17
7.1312.211.893.657.6511.924.93.044.53.9115.636.8226.835.843.5316.717.922.214.5812.89
7.4412.8113.083.88.0312.335.033.1804.116.086.9729.126.13.6117.458.2723.014.7113.11
7.4512.6812.983.88.0112.255.153.164.954.11167.0928.3963.5917.468.2622.954.6612.83
7.5512.6813.063.767.9212.315.173.184.94.1215.667.0128.236.23.5517.598.322.864.912.8
7.3412.2312.563.717.5811.715.073.094.723.9515.166.7226.985.93.53178.0604.7512.31
7.111.8212.323.647.2411.414.923.034.853.8914.726.6327.15.73.5516.65021.184.5912.25
7.412.5213.363.837.63125.13.175.174.0815.326.8628.46.073.5917.358.4122.754.8112.92
7.1512.9513.453.797.3811.794.953.1254.0714.886.9927.125.973.5416.78.2421.54.7612.76
7.1913.2313.963.817.4511.994.943.144.94.1315.446.9124.416.073.5515.038.2921.624.8213.27
7.3913.2414.543.857.612.344.783.174.94.1915.886.8624.126.213.5415.358.3522.074.9813.38
7.3112.4914.033.817.4912.224.773.1754.215.436.824.436.073.4814.858.3321.94.8412.84
7.3712.5213.993.787.5512.214.972.995.074.4115.336.8724.676.093.4814.88.3221.894.7412.78
7.4512.2613.643.737.3912.194.922.945.034.315.256.8523.655.933.4714.768.1421.534.6712.71
7.8312.4814.107.812.345.1705.084.5215.386.9124.316.143.515.088.2322.274.7612.71
7.6912.713.863.847.8112.485.393.055.134.7515.66.9124.336.463.515.258.3323.054.8812.66
7.7112.7113.753.837.8812.485.393.135.124.9915.926.9424.346.333.4815.558.4522.914.8812.91
7.5512.2313.183.747.9212.255.333.055.15.2415.756.7424.736.173.4315.38.2722.494.8112.49
7.6812.513.733.828.0712.55.353.115.175.1716.086.8325.146.353.515.688.4923.114.8912.8
7.6712.8813.733.838.0212.615.383.215.245.116.066.7125.46.433.4615.48.623.34.9312.73
7.5712.8813.853.887.9912.635.393.195.295.3615.946.6925.26.673.4515.618.7423.524.9812.74
7.612.8813.753.838.0112.755.473.235.555.5616.056.6626.476.583.4515.559.0523.795.0112.58
7.7113.1213.683.818.0712.795.513.295.535.4515.826.5826.096.843.4215.349.0123.694.9912.76
7.8213.2114.043.888.1512.895.643.355.755.4915.96.7226.566.893.4516.269.1923.965.0913.08
7.7113.0713.813.898.2413.15.513.395.665.3916.596.7426.526.833.4316.589.1823.595.0912.98
7.6813.1713.883.878.3513.115.383.325.535.2316.46.6826.246.773.4616.499.0623.275.0612.98
7.6613.0813.873.878.2313.035.413.35.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 两广 地区 股票价格 相关性 分析