上海交易所证券股市走势分析 1.docx
- 文档编号:9500360
- 上传时间:2023-05-19
- 格式:DOCX
- 页数:25
- 大小:46.65KB
上海交易所证券股市走势分析 1.docx
《上海交易所证券股市走势分析 1.docx》由会员分享,可在线阅读,更多相关《上海交易所证券股市走势分析 1.docx(25页珍藏版)》请在冰点文库上搜索。
上海交易所证券股市走势分析1
上海交易所证券股市走势分析
摘要:
我国经济在改革开放后自1990年12月19日上海证券交易所成立引入了证券交易以来,已经有十七年了。
通过所给出在这17年以来上证综合指数的数据,运用统计学原理和Excel,Lingo,Matalab等数学软件分析上证综合指数规律。
题目背景:
我国经济在改革开放后自1990年12月19日上海证券交易所成立引入了证券交易以来,已经有十七年了。
这十七年来,我国的证券交易逐渐走上成熟。
在证券交易的过程中经常使用股价指数反映股市总体价格或某类股价变动和走势的指标。
它是根据上市证券品种价格,使用统计学方法编制而成的。
可以反映不同行业的景气状况及其价格整体变动状况,从而给投资者提供不同的投资组合分析的参照系。
譬如,上证指数系列就是从总体上和各个不同侧面反映了上海证券交易所上市证券品种价格的变动情况。
深证综合指数反映的是深圳证券交易所股市的整体走势,而深圳B股指数反映的是在深交所上市的B股价格走势。
这些指数将逐步成为观察中国经济运行的“晴雨表”。
2007年2月7号国务院批准了新的《期货交易管理条例》,3月30日证监会发布了期货公司和交易所管理办法的修订草案,并于4月15日开始实施.。
股指期货的推出的脚步越来越近了。
而了解和掌握股市的变化规律对于成功地进行股指期货交易是非常重要的。
问题重述:
2007年2月7号国务院批准了新的《期货交易管理条例》,3月30日证监会发布了期货公司和交易所管理办法的修订草案,并于4月15日开始实施.。
股指期货的推出的脚步越来越近了。
为了将来能在股指期货交易中取得成功,我们搜集了我国上海证券交易所从1990年12月19日成立以来的每月上证综合指数的数据,包括当月开盘指数,最高指数,最低指数,收盘指数,成交量和成交金额(见附件)。
请你对上海股市的整体走势的规律给出分析。
解决下列问题:
(1).上证收盘的综合指数的运行规律如何?
(2),上证综合收盘指数与开盘指数,最高指数,最低指数,成交量,成交金额有什么关系?
(3).上证综合收盘指数的季节因素表现什么特征?
名词解释:
此道建模题与股市密切相关,所以在开始列出一些股市名词解释以供参考。
1.股票指数。
一般认为,股票指数是股市中一组股票的平均价格,但股票指数的实质是一组股票的市值,当股票价格的变化导致这组股票市值上升时,股票指数就上涨,反之就下跌,其涨跌幅度就为这一组股票的投资收益率。
在以股票指数作为投资的参考依据时,股民应注意股票指数中所包含的股票样本。
如过去的深圳综合指数和上证指数,由于其样本为所有的股票,故任何一支股票价格的变化都对其有影响。
而现在的深圳成分股指数及上海50指数,由于其样本中分别只包含上市流通的40支及50支股票,故除此之外任何股票价格的变动,都对指数的涨跌无影响。
2.股票代码与股票简称。
股票代码是股票交易中用来代表股票名称的数码,由6位数组成。
股票简称是在股市中用来代表股票的简明称号,一般用四个中文字组成。
3.开盘价和开盘指数。
开盘价是一个交易日中股票第一笔的交易价格,由于沪深股市的开盘价都由集合竟价产生,所以股票的开盘价是开市前25分钟内所有委托集体成交的价格。
开盘指数为当日开市时的股票指数。
4.收盘价和收盘指数。
收盘价是一个交易日中股票最后一笔交易的价格。
收盘指数为前一交易日收市时的股票指数。
5.最高价、最低价。
是股市开盘后到目前为止股票成交的最高价格和最低价格。
6.最新价和即时指数。
最新价是刚刚成交那一笔股票的价格。
即时指数就是依照股票的最新价计算出来的股票指数。
7.成交量和成交金额。
成交量为股票成交的数量,其中总手为到目前为止股票成交的累计数量。
手是股票成交的最小单位,一手为100股。
现手为刚刚成交的那一笔股票数量。
股票的成交金额是用货币表示的股票成交总量,也可以说是已成交的股票价值。
建模分析:
一、观察题目所给参考数据,可以发现收盘综合指数在整体上是随着时间的推移而增长的。
而且在17年的时间中指数增长速度的很快。
首先对数据进行去噪处理,排除数据中的奇异值。
要分析综合指数的运行规律,我们选择分别观察和对比17年收盘指数的情况,并从中去发现一些规律。
(一)统计学的原理告诉我们,描述随机变量的特征可以用期望和标准差来解决。
我们以年为单位,经过计算得出17年的综合指数平均值,如下表所示:
年份
收盘指数平均值
相对变化率
年份
收盘指数平均值
相对变化率
1990-1991
165.46
N/A
2000
1897.42
37.35%
1992
710.03
329.12%
2001
1940.87
2.29%
1993
1005.51
41.62%
2002
1561.77
-19.53%
1994
646.72
-35.68%
2003
1468.01
-6.00%
1995
643.78
-0.45%
2004
1467.06
-0.06%
1996
767.53
19.22%
2005
1144.54
-21.98%
1997
1182.596
54.08%
2006
1687.14
47.41%
1998
1257.25
6.31%
2007
3062.59
81.53%
1999
1381.49
然后我们对其图像进行拟合,在进行线形拟合,指数拟合,对数拟合,多项式拟合等多种拟合方法后,通过比较我们发现5次多项式的拟合程度是比较高的,如下图所示(蓝色的线表示的是实际收盘指数平均值,黄色的虚线是拟合图像)
图1
我们对五次多项式进行系数估计。
首先将横坐标1990-1991点取为原点:
经过Excel计算我们得到多项式为:
y=-0.0038x6+0.3846x5-11.788x4+155.28x3-937.61x2+2501.7x-1548.1①
其中R2=0.9689
由此我们便可以预测2007年上证指数平均值为2710.84,从表中我们可以看到在2007年前4个月的平均收盘指数为3062.59,所以可以预知在后面的八个月中上证收盘指数将会下跌至平均线以下。
(二)我们对①式进行求导可得:
y’=-0.0228x5+1.923x4-47.152x3+465.84x2-1875.22x+2501.7
令y’=0我们便可以求出5个极值点,这也可以从图上的拟合曲线看出。
从实际来看,上海股市的综合指数的确随着我国改革开放和社会主义现代化建设的进程中稳步上涨。
这种估计与实际也是比较相符的。
(三)统计学中的方差、标准差是用来描述离散点与期望之间的紧密程度。
是离散点与期望距离的期望。
我们求出了17年来上证收盘指数每年的标准差,如下表所示:
年份
收盘指数标准差
年份
收盘指数标准差
1990-1991
55.87
2000
XX文库-让每个人平等地提升自我151.57
1992
307.92
2001
195.47
1993
180.78
2002
105.93
1994
134.15
2003
65.66
1995
65.53
2004
149.07
1996
163.5
2005
64.65
1997
108.35
2006
379.6
1998
76.89
2007
243.48
表中的标准差数值越大,则表明在该一年股市的暴涨暴跌的情况比较严重。
但标准差对当时政策和经济的依赖较大。
政策的改变与经济的波动都会影响到标准差的取值。
例如在1992年和2006年(两个标准差较大的年份)就发生了一些对经济影响较深的重要事件。
二、上证综合收盘指数与开盘指数、最低指数和最高指数的关系。
(一)我们对表中所给数据进行折线作图,所的图像如下:
由以上四个图可以看出,收盘指数、开盘指数、最高指数、最低指数随时间变化的折线图十分的相似,因此我们采取线性拟合的办法,试将收盘指数用开盘指数,最高指数,最低指数线性表示。
参数设置:
收盘指数:
s
开盘指数:
x1开盘指数线性系数:
k1
最高指数:
x2最高指数线性系数:
k2
最低指数:
x3最低指数线性系数:
k3
(二)公式推导:
由于是考虑收盘指数是由开盘指数、最高指数、最低指数线性表示而成,所以可得基本关系式:
S=k1*x1+k2*x2+k3*x3②
我们将17年以来收盘指数、开盘指数等可以分别看作一个1行,197列的矩阵。
以收盘指数为例:
S=(126.45130.44133.47120.19113.94114.83137.56……………)1*197
K1,k2,k3依然作为系数,而不是矩阵。
X1,X2,X3是与S等规格的矩阵,分别为开盘指数,最高指数,最低指数。
则②也成立,然后我们就将其可以转化成为一个求最优解的问题,存在约束条件:
0<=ki<=1。
使用lingo软件寻求最优解。
下面考虑目标函数,因为我们所做的是线性拟合,所以我们寻求的是②中等式右边所算出的值S’与实际值S的偏差越小越好,这也类似于方差的原理。
即为矩阵ΔS:
ΔS=S-S’=S-(k1*x1+k2*x2+k3*x3)
ΔS矩阵中所有元素的平方和的最小值和此时k1,k2,k3的值。
通过计算可得:
ΔS矩阵中所有元素的平方和取最小值时k1=0,k2=0.7816,k3=0.2095
所以S=0.7816*x2+0.2095*x3。
即:
收盘指数=0.7816*最高指数+0.2095*最低指数
三、收盘指数与成交量,成交总额的关系
收盘指数、开盘指数、最高指数、最低指数、成交量股价图
将此股价图的x轴标度细化后可以发现成交量与收盘指数存在这样的关系:
1、当交易量的数值比较小时,交易量与收盘指数不存在任何的线性或者其他关系。
2、当交易量的数值比较大时,收盘指数与交易量存在线性关系。
四、上证综合收盘指数的季节因素分析
(一)上证收盘指数的标准化
从1990年到2007年17年的时间里,股市的各项指数变化很大,要观察收盘指数季节性,就要考虑在每一年收盘指数的变化,同时也要建立一个统一的标准,使得每一年之间也具有可比性,于是运用统计学原理我们对数据以年为单位进行数据标准化
数据标准化公式:
参数设置:
:
为标准化后的数值。
D:
为方差
:
此年的平均值
:
原始数值
(二)数据标准化后进行以时间为横轴,标准化数据为纵轴的图像如下图所示:
(三)以零线作为标准,统计各月份处于平均线之上的概率,列表如下:
月份
零线之上
所占比率
月份
零线之上
所占比率
Jan
6
0.6
July
8
0.5
Feb
5
0.7
Aug
9
0.5625
May
9
0.5
Sep
9
0.5625
Apr
9
0.5
Oct
6
0.375
Mar
7
0.4375
Nov
7
0.4375
June
10
0.625
Dec
8
0.5
北半球的春季是从2月开始,所以根据公式
计算各季度期望可以得:
第一季度(2月-4月):
45.67%
第二季度(5月-7月):
52.08%
第三季度(8月-10月):
50%
第四季度(11月-转年1月):
42.03%
由此我们可以看到,上证收盘指数在一、四季度的状况不及二、三季度股市状况。
(四)统计每月涨跌情况所占比率,右上图我们可以得到以下数据:
月份
上涨
所占比率
月份
上涨
所占比率
Jan
11
0.4
July
5
0.3125
Feb
13
0.2
Aug
8
0.5
May
12
0.3
Sep
5
0.3125
Apr
11
0.4
Oct
5
0.3125
Mar
9
0.5
Nov
12
0.75
June
8
0.5
Dec
6
0.375
使用同样求平均值公式可得:
第一季度(2月-4月):
70.6%
第二季度(5月-7月):
43.7%
第三季度(8月-10月):
47.5%
第四季度(11月-转年1月):
58.8%
我们可以看到,每月涨跌情况与各月处在平均线之上的情况恰好相反,这里是不矛盾的。
我们由此也可以得到上证收盘指数每年走势的规律:
在每年的年初开始处于上涨阶段(注:
尽管一月份处于平均线以下,但这是由所选区域是年区域导致的,由于所有图和数据都是标准化后的数据,所以一月标准值低并不一定意味着比上一年十二月份的指数低,因为所取标准不同),到六七月份会出现涨停,然后开始下跌。
有部分年情况与此恰好相反,但是对于每一年而言,都有一个涨与跌的轮换,而不是围着平均线上下浮动。
对于模型的进一步思考:
一、对于三个问题之间联系的观察:
在第一题的运算中我们得到了这样的一个结论:
“由此我们便可以预测2007年上证指数平均值为2710.84,从表中我们可以看到在2007年前4个月的平均收盘指数为3062.59,所以可以预知在后面的八个月中上证收盘指数将会下跌至平均线以下。
”(上文引用),其现象我们从第三题也可以得到印证。
“对于每一年而言,都有一个涨与跌的轮换,而不是围着平均线上下浮动。
”,通过观察和统计我们就可以估计到下跌可能性最大的月份5-7月份。
虽然现在看到的只是表面数据,但是其中必然有这一层很深刻的联系。
其中会蕴含着经济学等原理。
二、第三个问题中划分区域所带来的问题
在第三题中,我们以一年为单位划分区域,并利用统计学的知识进行标准化。
但是标准化就会带来一个问题,那就是相邻区域的数据衔接问题。
按照此模型的划分,相邻两年的标准化数值是没有任何可比性的。
因为在标准化的过程中所需要的期望与方差是不一样的,也就导致了零线的不同实际取值。
以97年12月和98年1月为例,两个月份的标准值分别为0.106和-0.447,但是收盘指数却为1194.10和1222.91。
所以在遇到区域边界时单纯的比较标准化后的值是没有意义的,应该比较实际值。
三、收盘指数年平均值的n阶多项式拟合:
我们在第一题的求解中用到了数据的曲线拟合,由于直线拟合,指数拟合逻辑曲线拟合等所模拟的时间序列变化趋势比较单调,对于像股票这样的时间序列,由于其上涨下跌变化不定,因此用多项式的拟合更加合适,一般来讲,多项式模型的阶次越高,你和得精度越好,但实际中模拟的阶数部可能太高,我们采用的是6阶多项式的拟合。
在试验和计算中我们发现,使用5阶多项式拟合也是可行的。
于是我们又进一步的对多项式拟合进行深入的试验:
(1)3阶拟合:
(2)4阶拟合
(3)5阶拟合
对于拟合精度的好坏,我们只须观察R2的值,我们可以看到3、4、5、6阶拟合后的R2值分别为0.6703、0.7798、0.9676、0.9689,所以6阶拟合是比较合适的,也成为了我们最终的选择(最开始选择的是5阶拟合)。
同时选取6阶拟合的另一个原因是使用5阶拟合时,求导后会有4个极值点,实际图中已经出现四个极值点,这也就意味着2007年后上证收盘指数将会一直上涨,不出现回落状态,这是不符合实际的,所以采取6阶是很合理的。
附件1:
建模题目所给资料数据
日期
交易量
开盘指数
最高指数
最低指数
收盘指数
交易金额(万元)
1990-12-28
108
126.39
126.45
125.28
126.45
9
1991-1-30
36,565
127.61
134.74
127.61
130.44
1,964.00
1991-2-27
33,453
129.5
134.87
128.53
133.47
2,044.00
1991-3-29
23,295
132.53
132.53
120.11
120.19
1,560.00
1991-4-30
70,671
120.69
122.2
113.89
113.94
3,649.00
1991-5-31
76,786
113.04
114.83
104.96
114.83
3,946.00
1991-6-28
77,828
115.9
137.56
114.89
137.56
4,641.00
1991-7-31
160,132
136.64
143.8
131.87
143.8
8,594.00
1991-8-30
80,814
145.12
178.43
143.8
178.43
4,428.00
1991-9-30
286,133
180.08
191.18
178.43
180.92
19,413.00
1991-10-31
223,443
181.55
218.6
179.8
218.6
14,951.00
1991-11-29
96,270
220.71
259.85
218.6
259.6
8,019.00
1991-12-31
43,666
261.78
292.75
259.67
292.75
4,665.00
1992-1-31
16,905
293.74
313.24
292.76
313.24
2,268.00
1992-2-28
108,287
314.18
364.67
313.24
364.66
16,570.00
1992-3-31
161,441
365.15
382.06
364.66
381.24
34,680.00
1992-4-30
510,611
381.55
448.94
381.01
445.38
80,496.00
1992-5-29
1,073,313
454.86
1,429.01
439.96
1,234.71
208,523.00
1992-6-30
794,087
1,175.69
1,249.58
1,033.47
1,191.19
200,664.00
1992-7-31
1,388,425
1,199.54
1,215.24
961.61
1,052.07
278,120.00
1992-8-31
2,040,679
1,034.70
1,060.36
627.36
823.27
286,258.00
1992-9-30
2,089,985
826.96
832.84
595.42
702.32
273,412.00
1992-10-30
2,046,371
676.47
713.77
447.93
507.25
228,482.00
1992-11-30
3,251,862
471.18
752.32
386.85
724.6
282,849.00
1992-12-31
4,761,674
718.99
841.02
592.78
780.39
621,652.00
1993-1-29
7,341,654
784.13
1,198.48
777.16
1,198.48
1,152,714.00
1993-2-26
12,275,779
1,242.35
1,558.95
1,196.47
1,339.88
2,599,714.00
1993-3-31
7,621,896
1,328.22
1,339.10
913.74
925.91
1,460,900.00
1993-4-30
12,998,694
921.59
1,392.62
915.59
1,358.78
2,609,816.00
1993-5-31
6,612,356
1,365.15
1,380.50
930.64
935.48
1,212,499.00
1993-6-30
9,065,218
935.9
1,177.91
859.48
1,007.05
1,547,514.00
1993-7-30
6,560,435
1,000.80
1,009.89
777.73
881.07
807,471.00
1993-8-31
14,976,937
885.31
1,042.47
823
895.68
1,815,312.00
1993-9-30
6,194,908
898.01
947.53
864.38
890.27
692,399.00
1993-10-29
15,145,361
895.69
934.4
774.54
814.82
2,364,161.00
1993-11-30
26,927,669
801.86
1,011.76
793.32
984.93
3,731,798.00
1993-12-31
27,155,402
993.67
1,044.85
750.46
833.8
3,679,547.00
1994-1-31
24,245,439
837.7
907.09
760.78
770.25
2,359,665.00
1994-2-28
15,068,988
770.25
818.57
749.63
770.98
1,548,399.00
1994-3-31
53,540,892
771.52
807.52
694.03
704.46
5,807,720.00
1994-4-29
39,314,387
704.93
705.41
536.34
592.56
3,177,417.00
1994-5-31
41,944,620
593.94
620.94
537.78
556.26
2,319,451.00
1994-6-30
21,192,207
554.08
556.9
458.74
469.29
1,051,916.00
1994-7-29
15,428,914
469.27
469.43
325.89
333.92
763,791.00
1994-8-31
207,322,046
394.87
787.22
377.97
785.33
14,849,852.00
1994-9-30
148,753,124
785.61
1,052.94
785.56
791.15
15,156,706.00
1994-10-31
65,577,130
770.9
794.85
546.79
654.98
5,588,234.00
1994-11-30
32,386,736
667.66
743.22
648.68
683.59
2,948,145.00
1994-12-30
21,634,041
684.02
695.22
620.47
647.87
2,017,596.00
1995-1-27
7,730,020
637.72
657.45
547.38
562.59
502,634.00
1995-2-28
10,386,637
559.78
608.58
524.43
549.26
630,895.00
1995-3-31
29,372,607
548.91
648.04
545.72
646.92
2,3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 上海交易所证券股市走势分析 上海 交易所 证券 股市 走势 分析