高教社杯全国大学生数学建模竞赛.docx
- 文档编号:12880350
- 上传时间:2023-06-08
- 格式:DOCX
- 页数:17
- 大小:125.33KB
高教社杯全国大学生数学建模竞赛.docx
《高教社杯全国大学生数学建模竞赛.docx》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛.docx(17页珍藏版)》请在冰点文库上搜索。
高教社杯全国大学生数学建模竞赛
2014高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
我们的报名参赛队号为(8位数字组成的编号):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)
日期:
年月日
赛区评阅编号(由赛区组委会评阅前进行编号):
2014高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
题目
摘要
针对…(写清楚什么问题),通过…(方式怎么分析),考虑到…(约束/限制条件),运用…(方法),解决…(问题)(300-500左右)
逐个问题来表述
问题一:
问题二:
问题三:
问题四:
问题五:
问题六:
【关键词】:
3-5个
1.问题的重述
股票交易数据的分析
1.1问题的背景
新中国股份公司的出现和股票市场的形成出现于20世纪八十、九十年代,特别,上海证券交易所、深圳证券交易所的成立标志着我国证券市场开始发展。
1990年12月19日,上海证券交易所开业;1991年7月3日,深圳证券交易所正式开业。
中国证券市场作为一个新兴的高速成长的证券市场,在短短十几年的时间里取得了举世瞩目的成就。
证券市场在促进国有企业改革、推动我国经济结构调整和技术进步方面发挥了突出的作用,目前我国股票总市值已经超过日本,位于世界第二。
1.2问题所给信息及数据
股票市场的发育程度与活跃状态,通常与一个国家或国际社会的经济发展状态关联,同时也受风险投资者(机构、散户)对企(行)业成长环境的评估与发展前景的预判等多方面因素的影响,特别,不同投资者基于市场投机的利益博弈,有时成为证券交易市场风云起伏的重要主导因素。
通常用“牛市-熊市-牛市-熊市-….”这样的交替转化来描述股票市场的景气度周期性质。
所谓“牛市”,也称多头市场,指多数上市公司的股票的行情(交易价格)普遍看涨,延续时间较长的大升市。
而“熊市”则正好相反,也称空头市场,指行情普遍看淡,延续时间相对较长的大跌市。
图B1:
上证指数历史数据图(19901219-20150717,共6013个交易日数据),不难发现其交易记录上的几个阶段性高点,分别以HP1、HP2、HP3、HP4标示,特别HP3对应发生在2007年10月16日的高点6124.04,而HP4对应发生在2015年06月12日5178.19。
1.3所要解决的问题
通过一些主要门户网站或股票交易的专业网站,可以获取非常丰富的上市公司股票交易历史数据。
通过对这些数据的有效建模分析,我们希望在如下方面得到有价值的结论:
1)近25年的股票交易历史,有何典型的周期性结论?
2)可以获取国际上其它一些重要经济体的证券交易指数历史数据,分析其变动有无共同的特点;
3)请结合我国的一些主要经济发展数据指标,给出上证指数目前的合理估值;
4)HP3与HP4在适宜的时间跨度下,显示出极强的相似性,升也匆匆,落也汹汹。
一方面,从大众对风险投资概念与心理意识,两次过山车行情的心理把握与介入节奏有非常大的不同;另一方面,股市行情与外围经济发展的支撑数据关联也有很大差异。
百尺巨浪,成于万里浩淼碧波,我们通常认为,系统的大范围坍塌必然可以从一些局部环节的表现上发现线索。
因此,我们希望能从一些个别上市公司的交易数据的奇异变化,来做出市场风险积累与释放前兆的预警方法。
比方给出类似一轮行情延续的时限(显然能做到最切近的提示是最有价值的)和冲高的幅值等的预判;
5)一些观点认为,近期股市交易的大幅起落,只是宏观慢牛当中的一次短暂性修复,请通过严肃的建模分析,给出相应的分析结论;
6)结合你的工作,请给出你对目前中国股市发展的政策建议,篇幅限制在1000字以内。
2.问题的分析
市场上,股票价格起伏无常,投资者往往面临着市场价格风险。
对于多种股票的价格变化,投资者要逐一了解,既不容易,也不胜其烦。
题目中提供了1990-2015年上证指数的6000多个交易日数据,作为股票市场价格变动的指标,供我们参考。
我们通过找出影响股票价格指数的各种因素,并根据这些因素,结合相关数据的建模分析,借以预测股市未来走势。
同时,搜集了我国的一些主要经济发展数据指标,并选取有代表性的股票的成交数据,为当前的上证指数合理估值。
2.1问题
(1)的分析
观察近25年来的股票交易历史数据,有波峰,有波谷,震荡起伏,体现出一定的周期性。
所以我们采用周期性函数拟合的方法,假设拟合函数傅里叶级数展开到5阶。
股票的历史数据系列,可以看做是一系列不同振幅与相位的正弦函数迭代所构成,?
?
?
在计算机上我们给定了置信度P与检验的最大最小周期,使之自动进行时间序列的周期性检验,找出最显著的周期进行拟合,一直到再也找不出显著周期为止。
?
?
?
2.2问题
(2)的分析
本题选取的数据是道琼斯指数1896-2012年的完整收盘价数据,进行相关性分析。
具体操作是采用?
?
?
散点图?
?
的方法,显著性水平为0.05,同时通过计算相关系数R?
?
进行深入的定量考察。
2.3问题(3)的分析
此问我们结合了国内生产总值GDP、城乡居民储蓄、居民消费指数CPI、M1供给量、M2供给量及其各自的同比增长率,共计5组10个主要的经济发展数据指标,运用多元回归的方法,在matlab软件上求出各组数据的权重系数?
?
,确定至少3个关键的影响因素,进而给出上证指数目前的合理估值。
2.4问题(4)的分析
本题建立了系统模型以方便求解,在股票市场这个现实的系统中,以?
?
?
?
为输入,以?
?
?
?
为输出,利用?
?
方程,约束条件有?
?
?
,系统的目标在于通过一些个别上市公司的交易数据的奇异变化,做出市场风险积累与释放前兆的预警方法。
2.5问题(5)的分析
每日股票交易的数据.可以看作是随着时间的推移而形成的一个随机时间序列,通过对该时间序列上股票指数的随机性、平稳性以及周期性等因素的分析,将这些单日股指数之间所具有的相关性或依存关系用数学模型描述出来,从而达到利用过去及现在的股票指数信息来预测未来股票价格情况的目的。
对此我们运用了自回归积分滑动平均模型(ARIMA模型),以时间序列的自相关分析为基础,而且对序列?
?
“取对数和作差分”等平稳化处理,既考虑了股票指数在时间序列上的依存性,又考虑了随机波动的干扰性。
除此之外,结合了?
?
参数估计,通过了假设检验,诊断了残差序列,对于股票交易短期趋势的预测很有依据性。
3.模型的假设
3.1基本假设
3.1.1模型一
1)
2)
3.1.2模型二
1)
2)
3)
3.1.3模型三
1)假设股票交易市场是一个线性时不变系统
2)假设当任意两支大盘股相关度足够高(大于?
?
)时,可以以其中一支为基础数据,近似预测另一支
3)
3.1.4模型四
1)
2)
3)
4.变量假设
4.1变量的符号说明
符号
表示的内容
5.模型的建立与求解
5.1问题
(1)的模型建立与求解
5.1.1图像解释
近25年来的股票历史交易数据如图?
?
,随着时间的推移震荡上扬,连续3次包络线,指数递增,迅速又衰减,对应时间点,详细函数变化要说清楚
5.1.2构造函数拟合
5.1.3发现周期性结论
5.2问题
(2)的模型建立与求解
5.2.1其他重要经济体的证券历史交易数据
表格1道•琼斯股票指数历史收盘数据
5.2.2相关性分析
5.2.3模型求解
沿用问题
(1)的模型,解题说明如下:
5.2.4结论
5.2.4.1道•琼斯历史股指数变化趋势分析
5.2.4.2与上证的共同点挖掘
5.3问题(3)的模型建立与求解
5.3.1参考数据指标
本题所参考的主要经济发展指标包括“国内生产总值GDP、城乡居民储蓄、居民消费指数CPI、M1供给量、M2供给量及其各自的同比增长率”,共计5组10个,同时提供有有上证指数的相关信息。
而每一类数据的时间跨度均在1990-2013年。
表格2我国主要的经济发展指标
5.3.2相关矩阵计算
各个经济发展指标用分别用列向量组?
?
?
?
表示,而24年来的上证指数以向量组?
?
?
表示,依次将每一个经济发展指标与对应时期的上证指数做相关性分析,相关系数?
?
?
?
?
,通过协方差计算,协方差矩阵如下:
结果得出?
?
?
?
(列向量组)相当于?
?
(向量组)的系数矩阵,建立公式?
?
?
5.3.3偏最小二乘法分析
偏最小二乘回归≈多元线性回归分析+典型相关分析+主成分分析
方法体现:
设有q个因变量和p个自变量。
为了研究因变量与自变量的统计关系,观测了n个样本点,由此构成了自变量与因变量的数据表X和Y。
偏最小二乘回归分别在X与Y中提取出t和u,要求:
(1)t和u应尽可能大地携带它们各自数据表中的变异信息;
(2)t和u的相关程度能够达到最大。
在第一个成分被提取后,偏最小二乘回归分别实施X对t的回归以及Y对t的回归。
如果回归方程已经达到满意的精度,则算法终止;否则,将利用X被t解释后的残余信息以及Y被t解释后的残余信息进行第二轮的成分提取。
如此往复,直到能达到一个较满意的精度为止。
若最终对X共提取了多个成分,偏最小二乘回归将通过施行yk对X的这些成分的回归,然后再表达成yk关于原自变量的回归方程。
为自变量、因变量赋值!
!
!
展示最终表达式!
!
!
5.3.4求解
5.3.5上证目前的合理估值
5.4问题(4)的模型建立与求解
5.4.1数据的分析比较
首先,根据所提供的B题参考数据-601318文档中平安证券自20070301-20150717的历史交易数据,以交易日t为横轴,以每日交易的最高价X(t)为纵轴,作出平安证券8年来股票交易历史数据的曲线图。
?
?
?
图+上证在一张图上
我们发现,该曲线的数据震荡变化态势大体类似于题目中“图B1:
上证指数历史数据图(19901219-20150717,共6013个交易日数据)”的变化走势。
通过其相关矩阵的推导求解,得知两组大盘数据的相关度在95%以上。
据此,我们大胆猜想,上证的大盘指数可以由平安提供的大盘历史数据经一定的拉伸变换和时延操作近似得来。
5.4.2模型的建立
这里要给出一个系统框图!
!
!
!
本题建立一系统模型H,把整个股票交易市场看作是一个系统,令Y(t)=X(t)*h(t),其中X(t)代表平安证券的每日交易指数,作为系统激励信号;Y(t)代表上证的大盘指数,作为系统响应信号;而h(t)则表示系统所发挥的作用。
研究清楚h(t)的数学表达式,将对于股票市场风险的预估及未来股指的预判有重要意义。
5.4.3模型求解
在这样一个系统模型中,实际上输入X(t)与输出Y(t)已经能够从附件所给出的“平安历史交易数据”和“上证历史交易指数”中有所窥见,通过已有的数据,我们可以采用逆卷积的方法去求解系统h(t)。
可以假设h(t)=A*δ(t)+B*δ(t-t0),t0作为时延。
以下是详细求解过程:
配部分程序语言和求解用图!
!
!
!
5.4.4风险预测和行情预判
可能的风险
对策建议
预测图!
!
!
5.5问题(5)的模型建立与求解
5.5.1应用ARIMA模型建模的步骤
Step1L:
求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
Step2:
根据样本自相关系数和偏自相关系数的性质,选择阶数适当的ARMA(p,q)模型进行拟合。
Step3:
估计模型中未知参数的值。
Step4:
检验模型的有效性。
如果拟合模型通不过检验;转向步骤
(2),重新选择模型再拟合。
Step5:
模型优化。
如果拟合模型通过检验,仍然转向步骤
(2),充分考虑各种可能,建立多个拟合模型,从所有通过检验的拟合模型中选择最优模型。
Step6:
利用拟合模型,预测序列的将来走势。
5.5.2随机序列的确定
5.5.2.1数据的来源
基本数据选取的是B题目提供的19901219-20150717,共6013个交易日的上证历史指数,拟对2015年7月以后约百日内的上证综合指数进行预测和实证分析。
我们把这部分随机数据用时间序列{yt}来表示。
图1上证指数历史数据图(19901219-20150717,共6013个交易日数据)
5.5.2.2原随机序列的平稳性检验
1)平稳性的时序图检验
观察时间序列{yt}图谱是否围绕着一个常数附近作随机波动,波动幅度范围是否基本一致、有界。
由图1断定,上证指数的时序图尚不够稳定。
2)平稳性的自相关图检验
以下作出自相关图:
一个坐标轴表示延迟时期数k,另一个坐标轴表示自相关系数ACF,通常以悬垂线表示自相关系数的大小。
给出自相关图?
?
?
观察?
?
?
自相关系数ACF随延迟期数k的增加并没有快速衰减到零,在k=3以后仍旧大于2倍标准差。
初步判断,已知的时间序列{yt}尚不够稳定。
5.5.2.3平稳化处理
对时间序列{yt}进行若干次差分,可使序列平稳化。
将一阶差分的序列记为ΔY,进行ADF检验,从图?
?
可看出,差分后的序列为平稳时间序列
ADF检验的一些设定形式或公式?
?
?
配一阶差分的ADF检验图!
!
!
!
!
有差分序列的自相关和偏自相关函数图也要
?
?
?
?
?
序列蕴含着显著的线性趋势,1阶差分就可以实现趋势平稳
?
?
?
?
?
?
序列蕴含着曲线趋势,通常低阶(2阶或3阶)差分就可以消除曲线趋势的影响
5.5.3模型定阶与识别
自回归模型AR(p)(AR:
Auto-regressive)
移动平均模型MA(q)(MA:
Moving-Average)
混合模型ARMA(p,q)(ARMA:
Auto-regressiveMoving-Average)
模型ARMA(p,q)的一般表达式为:
{εt}是白噪声,并且对于所有的t,满足:
E(εt|yt-1,yt-2,…)=0
引进延时算子B:
yt-1=Byt则有:
其中:
5.5.3.1p,q参数的处理
令
求和自回归移动平均模型ARIMA(p,d,q)
配参数求解结果?
?
?
?
或者必要的说明
5.5.3.2白噪声检验
对ARMA(p,d,q)的残差序列进行Q检验,具体结果如下
配白噪声检验相关图!
!
!
!
!
由图?
?
可知该残差序列为白噪声过程。
因此确定用模型ARMA(p,d,q)来拟合时间序列{yt}是合适的。
5.5.4模型的求解及结果输出
我们可以得到yt+l的预测值yt(l):
预测的置信区间
对于ARMA(p,q)模型,我们可以得到yt+l预测的95%的置信区间:
yt(l)±1.96*se(l),式中se(l)是误差标准差.
模型拟合的相关估计结果图表?
?
模型ARMA(p,d,q)在matlab中的输出结果图示!
!
!
5.5.5大盘预测效果
结论+预测结果?
Matlab中预测的数据变动趋势?
均值?
误差率?
等等需要图!
!
!
!
6.模型的评价及推广
6.1优点
模型1,问题
(1)和
(2)都采用,
模型2,
模型3,
模型4,
6.2缺点
模型1,问题
(1)和
(2)都采用,
模型2,
模型3,
模型4,
6.3推广
7.对中国股市发展的政策建议
1)对1990-2015年以来已有的股市大盘综合指数变动趋势的分析、总结
2)根据上文4个模型的研究,对今后一段时间(约100天内)股指数大体走势的预测
3)结合股市走势的预测为政府及相关部门提出经济发展方面的建议
参考文献
[1]
[2]
[3]
[4]
[5]
Zhu:
●参考文献按正文中的引用次序列出,其中
书籍的表述方式为:
[编号]作者,书名,出版地:
出版社,出版年。
参考文献中期刊杂志论文的表述方式为:
[编号]作者,论文名,杂志名,卷期号:
起止页码,出版年。
参考文献中网上资源的表述方式为:
[编号]作者,资源标题,网址,访问时间(年月日)。
附录:
附录一
附录二
附录三
附录四
在论文纸质版附录中,应提供参赛者实际使用的软件名称、命令和编写的全部计算机源程序(若有的话)。
同时,所有源程序文件必须放入论文电子版中备查。
论文及源程序电子版压缩在一个文件中,一般不要超过20MB,且应与纸质版同时提交。
(如果发现程序不能运行,或者运行结果与论文中报告的不一致,该论文可能会被认定为弄虚作假而被取消评奖资格。
)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高教 全国大学生 数学 建模 竞赛
![提示](https://static.bingdoc.com/images/bang_tan.gif)