基于万科A股线性时间序列分析金融统计实验报告.docx
- 文档编号:13810303
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:19
- 大小:191.44KB
基于万科A股线性时间序列分析金融统计实验报告.docx
《基于万科A股线性时间序列分析金融统计实验报告.docx》由会员分享,可在线阅读,更多相关《基于万科A股线性时间序列分析金融统计实验报告.docx(19页珍藏版)》请在冰点文库上搜索。
基于万科A股线性时间序列分析金融统计实验报告
《金融统计分析》实验报告
题目基于万科A股线性时间序列分析
与GARC模型分析
姓名唐小勇
班级11301020402
学号11301040208
《金融统计分析》实验报告参考标准及得分
序号
指标
分值
得分
1
选题有现实意义,且能体现金融与统计的结合
10
2
综合应用数据处理技术解决金融问题的能力,熟练操作统计软件R的能力
50
3
与学分相适应的工作量和难度,有一定的创新,结论明确
20
4
报告撰写质量:
图标美观,参考文献,格式合适等
20
实验报告成绩
任课教师签名
实验一
实验内容:
基于万科A股线性时间序列分析
实验结果:
arma模型对数据的动态线性相依性的建模是充分的
实验过程:
万科企业股份有限公司成立于1984年5月,是目前中国最大的专业住宅开发企业,也是股市里的代表性地产蓝筹股。
我们可以对其收盘价指数作出分析。
首先从resset数据库中下载了万科A股(000002)的日收盘价(2000/1/1至2016/1/1)。
共计3543个观测值。
利用R软件作出其日收盘价时序图(图表1)。
(图表1万科A股在2000/1/1到2016/1/1期间的日收盘价)
由图表1可见,在2000/1/1到2016/1/1期间的日收盘价有明显的涨跌趋势。
其中2006年到2008年的涨幅和跌幅幅度最大,而在2015年之后也有持续增幅的趋势。
故我们先可认为其收盘指数不稳定。
进一步作出日收盘指数取对数,并
进行一阶差分,得到2000/1/1到2016/1/1期间万科A股日收盘指数收益的时序图(图表2)。
(图表2万科A股在2000/1/1到2016/1/1期间的日对数收益率)
由图表2可以观察到,万科A股的日对数收益率在0值周围波动,除了几个少数几个值波动比较大外,其他的都在一个固定的范围内波动,即在方差2范围波
动。
我们可以简单认为其为平稳序列。
先对其进行单位根检验,如图:
>Hil-ar(diff(rcn)'wile')
>(diff(rcn),nethod™'ml亡')
>mLSorder
[1]12
>(rtn,ldqs=12ftype=c(^c"))
Tide:
AugrrencedDickey-FullexTest
Tea*Results!
PARAMETER:
匚注甘Order!
12
STATISTIC;
Dickey-Fuller:
-15.7591
PVALUE:
0.01
MonJun202016byuser:
John.
Warningir.essage:
Lnaddes匸[匸匸口.J■日口n=12rType=c(*c")):
p-value3n:
allexthanfrinredp'value
图表3单位根检验
取日收益率的对数,对该对数序列进行扩展的Dickey-Fuller单位跟检验,我们选择p=10,ADF检验统计量是-9.09,p值是0.01,所以可以得到的结论是拒绝原假设,说明该序列是个平稳性序列。
s«f*»cipr
O
5-
JL
<
锐-
0'
—-』
0S10152-530
Lm一
(图表4一阶差分序列的时序图)
下图为该样本数据的偏自相关函数图,由图可以看出该样本数据的PACF在
第6个点才看起来是显著的,是拖尾的,更后面的也有但是在这里我们不考虑。
(图表5差分序列的样本PACF
AR(P)模型建立与分析
AR(P)模型的定阶方式有两种,第一种方法利用偏字相关PACF函数,第二种用某个信息准则函数AIC。
观察样本偏自相关函数,我们发现在5%显著性水平条件下,3、4、&7、11、12阶数显著。
进一步我们利用信息准则AIC来判定阶数。
0123456
^5.995699^6^2360249^68^7037.47195335.41550118.653065
789101112
20・34203117.55596315.155S2515.3385199・2394870.000000
0与|r
(图6上证指数日指数收益率AIC滞后12阶)
AIC信息准则为序列识别出了一个AR(12)模型,但同时也说明AR(6)模型也存在一定的合理性,图五表明,如果着重于低阶的模型,AIC会识别AR(6)
模型,注意:
在R语言中的AR命令已经对AIC准则值进行了调整,使得AIC的最小值为0。
运用R语言进行拟合AR(6)模型,结果如图六:
arima(x
■ritetorder
■
0.0)>
Caefflciencs:
ar1
ax2
ar3
岂工4
arS
ar5
j_ntercept
0.
.0117
0,0170
0.
.0615
O.O4SS
0.0272
-0.0573
3e-O4
m*E-0,
0132
0.0132
0,
0132
0.0132
0.0132
0,0132
3e-0^
estimatedasO-OOQ^SSS:
laglikelihood=1372Q.72,aic=-27^25■坨轉
拟合的模型为:
Xt0.0117xt10.017xt20.0615xt30.0485xt40.0272xt50.057xt6at
模型的各参数的标准误差都为0.132,在显著性5%水平下,根据2倍标准差原则滞后1,2阶系数显著为0,故修改后的拟合模型为:
Xt0.0618xt30.0495xt40.0287xt50.0561xt6at
我们必须仔细检查拟合模型以防止可能存在的模型的非充分性。
如果模型是充分的,那么它的残差序列应为白噪声,我们运用Ljung-Box统计量对残差序列进行检验,滞后12阶,结果如图七:
>Box.test(mlSresidual3,lagw12f'Ljling')
Box-Ljungtes'C
data:
mlSzesldual^
X-squared■35.7-6$tdJ■12fp-value■0,001052
>pv=l-pchisq(32*T巧戏fg)
>pv
[1]0-0001^«5577
(图8上证指数日指数收益率AR(6)拟合模型残差序列Box检验)
其中Q(12)=32.768,并且基于它的渐进分部的自由度为9的卡方分布,得到
的p值为0.00001在5%的置信水平下,前拒绝原假设,贝俄差序列的前12个系
数无相关性被拒绝,也就是说残差序列为非白噪声,同时在Q(12)=32.768,其
2
中p值为0.000146(基于10分布),该模型对数据的动态线性相依性的建模是非充分的。
MA(q)模型建立与分析
建立的AR(p)模型不充分,我们考虑建立MA(q)模型,我们知道自相关函数
ACF是识别一个MA莫型阶数的有用工具,对于具有自相关函数t的时间序列X,若t0但对1I有丨0,则X服从一个MA(q)模型。
通过观察该序列的自相关函数,我们首先q=4,建立一个MA(4)的模型。
>ml-arimaorder(0,0,4))
>ml
Call:
arlira(x=sy,
order
=c{
0,0,
匚u已ffic3_ent3:
ir.al
rca2
ir.a3
na-z
mtercept
0.0352
□.0179
0-
0632
0,0516
3e-04
5,Q.0132
0.0133
Q*
0139
□・013-6
3e-0^
sigrra^Sestiiratedaa
:
10?
likelihood=1371Q品*aic=-27^0S,77
(图9上证指数日指数收益率MA(4)拟合模型各参数估计值)模型的表达式为:
Xt0.082at10.0179at20.0632xt30.0516%4
0.00049
模型的各参数的标准误差都为0.133,在显著性5%水平下,根据2倍标准差原则滞后1,2阶系数显著为0,故修改后的拟合模型为:
Xt0.0646为30.0496xt4
0.00049
我们必须仔细检查拟合模型以防止可能存在的模型的非充分性。
如果模型是充分的,那么它的残差序列应为白噪声,我们运用Ljung-Box统计量对残差序列进行检验,滞后12阶,结果表示残差序列为非白噪声,同样在5%勺显著性水平下模型非充分。
ARMA(p,q)模型建立与分析
对MA莫型,ACF对模型定阶是有用的,因为MA(q)序列的ACF是q步截尾的,对AR模型,PACF对模型定阶是有用的,因为AR(P)序列的PACF是P步截尾的。
其实我们观察1992年01月01日到2016年04月11日上证指数
日指数收益率的样本自相关函数与偏自相关函数,发现ACF与PACF都是明显拖尾的,并非截尾,所以无论建立AR(P)或者MA(q)都应该是非充分的,上述AR(6)与MA(4)两模型建立验证了结论,接下来我们建立ARM(p,q)模型,我们知道在给ARM(p,q)模型定阶时,ACF和PACF都不能提供足够的信息,我们可以利用推广的自相关函数来(EACF确定ARMAS程的阶。
一个白噪声序列)。
这与图四中上证指数日收益率的样本自相关表明的结果一致前面我们所讨论的信息准则同样适用于来选择ARMA莫型,具体来说,我们县给定指定的整数P和Q计算ARM(p,q)模型的AIC,选择使得AIC取最小的值得模型。
首先取p=6,q=4,建立ARM(6,4)模型,并且同时拟合I不同p,q值的ARMAg型。
其中发现建立ARM(6,4)模型的AIC的值最小。
>flil'arima(3yforder»c4))
>ml
Call:
arinia{x=ay,
order=
c(6r0r
<})
Coefficients:
ar1
czrZ
ar3
arS
s.x6
hla.1
JT.iS
0.523Q
-0,242^
0・0106
—Q・0733
0,2710
-0,5025
3*伫*0.139B
0.2Q94
0,1116
0,1^82
D・0213
0・01S9
0.1900
0.2114
ira3
ma4
intercept
-0.137B
0・2996
3e-04
头皀+0.1096
0.1415
3e-04
吉丄grtaA'2esuixaned&s0_0004878:
laglikelihood且1372€.12,aic■-27430.24
(图11上证指数日指数收益率ARMA(6,4)拟合模型各参数的估计值)
拟合的模型为:
(1-iB2B……6B)Xt(11••…4)at
我们必须仔细检查拟合模型以防止可能存在的模型的非充分性。
如果模型是
充分的,那么它的残差序列应为白噪声,我们运用Ljung-Box统计量对残差序列进行检验,滞后12阶,结果如图十一:
>口v-1-pchlsq(15.905,9)
>pv
[1]0-OeSS9213
>Box.tes匸(nilSresiduaLsrtype=1Lj口n口1)
Box-Ljting匕色吉亡
daca:
n;l$residuals
X-scfjarsd■15.905^df=12tp-value■2<195€
>pv^l-pcilisq(15・905尸吕]
>pv
[1]0.0^376021
(图12上证指数日指数收益率ARM(6,4)拟合模型残差序列Box检验)其中Q(12)=15.905,并且基于它的渐进分部的自由度为8的卡方分布,得到
的p值为0.1956,在5%勺置信水平下,不前拒绝原假设,则残差序列的前12
个系数无相关性不能拒绝,也就是说残差序列为白噪声,同时在Q(12)=15.905,其中p值为0.0437(基于(分布),在1%勺显著性水平检验水平下,该模型对数据的动态线性相依性的建模是充分的。
实验二
实验内容:
基于万科A股GARC模型分析
实验结果:
rtat
0.00020.0629at210.2074a:
20.0846a;30.1062a;40.1443a;50.0516a:
6
实验过程:
这是万科A股(000002)的日收盘价(2000/1/1至2016/1/1)。
共计3543个
观测值。
取它们的对数。
对数收益率中有显著的序列相关性,通过自相关系数和
5%的显著性水平解答
!
>Bax.testtype=1Lju_nq-h)
a划匚冷:
t
X-3(juared=IS.G92,df=9,r>-value=0*03412
样本的ACF值只有6阶的在两倍标准差之外,是显著的,其余的都在两倍标准差之内不显著,对于对数收益率,Ljung-Box统计量为Q(9)=18.092,对应的P值为0.034,P小于0.05,拒绝原假设,即证实了该股票的对数收益率有显著的序列相关性。
由于存在序列相关性,因此需要用残差的平方做关于对数收益率的ARCH效
应检验,使用Box-Ljung检验的6个间隔与12个间隔的自相关系数在5%的显著性水平下对残差的平方进行检验,结果如下:
>y—b-mein
>Box.cesu(yA2rlag-12,1Ljung*)
Boa-Ljungtest
data:
y^2
X-sqnared=17S.57,di=12,p-valu.e<2.2t-16
>v=b-mean(b)
>Sax.res匸1呂厉'Ljuug')
Box-Ljungtest
data:
yrt2
X-sq-ared■144►€5,df■€,p-value<2►2e-L6
>archTest(v,12)
Call:
lm(formula-atsq»x)
Reszdnals:
MinIQMedian32Max
-O.OG21663-G-0003S59-0・0003761-0・OOdOSOO0.0107398
匚oe±fi^r-ETitB:
Eatiirate
Std»Error
tTralue
(Intercept)窪.592e-04
4.96Se-05
S.221
2・10e-07
xl
£.955e-O2
2.992&-02
2.40S
0,01630
*
1.-I59e-Ol
2.8&9e-02
5.034
5.5仏-tn
*疗誉
x3
S・
2,92Se-02
3・059
0.00227
x4
-2・3S5e-C3
2.543e-02
-O.OB1
0.53535
xS
7.■后r亡一QN
丄.53£e-0^
2.€44
0.00531
孑峪
7
2・a^le-02
2・5^3
Q・Q1096
*
3.
2t&lie-02
1.311
xS
3・913C-Q2
2・936e-0Z
】.・33Z
0.13312
-2•丄2fie-02
2・939e-02
-0・723
0・46963
JtlO
-l<513e-02
2.928e-02
一Q・517
0・5Q539
xll
-理.075C'Q3
2H09Ee-O2
-o 0.33821 X12 l*557e-02 2・a91e-02 0*538 0.5903B SigniX, codes: 0'***, 0.001 0,01x i0.05、 「0,11r Residual standarderrcy : 0*001252 on1155 iegrees □ffreedom NliI匸丄匚1e R-squared: 0. 07734,ilBted. R.-squ且red : O'„06358 F-statistiG: B.405on12and1195DFfp-valne: 1,934e-L5 序列的Box-Ljung统计量Q(6)=144.62,Q(12)=178.57,P值都十分接近于 0,应用拉格朗日乘子法(m=12,我们有F=8.405,相应的P值为1.93410-15, 该检验进一步确认了该股票日对数收益率存在很强的ARCH效应。 建立GARC模型: 用残差的平方做关于对数收益率的ARCH效应检验图,结果如下图所示: 段0CILogncl llo<匹匸忙」 g o 9 05101520253035 Lag 样本中PACF表面GARCH,0)模型可能是合适的,因此下面将对该股票的日对 数收益率具体建立一个如下形式的模型: 2222 rtatta01at12at2...6at6 程序和结果如下 >(-6ffLrace=r) >SHIETL己工了(血二) Std・Exxors: onHessian EttotAzialysis: E吕匸iirate 5匸d.»Error 匸value PrOKI) mu O・0002572 0.0005415 0.475 0*634965 erreaa 0.0002027 0.0000205 ? .747 <2^-16 ftRft 0.062A641 0.0290526 2,164 0.030475 ft 0.207^040 0.045'9460 昼.S14 6,36e-06 ArfA alph-a3 O・0E45£9^ 0.0365724 2.313 □*020727 A 2丄pha4 0.1062293 0.0336C61 3.155 0,001603 ftft alpjiai 0.1443151 0.0434502 3,400 0.00067S 0.0515531 Q.0231296 2.229 0,025322 TT SignAf.codes: 00.0010.01O.OS0.1 legLivelihood: 2979.9^5Tiorw.alizeti: 2.442581 Descr丄ptJicrn: SunJun1919: 35: 552Q16byuser: lx St-andaidisedR.esid.ualsTests: S'batis七iu p-Val口住 Jiique-Be raTest R Chi*2 6S4・6S34 0 ■ShafjLHQ-W丄IkTest R W 0. a Ljvmg—Box Tes七 R Q3) 丄3.£6S2S 0.2041832 Ljvng-Box Test R 0(15) 13.62341 0,554260S Ljung-Bcx Test R 23.0398S 0-2S6S402 Ij\mg-3dx Test RAi 3.10SL4S 0.97BS401 1jvng—Box Test 22 S.572635 0・9727858 Ljvng-Box Test RT 0(呻 35.54115 0,017^0442 LtlArchlest R 3*35728 Qt592^523 匚=1「密=1口二3「乩七1巴「丄匚m; AIC5IG5工匚匚 -4*S72043-岂・£3S5«2.372133S59i45 去掉不显著的参数,得到的模型为: rtat 其中各参数估计的标准误差分别为0.00002,0.0291,0.0459,0.0366, 0.0337,0.0425,0.0231,并且所估计的都是高度显著的,下面三图显示的是标 准化的残差的{at}的时序图和ACF图及残差平方的样本PACFACF图表明标准化残差没有序列相关性,PACF图表明在标准化残差的平方序列的第20阶显著,除此之外都不显著,说明也没有序列相关性。 而且标准化残差的平方LB统计量也 只有Q(20)=38.8,p值为0.017,可以忽略。 那么由上述各种表面GARCH(6,0) 模型可以充分的描述该股票数据收益率的日波动率。 Time ssenesresi ..o 2 ratEd 下图为日对数收益率序列的时序图,两条虚线表示基于咼斯新息的 GARCH(60)模型的95%点预测区间 c(nu)aoid 芒工匕P((teai\£i)哎 (X=s2TpZ1T3I)ffT5nPrGS~=Te31 (7JU)Az^mirs{b£=ar>,Ejri丿q二*(0*9)耳二工卞&十工*)aTjqaie5=x« (qd工©巳孑) fCG*A)4^314=^(uH-“耳阿工盼>3=jdoe (10tinCHi=3王匸斗j^=5&t1・xog ^q)uea^i- ("£T=5hT*3^A)iS^^-XQ0(q)0244%(.AunCit=adAaJ6=^? r*q)ase^'xog (q)工护{匚十[忙』]ep)5dt=Q(I=jap? ax{Jua? ^fcrru)'p€^x=ep器爭臬H-飙半般 : 咨朗 KtipUl pdsodui|J3dns口3le
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 线性 时间 序列 分析 金融 统计 实验 报告
![提示](https://static.bingdoc.com/images/bang_tan.gif)