时间序列分析第三章平稳时间序列分析.docx
- 文档编号:15622618
- 上传时间:2023-07-06
- 格式:DOCX
- 页数:20
- 大小:509.09KB
时间序列分析第三章平稳时间序列分析.docx
《时间序列分析第三章平稳时间序列分析.docx》由会员分享,可在线阅读,更多相关《时间序列分析第三章平稳时间序列分析.docx(20页珍藏版)》请在冰点文库上搜索。
时间序列分析第三章平稳时间序列分析
应用时间序列分析实验报告
实验名称第三章平稳时间序列分析
一、上机练习
dataexample3_1;
inputx;
time=_n_;
cards;
0.30-0.450.0360.000.170.452.15
4.423.482.991.742.400.110.96
0.21-0.10-1.27-1.45-1.19-1.47-1.34
-1.02-0.270.14-0.070.10-0.15-0.36
-0.50-1.93-1.49-2.35-2.28-0.39-0.52
-2.24-3.46-3.97-4.60-3.09-2.19-1.21
0.780.882.071.441.500.29-0.36
-0.97-0.30-0.280.800.911.951.77
1.800.56-0.110.10-0.56-1.34-2.47
0.07-0.69-1.960.041.590.200.39
1.06-0.39-0.162.071.351.461.50
0.94-0.08-0.66-0.21-0.77-0.520.05
;
procgplotdata=example3_1;
plotx*time=1;
symbolc=redi=joinv=star;
run;
建立该数据集,绘制该序列时序图得:
根据所得图像,对序列进行平稳性检验。
时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的X围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
从图上可以看出,数值围绕在0附近随机波动,没有明显或周期,其本可以视为平稳序列,时序图显示该序列波动平稳。
procarimadata=example3_1;
identifyvar=xnlag=8;
run;
图一
图二样本自相关图
图三样本逆自相关图
图四样本偏自相关图
图五纯随机检验图
实验结果分析:
(1)由图一我们可以知道序列样本的序列均值为-0.06595,标准差为1.561613,观察值个数为84个。
(2)根据图二序列样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟3阶之后,自相关系数都落入2倍标准差X围以内,而且自相关系数向0.03衰减的速度非常快,延迟5阶之后自相关系数即在0.03值附近波动。
这是一个短期相关的样本自相关图。
所以根据样本自相关图的相关性质,可以认为该序列平稳。
(3)根据图五的检验结果我们知道,在各阶延迟下LB检验统计量的P值都非常小(<0.0001),所以我们可以以很大的把握(置信水平>99.999%)断定该序列样本属于非白噪声序列。
procarimadata=example3_1;
identifyvar=xnlag=8minicp=(0:
5)q=(0:
5);
run;
IDENTIFY命令输出的最小信息量结果
某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:
A:
求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
B:
根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
C:
估计模型中未知参数的值。
D:
检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
E:
模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
F:
利用拟合模型,预测序列的将来走势。
为了尽量避免因个人经验不足导致的模型识别问题,SAS系统还提供了相对最优模型识别。
最后一条信息显示,在自相关延迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMR(p,q)模型中,BIC信息量相对最小的是ARMR(0,4)模型,即MA(4)模型。
需要注意的是,MINIC只给出一定X围内SBC最小的模型定阶结果,但该模型的参数未必都能通过参数检验,即经常会出现MINIC给出的模型阶数依然偏高的情况。
estimateq=4;
run;
本例参数估计输出结果显示均值MU不显著(t的检验统计量的P值为0.9968),其他参数均显著(t检验统计量的P值均小于0.00001),所以选择NOINT选项,除去常数项,再次估计未知参数的结果,即可输入第二条ESTIMATE命令:
estimateq=4noint;
run;
参数估计部分输出结果如图六所示:
图六ESTIMATE命令消除常数项之后的输出结果
显然四个未知参数均显著。
拟合统计量的值
这部分输出五个统计量的值,由上到下分别是方差估计值、标准差估计值、AIC信息量、SBC信息量及残差个数,如图七所示:
图七ESTIMATE命令输出的拟合统计量的值
系数相关阵
这部分输出各参数估计值的相关阵,如图八所示:
图八ESTIMATE命令输出的系数相关阵
残差自相关检验结果
这部分的输出格式(图九)和序列自相关系数白噪声检验部分的输出结果一样。
本例中由于延迟各阶的LB统计量的P值均显著大于a(a=0.05),所以该拟合模型显著成立。
图九ESTIMATE命令输出的残差自相关检验结果
拟合模型的具体形式
ESTIMATE命令输出的拟合模型的形式
序列预测
forecastlead=5id=timeout=results;
run;
其中,lead是指定预测期数;id是指定时间变量标识;out是指定预测后的结果存入某个数据集。
该命令运行后输出结果如下:
FORECAST命令输出的预测结果
该输出结果从左到右分别为序列值的序号、预测值、预测值的标准差、95%的置信下限、95%的置信上限。
利用存储在临时数据集RESULTS里的数据,我们还可以绘制漂亮的拟合预测图,相关命令如下:
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=start;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
输出图像如下:
拟合效果图
注:
图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限。
所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计。
目前对平稳序列最常用的预测方法是线性最小方差预测。
线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小。
在预测图上可以看到,数据围绕一个X围内波动,即说明未来的数值变化时平稳的。
二、课后习题
第十七题:
根据某城市过去63年中每年降雪量数据(单位:
mm)得:
(书本P94)
程序:
dataexample17_1;
inputx;
time=_n_;
cards;
126.482.478.151.190.976.2104.587.4
110.52569.353.539.863.646.772.9
79.683.680.760.37974.449.654.7
71.849.1103.951.682.483.677.879.3
89.685.558120.7110.565.439.940.1
88.771.48355.989.984.8105.2113.7
124.7114.5115.6102.4101.489.871.570.9
98.355.566.178.4120.597110
;
procgplotdata=example17_1;
plotx*time=1;
symbolc=redi=joinv=star;
run;
procarimadata=example17_1;
identifyvar=xnlag=15minicp=(0:
5)q=(0:
5);
run;
estimatep=1;
run;
estimatep=1noin;
run;
forecastlead=5id=timeout=results;
run;
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=start;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
(1)判断该序列的平稳性与纯随机性
该序列的时序图如下(图a)
图a
由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图b)
图b
时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的X围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差X围以内,
自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差X围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。
纯随机性检验见下图:
(图c)
图c
根据图c的检验结果我们知道,在6阶延迟下LB检验统计量的P值显著小于0.05,所以我们可以以很大的把握(置信水平>95%)断定这个拟合模型的残差序列属于非白噪声序列。
(2)如果序列平稳且非白躁声,选择适当模型拟合该序列的发展。
模型识别如下图(图d)
图d
假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:
1:
求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
2:
根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
3:
估计模型中未知参数的值。
4:
检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
5:
模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
6:
利用拟合模型,预测序列的将来走势。
最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(1,0)模型,既AR
(1)模型。
它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质。
自相关系数是按负指数单调收敛到零;
利用拟合模型,预测该城市未来5年的降雪量.
由
(2)可以知道该模型是AR
(1)模型;
预测结果如下图(图e)
由图得未来5(64-68年)的降雪量分别为103.6820mm、97.7270mm、92.1139mm、86.8232mm、81.8365mm。
18.某地区连续74年的谷物产量(单位:
千吨)
dataexample18_1;
inputx;
time=_n_;
cards;
0.970.451.611.261.371.431.321.230.840.891.18
1.331.210.980.910.611.230.971.100.740.800.81
0.800.600.590.630.870.360.810.910.770.960.93
0.950.650.980.700.861.320.880.680.781.250.79
1.190.690.920.860.860.850.900.540.321.401.14
0.690.910.680.570.940.350.390.450.990.840.62
0.850.730.660.760.630.320.170.46
;
procgplotdata=example18_1;
plotx*time=1;
symbolc=redi=joinv=star;
run;
procarimadata=example18_1;
identifyvar=xnlag=18minicp=(0:
5)q=(0:
5);
run;
estimateq=1;
run;
forecastlead=5id=timeout=results;
run;
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=start;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
(1)判断该序列的平稳性与纯随机性
该序列的时序图如下(图f)
图f
时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的X围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
由时序图显示过去74年中每年谷物产量数据围绕早0.8千吨附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图g)
图g
样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差X围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差X围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。
纯随机性检验见下图:
(图h)
图h
根据图h的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于0.05,所以我们可以以很大的把握(置信水平>95%)断定这个拟合模型的残差序列属于非白噪声序列。
选择适当模型拟合该序列的发展。
如果序列平稳且非白躁声,选折适当模型拟合序列的发展
模型识别如下图(图i)
图i
假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:
A:
求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
B:
根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
C:
估计模型中未知参数的值。
D:
检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
E:
模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
F:
利用拟合模型,预测序列的将来走势。
最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(1,0)模型,既AR
(1)模型。
它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质。
自相关系数是按负指数单调收敛到零;
利用拟合模型,预测该地区未来5年的谷物产量,预测结果如下图(图j)
由
(2)可知,该模型为AR
(1)模型;
图j
未来5年的谷物产量一次为0.7849,0.8518,0.8518,0.8518。
19.现有201个连续的生产记录
dataexample19_1;
inputx;
time=_n_;
cards;
81.989.479.081.484.885.988.080.382.6
83.580.285.287.283.584.382.984.782.9
81.583.487.781.879.685.877.989.785.4
86.380.783.890.584.582.486.783.081.8
89.379.382.788.079.687.883.679.583.3
88.486.684.679.986.084.283.084.883.6
81.885.988.283.587.283.787.383.090.5
80.783.186.590.077.584.784.687.280.5
86.182.685.484.782.881.983.686.884.0
84.282.883.082.084.784.488.982.483.0
85.082.281.686.285.482.181.485.085.8
84.283.586.585.080.485.786.786.782.3
86.482.582.079.586.780.591.781.683.9
85.684.878.489.985.086.283.085.484.4
84.586.285.683.285.783.580.182.288.6
82.085.085.285.384.382.389.784.883.1
80.687.486.883.586.284.182.384.886.6
83.578.188.881.983.380.087.283.386.6
79.584.182.290.886.579.781.087.281.6
84.484.482.288.980.985.187.184.076.5
82.785.183.390.481.080.379.889.083.7
80.987.381.185.686.680.086.683.383.1
82.386.780.2
;
procgplotdata=example19_1;
plotx*time=1;
symbolc=redi=joinv=star;
run;
procarimadata=example19_1;
identifyvar=xnlag=24minicp=(0:
5)q=(0:
5);
run;
estimateq=1;
run;
forecastlead=5id=timeout=results;
run;
procgplotdata=results;
plotx*time=1forecast*time=2l95*time=3u95*time=3/overlay;
symbol1c=blacki=nonev=start;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=nonel=32;
run;
(1)判断该序列的平稳性与纯随机性
该序列的时序图如下(图k)
图k
由时序图显示过去201个连续的生产记录数据围绕早84附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图l)
图l
时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的X围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟1阶之后,自相关系数都落入2倍标准差X围以内,
自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差X围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。
纯随机性检验见下图:
(图m)
根据图m的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于0.05,所以我们可以以很大的把握(置信水平>95%)断定这个拟合模型的残差序列属于非白噪声序列。
(2)如果序列平稳且非白躁声,选折适当模型拟合序列的发展
模型识别如下图(图n)
某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:
1、求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
2、根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
3、估计模型中未知参数的值。
4、检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
5、模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
6、利用拟合模型,预测序列的将来走势。
最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(0,1)模型,即MA
(1)模型。
利用拟合模型,预测该城市下一时刻95%的置信区间。
由
(2)可得,该模型为MA
(1)模型;
下一时刻95%的置信区间[78.2859,89.9738]。
实验小结:
给定一个序列,我们首先应该判断平稳性,如果平稳,再检查是否是纯随机序列,如果序列平稳且非白躁声,选折适当模型拟合序列的发展,选择AR,MA,或ARMA模型,然后可以对该序列进行预测。
三、实验体会
通过本次实验使我掌握了一些对时间序列的处理,运用不同的语句对一个样本序列的平稳性检验和随机性检验,这对我们处理数据有很大的帮助。
在生活中我们往往会遇到这样的现象,当我们所得到的样本信息太少,并且没有其他的辅助信息时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间 序列 分析 第三 平稳