换一换

冰点文库 > 资源分类 > DOCX文档下载

预览

第五章时间序列的模型识别汇总.docx

资源ID：10309282 资源大小：98.42KB 全文页数：25页
资源格式： DOCX 下载积分：3金币

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要3金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

第五章时间序列的模型识别汇总.docx

1、第五章时间序列的模型识别汇总第五章时间序列的模型识别前面四章我们讨论了时间序列的平稳性问题、可逆性问题，关于线性平稳时间序列模型, 引入了自相关系数和偏自相关系数，由此得到ARMA（/;. q）统计特性。从本章开始，我们将运用数据开始进行时间序列的建模工作，其工作流程如下：图5.1建立时间序列模型流程图在ARMASM）的建模过程中，对于阶数少旳）的确定，是建模中比较重要的步骤，也是比较困难的。需要说明的是，模型的识别和估计过程必然会交叉，所以，我们可以先估计一个比我们希望找到的阶数更高的模型，然后决定哪些方面町能被简化。在这里我们使用估计过程去完成一部分模型识别，但是这样得到的模型识

2、别必然是不精确的，而且在模型识别阶段对于有关问题没有精确的公式可以利用，初步识别可以我们提供有关模型类型的试探性的考虑。对于线性平稳时间序列模型来说，模型的识别问题就是确定ARMA9，q）过程的阶数，从而判定模型的具体类别，为我们卞一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数（ACF）和偏自相关系数（PACF）初步判定其阶数，如果利用这种方法无法明确判定模型的类别，就需要借助诸如AIC、BIC等信息准则。我们分别给出几种定阶方法，它们分别是（1）利用时间序列的相关特性，这是识别模型的基本理论依据。如果样本的自相关系数（ACF）在滞后q+/阶时突然截断，

3、即在q处截尾，那么我们可以判定该序列为MA（q）序列。同样的道理，如果样本的偏自相关系数（PACF）在处截尾，那么我们可以判定该序列为AR（）序列。如果ACF和PACF都不截尾，只是按指数衰减为零，则应判定该序列为ARMA（p,q）序列，此时阶次尚需作进一步的判断；（2）利用数理统计方法检验高阶模型新增加的参数是否近似为零，根据模型参数的置信区间是否含零来确定模型阶次，检验模型残差的相关特性等；（3）利用信息准则，确定一个与模型阶数有关的准则函数，既考虑模型对原始观测值的接近程度，又考虑模型中所含待定参数的个数，最终选取使该函数达到最小值的阶数，常用的该类准则有AIC、EIC、F

4、PE等。实际应用中，往往是几种方法交叉使用，然后选择最为合适的阶数（p,q）作为待建模型的阶数。5.1自相关和偏自相关系数法在平稳时间序列分析中，最关键的过程就是利用数据去识别和建模，根据第三章讨论的内容，一个比较直观的方法，就是通过观察自相关系数（ACF）和偏自相关系数（PACF）可以对拟合模型有一个初步的识别，这是因为从理论上说，平稳AR、MA和ARMA模型的 ACF和PACF有如下特性：模型（序列）AR(/JMA(q)ARMA(/7,g)自相关系数（ACF）拖尾q阶截尾拖尾偏自相关系数（PACF）P阶截尾拖尾拖尾但是，在实际中ACF和PACF是未知的，对于给定的时间序列观测值召,兀

5、2，.,為.，我们需要使用样本的自相关系数久和偏自相关系数无对其进行估计。然而由于久和几均是随机变量，对于相应的模型不可能具有严格的截尾性，只能呈现出在某步之后围绕零值上、下波动，因此，我们需要借助Q和&J的“截尾性”来判断久和“如的截尾性，进而由此可以给出模型的初步识别。首先，我们需要给出样本的自相关系数A和偏自相关系数必的定义。设平稳时间序列X,的一个样本，与。则样本自协方差系数定义为1 T-k久行若-元）（-无），皿灯-1 （51lkT-l1 丁其中x = 为样本均值，则样本自协方差系数%是X的自协方差系数齐的估T j=i计。样本自相关系数定义为A=n/n5 k%A1Pk-i

6、A A =APl1p2a .1A PzA-iA-Pk关于样本的自相关系数A的统计性质，我们将在下一章给予讨论。Quenouille证明，亦也满足Bartlett公式，即当样本容量T充分人时,必N(0, 1仔)这样根据正态分布的性质，我们有= 68.3%= 95.5%(5.4)(5.5)(5.6)(5.7)这样，关于偏自相关系数血的截尾性的判断，转化为利用上述性质(5.6)或者(5.7), 可以判断&J的截尾性。具体方法为对于每一个00,考查%十,蚣+2中落入应卜寺或应卜滸的比例是否占总数M的68.3 %或95.5%。一般地，我们取M = 如果p = pQ之前&火都明显地不为零，而当p pQ时,

7、k+lo+l 0o+2,o+2，中满足不等式的个数占总数M的68.3%或95.5%,则可以认定如在几处截尾，由此可以初步判定序列/为AR(几)模型。对于样本的自相关系数A,由第二章的Bartlett公式，对于q0, p,满足(5.8)(5.9)1 qXN 0,- 1 + 2工0；I 7 L 冃丿进一步地，当样本容量T充分人时，Q也满足A N(0,l/T)类似于(5.6)或者(5.7)式，对于每一个q0,检查氏+氏乜，昭中落入中的比例是否占总数M的68.3%或95.5%左右。如果在条之前,A都明显不为零，而当q = q时，必。+2,，蔦。枷中满足上述不等式的个数达到比例，则判断久在处截尾。

8、初步认为序列XJ为MA(q)模型。至此我们可以利用样本的自相关系数A和偏自相关系数入，得到ARMA模型阶数的初步判定方法。具体做法如卜：(1)如果样本自相关系数久在最初的q阶明显的大于2倍标准差范围，即2(1/存)，而后几乎95%的样本自相关系数A都落在2倍标准差范围之内，并且由非零样本自相关系数衰减为在零附近小值波动的过程非常突然，这时通常视为自相关系数截尾，既可以初步判定相应的时间序列为MA( )模型同样，样本偏自相关系数无如果满足上述性质，则可以初步判定相应的时间序列为AR(p)模型。对于样本自相关系数A和样本偏自相关系数矗，如果均有超过5%的值落入2倍标准差范闱之外,或者

9、由非零样本自相关系数和样本偏自相关系数衰减为在零附近小值波动的过程非常缓慢，这时都视为不戴尾的，我们将初步判定时间序列为ARMA模型, 那么这样的判断往往会失效，因为这时ARMAQq)模型的阶数卩和q很难确定。总之，基于样本自相关和偏自相关系数的定阶法只是一种初步定阶方法，可在建模开始时加以粗略地估计。例5.1绿头苍蝇数据的时间序列。具有均衡性别比例数目固定的成年绿头苍蝇保存在一个盒子中，每天给一定数量的食物，每天对绿头苍蝇的总体计数，共得到T=82个观测值。经过平稳性处理后计算其基于样本自相关和偏自相关系数，见表5.1kAPkkA 加10.7310.7320.492-0.0930.303

10、-0.0440.2040.0450.125-0.0360.026-0.127-0.0170.078-0.048-0.059-0.0190.0710-0.0310-0.08表5.1绿头苍蝇的样本ACF和PACF样本门相关系数样本偏门相关系数110图5.2绿头苍蝇的样本ACF和PACF由表51和图52知，样本自相关函数A呈拖尾状，而从10个偏自相关系数的绝对值来看，除亦显著地异于零之外，其余9个中绝对值不人于1 _ 1# _/82= 0.11的有8个,Q- 0.89 68.3% ,故该时间序列初步判定为AR模型。例5.2某时间序列数据（T=273）的样本自相关系数和偏自相关系数计算数据如下:表5.

11、2某时间序列数拯的样木他偏门相关系数样本自相关系数样本偏自相关系数kAPkkAPkkA0球kAOkk10.8290.4610.8290.1920.45100.642-0.68100.0130.047110.633-0.1211-0.014-0.26120.4540.0612-0.035-0.41130.165-0.02130.026-0.3614-0.1160.18140.057-0.1515-0.3070.2015-0.0680.1680.04由上表知，样本自相关函数久呈拖尾状，而从15个偏自相关系数的绝对值来看，除几,氐显著地异于零之外,其余13个中绝对值不人于1 = 1# _/273=0

12、.0605的有9个,Q = 0.6926&3%,故该时间序列初步判定为AR（2）模型。例5.3某车站1993-1997年个月的列车运行数量数据共60个，见表5.3,试对该序列给出初步的模型识别。表5.3某车站1993-1997年个月的列车运行数量数据（单位：T列 T米）k观测值k观测值k观测值k观测值k观测值k观测值11196.8111206.5211238.9311261.6411183.0511306.021181.3121204.0221267.5321274.5421228.0521209.031222.6131234.1231200.9331196.4431274.0531248.0

13、41229.3141146.0241245.5341222.6441218.0541208.051221.5151304.9251249.9351174.7451263.0551231.061148.4161221.9261220.1361212.6461205.0561244.071250.2171244.1271267.4371215.0471210.0571296.081174.4181194.4281182.3381191.0481243.0581221.091234.5191281.5291221.7391179.0491266.0591287.0101209.72012773301

14、178.1401224.0501200.0601191.0图5.3, 5.4分别为原始数据和平稳化以后（第8章将给出具体平稳化方法）数据的散点图。图5.3列车运行数量数据图5.4平稳化列车运行数量数据经过计算，其前20个样本自相关系数和偏自相关系数如下表5.4平稳化列车运行数呈数据样木1%偏白相关系数样本自相关系数样本偏自相关系数kAAkAkA0球kA0球1-0.68511-0.0361-0.68511-0.13020.341120.1562-0.243120.1393-0.19313-0.1653-0.139130.13640.042140.0384-0.20814-0.1845-0.06

15、8150.0015-0.31315-0.12060.19916-0.02760.04616-0.0127-0.221170.1437-0.030170.19680.18518-0.1308-0.037180.0259-0.130190.0049-0.00219-0.143100.037200.02110-0.04220-0.073由上表知，样本自相关函数必呈拖尾状，而从20个自相关系数的绝对值来看，样本自相关系数久在最初的2阶明显的大于2倍标准差范围，即(-0.26, 0.26),而后95%以上的样本自相关系数A都落在(-0.26, 0.26)内，并且由非零样本自相关系数衰减为在零附近小值波

16、动的过程非常突然，这时通常视为自相关系数几截尾，故该时间序列初步判定为MA或MA(3)模型。5.2 F检验法利用F分布进行假设检验是实践中经常使用的统计检验方法，在回归分析中，往往用F 检验来考察两个回归模型是否有显著差异，因此常彼用来判定ARMA模型的阶数。考虑如卜线性回归模型y = ex】+ a2X2 + + + s(5.10)丫 =(儿，儿厂，Xv)T为N个独立的随机观察值，X,=(XxXa、XQT，j = 12为厂个回归因子，G心,J)T为模型残差。设0是模型(5.7)中参数 a = (al,a2, -,ar)T的最小二乘估计，为了检验其中后面$个元素对因变量的影响是否显著，设去掉

17、此s个因素的线性回归模型为y = aX + aX2 + -+axXs + e (5.11)其中模型(5.11)的参数/的最小二乘估计为因此，检验模型(5.10)与(5.11)是否有显著差异等价于检验原假设，即(5.12)= ar=0是否成立。为此，考虑上述两个模型的残差平方和Q。与Q于是有2 =込-讥-/x “arXrl) r=l(5.13)Ql = X(yl-Xll-a2X2l-ar_sXr_J (5.14)/=!借助回归分析中残差平方和的分布结论：Q。o才(N r), 0。与0-00相互独立, 且当原假设H。为真时，0 2，才(0,因此有：(5.15)(5.16)(5.17)0 /_gg_

18、 f,N r)s N _ r据此构造统计量f_QQo $ Qs N -r对于预先给定的显著性水平&,由附录F分布表查出满足P(FFa) = a若FFN- 则拒绝原假设H。，即后面s个因素对因变量的影响是显著的；若 FFa(s,N-r),则接受原假设Ho,即这$个因素对因变量的影响是不显著的，表明模型 (5.11)是合适的。5.2.1 AR(p)模型定阶的F准则1967年，瑞典控制论专家KJ.Astidm教授将F检验准则用于对时间序列模型的定阶。设Xz(ltN)是零均值平稳序列的一段样本。并用模型AR(p)X严肚1 + 0丸7 +0,Xr + (5.18)进行拟合。根据模型阶数节省原则(par

19、simonyprinciple),采取由低阶逐步升高的“过拟合”办法。先对观测数据拟合模型AR(p)(p=l, 2,.),用递推最小二乘估计其参数(1 ；Fa就拒绝假设Ho,即AR(p-l)是不适合模型；若F代，这表明F检验显著，表明AR(1)模型是不适用的，应改用AR(2)模型。计算得 F=3.86/,这表明F检验不显著，因此AR(2)模型是适用的。5.2.2 ARMA(p, q )模型定阶的F准则仿照AR(p)模型定阶F检验准则，可以将F检验应用于ARMA(p, q)模型的定阶。采用过拟合方法，首先对观测数据用ARMA(p, q)模型进行拟台，再假定,-高阶系数中某些取值为零，用F检

20、验准则来判定阶数降低之后的模型与ARNIA(p, q)模型之间是否存在显著性差异。如果差异显著，则说明模型阶数仍存在着升高的可能性；若差异不显著，则说明模型阶数可以降低，低阶模型与高阶模型之间的差异用残差平方和来衡量。假定原假设为H。：蚣=0,0 = 0,记Q。为ARMA(p.q)模型的残差平方和，Qi为ARMA(p-l, qJ)模型的残差平方和，则可以计算统计量Qi -QoF(2,N- p-q)(5.22)对照式(5.16)这里n=p+q是模型阶数的总数，s=2是被检验阶散的差数。如果FF, 则Ho不成立，模型阶数仍有上升的可能；否则Ho成立，即ARNIA(p-l, ql)是合适的模型。

21、5.3信息准则法5.3.1 FPE准则法前面两节中模型的定阶都采用统计检验手段，在给定显著性水平Q卞作假设检验，带有一定的人为性和主观性。而FPE、AIC和BIC准则都避免上述的缺陷。1969年，口本统计学家赤池(Akaike)提出了一种识别AR模型阶数的最终预报误差准则(Fuual Prediction Enor),简称FPE准则。其基本思想是用模型一步预报误差的方差来判定自回归模型的阶数是否适用，一步预报误差的方差愈小，就认为模型拟合愈好。设随机序列X,所适合的真实模型为AR(p),即X?=叽X + 0X/7 + + 0,Xf_p + 其中(,) = 0, = 设的估计值为(lZpX

22、t_p (5.23)可以证明一步预报误差的方差为EX,+1-X,(1)2-(1 + 2 (5.24)n可以证明，当样本总量11充分大时有Ecr2 (1-)cr2 (5.25)n上式表明F/(l-上)是b1的无偏估计。在式(5.21)中用无偏估计来代替亍便可得到 nX屮一兄(1)F 2(1 +上)(1 一上)T& (5.26)n n因而将FPE准则定义为(5.27)FPEp =(J2其中可以看出，系数U随着的增人而增人，而当阶数由低阶至高阶增加时，AR(p) n_ p模型残差方差(T2开始是随着p的增大而减小，但当p超过序列X,的真正模型阶数p.之后，歹2就不会再减少了，这时仝厘将起主导作用。最

23、终，使FPE-取最小值的那个卩就 /?- P可以判定为模型的最佳阶数。根据经验，当样本点数n=100200时取预先设定的样本上限 =；当n=50100 1112呵，収L= 一一。3 2如果Ep的数值从p=i就开始上升，则可以判定模型阶数p=l。若FPEp的值随p增加而一直下降，则很可能是由于实际数据序列不宜采用AR序列来描述。如果在某一 p的 FPE】,值下降很快，以后又有缓慢地下降，则可以将这个p值作为模型的阶。如果随p的增加FPE,的值上、卞剧烈跳动，取不出最小值，这很可能是由于样本数据长度n太小引起的, 可增人样本长度后再进行定阶。例55 根据某实测数据序列拟合的AR(p)(p=l,2,.,10)模型的或和FPEp结果如卞表所示：表5.4 拟合各阶AR(p)模型的和P&2FPEp01.72031.720310.50970.520220.47900.498930.47280.502740.47080.510950.47050.521160.47050.531870.46790.539980.46640.549390.46640.5607100.44530.5465由表中可以看出，或随着的增加持续下降，但是FPEp在=2时取得最小值，这提示着模型取为AR(2)较合适。5.3.2 AI

注意事项

本文（第五章时间序列的模型识别汇总.docx）为本站会员主动上传，冰点文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知冰点文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。