欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    时间序列ARMA模型.docx

    • 资源ID:9488918       资源大小:3.41MB        全文页数:28页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    时间序列ARMA模型.docx

    1、时间序列ARMA模型第1节 时间序列ARMA模型一、时间序列及其特征识别(一)地理时间序列的分类与构成1.地理系统中的时间序列如果对地理系统进行长期观测,每隔一定的时间作一个记录,则记录结果可以构成时间序列。如果只针对某一个指标进行观测,得到的记录为一元时间序列;如果同时观测多个指标,则可形成多元时间序列。因此,所谓时间序列(time series),实际上就是将某个指标在不同时刻的不同数值,按照时间先后的顺序排列而成的数列。时间序列分析就是利用这组数列,应用数理统计方法加以处理,以预测未来事物的发展。地理系统的演化过程一般包含两种成分,一是确定性成分,二是随机性成分。确定性成分具有一定的物理

    2、意义,它们又包括周期成分和非周期成分,其坐标曲线具有比较明确的规则;随机成分则表现得没有规则,其坐标曲线似乎是任意摆动和振荡的轨迹,这种轨迹很难从物理上进行阐释,只能借助随机过程理论和方法予以分析。随机时间序列通常包括平稳和非平稳两种情况,二者的性质有很大不同。简而言之,时间序列的分类和构成可以图示如下(图4-1-1)。这种分类不是特别严格的,它们之间的界限有时很难区分。例如,有些学者将周期性序列视为广义的平稳序列。图4-1-1 地理时间序列的分类与构成地理系统时间序列的周期性一般与地球的公转、太阳活动和月球绕转有关,因此自然地理的许多现象如江河的水位、生物的发育都具有一定的季节性。与此相关,

    3、许多人文地理现象由于生态环境的季节变化也表现出明确的周期规律,例如风景旅游地的游客人数具有季节性特征。认识自然变化的周期性规律有时是非常重要的,例如,早在80 年代,浙江省气象研究所就有人(田清鉴)研究发现,1887 年、1909 年、1931 年、1954 年、1975 年,我国长江、黄淮海流域都曾发生特大洪水,时间间隔平均约为22 年,与太阳黑子的22 年周期有关,由此可以推断,1997 年前后还会发生特大洪水。结果1998 年中国果然再次洪水泛滥成灾。时间序列分析是定量预测方法之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势。二是考虑到事物发展的随机性。

    4、任何事物发展都可能受偶然因素影响。时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。一个时间序列通常由4种要素组成:长期趋势T、季节变动S、循环波动C和不规则波动I。长期趋势T:是时间序列在长时期内呈现出来的持续向上或持续向下的变动。季节变动S:是时间序列在一年内重复出现的周期性波动。它是诸如气候条件、生产条件、节假日或人们的风俗习惯等各种因素影响的结果。比如春节、圣诞节前百货商店的销售额剧增;五一节、国庆节旅游人数剧增(假日经济)。循环波动C:是时间序列呈现出得非固定长度的周期性变动。循环波动的周期可能会持续一段时间,但与趋势不同,它不是朝着单一方向的持续变动,而是涨落

    5、相同的交替波动。一个重要例子就是所谓的“经济循环”,它由经济繁荣、衰退、萧条、复苏构成。不规则波动I:是时间序列中除去趋势、季节变动和周期波动之后的随机波动。不规则波动通常总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。只含有随机波动的序列也称为平稳序列。比如洪水等自然灾害、战争、SARS等不规则变动,对经济的影响极为重大。尽管一般认为这样的事件只会引起短时间的变化,但是他们也可能导致新的周期或者其他运动。(二)地理时间序列的识别判据识别时间序列的最简单的方法是坐标图直观法:以时间 t 为横坐标,以变量x(t)为纵坐标,画成变动图,便可以看出时间序列的基本特征:周期型,趋势型,

    6、抑或随机型。将表14-1-1 中的数据画成坐标图,便可构成一种关于时间序列的简明图式,不过时间序列较短,难以准确地做出结论。坐标图直观法虽然简单,但判定的结果准确与否依赖经验。因此,要较为准确地进行时间序列的识别,还要借助一定的参数验证。最常用的统计量就是自相关系数以及由此建立的2(卡方)检验。1.自相关系数自相关系数的一种表达式为式中t 为时序, 为时滞(time-lag,或译“时移”、“滞后”、“时间延迟”等),且一般取=1, 2, , n/4,xt 为第t 个变量,变量的均值定义为这里n 为时间序列的长度(即观测点个数)。当n 较大而 较小时,采用近似计算即可。自相关系数随着时滞的增加而

    7、改变,乃是时滞的函数,自相关系数序列称为自相关函数。2.Q 统计量及其修正公式为了利用自相关系数判断时间序列的基本特征,G. E. P. Box 和D.A. Pierce 提出了一种简单的判别公式。假定计算出m 个自相关系数,则定义如下统计量:他们证明Q 近似地服从卡方()分布。Q 越小,表示m 个自相关系数同时为0 的可能性越大;反之越小。Q 的大小需要在一定显著性水平上进行确定其临界值。后来Ljung和Box 对上式进行修正,结果为这就是所谓Box-Ljung 统计量,上式仍然近似服从卡方分布,检验的原理与方法基本不变,但效果更好。Q 统计量的等价检测判据是自相关系数的P 值(或者叫做si

    8、g.值),因为P 值是基于渐近卡方近似。(二)地理时间序列特征的识别时间序列的识别内容主要包括随机性的识别、平稳性的识别、周期性的识别和趋势性的识别。1 .随机性的识别将一个的时间序列 x0、x1、xt-1、xt 视为一组信号,当前信号xt 与在此之前的所有信号之间的完全独立。换言之,在已知x0、x1、xt-1的条件下,xt依然不可预测。这时,我们就说时间序列具有随机性。随机性的要点包括三个方面:均值为零,方差为常数,序列不存在自相关(自协方差为零)。现实中的随机序列均值为常数,可以视为标准的零均值随机序列平移的结果。这类序列中心化之后,均值便为零。随机性检验的一个定量判据就是自相关系数,方法

    9、与“回归分析”一章中的相关系数检验相似。一般认为,当取显著性水平为=0.05 时,如果自相关系数满足:则有95%的把握断定所有的自相关系数与0 没有显著性差异,从而该时间序列具有随机性。需要指出的是,1.96 这个数值来自正态分布,是一个统计学常数,一般近似为2。样本路径长度的平方根为序列的标准误差。因此,1.96 / n 给出了二倍的标准误差线。过去,这个二倍的标准误差既用来检测自相关系数,也用于检测偏自相关系数。近些年来的一个趋势是主要用于检测偏自相关系数,自相关系数采用更为复杂的修正公式。有些软件如SPSS 在计算自相关函数时,会给出各个自相关系数的P 值(sig.值)。P 值基于渐近卡

    10、方近似,与Q 统计量的检验相辅相成:如果一个序列是随机的,则其自相关系数的P 值大于0.05,典型情况大于0.5。反之,如果一个序列不是随机的,则其自相关系数序列的P 值小于0.05,典型情况小于0.01。概括起来,当一个时间序列的所有自相关系数满足如下条件,就可认为它在某个显著性水平上是随机的: 自相关系数满足 ; 统计量Q 满足 (显著性水平取0.05)。 P 值(sig.值)大于0.05,典型的情况大于0.01。2.平稳性的识别时间序列的平稳性是指产生该时间序列的随机过程大体上以恒定的平均水平在整个时间序列内均衡发展,即数据是无趋势的、大致水平的,且在平均水平上起伏的概率也是在各个时间点

    11、上都相同。换言之,一个严格的时间平稳序列的均值为常数,方差为有限,不同观测之间的协方差仅依赖于观测值之间的时间滞后阶数。当一个时间序列的所有自相关系数满足如下条件,就可认为时间序列在某个显著性水平上是平稳的: 只有前面有限阶数的自相关系数绝对值大于二倍标准误差,后面的绝大多数自相关系数满足 ; 统计量Q满足 (显著性水平取0.05)。 P值(sig.值)小于0.05,典型的情况小于0.01。3.周期性的识别周期变动序列常被视为广义的平稳序列的一类。因为远距离看来,周期序列的变化曲线可视化为一条水平线。周期序列的统计特性是:均值和方差为常数,自相关系数周期变动。时间序列的周期性分为单向周期和双向

    12、周期两种情况。所谓单向周期,指的是只有峰值或谷值的情况。如果一个时间序列周期性地出现某种脉动或者脉冲,就属于单向周期序列。不论属于那种情况,周期序列的自相关系数序列具有如下特征: 自相关系数周期性地突破二倍标准误差线; Q统计量大于相应的卡方统计量的临界值(显著性水平取0.05); P值(sig.值)小于0.05,典型的情况小于0.01。4.趋势性的识别趋势序列的统计特性非常明显:均值和方差都随着计算的时间起点不同而改变,自相关系数单边衰减或者阻尼振动式衰减。如果计算的一系列自相关系数中,有相当多个 ,即与0 有显著性差异,则可认为时间序列存在趋势性。具有趋势性的时间序列基本特征概括如下: 排

    13、列靠前的多个自相关系数突破二倍标准误差线,典型的趋势序列的自相关系数在有效时滞范围内都超过二倍的标准误差线; Q 统计量大于相应的卡方统计量的临界值(显著性水平取0.05); P值(sig.值)小于0.05,典型的情况小于0.01。5.上述四种特性的对比在时间序列的四种基本属性中,随机性是最为基本的特性。现实中的观测数据或多或少具有随机性。一个复杂的序列通常是包括随机性在内的多种属性的序列“组合”而成的结果。在系统总结各种序列属性检测标准之前,首先澄清两个基本概念:随机性和随机序列。一个满足随机性统计判据(零均值、常方差、序列无关)的序列一定是随机序列,但随机序列未必满足随机性的检测判据。原因

    14、在于,一个隐含着随机性的序列,譬如,平稳序列,也叫做随机序列,但它们不满足随机性的三个统计判据。典型的实例是移动平均过程。基于一个典型的随机过程满足随机性判据的白噪声序列可以生成一个平稳的移动平均过程,但移动平均序列不满足随机性的三个统计判据,而是满足平稳性的统计判据。随机序列的属性检测判据在于两个方面:一是自相关系数绝对值与二倍的标准误差,二是修正后的Q 统计量即Box-Ljung 统计量与卡方临界值的关系。第二个检测标准在理论上与P 值是否大于或者小于某个显著性水平等价。但在现实中,由于序列结果的复杂性,我们需要结合Q 统计量和P 值共同判断。将时间序列特性的检测标准概括起来(见表4-1-

    15、1),可以看到,Q统计量检测效果与P 值的检测效果一致:在一定的显著性水平下,Box-Ljung 统计量是否小于卡方临界值与P 值是否大于某个显著性水平是一个问题的两个方面。但是,自相关系数与标准误差的关系却各有不同的检测标准。表4-1-1 随机性、平稳性、周期性和趋势性判据的对比序列属性统计性质自相关系数Q统计量Box-L.jung统计量P值典型例证随机性零均值、常方差、序列无关小于2倍标准误差小于卡方临界值大于0.05自噪声平稳性均值为常数、方差有限,自相关系数仅与时滞有关除了前面几个数值,大多小于2倍标准误差大于卡方临界值小于0.05MA过程周期性均值、方差、自相关系数周期变动周期性突破

    16、二倍标准误差线大于卡方临界值小于0.05正弦波动序列趋势性均值、方差随时变动,自相关系数逐渐衰减多数大于2倍标准误差大于卡方临界值小于0.05指数增长序列说明:为了与二倍的标准误差对应,检测标准一律取=0.05的显著性水平。二、ARMA模型对于预测分析而言,模型是否真实并不重要,重要的是对复杂现实的近似效果。一个时间序列模型建设和预测是否成功,关键在于是否能够简约而又准确地近似Wold 表示。目前存在三种近似表达:其一是移动平均(Moving Average, MA),其二是自回归(Auto-Regression, AR),其三是自回归移动平均(Auto-Regressive Moving A

    17、verage,ARMA)。自回归、移动平均等概念最初由前苏联统计学家E. Slutsky 和英国统计学家G.U.Yule 提出。G.E.P. Box 和G.W. Jenkins 在此基础上发展了一套完善的建模和预测规范。因此,移动平均自回归模型通常也被称为Box-Jenkins 模型。MA、AR 和ARMA 三种模型形式各异,但本质上都是对Wold 表示的一种近似。尽管如此,不同的模型功能各异,效果有所差别。有时候,尤其是在假设模型为真的前提下描述总体特性时,常常将这些模型视为一种“过程”,亦即随机过程(stochastic process)的简称。因此之故,一些文献中常常出现移动平均过程、自

    18、回归过程、自回归移动平均过程等概念。(一)协方差平稳和自相关检验1.自协方差平稳条件时间序列的观测值通常是按照时间的顺序从前到后排列,构成一个有序的集合。一个时间序列的实际值通常被称为一个实现(realization)。在理论上,时间序列的实现是无穷长度的:从无限远的过去一直延伸到无穷远的将来。实现的意义似乎非常抽象,实用价值也比较有限,但在理论推导与变换中却非常有用。在功率谱分析的理论基础中,实现的意义十分明确。正如样本(sample)是总体(population)的子集,现实中的观测值通常是实现的有限子集。这个子集被称为样本路径(sample path),其中下标表示时序t=1, 2, ,

    19、 T。这里T 为样本路径的长度(也可以用n 表示)。时间序列分析的重要目的是预测分析。对于任何一个时间序列,从微观上,我们非常关心样本路径的基本概率结构。只有一个序列的均值和协方差结构在时间上保持稳定,我们才可以借助过去的信息预测未来。如果控制未来的信息不同于过去,预测模型就没有实际效果。因此,为了正确地建立时间序列模型,必须讨论时间序列的协方差平稳性质。从图像上看,时间序列的数据点通常用折线相连,通过折线的变化特征可以识别时间序列的发展趋势。如果生成时间序列的随机过程不随时间的变化而变化,则折线就变成了一条水平直线。现实中几乎没有什么事物沿着水平直线向前演进,但有一类系统的时间序列近似围绕水

    20、平趋势线上限波动,远距离看来(或者粗视化之后)就像一条水平直线。对于这一类的时间序列,反映的就是所谓随机系统的平稳过程。如前所述,平稳性的本质是时间序列的概率结构保持不变。对于一个样本路径,记P(x1, ,xk)为k 元随机向量(x1, ,xk)的概率分布函数。假如对于任意的t、k、m,下式成立就称时间序列是平稳的,等式的含义就是概率结构不变。这样理解似乎有些抽象。现在我们具体描述协方差平稳序列的数学特征。所谓协方差平稳性质(covariance stationary),理论上有如下要求:第一,序列的均值在时间上稳定。假定在某个时刻t,一个序列的均值记为式中E=为均值算子。只要该序列满足协方差

    21、平稳性要求的均值稳定条件,则对于任意的t 值,应有这意味着,对于均值稳定序列,均值与参照时间无关。第二,序列的协方差在时间上稳定。为了说明这个问题,需要引入自协方差函数的概念。假定一个序列,取时间间隔即时滞为,则xt 与xt- 的自协方差函数(autocovariance function)的定义如下:也就是说,自协方差函数与时间t 和时滞 有一定关系。但是,假如时间序列的协方差平稳,则 仅仅取决于时滞,而与时间t 没有关系,亦即自协方差函数可以反映协方差平稳序列的周期变化。时间序列的周期识别,本质上就是自协方差分析。自协方差函数具有对称性,也就是说,对于0,我们有对称性表明协方差平稳序列的自

    22、协方差函数仅仅与时滞长度有关,而与时间延迟的方向无关(前向移动与后向移动的效果一样)。顺便指出,当=0,自协方差就是时间序列的方差。第三,序列方差有限。换言之,就是时滞为0 时的自协方差为(0)。根据对称性可以证明如果(0)0)。随机冲击作用的时间间隔越大,累积效应越强,引起时间序列失稳的可能性也就是越大。为了刻画时间序列过去与未来的影响,我们引入自相关函数概念。自相关系数(Auto correlation Coefficient, ACC)由相关系数公式推广而来。其公式可以表示为相关系数的分子为x 与y 的协方差,分母是x 和y 各自的标准差。可以认为,所谓相关系数,其实就是基于“标准化”的

    23、协方差,其数值介于-1 到1 之间,消除了量纲的影响,便于比较。相关系数可以推广到自相关系数,自相关系数随时滞的变化形成自相关函数(autocorrelation function, ACF)。这里涉及两个要领:其一,根据协方差平稳条件的假设,任意时刻的方差不变,即有其二,任何序列都与自身完全相关,即有因此,计算(0)=1 没有实际意义,自相关系数都从0 时起算。自相关函数有各种类型,包括单边衰减式,阻尼振荡式。下面是H.A. Wolfer 记录的17701869 百年太阳黑子数据(Wolfers sunspot series)自相关函数图,具有明显的阻尼振荡衰减特征。图4-1-2 Wolfe

    24、r 太阳黑子阻尼振荡式自相关函数和偏自相关柱形图(17701869)偏自相关函数在分析中可以与自相关函数相辅相成。偏自相关函数( partial autocorrelation function, PACF)是偏自相关系数随时滞变化的函数。所谓偏自相关系数(partial autocorrelation coefficient, PACC),时间就是利用xt-1、xt-2、xt- 与xt 进行总体线性回归时的回归系数。也就是说,如果我们建立自回归方程:式中的p 是偏自相关系数,它所对应的函数p()便是偏自相关函数。顺便说明一下总体回归(population regression)概念:当处理的

    25、样本中包含的数据为无穷多个的时候,回归估计参数将不受抽样变动的影响,此时估计的参数为总体参数。自相关函数与偏自相关函数存在一定的数理联系,两种系数测度可以借助Yule-Walker方程相互表达。尽管如此,自相关函数系数与偏自相关系数又有不同。自相关系数是xt 和xt-的简单、常规相关测度,而偏自相关系数则是在控制xt-1、xt-1 之后xt 和xt-的联系程度。二者的区别类似于多元线性回归中简单相关系数与偏相关系数的区别。偏自相关函数也可以作图表示,其柱形图可以与自相关函数的柱形图相互参照,互补分析。(二)移动平均与自回归模型1.AR模型AR模型也称为自回归模型。它的预测方式是通过过去的观测值

    26、和现在的干扰值的线性组合预测, 自回归模型的数学公式为:式中: 为自回归模型的阶数(i=1,2, ,p)为模型的待定系数,为误差, 为一个平稳时间序列。图4-1-3显示,山东省人口变化的自相关分析表明,有相当多个自相关系数与0有显著性差别,这正是趋势性的特征之一。另一方面,在一次滞后处偏自相关函数明显截尾,这又是典型的自回归过程的标志之一。图4-1-3 山东省1949-2012年人口增长的相关函数柱状图2MA模型MA模型也称为滑动平均模型。它的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为:式中: 为模型的阶数; (j=1,2,q)为模型的待定系数;为误差;

    27、为平稳时间序列。山东省1916-2012年降水量自相关函数柱状图3.ARMA模型自回归模型和滑动平均模型的组合, 便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA, 数学公式为:确定ARMA模型的阶数可以使用残差方差图定阶法、F检验定阶法、最佳准则函数定阶法。(三)ARMA模型建模步骤1求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。2根据样本自相关系数和偏自相关系数的性质,选择阶数适当的ARMA(p,q)模型进行拟合。(1)在k=q后自相关函数k 截尾,而偏自相关函数kk拖尾 = MA(q)(2)在k=p后偏自相关函数kk 截尾,而自相关函数k拖尾= A

    28、R(p)(3)若自相关函数、偏自相关函数都拖尾= ARMA(p,q) p=?,q=?进一步试验。表4-1-2 三类模型的形式、特性及自相关和偏自相关函数的特征AR(P)MA(q)ARMA(p,q)模型方程平稳性条件无可逆性条件无自相关函数拖尾Q步截尾拖尾偏自相关函数P步截尾拖尾拖尾3估计模型中未知参数的值。4检验模型的有效性。如果拟合模型通不过检验;转向步骤(2),重新选择模型再拟合。(1)成功拟合后残差序列应为白噪声。(2)检验所建立模型是否能满足平稳性和可逆性,即要求方程: ( )=1- j=1p j j=0 和 ( )=1- j=1q j j=0的根 1。(3)通过AIC等信息准则选择较

    29、优的ARMA(p,q) (AIC等统计值较小)。5模型优化。如果拟合模型通过检验,仍然转向步骤(2),充分考虑各种可能,建立多个拟合模型,从所有通过检验的拟合模型中选择最优模型。6利用拟合模型,预测序列的将来走势。三、实例:1978-2012年山东省经济增长ARMA模型从2013年山东省统计年鉴中获取按照可比价格计算的山东省GDP,进而计算得到1979-2012年GDP每年增长率。以此为原始数据,建立山东省经济增长ARMA模型,并预测2013年和2014年经济增长率。(一)模型识别1数据录入打开Eviews软件,选择“File”菜单中的“New-Workfile”选项,在“Workfile structure type”栏选择“Unstructured /Undated”,在“Date Specification”栏中输入“Start date1978”和“End date2013”,点击ok,见图4-1-4,这样就建立了一个工作文件。图4-1-4 建立工作文件窗口2绘制序列时序图双击序列production,点击view/Graph/line,则出现图4-1-5的序列时序图,时序图看出数据是平稳的,这个判断比较粗糙,需要用统计方法进一步验证。图4-1-5 山东省GDP增长率序列图3绘制序列相关图双击序列production,点击view/Correlogram,


    注意事项

    本文(时间序列ARMA模型.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开