时间序列分析及SPSS操作.ppt
- 文档编号:18068462
- 上传时间:2023-08-07
- 格式:PPT
- 页数:90
- 大小:1.24MB
时间序列分析及SPSS操作.ppt
《时间序列分析及SPSS操作.ppt》由会员分享,可在线阅读,更多相关《时间序列分析及SPSS操作.ppt(90页珍藏版)》请在冰点文库上搜索。
时间序列分析及其SPSS操作,教师:
韩艳敏电话:
13676798448(668448),一、时间序列分析概述,时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列。
分析时间序列的方法构成数据分析的一个重要领域,即时间序列分析.,时间序列根据所研究的依据不同,可有不同的分类1按研究对象多少分:
一元时间序列和多元时间序列;2按时间连续性分:
离散时间序列和连续时间序列;,3按序列的统计特性分:
平稳时间序列和非平稳时间序列;4按时间序列分布规律分:
高斯型和非高斯型时间序列.,时间序列,时间序列分析发展的两个阶段,主要内容:
平稳时间序列分析Box-Jenkins(1976)非平稳时间序列分析Engle-Granger(1987)时间序列模型不同于经济计量模型的两个特点是:
-这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。
-明确考虑时间序列的平稳性。
如果时间序列非平稳,建立模型之前应先通过差分或者协整把它变换成平稳的时间序列,再考虑建模问题。
2,如果一个时间序列的概率分布与时间t无关,则称该序列为严格的(狭义的)平稳时间序列。
如果序列的一、二阶矩存在,且对任意时刻t满足:
(1)均值为常数
(2)方差为常数(3)协方差为时间间隔k的函数,则称该序列为宽平稳时间序列,也叫广义平稳时间序列。
以后所研究的时间序列主要是宽平稳时间序列.,平稳时间序列,平稳过程例1i.i.d序列,一个最简单的随机时间序列是独立同分布标准正态分布序列:
平稳过程例2自回归过程,AR
(1),3,1确定性时间序列分析方法概述,时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化趋势的。
一个时间序列往往是以下几类变化形式的叠加或耦合。
(1)长期趋势变动。
是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势。
(2)季节变动。
(3)循环变动。
通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相似的波动。
(4)不规则变动。
通常它分为突然变动和随机变动。
时间序列数据的分解,通常用Tt表示长期趋势项,St表示季节变动趋势项,Ct表示循环变动趋势项,Rt表示随机干扰项。
常见的确定性时间序列模型有以下几种类型:
加法模型乘法模型混合模型,yt=Tt+St+Ct+Rtyt=TtStCtRtyt=TtSt+Rt,yt=St+TtCtRt,t,其中yt是观测目标的观测记录,E(Rt)=0,E(R2)=2如果在预测时间范围以内,无突然变动且随机变动的方差2较小,并且有理由认为过去和现在的演变趋势将继续发展到未来时,可用一些经验方法进行预测,具体方法如下:
4,5,设观测序列为y1,yT,取移动平均的项数NT一次移动平均值计算公式,1.移动平均法,6,当预测目标的基本趋势是在某一水平上下波动时,可用一次移动平均方法建立预测模型:
二次移动平均,其预测标准误差为,7,最近N期序列值的平均值作为未来各期的预测结果。
一般N取值范围:
5N200。
当历史序列的基本趋势变化不大且序列中随机变动成分较多时,N的取值应较大一些。
否则N的取值应小一些。
在有确定的季节变动周期的资料中,移动平均的项数应取周期长度。
选择最佳N值的一个有效方法是,比较若干模型的预测误差。
均方预测误差最小者为好.当预测目标的基本趋势与某一线性模型相吻合时,常用二次移动平均法,但序列同时存在线性趋势与周期波动时,可用趋势移动平均法建立预测模型:
yT+m=aT+bTm,m=1,2,其中,),
(1)T,
(2)T,
(1)T,
(2)T,(M,aT=2M,M,bT=,M,2N1,例1某企业1月11月份的销售收入时间序列如下表所示。
取N=4,试用简单一次滑动平均法预测第12月份的销售收入,并计算预测的标准误差.,Matlab程序y=533.8574.6606.9649.8705.1772.0816.4892.7963.91015.11102.7;temp=cumsum(y);%求累积和mt=(temp(4:
11)-0temp(1:
7)/4;y12=mt(end)ythat=mt(1:
end-1);fangcha=mean(y(5:
11)-ythat).2);sigma=sqrt(fangcha),结果temp=1.0e+003*0.53381.10841.71532.36513.07023.8422,4.65865.55136.51527.5303,8.6330,mt=591.2750634.1000683.4500735.8250796.5500861.2500922.0250993.6000y12=993.6000ythat=591.2750634.1000683.4500735.8250796.5500861.2500922.0250fangcha=2.2654e+004sigma=150.512110,11,2.指数平滑法,一次移动平均实际上认为最近N期数据对未来值影响相同,都加权1/N;而N期以前的数据对未来值没有影响,加权为0。
但二次及更高次移动平均数的权数却不是1/N,且次数越高,权数的结构越复杂,但永远保持对称的权数,即两端项权数小,中间项权数大,不符合一般系统的动态性。
一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。
所以更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。
指数平滑法可满足这一要求,而且具有简单的递推形式.指数平滑的基本公式,
(1),
(1)2,设观测序列为y1,yT,为加权系数,01,一次指数平滑公式为:
假定历史序列无限长,则有,由于加权系数序列呈指数函数衰减,加权平均又能消除或减弱随机干扰的影响,所以称为一次指数平滑.一次指数平滑预测:
12,表明St
(1)是全部历史数据的加权平均,加权系数分别为,一次指数平滑,13,类似地有,二次指数平滑公式三次指数平滑公式,P次指数平滑公式,利用指数平滑公式可以建立指数平滑预测模型。
原则上说,不管序列的基本趋势多么复杂,总可以利用高次指数平滑公式建立一个逼近很好的模型,但计算量很大。
因此用的较多的是几个低阶指数平滑预测模型。
1)一次指数平滑预测,2)二次指数平滑预测:
(适用线性趋势数列)Brown单系数线性平滑预测,指数平滑预测,3)三次指数平滑预测:
(适用于二次曲线趋势数列)Brown单系数二次式平滑预测,由于指数平滑公式是递推计算公式,必须确定初始值,可以取前35个数据的算术平均值作为初始值。
.,16,指数平滑预测模型以时刻t为起点,综合历史序列信息,对未来进行预测。
选择合适的加权系数是提高预测精度的关键环节。
据经验,的取值范围一般以0.10.3为宜。
值愈大,加权系数序列衰减速度愈快,所以取值大小起着控制参加平均的历史数据个数的作用。
值愈大意味着采用的数据愈少。
因此可得到选择值的一些基本准则。
(1)如果序列的基本趋势比较稳,预测偏差由随机因素造成,则值应取小一些,以减少修正幅度,使预测模型能包含更多历史数据的信息。
(2)如果预测目标的基本趋势已发生系统地变化,则值应取得大一些。
这样,可以偏重新数据的信息对原模型进行大幅度修正,以使预测模型适应预测目标的新变化.,例2下表数据是某股票在8个连续交易日的收盘价,试用一次指数平滑法预测第9个交易日的收盘价(初始值S0
(1)=y1,=0.4),19,Matlab程序alpha=0.4;y=16.4117.6216.1515.5417.2416.8318.1417.05;s1
(1)=y
(1);fori=2:
8s1(i)=alpha*y(i)+(1-alpha)*s1(i-1);endyhat9=s1(end)sigma=sqrt(mean(s1(1:
end-1)-y(2:
end).2)运行结果,s1=16.4100,yhat9=17.1828,sigma=0.9613,Matlab程序clc,clearalpha=0.4;y=16.4117.6216.1515.5417.2416.8318.1417.05;s1
(1)=y
(1);fori=2:
8s1(i)=alpha*y(i)+(1-alpha)*s1(i-1);ends2=y
(1);fori=2:
8s2(i)=alpha*s1(i)+(1-alpha)*s2(i-1);enda8=2*s1(8)-s2(8)b8=alpha/(1-alpha)*(s1(8)-s2(8)yhat9=a8+b8yhat
(1)=y
(1)fori=2:
8yhat(i)=s1(i-1)+1/(1-alpha)*(s1(i-1)-s2(i-1);endtemp=sum(yhat-y).2);sigma=sqrt(temp/6),运行结果:
a8=17.3801b8=0.1315yhat9=17.5116yhat=16.4100sigma=1.2054预测结果不如一次指数平滑法预测的预测结果。
21,46,二、平稳时间序列模型,这里的平稳是指宽平稳,其特性是序列的统计特性不随时间平移而变化,即均值和协方差不随时间的平移而变化。
主要有下面几种模型:
1.自回归模型(AutoRegressiveModel),简称AR模型2.移动平均模型(MovingAverageModel),简称MA模型3.自回归移动平均模型(AutoRegressiveMovingAverageModel)简称ARMA模型,假设时间序列Xt仅与Xt-1,Xt-2,Xt-n有线性关系,而在Xt-1,Xt-2,Xt-n已知条件下,Xt与Xt-j(j=n+1,n+2,)无关,t是一个独立于Xt-1,Xt-2,Xt-n的白噪声序列,,可见AR(n)系统的响应Xt具有n阶动态性。
AR(n)模型通过把Xt中的依赖于Xt-1,Xt-2,Xt-n的部分消除掉后,使得具有n阶动态性的序列Xt转化为独立的序列t。
因此拟合AR(n)模型的过程也就是使相关序列独立化的过程.,
(1)一般自回归模型AR(n),48,如果一个系统在t时刻的响应Xt,与其以前时刻t-1,t-2,的响应Xt-1,Xt-2,无关,而与其以前时刻t-1,t-2,t-m进入系统的扰动t-1,t-2,t-m存在着一定的相关关系,那么这一类系统为MA(m)系统.,
(2)移动平均模型MA(m),如:
MA
(1)模型:
Yt=0.1+t0.3t1,其中t是白噪声过程,49,一个系统,如果它在时刻t的响应Xt,不仅与其以前时刻的自身值有关,而且还与其以前时刻进入系统的扰动存在一定的依存关系,那么,这个系统就是自回归移动平均系统.ARMA(n,m)模型:
对于平稳系统来说,由于AR、MA、ARMA(n,m)模型都是ARMA(n,n-1)模型的特例,我们以ARMA(n,n-1),模型为一般形式来建立时序模型.,(3)自回归移动平均模型,MA过程,例下面是一个MA
(2)模型,计算它的自相关函数,并画图t=t+0.2t10.1t21(121)/(11222)(0.2+0.2*0.1)/(1+0.12+0.22)=0.22
(2)/(11222)0.1/(1+0.12+0.22)=0.095,ARMA的模型设定与识别,ACF图(识别阶数q),基本结论MA(q)过程的自相关函数q步截尾,根据自相关函数与偏自相关函数定阶,根据样本自相关函数和样本偏相关函数定阶一般要求样本长度大于50,才能有一定的精确程度自相关函数和样本偏相关函数定阶的准则MA(q)AR(p)ARMA(p,q)自相关函数q步截尾拖尾拖尾偏相关函数拖尾p步截尾拖尾,ARMA的模型设定与识别,ARIMA(p,d,q)过程和模型,随机过程不平稳:
从图形看不重复穿越一条水平线,样本自相关函数收敛速度慢。
差分以后是一个ARMA过程注意不要过度差分d表示差分的次数,ARMA的模型设定与识别,MA
(1)Ytt0.5t1,ARMA的模型设定与识别,MA(q)AR(p)ARMA(p,q)自相关函数q步截尾拖尾拖尾偏相关函数拖尾p步截尾拖尾,AR
(1)Yt=0.6Yt-1+t,ARMA的模型设定与识别,MA(q)AR(p)ARMA(p,q)自相关函数q步截尾拖尾拖尾偏相关函数拖尾p步截尾拖尾,ARMA(1,1)Yt=-0.7Yt-1+t-0.7t-1,三、ARMA的模型设定与识别,ARMA模型的其他识别方法,采用ACF和PACF定阶AIC或者BIC准则选择,越小越好一般到特殊,最后显著法(Lastsignificant)Remark:
在高频时间序列中(日内数据),条件均值模型可能是MA
(1)模型,ARMA的模型设定与识别,ARMA模型的其他识别方法,ACF和PACF定阶-对纯粹的AR模型或者MA模型可以定阶-可以判别某个过程为ARMA过程,但不能定阶-由于估计误差的存在,很难判断拖尾和截尾,这种方法在实际应用中存在缺陷AIC或者BIC准则选择,越小越好-特别适用于ARMA模型,当然也适用于AR模型或者MA模型一般到特殊,最后显著法(Lastsignificant)-选择一个高阶的AR模型,逐渐递减,直到最后一个变量显著,这与AR模型PACF定阶异曲同工.,ARMA的模型设定与识别,ARMA模型的估计,AR模型采用OLS法估计AR模型可采用自相关函数的直接估计MA模型采用最大似然法估计ARMA模型采用最大似然法估计,四、ARMA的模型估计与检验,建模步骤,平稳化,采用差分的方法得到平稳的序列定阶,确定p,q的大小估计,估计未知参数检验,检验残差是否是白噪声过程预测,最后利用模型预测,ARMA模型的建模步骤,三、非平稳时间序列模型,三、非平稳时间序列模型,本章结构,差分运算ARIMA模型方差齐性变化,主要内容:
实际上我们经常会遇到一些非平稳时间序列,往往会呈现明显的趋势性或周期性,可以通过适当差分等手段,将它化为平稳时间序列,在采用用ARMA(n,m)模型建模。
1.差分运算,差分方法是一种非常简便、有效的确定性信息提取方法Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息差分运算的实质是使用自回归的方式提取确定性信息一阶差分:
二阶差分:
d阶差分:
差分方式的选择,序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响对于蕴含着固定周期的序列进行步长为周期长度s的差分运算(季节差分),通常可以较好地提取周期信息,如:
季节差分:
D阶季节差分:
例5.1,【例1.1】1964年1999年中国纱年产量序列蕴含着一个近似线性的递增趋势。
对该序列进行一阶差分运算考察差分运算对该序列线性趋势信息的提取作用,差分前后时序图,原序列时序图,差分后序列时序图,例5.2,尝试提取1950年1999年北京市民用车辆拥有量序列的确定性信息,差分后序列时序图,一阶差分,二阶差分,例5.3,差分运算提取1962年1月1975年12月平均每头奶牛的月产奶量序列中的确定性信息,差分后序列时序图,一阶差分,1阶12步差分,过差分,足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息但过度的差分会造成有用信息的浪费,2.ARIMA模型,ARIMA模型结构ARIMA模型性质ARIMA模型建模ARIMA模型预测,ARIMA模型结构,使用场合差分平稳序列拟合模型结构,ARIMA模型族,d=0ARIMA(p,d,q)=ARMA(p,q)P=0ARIMA(P,d,q)=IMA(d,q)q=0ARIMA(P,d,q)=ARI(p,d),预测值,等价形式计算预测值,SPSS时间序列分析的特点SPSS的时间序列分析没有自成一体的单独模块,而是分散在Data、Transform、Analyze、Graph四个功能菜单当中。
在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;在Analyze的TimeSeries中主要提供了四种时间序列的分析方法,包括指数平滑法、自回归法、ARIMA模型和季节调整方法;在Graph中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等,SPSS16.0将时间序列的图形工具放在Analyze-timeseries中。
另外,也可利用SPSS的谱分析图等模块进行简单的谱分析。
四、时间序列的SPSS操作,1.数据准备,SPSS的数据准备包括数据文件的建立、时间定义和数据期间的指定。
其中数据文件的建立与一般SPSS数据文件的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。
具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。
SPSS的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:
(1)选择菜单:
DateDefineDates,出现窗口:
(2)CasesAre框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。
至此,完成了SPSS的时间定义操作。
SPSS将在当前数据编辑窗口中自动生成标志时间的变量。
同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。
数据期间的选取可通过SPSS的样本选取(SelectCases)功能实现。
时间序列的图形化观察及检验,时间序列的图形化及检验目的通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的关系等。
时间序列的图形化观察工具序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:
趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。
序列图还可用于对序列异常值的探索,以及体现序列的“簇集性”,异常值是那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。
“簇集性”是指数据在一段时间内具有相似的水平。
在不同的水平间跳跃性变化,而非平缓性变化。
直方图(Histogram)直方图是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳性、正态性等特征。
自相关函数图和偏自相关函数图(ACFPACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。
对自相关的测度往往采用自协方差函数和自相关函数。
偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。
自相关函数图和偏自相关函数图将时间序列各阶滞后的自相关和偏自相关函数值以及在一定置信水平下的置信区间直观的展现出来。
各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:
1、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。
但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。
2、具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。
3、异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。
4、具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。
5、非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。
互相关图对两个互相对应的时间序列进行相关性分析的实用图形工具。
互相关图是依据互相关函数绘制出来的。
是不同时间序列间不同时期滞后序列的相关性。
时间序列的检验方法参数检验法参数检验的基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。
根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。
如果差值大于检验值,则认为序列具有非平稳性。
时间序列的图形化观察和检验的基本操作1绘制序列图的基本操作
(1)选择菜单GraphSequence。
(2)将需绘图的序列变量选入Variables框中。
(3)在TimeAxisLabels框中指定横轴(时间轴)标志变量。
该标志变量默认的是日期型变量。
(4)在Transform框中指定对变量进行怎样的变化处理。
其中Naturallogtransform表示对数据取自然对数,Difference表示对数据进行n阶(默认1阶)差分,Seasonallydifference表示对数据进行季节差分。
(5)单击TimeLines按钮定义序列图中需要特别标注的时间点,给出了无标注(NoreferenceLines)、在某变量变化时标注(Lineateachchangeof)、在某个日期标注(Lineatdate)三项供选择。
(6)单击Format按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。
2绘制自相关函数图和偏自相关函数图的基本操作
(1)选择菜单GraphTimeSeriesAutocorrelations。
(2)将需绘制的序列变量选入Variables框。
(3)在Display框选择绘制哪种图形,其中Autocorrelations表示绘制自相关函数图;Partialautocorrelations表示绘制偏自相关函数图。
一般可同时绘制两种图形。
(4)单击Options按钮定义相关参数,其中MaximumNumberofLags表示相关函数值包含的最大滞后期,即时间间隔h。
一般情况下可选择两个最大周期以上的数据。
在StandardErrorMethod框中指定计算相关系数标准差的方法,它将影响到相关函数图形中的置信区间。
其中Independencemodel表示假设序列是白噪声的过程;Bartlettsapproximation表示,根据Bartlett给出的估计自相关系数和偏自相关系数方差的近似式计算方差。
该方法适合当序列是一个k-1阶的移动平均过程,且标准差随阶数的增大而增大的情况。
(5)选中Displayautocorrelationatperiodiclags表示只显示时间序列周期整数倍处的相关函数值。
一般如果只考虑序列中的周期因素可选中该项。
否则该步可略去。
3绘制互相关图的基本操作
(1)选择菜单GraphTimeSeriesCrosscorrelations。
(2)把需绘图的序列变量选择到Variables框中。
绘制互相关图时要求两个序列均具有平稳性。
时间序列的预处理,1时间序列预处理的目的和主要方法预处理的目的可大致归纳为两个方面:
第一,使序列的特征体现得更加明显,利于分析模型的选择;第二,使数据满足于某些特定模型的要求。
序列的预处理主要包括以下几个方面:
序列缺失数据的处理序列数据的变换处理主要包括序列的平稳化处理和序列的平滑处理等。
均值平稳化一般采用差分(Difference)处理,方差平稳化一般用Box-Cox变换处理,如取对数、平方根等,差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之间进行。
季节差分(Seasonaldifference)就是一个典型的代表。
对于既有趋势性又有季节性的序列,可同时进行差分和季节差分处理。
时间序列的平滑处理目的是为了消除序列中随机波动性影响。
平滑处理的方式很多,常用的有各种移动平均、移动中位数以及这些方法的各种组合等。
中心移动平均法(Centeredmoving
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间 序列 分析 SPSS 操作