换一换

冰点文库 > 资源分类 > DOC文档下载

预览

本科毕业论文基于SAS及时间序列的上海GDP预测.doc

资源ID：4717918 资源大小：1.41MB 全文页数：21页
资源格式： DOC 下载积分：10金币

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要10金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

本科毕业论文基于SAS及时间序列的上海GDP预测.doc

1、摘要近日，随着2012年世界各国GDP实力排名的发出，关于中国成为世界第二大经济强国的说法越来越多。我国省区经济是国民经济的重要组成部分，而各个省区经济优势具有相对独立性的。上海作为中国最大的经济中心城市，带动着我国经济发展，在中国经济发展中一直具有重要地位与举足轻重的影响。因此，上海人均GDP不仅反映出上海居民收入和生活水平，还可以在一定程度上显示出中国经济的发展势头。本文基于时间序列理论，以上海1978年至2013年三十六年的生产总值为基础，运用SAS软件对数据进行时间序列分析，对数据进行绘图分析、模型识别、模型估计，模型拟合。最后利用所建模型对上海市未来4至5年的年人均生产总值做出预测。

2、关键词：人均GDP；时间序列；ARIMA模型AbstractRecently, with the 2012 issue of world GDP rankings for all countries, more and more people think China has become the second largest economy country . As an important part of our national economy, the provincial economy possesses the relatively independent economic adv

3、antages. Shanghai, Chinas largest urban economic center, has been exerting significant influence on the domestic economic development; therefore, the real per capita GDP of Shanghai can not only reflect Shanghai residential income level and living standard, but also reveal the development trend of C

4、hinas economy.In this paper, based on the gross product data during the thirty six years from 1978 to 2013, we carry out the time series analysis of the data by the theory of time series and SAS software, and we then do the mapping analysis, model identification, model estimation and model fitting.

5、Finally, we apply the proposed model to the real per capita GDP prediction of Shanghai in the next four to five years.Keywords: Real per capita GDP；time series；ARIMA model1 引言国内生产总值（Gross Domestic Product，简称GDP）是指在一定时期内（一个季度或一年），一个国家或地区的经济中所生产出的全部最终产品和劳务价值的总和，常被公认为衡量国家经济状况的最佳指标。它不但可以反映一个国家的经济表现，还可以反

6、映一国的国力与财富。而它所对应的人均GDP直接决定和影响着一个国家在居民收入和生活水平及其社会建设方面的投入取向、投入能力与投入水平。地区生产总值是指一个地区所有常住单位在一定时期内生产活动的最终成果。这个指标把国民经济全部活动的产出成果概括在一个极为简明的统计数字之中，为评价和衡量该地区经济状况、经济增长趋势及社会财富的经济表现提供了一个最为综合的尺度，可以说，它是影响经济生活乃至社会生活的最重要的经济指标。对其进行的分析预测具有重要的理论与现实意义。本文以上海为例，从上海统计年鉴中选取上海1978年2013年共36年的人均GDP作为数据，运用时间序列分析的基本的分析方法随机时序分析，进行模

7、型识别、参数估计和模型检验，建立上海人均GDP时间序列模型，应用选定时间序列方法预测未来人均GDP，并对未来上海经济发展做出短期预测，为政府制定经济发展战略提供依据。2 时间序列分析基本方法2.1 时间序列分析的预处理2.1.1 差分运算一阶差分相距一期的两个序列值之间的减法运算。二阶差分对一阶差分后序列再进行一次一阶差分运算。阶差分对阶差分序列再进行一次一阶差分运算。步差分相距期的两个序列值之间的减法运算。差分方式的选择：序列蕴含着显著的线性趋势，一阶差分就可以实现趋势平稳。序列蕴含着曲线趋势，通常二阶或三阶差分就可以提取出曲线趋势的影响。序列蕴含着固定周期的序列进行步

8、长为周期长度的差分运算，通常可以较好地提取周期信息。2.1.2 平稳性检验平稳性是一些时间序列具有的统计特征,对数据进行平稳性检验是分析时间序列的关键步骤。平稳时间序列有两种定义，根据限制条件的严格程度，分为严平稳时间序列和宽平稳时间序列。对序列的平稳性有两种检验方法，一种是根据时序图和自相关图显示的特征做出判断的图检验方法；一种是构造检验统计量进行假设检验的方法。（1）时序图检验平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动，而且波动范围有界的特点。如果观察序列的时序图，显示出该序列有明显的趋势性或周期性，那它不是平稳序列。（2）自相关图检验自相关图是一个平面二位坐标悬垂线图

9、，一个坐标轴表示延时期数，另一个坐标轴表示自相关系数，通常以悬垂线表示自相关系数的大小。在平稳序列中，随着延迟期数的增加，自相关系数会很快地衰减向零。反之，非平稳序列的自相关系数衰减向零的速度通常比较慢，这就是我们利用自相关图进行平稳性判断的标准，（3）单位根检验法由于图检验带有很强的主观色彩，为了客观起见，人们开始研究各种序列平稳性的统计检验方法，其中应用最广的是单位根检验。（a）DF检验（只适用于过程的检验）对于1阶自回归序列：检验假设为： DF检验统计量：，其中，DF检验为单边检验，当显著性水平取时，记为DF检验的分位点。则（b）ADF检验对于任一过程：为了方便检验，将其间记为:

10、其中：则，序列非平稳；，序列平稳。2.1.3 纯随机性检验为了判断序列是否有分析价值，必须对序列进行纯随机性检验，即白噪声检验，因此在建模之前需要进行纯随机性检验。若是到平稳的白噪声序列，则该序列没有分析价值；若是平稳非白噪声序列，可进行模型拟合。原假设：延迟期数小于或等于期的序列值之间相互独立。备择假设：延迟期数小于或等于期的序列值之间有关联性。该假设条件用数学语言描述为：检验统计量：，其中：为序列观测期数；为指定延迟期数。则，拒绝原假设，认为该序列为非纯随机序列，可以建模。，接受原假设，认为该序列为纯随机序列，终止建模。2.2 时间序列基本模型1时间序列分析模型分为三类：自回归

11、模型、移动平均模型和自回归移动平均模型。2.2.1 自回归模型模型： 2.2.2 移动平均模型模型： 2.2.3 自回归移动平均模型由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均模型，记为，其中，别表示自回归系数和移动平均系数。模型：当时，模型就退化成了模型；当时，模型就退化成了模型。2.3 ARIMA模型建模步骤2.3.1 数据平稳化处理首先可通过时间序列的散点图或折线图对序列进行初步的平稳性判断。对非平稳的时间序列，可以先对数据进行取对数或进行差分运算（模型中的阶数即为差分的次数），然后判断经处理后序列的平稳性。在得到平稳序列前，重复以上过程。虽然足够多次的差分运算可

12、以充分地提取序列中的非平稳确定性信息，但差分运算的阶数并不是越多越好。因为差分运算只是对信息的提取、加工过程，每次差分都会使得信息有所损失，所以实际应用中差分运算的阶数要适当，应避免过差分现象，一般差分次数不超过2次。2.3.2 模型识别2平稳的序列的自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后，系数都为0；拖尾就是有一个衰减的趋势，但是不都为0。图2-1拖尾与截尾说明此偏自相关图中，当阶数为1的时候，系数值还是很大，0.914，二阶长的时候突然就变成了0.050，后面的值都很小，认为是趋于0，这种状况就是截尾。自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式，这种

13、趋势是单调趋势的典型图形。在判断运用什么模型进行拟合时，需运用以下准则3：表2-1 时间序列模型选择标准模型自相关系数偏自相关系数拖尾阶截尾阶截尾拖尾拖尾拖尾2.3.3 参数估计确定模型阶数后，应对拟合的模型进行参数估计。参数最优估计应该是在前面分析的基础上，利用序列的观察值确定该模型的口径，即估计模型中未知参数的值，将所有参数联合求解。模型中，待估参数个未知参数（）。对未知参数的估计方法有三种：矩估计，极大似然估计和最小二乘估计。（1）矩估计：（a）原理：从样本自相关系数估计总体自相关系数中解出的参数值，就是，的矩估计。（b）样本一阶均值估计总体均值：样本方差估计总体方差：（c）优点：

14、估计思想简单直观，不需要假设总体分布，计算量小（低阶模型场合）缺点：信息浪费严重，只用到了个样本自相关系数信息，其他信息都被忽略，估计精度差，通常矩估计方法被用作极大似然估计和最小二乘估计迭代计算的初始值。（2）极大似然估计:（a）原理:在极大似然准则下，认为样本来自使该样本出现概率最大的总体。因此未知参数的极大似然估计就是使得似然函数（即联合密度函数）达到最大的参数值。（b）对对数似然函数中的未知数求偏导数，得到似然方程组：由于和都不是的显式表达式。因而似然方程组实际上是由个超越方程构成，通常需要经过复杂的迭代算法才能求出未知参数的极大似然估计值。（c）优点：极大似然估计充分应用了每一个

15、观察值所提供的信息，因而它的估计精度高；同时还具有估计的一致性、渐近正态性和渐近有效性等许多优良的统计性质。缺点：需要假定总体分布。（3）最小二乘估计（实际中最常用的参数估计方法）4：（a）原理：使残差平方和达到最小的那组参数值即为最小二乘估计值。（b）假设条件：残差平方和方程：解法：迭代法（c）优点：最小二乘估计充分应用了每一个观察值所提供的信息，因而它的估计精度高；条件最小二乘估计方法使用率最高。缺点：需要假定总体分布。2.3.4 模型检验完成模型的识别与参数估计后，我们还要对估计结果进行必要的检验。（1）模型的显著性检验目的：检验模型的有效性，即对信息的提取是否充分。检验对象：

16、残差序列判定原则5：一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息，即残差序列应该为白噪声序列；反之，如果残差序列为非白噪声序列，那就意味着残差序列中还残留着相关信息未被提取，这就说明拟合模型不够有效。假设条件：原假设：残差序列为白噪声序列备择假设：残差序列为非白噪声序列即：检验统计量：（2）参数的显著性检验（模型结构是否最简）目的：检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简。假设条件：检验统计量：当该检验统计量的值小于或者时，拒绝原假设，认为该参数显著。反之，认为该参数不显著。此时应剔除不显著参数所对应的自变量重新拟合模型，构造新的、结构更精炼

17、的拟合模型。3 基于时间序列模型的GDP预测实例分析下面以上海19782013年人均生产总值数据(见表3-1)为例，选取最为合理的预测方法对未来4年上海人均GDP的做出预测。表3-1 上海19782013年人均生产总值（单位：元）6年份GDP年份GDP年份GDP年份GDP19782485198743401996206472005496481979255619885080199723397200654858198027251989536219982520620076204019812800199059111999270712008669321982286419916661200030047200

18、96916519832947199282082001317992010760741984323219931106120023395820118256019853822199414328200338486201285373198639561995177792004448392013907493.1 上海人均GDP时间序列分析3.1.1 平稳性检验及平稳化处理首先绘制原始人均GDP的时间序列图7, 从图3-1可以看出上海人均GDP具有很明显的上升趋势，可以看出原始序列显然是非平稳的。图3-1上海1978-2013年人均GDP时序图为了能够对序列进行分析，要使其平稳化。故将选择两种方法：取对数法和差

19、分法，对序列进行平稳化处理，从而进一步分析预测。由差分的选择我们可以知道序列蕴含着曲线趋势，通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响，我们对原始数据进行一、二阶差分，并验证其平稳性。图3-2 一阶差分时序图图3-3 一阶差分单位根检验检验结果表明Tau统计量的P值显著大于O05，所以我们可以认定差分后的序列是非平稳的。故还要再次进行差分计算。图3-4 二阶差分时序图图3-5 二阶差分单位根检验由检验结果我们可以看到Tau统计量的值显著小于00001，所以我们可以确定三阶差分后序列平稳。所以，我们认为模型的差分阶数等于2。3.1.2 纯随机性检验在将数据平稳化之后，还要判断序列是否

20、有分析价值，必须对序列进行纯随机性检验，即白噪声检验。图3-6 二阶差分后白噪声检验SAS里面的白噪声检验假设是所给的时间序列属于白噪声。所以当值（PrChiSq）小于置信水平（）时，拒绝检验假设；而当值大于置信水平时，不拒绝检验假设。在二阶差分后白噪声检验（图3-6）中显示8，LB统计量的值小于0.0001，所以可以断定二阶差分序列属于非白噪声序列。结合前面的平稳性检验结果，说明该序列是平稳非白噪声序列，可进行模型拟合。3.2 时间序列模型的建立3.2.1 模型定阶根据二阶差分序列自相关图（图3-7）及二阶差分序列偏自相关图（图3-8）图3-7 二阶差分序列自相关图图3-8 二阶差分序列偏自

21、相关图二阶差分自相关图（图3-8）显示出该序列有自相关系数1阶拖尾的性质，而偏相关系数显示出2阶或3阶截尾的性质，所以可以考虑用或模型拟和2阶差分后的序列。为了检验所选择模型是否合适，我们可以用SAS系统提供的MINIC命令做最优模型识别9。图3-9 BIC定阶由图3-9显示，在自相关延迟阶数小于等于5，移动平均延迟阶数小于等于5的所有模型中最优，故我们选择模型。3.2.2 参数估计SAS支持三种参数估计方法，如果不特别指出制定参数估计的方法，系统默认的估计方法是条件最小二乘估计方法。对模型进行参数估计，结果为：图3-10 参数估计由结果中可以看到MU不显著，而其它参数均显著，所以要去掉常数项

22、再次估计未知参数结果如图3-11，显然3个未知参数都显著10。图3-11 去掉常数后参数估计得到拟合结果为：图3-12 拟合结果可表示为： 3.2.3 模型检验图3-13 拟合模型检验从上图可以看出，延迟各阶的LB统计量值均显著大于（），可知残差通过了白噪声检验，即认为残差序列为白噪声序列，该拟合模型显著成立。 3.3 上海人均GDP短期预测及分析我们利用此模型对上海市之后3年的人均GDP进行预测结果如下：图3-14 预测结果经过处理后，可得到预测值如下表：表3-2 上海2014年2016年人均GDP预测值（单位：元）年份201420152016预测值97310.9148101211.3642

23、104612.55744 结论本文根据19792013年上海市年人均GDP的统计资料，针对上海市人均GDP的非平稳特征，通过差分变成平稳序列，建立上海市年人均GDP时间序列的ARIMA模型，并在此基础上用于上海市年人均GDP的预测分析。计算结果表明，该模型能较好地解决上海市年人均GDP的估计和预测问题，预测精度较为精确。参考文献1王燕. 应用时间序列分析M. 北京:中国人民大学出版社，第三版.2刘薇. 时间序列分析在吉林省GDP预测中的应用D. 东北师范大学硕士学位论文，2009.3周文娟. 我国GDP的统计分析及预测EB/OL. 4徐雅静. ARIMA模型在河南省GDP预测中的应用及SA

24、S实现J. 中国科技信息， 2006，10:216-219.5张丽. 天津市人均GDP时间序列模型及预测J. 北方经济，2007,(6):44-46.6上海统计局. 上海统计年鉴EB/OL. http:/www.stats-7胡良平,高辉. SAS统计分析教程M.北京:电子出版社,2010.8姚鑫锋,王薇等. SAS统计分析实用宝典M.北京：清华大学出版社,2013.9龚国勇 ARIMA 模型在深圳GDP预测中的应用J 数学的实践与认识，2008， 38(4):53 57.10刘颖, 张智慧. 中国人均GDP时间序列分析J. 统计与决策, 2005,(4):61-62.附录：SAS代码/*绘制

25、散点图*/proc gplot data=GDP;plot GDP*year=1 ;symbol c=green v=dot i=join;run;/*一阶差分*/data GDP;set work.GDP;cfGDP=dif(GDP);run;/*一阶差分散点图*/proc gplot;plot cfGDP*year=1;symbol c=green v=dot i=join;run;/*一阶差分数据的自相关图、偏自相关图、纯随机性检验、单位根检验 */proc arima data=GDP; identify var=cfGDP stationarity=(adf=1) ;run;/*二阶

26、差分*/data GDP;set work.GDP;cfcfGDP=dif(dif(GDP);run;/*二阶差分散点图*/proc gplot;plot cfcfGDP*year=1;symbol c=green v=dot i=join;run;/*二阶差分数据的自相关图、偏自相关图、纯随机性检验、单位根检验 */proc arima data=GDP; identify var=cfcfGDP stationarity=(adf=1) ;run;/* 定阶 */proc arima; identify var=cfcfGDP(1,1) minic p= (0:5) q= (0:5);run;/* 参数估计 */proc arima data=GDP;identify var=cfcfGDP(1,1);estimate p=3;run;/* 去常数项参数估计 */proc arima data=GDP;identify var=cfcfGDP(1,1);estimate p=3 noint;run;/*自相关图、偏自相关图、拟合模型、预测部分*/ proc arima data=a1; identify var=m nlag=15; estimate p=3 noint; forecast lead=4 out=results id=year; run;20

注意事项

本文（本科毕业论文基于SAS及时间序列的上海GDP预测.doc）为本站会员主动上传，冰点文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知冰点文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。