完整版基于时间序列在粮食产量中的方法研究毕业设计.docx
- 文档编号:11000783
- 上传时间:2023-05-28
- 格式:DOCX
- 页数:20
- 大小:114.60KB
完整版基于时间序列在粮食产量中的方法研究毕业设计.docx
《完整版基于时间序列在粮食产量中的方法研究毕业设计.docx》由会员分享,可在线阅读,更多相关《完整版基于时间序列在粮食产量中的方法研究毕业设计.docx(20页珍藏版)》请在冰点文库上搜索。
完整版基于时间序列在粮食产量中的方法研究毕业设计
学号:
毕业设计(论文)
(2015届)
题目基于时间序列在粮食产量中的方法研究
学生
学院专业班级
校内指导教师专业技术职务
校外指导老师专业技术职务
基于时间序列在粮食产量中的方法研究
摘要:
粮食是我们生产和生活中的基本消费品,我国民生国计的首要大事就是解决我国的粮食产量问题。
本文介绍了几种时间序列的建模方法,来分析预测出我国的粮食产量问题。
并且通过分析我国2000到2014年的粮食生产总量数据的特点,建立了自回归移动平均模型ARIMA(p,d,q)模型。
最后,通过使用Eviews6.0操作软件成功的计算完成了关于我国粮食产量的预测问题。
得出的结果如下,在未来的几年内,我国粮食生产在不受到自然灾害等因素影响的前提下,将会缓慢增长。
通过分析,显示农业科技技术和重大的自然灾害对我国粮食产量的影响较为严重,为了保证粮食产量的增长要发展好农业技术和做好重大自然灾害的预防措施。
关键词:
时间序列;粮食产量问题;ARIMA模型。
Studyonthemethodoftimeseriesbasedongrainoutput
Abstract:
Foodisthemostbasicconsumergoodsforhumansurvival,theproblemofthegrainoutputofacountryrelatestothenationaleconomyandthenationaleconomyandthecountry'snationaleconomyandthenation'slivelihood.Tomakefoodforecast,thispaperpresentsseveralmodelingmethodsfortimeseries.ThroughmodelofautoregressivemovingaverageARIMA(p,d,q)isestablished.Finally,theforecastofgrainoutputofourcountryiscalculatedbyEviews6.0software.Theresultsshowthatthegrainoutputisnotaffectedbynaturaldisastersinthenextseveralyears,anditwillslowgrowth.TheanalysisshowsthattheagriculturaltechnologyandthemajornaturaldisastershaveaseriousimpactonthegrainoutputinChina.Inordertoensurefoodproductionproblemstodevelopagriculturaltechnologyandtodoamajordisasterprevention.
Keyword:
Timeseries;Grainoutput;ARIMAmodel.
目录
摘要II
目录III
1.引言1
1.1课题背景1
1.2本课题研究的意义1
2.关于我国的粮食产量问题2
2.1国内粮食产量的现状2
2.2研究粮食产量的方法2
3.几种时间序列预测方法简介2
3.1自回归(AR)模型3
3.2移动平均(MA)模型4
3.3自回归移动平均(ARMA)模型5
3.4差分自回归滑动平均(ARIMA)模型5
4.数据的分析及模型建立7
4.1数据分析7
4.2数据平稳化8
4.3模型的定阶9
4.4模型有效性检验12
4.5模型预测13
5.结论13
参考文献15
致谢17
1.引言
1.1课题背景
我国的民生问题与粮食产量密切相关,国家经济的可持续性发展以及政治局面的稳定等方面都受到粮食产量的影响。
我国有13亿的人口,为世界总人口数比例的百分之二十一,但是可用耕地面积却很少,仅占全球可用的耕地面积比例为百分之七,粮食产量问题是关系到经济发展的安全,而且是关系到民生和国计的重大的战略物资问题,每时每刻都不能有一丝一毫的松懈。
解决十几亿人口的粮食问题是目前的头等大事。
我国的粮食产量问题受到很多方面要素的影响,并且无法从中找出任何规律。
而且有的专家指出,从中长期的发展来看,因为人口的不断增加,耕地面积在不断的减少,城市化的步伐的加快,我国人民的生活水平有着显著的提升。
粮食是人们生活中不可或缺的重要必需品,而且需求越来越大,市场上的粮食的供求关系将会发展成是偏紧的关系。
粮食始终人类生活中必不可少的特殊的商品,所以我国的一项极为重要的战略职责就是要保证粮食安全。
1.2本课题研究的意义
十几年前,美国世界观察所的所长布朗就曾说过,我国的人口在逐年大量的增加,但是耕地面积却在的逐年减少。
等到了2030年那年,我国人口将从13亿增加到16亿,还有由于耕地的减少,粮食产量下降,会导致粮食产量不满足消耗需求。
到时候,人们必然会到各处特别是到国际市场去抢购粮食,这样的势头必然会带动粮食价格的的上涨,形成粮食恐慌的现象,进而引起世界范围的粮危机。
然而事实在证明:
我国的粮食种植面积每削减一个百分点,我国的粮食需求就会要求增添500万吨的粮食的进口,而我国粮食减少或者增加百分之5的粮食进口量,同时,将导致国际大宗商品市场粮食价格的下跌或上涨约30%,从而影响到近30个发展中国家的经济利益。
于是可以看出中国的粮食产量问题对我国甚至于全世界的粮食价格都有着极为重大的影响。
据统计,耕地面积在全球土地总面积中的比重中,印度达百分之56,日本占地百分之12,美国达百分之20。
据统计,当前我国的人均耕地仅为12亩(该数字比实际值小,还有待进一步的核查),我国的耕地面积不足世界人均耕地的区域面积减少相当于缩小了近一个安徽省那么大地域的耕地。
在1990年,我国的粮食的播种面积就降低到了十七亿亩,在此后越来越少,到了1994年的时候我国粮食的播种面积甚至降到了十六点四亿亩,这是第一次比国家制订的粮食安全警戒线要低。
1994年以后,我国的粮食播种面积就一直没有达到国家制定的安全警戒线。
2000年全国粮食播种面积比上年减少了7035万亩、201年的全国粮食播种面积比上年减少了3575万亩,还有2002年我国的粮食播种面积比上年减少了3284万亩。
包括受灾被损坏和农业布局的调整而占用了的一部分耕地之外,各种各类的建设工程也占用了大批的耕地,这些都导致了可用耕地急速减少。
还有退耕还林、退耕还草等这些政府大规模组织的这类的项目,包括了明显加大种植其他非农作物,可用的耕地面积不断减少等都直接对粮食播种面积产生了影响,导致可用的粮食播种面积的减少。
近几年来,中国粮食生产的单位面积产量的提高受到以下因素的影响,种植面积波动,农业基础设施不足,以及自然灾害的频繁发生等。
为了提高粮食生产产量和促进粮食的生产的根本就是先提供一套可以鼓励粮食生产的政策措施,只有提高了粮食种植的效益和增加粮农的收入,才可以更加有效。
但是,由于粮食生产的不确定系统的许多因素的制约,未来中国的粮食产量将如何改变,是否能实现国家粮食安全的目标已经成为一个非常有意义的话题。
因此,为了政策的调整方向和保障粮食安全,更加有效的分析预测我国的粮食产量问题尤其重要。
2.关于我国的粮食产量问题
2.1国内粮食产量的现状
就当前看来,统计动力学生长模拟法以及遥感技术预测法还有天气预测法等方法是目前国外较为受欢迎的几种粮食预测方法。
在世界预测粮食生产的问题有很多研究,尤其中国粮食产量预测更是是受到众多研究者的关注。
目前我国学者对于中国粮食产量的预测用的比较多的是时间序列模型的三大类预测模型。
其中,自回归移动平均模型、差分自回归滑动模型大多用来是处理非平稳的时间序列常用的时间序列模型。
另外,自回归模型(AR模型)、移动平均模型(MA模型)也是时间序列模型中的两类。
双对数模型是一种被广发应用的回归模型,和双对数模型一样回归模型中应用的比较多的还有线性回归模型。
2.2研究粮食产量的方法
从大多的资料看来,基本上时间序列大多不是平稳的,但是假如直接对非平稳的时间序列做回归分析处理的话,就有可能会造成“伪回归”的现象。
“伪回归”的现象是指:
由于对序列进行操作是,使原本并不存在依赖关系的变量却出现了依赖关系。
本文是根据我国粮食产量的时间序列,做出时间序列的散点图并分析数据的特点,再根据该序列的自相关函数图以及偏自相关函数图,然后判断这个时间序列的平稳性。
然后,平稳化非平稳时间序列的数据,把它当做一个随机序列,然后根据该序列的特征,建立出一个与之相应的时间序列模型。
最后对其进行检验,判断其有效性,再利用该模型进行分析预测我国的粮食产量问题。
3.几种时间序列预测方法简介
就现状而言,数量分析方法应用的较多的方法是时间序列分析。
现象是随着时间而变化的,时间序列分析就是寻找出其中得规律,然后描述出来。
一切客观现象都在不断的发展变化中,所以对于现象在发展中的变的规律,不光要其相互关联以及从内部结构以去认识,并且应当随着时间演化的过程去钻研,这就需要运用到时间序列分析方法。
时间序列分析是处理动态数据数据的统计方法。
数理统计方法和随机过程理论,都是在时间序列分析的基础上,探索一些随机数据的统计规律,为解决实际问题的。
传统的统计分析是基于数据序列是独立的,与时间序列分析的随机数据序列之间的相关性。
后者又可以看成随机过程统计的一部分。
一个单变量时间序列的建立模型和预测的主要方法是使用时间序列建模方法。
单变量的时间序列模型(比如说ARIMA模型,季节性ARIMA延长的销售季节ARIMA和TFN的外生变量)被广泛应用于建模和预测粮食产量在不同时间尺度下的常态假设。
包含自回归和移动平均线的组件使得AR
(1)模型非常灵活的和受欢迎的时间序列建模范围广泛的应用程序。
此外,ARIMA模型有很多优势,如处理序列相关性、与时间相关的变化和预测能力比其他类似的模型。
时间序列是一系列的数字序列的时间序列。
时间序列分析就是指利用这组序列,使用数理统计方法进行处理,以此来预测该时间序列的现象在未来一段时间内的发展形势。
在时间序列,数据或数据点在时间依赖性,这是数据值的变化,但可能不是时间的严格函数。
定量预测包括了时间序列分析方法,时间序列分析的基本原理如下:
一、对事物发展的连续性的识别。
利用过去的数据,可以推断出事物的发展。
二、考虑到事物发展的随机性。
任何事物的发展可能是偶然因素的影响,所以历史数据应采用加权平均法分析处理。
时趋势变化、周期性变化、随机变化这是时间序列预测所反映的三类实际变化规律。
要使用时间序列预测出一个现象的发展方向,需要进行如下步骤:
首先,通过对这一现象的历史数据的观测研究,我们发现随着时间的变化而变化的现象的规律,并预测未来的现象。
随着社会的不断发展,在影响经济生活的许多不确定因素的影响越来越大,这必然会吸引人们的注意。
时间序列分析的模型有如下:
AR模型、MA模型、ARMA模型和ARIMA模型。
时间序列分析预测法跟回归分析之间的差异就是时间序列分析能够依据一个变量的值,而不添加任何辅助信息来预测自己的变化。
3.1自回归(AR)模型
假设时间序列是其前期值和随机项的线性函数,那么就能够表示为
=++…++
(1)
那么称这个时间序列为自回归序列,式
(1)为自回归模型,记做AR(p)。
实参数,,…,是自回归系数,是该模型的待估参数。
随机项是互相独立的白噪声序列,而且该随机是一个项服从均值是0、方差是的正态分布。
该随机项和滞后变量,,…,是不相关的。
不是一般性,在
(1)中假设时间序列均值为0.若,则令,可将写成
(1)式的形式。
是k步滞后算子,就是,那么模型
(1)就可以表示为
=++…++
(2)
令=1---…-
模型可简写为:
=(3)
那么要使AR(p)过程平稳的前提条件是滞后多项式的所有根都必须在单位圆外,并且的根不小于等1。
其中AR(p)过程中经常使用到的是AR
(1)过程和AR
(2)过程,
保持其平稳性的条件是特征方程
根的绝对值必须大于1,满足。
3.2移动平均(MA)模型
假设时间序列是它的当前跟前期的随机误差的线性函数,那么可以表示为
(4)
就称这个时间序列是移动平均序列,
(2)式是q阶移动平均模型,记为MA(q)模型。
实参数,,…是移动平均系数,是模型的待估系数。
引入滞后算子,并令
则模型(4)可简写为
(5)
移动平均过程,即MA过程是无条件的平稳的。
然而期望AR过程和MA过程能互相表出,也就是说过程是可逆的。
所以要求滞后多项式的所有根均必须在单位圆外,经过推导可得出
(6)
其中,,,其他权重可地推得到。
可以说式(6)是MA模型的逆转形式,这相当于无限阶数的AR过程。
3.3自回归移动平均(ARMA)模型
假设时间序列是其当前和前期的随机误差项和前期值的线性函数,那么能够表示为:
(7)
那么这个时间序列为自回归平均序列,(7)式是(p,q)阶的自回归移动平均模型,记为ARMA(p,q)。
,,…,为自回归系数,,,…,为移动平均系数,都是模型的待定参数。
那么就可以引入滞后算子B,模型(7)可简记为
(8)
ARMA(p,q)过程的平稳条件就是滞后多项式的根都在单位圆外。
可逆条件是的根都在单根圆外。
如果=0,那么方程
的平稳随机序列是p阶自回归模型,记为AR(p)模型。
很明显的可以看出,AR(p)模型和MA(q)模型全都是ARMA(p,q)模型的特例。
3.4差分自回归滑动平均(ARIMA)模型
差分自回归滑动平均模型,处理非平稳的时间序列,将其转化为平稳的时间序列。
继而将因变量对其的滞后值跟进行回归,同时把随机误差项的现值也进行进行回归,然后建立的模型。
将ARIMA模型进行平稳化处理是,依据对时间序列进行回归处理,然后根据回归中所含的部份的差异,可以分为以下的几类:
移动平均过程(MA(q)过程)、自回归过程(AR(p)过程)和自回归移动平均过程(ARMA过程)以及ARIMA过程。
差分自回归滑动平均模型ARIMA(p,d,q)模型中,每个参数都有不同的意义。
其中,AR指的是“自回归”,p为自回归的项数;MA指的是“滑动平均”,q为指滑动平均的项数,d是指使它成为平稳序列而做的差分的次数(即阶数)。
可以这么说,对看做是ARMA(p,q)模型进行扩展处理可以得到ARIMA(p,d,q)模型。
ARIMA(p,d,q)模型可以表示为:
=(9)
其中L是滞后算子,。
ARIMA模型预测的基本程序
数据平稳化处理:
第一步,检验时间序列数据是平稳的还是非平稳的。
并根据其散点图或者折线图的分析对该序列进行初步判断。
ADF单位根检验一般用来来精确判断这个序列的平稳性。
重复上述过程,直到其成为平稳的序列。
这个时候进行微分处理了多少次,这个次数就是ARIMA(p,d,q)模型当中的阶数d。
从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳确定性信息。
但应指出是,差分运算取出的阶数不应取得太多。
由于差分运算是一种信息的提取和处理,所以在实际操作中要适当的选取差分的次数(即差分的阶数),以避免出现过差分的现象。
一般情况下,差分次数不超过2次。
(1)检验时间序列数据是否是平稳性的。
并根据其散点图或者折线图的分析对该序列进行初步判断。
ADF单位根检验一般用来确定这个序列是否是平稳的。
(2)平稳化处理非平稳序列。
假如该时间序列的数据序列不是平稳的,并且还有一定的变化趋势,那么就要对该数据做差分处理,假如该数据处理时存在异方差,那么就需要技术处理该数据,一直处理到最后得出的数据所做出的自相关函数的值跟偏相关函数的值都是接无限近于零的。
(3)处理一个时间序列时,依据既定的识别规则,创建与之对应的时间序列模型。
对一个平稳序列而言,如果偏相关函数被截断,但自相关函数序列显示拖尾现象,因此可以认为该序列符合AR模型的规则;如果这个序列的偏相关函数是拖尾的,但是该序列的自相关函数却是显示截尾现象,那么就可断定,此序列符合MA模型规则;同时,如果该序列的偏相关函数和自相关函数都显示拖尾的现象,那么这个序列就符合ARMA模型的规则。
一个时间序列的自相关系数趋于零,或偏相关系数趋于零的序列,显示是拖尾现象,这一过程往往会有很多不同的形式,例如,几何衰减序列,又比如说有正弦波形式的衰减;而截尾就是指对于一个时间序列而言,从某一阶数后的自相关系数为0,又或者该序列的偏相关系数为0。
(4)进行参数估计。
(5)诊断该时间序列的残差序列是否为白噪声(可以通过假设检验)。
(6)预测分析是通过以检验的模型进行的。
参数的判断中AIC准则:
AIC信息准则就是Akaikeinformationcriterion,它是一种衡量统计模型拟合优良性的准则,又由于它是日本统计学家赤池弘次所创立和发展的,所以又称为赤池信息量准则。
它可以权衡所估计模型的复杂度和此模型拟合数据的优良性。
参数估计是指确定该时间模型的模型阶数后,然后对其对与之对应的ARMA模型做参数估计。
本文采是采用最小二乘法进行参数估计,但要提醒的是,对移动平均模型(MA模型)进行参数估计比较困难,所以我们应当选取较低阶数的自回归移动模型。
避免出现过度差分而引起的误差过大的现象。
模型试验和模型参数估计的识别后,估计的结果应该被诊断和测试,以找出合适的模型。
若不合适,应该知道下一步作何种修改。
这一阶段主要检验拟合的模型是否合理。
首先对该模型的参数做出显著性检验,其次对该模型是否为白噪声进行检验。
参数估计的意义是Q检验,t检验完成零假设。
该模型的误差项是一个白噪声过程。
4.数据的分析及模型建立
很多因素都会影响到我国的粮食生产,比环境、人力和土地资源、农业科学技术以及发展战略方向等,这些因素之间又存在着错综复杂的关系。
所以很难分析和利用结构的因果模型,预测粮食产量的问题。
将往年的粮食产量整理做时间序列,并找出过去数据的变化规律,然后建立预测模型,并用此来预测我国未来的粮食产量的发展变化,这有着非常重要的意义。
下面以我国2000—2014年我国粮食总产量的数据(见下表)为例,并用时间序列对下面数据进行数据分析处理的过程做出介绍。
4.1数据分析
2000—2014年我国粮食产量(单位:
万吨)如下表:
年份
粮食产量
年份
粮食产量
2000
46,217.52
2008
52,870.92
2001
45,263.67
2009
53,082.08
2002
45,705.75
2010
54,647.71
2003
43,069.53
2011
57,120.85
2004
46,946.95
2012
58,957.97
2005
48,402.19
2013
60,193.84
2006
49,804.23
2014
60,709.90
2007
50,160.28
注:
上表的数据取自中国统计局官网
在ARMA模型中,一个平稳的时间序列可以由一个均值为0的平稳随机过程发展出来,就是指在任何时间段这个序列的随机性不变,在图形上的表现是,在时间序列的所有样本点都在一定水平的随机波动。
对于非平稳时间序列,需要预先对时间序列进行平稳化处理。
建立时间序列模型之前需要检验序列的平稳性,只有平稳序列才能建立时间序列模型。
时间序列的ADF检验是通过Eviews软件进行数据分析,可以判断其稳定性。
根据测试结果,如果得出的测试值的绝对值大于临界值的绝对值,那么就可以判断出,该序列就是平稳序列;否则,为非平稳数据。
利用eviews软件做图,画出我国粮食总产量的曲线图,如下:
从这个图,我们可以清晰地看到,粮食产量总体呈上升趋势,但在2002年到2004年有了下跌的出现,这是对非平稳序列的直观表现形势。
4.2数据平稳化
粮食产量的时间序列是一阶差分的单位根检验,其结果是:
图:
粮食产量时间序列单根检验
由上图的测试结果可以看出,单根为0.609816明显大于10%水平以下的临界值,所以该时间序列存在单位根,故而时间序列是非平稳的时间序列。
4.3模型的定阶
ARIMA模型的参数的确定有不同的定阶方法,自相关和偏相关函数定阶法、FPS准则以及AIC和SC准则是三种广泛使用的方法。
下面是对我国粮食产量时间模型的定阶步骤,如下:
图:
粮食产量一阶差分单位根检验结果图
通过图,可以看出粮食产量异界差分后得到的序列在某一常数附近波动,可初步识别序列已平稳。
并且该序列的ADF检验值为-5.382102,分别小于1%、5%和10%的检验水平的临界值,所以它通过了ADF检验,可以看出该序列是平稳序列。
在此,可以看出一阶差分就已可以消除序列的非平稳性,因此在ARIMA(p,d,q)模型中可以确定:
d=1。
通过观察平稳时间序列的自相关函数的性质,相关函数的性质决定阶数。
做出粮食产量一阶差分序列D(x)的自相关—偏相关图,如下:
分别取几个p,q的值进行检验,所得到的AIC值,然后根据AIC值做出判断。
p,q值
AIC值
p=1,q=1
17.25400
p=1,q=2
16.50130
p=1,q=3
16.49318
p=2,q=1
17.28908
p=2,q=2
16.61116
p=2,q=3
16.02550
p=3,q=1
16.23902
p=3,q=2
16.04907
p=3,q=3
16.39271
从上表,其中p=2,q=3时,AIC值最小。
以此,可以得出:
p=2q=3
所以,我们可以确定模型参数,建立模型ARIMA(2,1,3)
4.4模型有效性检验
通过利用没使用过的时间序列的观测值判断模型的预测能力,这是模型的有效性检验。
利用一部分已有的历史数据,对其进行回归并做出预测。
最后将回归预测处理后得到的结果跟实际值做比较,这样可以简单对模型预测的有效性进行检验。
下面是2010—2014年的粮食产量估计值和真实值得比较及相对误差
表:
2010—2014年估计值与真实值及相对误差
年份
真实值(万吨)
估计值(万吨)
误差(%)
2010
54,647.71
55348.00
1.3
2011
57,120.85
56757.45
0.64
2012
58,957.97
58241.20
1.2
2013
60,193.84
59712.60
0.80
2014
60,709.90
61158.11
0.74
由上表可以看出相对误差最高为1.3%,都小于5%,可以判断出预测结果比较准确,能够基本拟合实际值。
4.5模型预测
表:
2015—2017年我国粮食产量预测
年份
2015
2016
2017
预测产量(万吨)
62607.92
64066.76
65524.09
由上图预测的结果我们可以看出,我国的粮食总产量在将来的几年内将呈现增长趋势。
5.结论
正常情况下,时间序列模型只适合进行短期预测,如果进行长期预测,就可能出现错误的预测结果。
所以模型只能对短期未来几年,中国的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 基于 时间 序列 粮食产量 中的 方法 研究 毕业设计