中国粮食产量影响因素分析.docx
- 文档编号:15717209
- 上传时间:2023-07-07
- 格式:DOCX
- 页数:21
- 大小:56.06KB
中国粮食产量影响因素分析.docx
《中国粮食产量影响因素分析.docx》由会员分享,可在线阅读,更多相关《中国粮食产量影响因素分析.docx(21页珍藏版)》请在冰点文库上搜索。
中国粮食产量影响因素分析
中国粮食产量影响因素分析
影响粮食总产量的因素有很多,有的影响因素可能会对粮食产量的预测产生直接的影响,而有些因素的影响可以忽略。
对粮食产量影响显著的因素是必须要考虑的,影响不是很显著的可以忽略。
下面主要选取农业机械总动力、有效灌溉面积、化肥施用量、农村用电量、粮食作物播种面积、受灾面积这六个因素来探讨他们对粮食总产量的影响。
这些变量分别用下面的字母表示。
y:
粮食总产量(万吨)
x1:
农业机械总动力(万千瓦)
x2:
有效灌溉面积(千公顷)
x3:
化肥施用量(万吨)
x4:
农村用电量(亿千瓦小时)
x5:
粮食作物播种面积(千公顷)
x6:
成灾面积(千公顷)
通过查阅各年的中国统计年鉴,搜集整理了从1991年到2010年的粮食总产量、农业机械总动力、有效灌溉面积、化肥施用量、农村用电量、农作物播种面积、成灾面积的数据。
见下表(表一)
表一:
各年的粮食总产量及相关指标数据
shijian
y
x1
x2
x3
x4
x5
x6
1991
43529
29388.6
47800.1
2805.1
963.2
112314
27814
1992
44266
30308.4
48590.1
2930.2
1106.9
110560
25893
1993
45649
31816.6
48727.9
3151.9
1244.8
110509
23134
1994
44510
33802.5
48759.1
3317.9
1473.9
109544
31382
1995
46662
36118.1
49281
3593.7
1655.7
110060
22268
1996
50454
38546.9
50381
3827.9
1812.7
112548
21234
1997
49417.1
42015.6
51239
3980.7
1980.1
112912
30307
1998
51229.5
45207.7
52296
4083.7
2042.1
113787
25181
1999
50838.6
48996.1
53158
4124.3
2173.4
113161
26734
2000
46217.5
52573.6
53820
4146.4
2421.3
108463
34374
2001
45263.7
55172.1
54249
4253.8
2610.8
106080
31793
2002
45705.8
57929.9
54355
4339.4
2993.4
103891
27160
2003
43069.5
60386.5
54014
4411.6
3432.9
99410
32516
2004
46946.9
64027.9
54478
4636.6
3933
101606
16297
2005
48402.2
68397.8
55029
4766.2
4375.7
104278
19966
2006
49804.2
72522.1
55750
4927.7
4895.8
104958
24632
2007
50160.3
76589.6
56518
5107.8
5509.9
105638
25064
2008
52870.9
82190.4
58472
5239
5713.2
106793
22283
2009
53082.1
87496.1
59261
5404.4
6104.4
108986
21234
2010
54647.7
92780.5
60348
5561.7
6632.3
109876
18538
数据来源:
中国统计年鉴
要想知道哪些因素对粮食总产量的影响显著,下面用一些模型方法和Eviews软件对
数据进行分析。
1.多元线性回归:
1.1最小二乘法对数据进行回归
用最小二乘法对数据进行回归,编写程序及相关结果如下
编写程序:
LSycx1x2x3x4x5x6
Eviews运行结果:
DependentVariable:
Y
Method:
LeastSquares
Date:
04/18/12Time:
13:
29
Sample:
19912010
Includedobservations:
20
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-59476.77
17101.57
-3.477854
0.0041
X1
-0.474401
0.194104
-2.444054
0.0295
X2
0.999522
0.549567
1.818744
0.0921
X3
5.260176
0.777593
6.764690
0.0000
X4
2.566848
1.123099
2.285504
0.0397
X5
0.495208
0.053717
9.218897
0.0000
X6
-0.134343
0.031293
-4.293066
0.0009
R-squared
0.984131
Meandependentvar
48136.30
AdjustedR-squared
0.976806
S.D.dependentvar
3424.003
S.E.ofregression
521.4577
Akaikeinfocriterion
15.62035
Sumsquaredresid
3534935.
Schwarzcriterion
15.96886
Loglikelihood
-149.2035
Hannan-Quinncriter.
15.68838
F-statistic
134.3647
Durbin-Watsonstat
2.566516
Prob(F-statistic)
0.000000
结果分析:
从上面的运行结果可以看出方程的拟合优度R2=0.984,调整后的拟合优
度为0.9768,说明模型拟合效果很好。
F值较大,且P值<0.01,表明方程从整体上有较好的解释能力。
但是在5%勺显著水平下,x2(有效灌溉面积)没有通过t检验,另外y(粮食总产量)与x1(农业机械总动力)成负相关,这与经济意义上的是有矛盾的,说明变量之间可能存在多重共线性。
1.2多重共线性的检验和处理
相关系数矩阵
coiieimnoiii
¥
X1
X2
X3
X4
X6
1.000000
0.655164
0.682504
0.712261
0.669736
0.2667B5
-0.54042^
0.655154
1.000000
0.986001
0.976584
0.988368
-0.480110
-0.3S8434
0.882504
0.906001
1.000000
0.977035
0.953872
-0.425019
■0.324712
0.712261
0.976584
0.977035
1000000
0.956742
-0.448734
-0.377653
0.669736
1986360
DJ53872
DJ56742
1.000000
-0.457347
-1454013
0.266785
^0.430110
^0.425019
'0.448734
”0.457347
1000000
0.Q3Q19B
-0.540422
-0.3B6434
-0.324713
*0.377653
-0.454013
0.030198
1.000000
通过对变量间简单相关系数的研究,发现各变量之间都存在相关关系
方差扩大因子法检验多重共线性
将X1作为因变量与其他解释变量作回归的结果
DependentVariable:
X1
Method:
LeastSquares
Date:
04/18/12Time:
13:
46
Sample:
19912010
Includedobservations:
20
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-80523.42
9556.148-8.426346
0.0000
X2
2.682415
0.24214811.07759
0.0000
X3
-0.486127
1.062752-0.457423
0.6544
X4
5.608573
0.38007614.75645
0.0000
X5
-0.210536
0.048003-4.385860
0.0006
X6
-0.001723
0.043085-0.039988
0.9687
R-squared
0.999035
Meandependentvar
55313.35
AdjustedR-squared
0.998690
S.D.dependentvar
19839.56
S.E.ofregression
717.9924
Akaikeinfocriterion
16.23412
Sumsquaredresid
7217184.
Schwarzcriterion
16.53284
Loglikelihood
-156.3412
Hannan-Quinncriter.
16.29243
F-statistic
2898.603
Durbin-Watsonstat
1.783091
Prob(F-statistic)
0.000000
方差扩大因子:
VIF打11000>20,说明解释变量x1与其它解释变量存在
1-RX11-0.999
高度的线性相关。
结论:
通过模型的R2值和参数的t检验及相应的经济意义,相关系数矩阵和方差扩大因子法的多重共线性检验,发现模型存在严重的多重共线性。
运用逐步回归法修正多重共线性
通过逐步回归法首先引入x3,接着引入x5,最后引入x6,得到最优模型如下
逐步回归的最优模型
DependentVariable:
Y
Method:
LeastSquares
Date:
04/18/12Time:
14:
11
Sample:
19912010
Includedobservations:
20
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-29332.38
5076.961-5.777547
0.0000
X3
4.037809
0.21715418.59424
0.0000
X5
0.590800
0.03997714.77851
0.0000
X6
-0.140937
0.031675-4.449505
0.0004
R-squared
0.972236
Meandependentvar
48136.30
AdjustedR-squared
0.967030
S.D.dependentvar
3424.003
S.E.ofregression
621.7174
Akaikeinfocriterion
15.87970
Sumsquaredresid
6184521.
Schwarzcriterion
16.07885
Loglikelihood
-154.7970
Hannan-Quinncriter.
15.91858
F-statistic
186.7610
Durbin-Watsonstat
1.872382
Prob(F-statistic)
0.000000
结果分析:
从上面的最优模型可以得出方程的拟合优度R2=0.972,调整后的拟合优
度为0.967,说明模型拟合效果很好。
F值较大,且Pfi<0.01,表明方程从整体上有较好的解释能力。
在5%的显著水平下,常数项、x3、x5、x6都通过t检验,且x3、x5、x6与y的关系与经济意义符合,所以此模型比较好。
图示法检验序列相关:
1.3序列相关检验
e与e(-1)的散点图
1^00-
8M
400
m0-
肿-
-&M-
■1^00-
-1.00030血1,0001,500
EC-1)
从上面e与e(-1)的散点图可以看出分布无规律,故无自相关现象发生。
故不存在序列相关。
DW捡验:
在5%的显著水平下,n=20,k=4,查表的:
dL=1du=1.68,又duvdv4-du,所以不存在序列相关。
结论:
由图示法和DW检验,都得出不存在序列相关的结论。
故随机扰动项不存在序列相关。
1.4异方差检验
图示法:
预测值yf和残差平方的散点图
从上面的预测值yf和残差平方的散点图可以看出两者之间没有规律性,故不存在异方差。
戈德菲尔特一夸特
将自变量的20个样本值从小到大排列,去掉中间的四个样本,剩下的划分为两组,每组样本有8个,自由度为4。
对每组样本分别求出回归模型,在求出各自的残差平方和RSS和RRS,得到统计量F。
1991年一1998年的样本回归结果
DependentVariable:
Y
Method:
LeastSquares
Date:
04/18/12Time:
18:
28
Sample:
19911998
Includedobservations:
8
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-25990.10
16565.18
-1.568960
0.1917
X3
4.751595
0.503412
9.438782
0.0007
X5
0.544577
0.156390
3.482173
0.0253
X6
-0.163259
0.054696
-2.984811
0.0405
R-squared
0.982100
Meandependentvar
46964.58
AdjustedR-squared
0.968674
S.D.dependentvar
3007.449
S.E.ofregression
532.2916
Akaikeinfocriterion
15.69911
Sumsquaredresid
1133337.
Schwarzcriterion
15.73883
Loglikelihood
-58.79645
Hannan-Quinncriter.
15.43121
F-statistic
73.15260
Durbin-Watsonstat
2.693181
Prob(F-statistic)
0.000597
2003年-2010年的样本回归结果
DependentVariable:
Y
Method:
LeastSquares
Date:
04/18/12Time:
18:
28
Sample:
20032010
Includedobservations:
8
Variable
Coefficient
Std.Errort-Statistic
Prob.
C
-16529.06
31946.29-0.517401
0.6322
X3
5.379611
4.3386311.239933
0.2828
X5
0.395260
0.4985840.792765
0.4723
X6
-0.093577
0.066889-1.398997
0.2344
R-squared
0.976798
Meandependentvar
49872.98
AdjustedR-squared
0.959397
S.D.dependentvar
3764.186
S.E.ofregression
758.4912
Akaikeinfocriterion
16.40739
Sumsquaredresid
2301235.
Schwarzcriterion
16.44711
Loglikelihood
-61.62957
Hannan-Quinncriter.
16.13949
F-statistic
56.13359
Durbin-Watsonstat
2.456816
Prob(F-statistic)
0.001002
F=RRSRSS=758.4912/532.2916=1.425
查表:
Fo.o5=6.39,1vFvFo.o5=6.39,因此残差不存在异方差。
格莱泽检验:
通过将残差与各个变量进行回归,发现没有任何一个回归模型通过检验,所以原模型不存在异方差。
怀特检验:
怀特检验结果
HeteroskedasticityTest:
White
F-statistic
1.330035
Prob.F(9,10)
0.3302
Obs*R-squared
10.89681
Prob.Chi-Square(9)
0.2828
ScaledexplainedSS
4.040587
Prob.Chi-Square(9)
0.9087
从上面的结果中可以看出:
Obs*R-squared=10.8968,其相伴概率为0.2828,故接
受零假设,即认为模型不存在异方差。
结论:
通过图示法、戈德菲尔特一夸特检验、格莱泽检验和怀特检验,都得出模型不存在异方差的结论,所以模型不存在异方差。
通过多重共线性,异方差、序列相关的检验,最终求得粮食总产量的最优模型为:
逐步回归的最优模型,其中变量是x3:
化肥施用量(万吨)、x5:
粮食作物播种面积(千公顷)、x6:
成灾面积(千公顷)。
粮食总产量的模型可表示为:
y=-29332.38+4.037809*x3+0.5908*x5-0.140937*x6
1.51990年的粮食总产量预测
y:
粮食总产量(万吨)x1:
农业机械总动力(万千瓦)
x2:
有效灌溉面积(千公顷)
x3:
化肥施用量(万吨)
x4:
农村用电量(亿千瓦小时)
x5:
粮食作物播种面积(千公顷)
x6:
成灾面积(千公顷)
根据1991年的中国统计年鉴,查到了1991年的粮食总产量、农业机械总动力、有效灌溉面积、化肥施用量、农村用电量、粮食作物播种面积、成灾面积的相关数据见下表。
1991年的相关数据
y
X1
X2
X3
X4
X5
X6
44624.3
28707.7
47403.1
2590.3
844.5
113466
17819
根据得到的粮食总产量模型y=-29332.38+4.037809*x3+0.5908*x5-0.140937*x6将1991年的化肥施用量、粮食作物播种面积、成灾面积的相关数据代入到粮食总产量模型中,得到1991年的粮食总产量预测值。
预测值:
y=-29332.38+4.037809*2590.3+0.5908*113466-0.140937*17819=45651.11
和实际的44624.3相比,误差为2.3%,预测的结果基本上还是可以的。
区间预测:
根据1991年的预测值,1991年的影响粮食总产量的显著影响因素化肥施用量、粮食作物播种面积、成灾面积的相关数据及模型的结果可以对1991年的粮食总产量进行区间预测,其步骤和过程见下面。
对于模型Y=xB
给出解释变量的预测值X。
=1,X10,X20,……,xk0,代入上式求得预测值Y0=X°B?
给出显著性水平:
•,则预测值Y0的1001-:
%的置信区间为(其中?
^SE):
纟-t-.(n-k-1)・SE仁1X0(XX),X0:
:
:
Y0:
:
:
Y?
)t.(n-k-1)1•X0(XX)‘X0
22
1.首先定义一个20行4列的X矩阵,编程为:
matrix(20,4)X矩阵X中的元素如下表。
矩阵X中的元素
3
X3
X5
X6
1.000000
2805.100
112314.0
27814.00
1.000000
2930.200
110560.0
25893.00
1.000000
3151.900
110509.0
23134.00
1.000000
3317.900
109544.0
31382.00
1.000000
3593.700
110060.0
22268.00
1.000000
3827.900
112548.0
21234.00
1.000000
3980.700
112912.0
30307.00
1.000000
4083.700
113787.0
25181.00
1.000000
4124.300
113161.0
26734.00
1.000000
4146.400
108463.0
34374.00
1.000000
4253.800
106080.0
31793.00
1.000000
4339.400
103891.0
27160.00
1.000000
4411.600
99410.00
32516.00
1.000000
4636.600
101606.0
16297.00
1.000000
4766.200
104278.0
19966.00
1.000000
4927.700
104958.0
24632.00
1.000000
5107.800
105638.0
25064.00
1.000000
5239.000
106793.0
22283.00
1.000000
5404.400
108986.0
21234.00
1.000000
5561.700
109876.0
18538.00
2.定义一个行向量xO,其中的元素是1和1991年的化肥施用量、粮食作物播种面积、成灾面积的相关数据。
编程:
Rowvector(4)xO
X0中的相关数据
1
2590.3
113466
17819
3.令T=X0(XX)」X,
编程为:
matrixT=xO*@
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国 粮食产量 影响 因素 分析