成都人口规模的多因素分析.docx
- 文档编号:9850133
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:17
- 大小:66.54KB
成都人口规模的多因素分析.docx
《成都人口规模的多因素分析.docx》由会员分享,可在线阅读,更多相关《成都人口规模的多因素分析.docx(17页珍藏版)》请在冰点文库上搜索。
成都人口规模的多因素分析
成都市人口规模的多因素分析
一、问题的提出:
人是社会发展最基本的要素。
随着人类社会的不断推进,世界人口呈上升的趋势。
尤其是近几十年来在发展中国家,由于社会、政治方面较为稳定,各国努力发展自身经济,使得居民的生活水平不断提高,生活条件日益改善,从而导致社会总人口持续增长。
固然,人口数增长将创造出更多的劳动力,极大地拉动社会的发展。
但是,人口过多又会导致资源不足、生态失调、社会负担过重等等问题。
影响城市人口发展的因素是多方面的,主要有政治、经济、用地、环境、住房、交通、基础设施等。
各地区政府应该充分认识到这些影响因素,准备地预测并控制本地的人口规模,以保持社会健康、稳定地可持续发展。
我国现在是一个发展中国家,正值经济高速发展的时期。
成都市是中国城市的一个典型代表。
第五次全国人口普查数据显示,成都市2000年11月1日0时常住人口1124.43万人,与全国各城市相比,总人口列直辖市重庆(3090万人)、上海(1674万人)和北京(1382万人)之后,居全国特大城市第四位,位居全国副省级城市首位。
我们将对90年代以来成都市人口规模概况进行多因素分析,找出影响成都市人口发展的影响因素,并对成都市人口规模进行分析、预测、并提出建议。
二、理论依据与数据来源:
(一)理论依据:
据相关理论,城市人口规模预测方法除传统的预测方法外,主要有:
国内生产总值与人口增长的相关性法;人口增长率法;容量规模法;城市建设开发费用分析法等。
且一般老城市人口预测常采用国内生产总值与人口增长的相关性或人口增长率法:
1、国内生产总值与人口增长的相关性法
K=P/G⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
(1)
式中:
K———相关系数;
G———国内生产总值平均年递增率;
P———人口平均年递增率。
利用当年的国内生产总值与相关系数,则可预测人口的规模。
2、人口增长率法
根据统计信息与历史资料,可以得知城镇常住人口多年的自然增长率、加强计划生育工作后得到控制的比率、人口的机械增长率、暂住人口增长率、常住人口与暂住人口比率等等。
据这些指标则可预测出该市的人口规模。
(二)数据来源:
Y
X1
X2
X3
X4
1990
919.5000
1699.000
1870.910
17953.00
1710273.
1991
927.7300
1897.000
2062.980
20007.00
4040628.
1992
936.8600
2029.000
2254.440
19335.00
4720000.
1993
947.3000
2059.000
2807.350
21420.00
10475721
1994
960.3900
2287.000
4239.480
19922.00
8284689.
1995
971.6000
2308.000
5075.820
19813.00
6644806.
1996
980.7400
3328.000
5700.710
20016.00
9429309.
1997
989.1900
3420.000
6046.840
17716.00
9593167.
1998
997.0000
3830.000
6490.180
23218.00
21737295
1999
1003.560
4013.000
7140.960
23319.00
25825592
2000
1013.350
4335.000
7695.000
27448.00
28145800
2001
1019.900
6305.000
8182.000
20191.00
31573619
2002
1028.480
11582.00
8791.000
25026.00
47653770
成都市统计信息网:
中经专网:
http:
//192.168.30.168/index/index.asp
成都市统计年鉴(2003版)
三、因素选取:
基于前面的理论知识,我们将选取以下因素构建模型:
被解释变量:
Y——成都市人口数(万人)
解释变量:
X1——成都市园林绿地面积(公顷)
在发展中国家,随着人类生存条件的逐步改善,人们越来越发现,环境的发展将极大地影响到人类自身的发展。
外界环境对人口的影响是显而易见的。
一个绿树成荫、环境优雅的城市将为其居民营造一个良好的生存生活环境,从而促进人口的发展。
这里用园林绿地面积这个指标来衡量环境这个因素。
X2——成都市居民人均现金收入(元)
前面讲到,用国内生产总值与人口增长的相关性来预测一个城市的人口规模,可见一个地区经济发展状况与人口规模具有非常密切的联系。
这是由于经济发展水平提高,人们的生活条件就能得到改善,就可以有效地避免各种非正常性的死亡,健康地生存下去。
另外,倘若一个城市经济发展迅速,居民生活水平较高就会吸引外来人口的流动,这也为人口增长提供了一个来源。
这里用居民人均现金收入水平来衡量成都市的经济发展状况。
X3——成都市医院床位数(张)
毫无疑问,医疗卫生条件是人口发展的重要因素。
但是,要量化一个城市的医疗卫生条件却比较困难。
为了引入模型进行计量,我们这里用医院床位数来衡量。
X4——成都市保险总承保额(万元)
人们在生活与工作中,总不可避免地遇到一些不确定性的因素,导致意外的发生。
人口的死亡就会有一些非正常的意外死亡。
社会保障体系的建立虽不能直接减少这些意外事故的发生,却可以在总体上对一个社会产生保障作用,从而推动人口的发展。
近年来,我国保险事业发展迅速,引入这个因素应该能对人口发展作一些解释。
U——随机扰动项
一些诸如政策、重大事故、突发事件等也将对人口发展产生一定的影响,这些因素都将被包括在随机扰动项内加以计量。
四、数据分析:
(一)时间序列平稳性检验:
对于时间序列,必须通过平稳性检验才能进行回归估计,否则会产生伪回归。
因此首先应对这五个序列进行平稳性检验:
对Y进行ADF检验:
滞后一期:
ADFTestStatistic
-1.342159
1%CriticalValue*
-5.1152
5%CriticalValue
-3.9271
10%CriticalValue
-3.4104
*MacKinnoncriticalvaluesforrejectionofhypothesisofaunitroot.
AugmentedDickey-FullerTestEquation
DependentVariable:
D(Y)
Method:
LeastSquares
Date:
12/09/05Time:
22:
07
Sample(adjusted):
19922002
Includedobservations:
11afteradjustingendpoints
Variable
Coefficient
Std.Error
t-Statistic
Prob.
Y(-1)
-0.290812
0.216675
-1.342159
0.2214
D(Y(-1))
0.412317
0.351033
1.174581
0.2786
C
272.2067
195.5342
1.392118
0.2065
@TREND(1990)
2.475602
2.080893
1.189683
0.2730
R-squared
0.509198
Meandependentvar
9.159091
AdjustedR-squared
0.298854
S.D.dependentvar
1.947282
S.E.ofregression
1.630546
Akaikeinfocriterion
4.090995
Sumsquaredresid
18.61077
Schwarzcriterion
4.235684
Loglikelihood
-18.50047
F-statistic
2.420789
Durbin-Watsonstat
2.609535
Prob(F-statistic)
0.151272
不平稳。
滞后两期:
,不平稳。
滞后三期:
,不平稳。
由此得:
Y序列不平稳。
同样的方法,可以检验得出:
X1、X2、X3、X4均不平稳。
时间序列不平稳,则不可直接回归,应进一步进行协整性检验,倘若协整才可回归。
此处为多因素模型,其协整较为复杂,这里略去直接做回归。
(二)设置回归模型:
1、模型一:
对Y、X1、X2、X3、X4做回归方程可得:
DependentVariable:
Y
Method:
LeastSquares
Date:
12/09/05Time:
17:
39
Sample(adjusted):
19902001
Includedobservations:
12afteradjustingendpoints
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
904.2668
14.41223
62.74300
0.0000
X1
-0.000995
0.002666
-0.373384
0.7199
X2
0.013932
0.001370
10.16882
0.0000
X3
-0.000156
0.000698
-0.223225
0.8297
X4
3.86E-07
3.88E-07
0.994992
0.3529
R-squared
0.990692
Meandependentvar
972.2600
AdjustedR-squared
0.985373
S.D.dependentvar
33.96828
S.E.ofregression
4.108162
Akaikeinfocriterion
5.958165
Sumsquaredresid
118.1390
Schwarzcriterion
6.160210
Loglikelihood
-30.74899
F-statistic
186.2616
Durbin-Watsonstat
1.090830
Prob(F-statistic)
0.000000
1)经济意义分析:
从经济意义与实际情况来看,我们这里研究的是成都市这样一个小范围内1990-2002年的人口发展趋势。
成都作为发展中国家的一个城市,这十几年来经济、政治、文化等方面都比较稳定。
在这种大环境下,园林绿地面积的增长意味着城市环境的改善,这将有利于人口的增长,即园林绿地面积与人口数应为正相关。
同样,医院床位数代表着城市医疗卫生条件,它与人口增长也应同向发展。
但是模型中X1与X3的系数均为负,这与实际经济意义不相符。
2)由相关系数矩阵:
X1
X2
X3
X4
X1
1.000000
0.905153
0.623965
0.913143
X2
0.905153
1.000000
0.562085
0.875993
X3
0.623965
0.562085
1.000000
0.757084
X4
0.913143
0.875993
0.757084
1.000000
可得:
所选的四个变量有部分的相关系数较高(达0.8以上),可以初步判断模型中存在多重共线性(但无法确定)。
又由F值显著大于临界值,但T检验却不显著,也可一定程度说明该模型可能存在多重共线性。
3)异方差检验(图示法)
X1:
X2:
X3:
X4:
若不存在异方差性,则图示法作出的图形应是一条水平线,表示e不随X的变化而变化。
由上述四个图形基本可以确定异方差存在。
4)自相关检验:
Dw=1.090830(dl=0.574du=2.094),可见落在不可判断区域,不能排除自相关的可能性。
综上,虽然该模型拟合集优度很高,但是各项统计检验的结果却都不好。
所以,该模型不具备良好的统计性质,不是一个好模型,应该加以修正或舍弃。
2、模型二:
选择依据:
一方面,由于模型的对数变换可以使测定变量值的尺度缩小,从而在一定程度上对异方差性进行修正;另一方面,在实际生活中,很多经济活动都更加符合对数模型,因此用该模型对原序列重新进行拟合。
1)逐步引入解释变量:
这种做法等同于逐步回归法,可以保证最终选定解释变量所组成的模型不具有多重共线性。
第一步:
引入一个变量。
分别引入X1、X2、X3、X4做回归,得X2的可决系数最高,为0.967593,所以最佳模型基础为:
LNY=C
(1)*LNX2+C
(2)
第二步:
在第一步所得模型的基础上分别加入X1、X3、X4,得最佳模型为:
LNY=C
(1)*LNX1+C
(2)*LNX2+C(3)(R2=0.989199)
第三步:
在第二步的基础上分别加入X3、X4,得最佳模型为:
LNY=C
(1)*LNX1+C
(2)*LNX2+C(3)*LNX4+C(4)
DependentVariable:
LNY
Method:
LeastSquares
Date:
12/04/05Time:
22:
13
Sample:
19902002
Includedobservations:
13
Variable
Coefficient
Std.Error
t-Statistic
Prob.
LNX1
0.013474
0.004038
3.336870
0.0087
LNX2
0.043830
0.004114
10.65468
0.0000
LNX4
0.006984
0.002714
2.573585
0.0300
C
6.291250
0.016646
377.9389
0.0000
R-squared
0.993778
Meandependentvar
6.883429
AdjustedR-squared
0.991704
S.D.dependentvar
0.037077
S.E.ofregression
0.003377
Akaikeinfocriterion
-8.295922
Sumsquaredresid
0.000103
Schwarzcriterion
-8.122092
Loglikelihood
57.92349
F-statistic
479.1445
Durbin-Watsonstat
1.880757
Prob(F-statistic)
0.000000
第四步:
全部引入,得:
LNY=C
(1)*LNX1+C
(2)*LNX2+C(3)*LNX3+C(4)*LNX4+C(5)
DependentVariable:
LNY
Method:
LeastSquares
Date:
12/03/05Time:
21:
00
Sample:
19902002
Includedobservations:
13
Variable
Coefficient
Std.Error
t-Statistic
Prob.
LNX1
0.013677
0.004330
3.158810
0.0134
LNX2
0.044249
0.004614
9.589956
0.0000
LNX3
0.003656
0.013573
0.269330
0.7945
LNX4
0.006290
0.003852
1.632983
0.1411
C
6.260933
0.113929
54.95471
0.0000
R-squared
0.993834
Meandependentvar
6.883429
AdjustedR-squared
0.990751
S.D.dependentvar
0.037077
S.E.ofregression
0.003566
Akaikeinfocriterion
-8.151103
Sumsquaredresid
0.000102
Schwarzcriterion
-7.933814
Loglikelihood
57.98217
F-statistic
322.3442
Durbin-Watsonstat
1.947515
Prob(F-statistic)
0.000000
可见,虽然在第三步的基础上加入X3后,可决系数从0.993778提高到0.993834,但LNX3与LNX4的t检验却不显著。
所以应剔除X3,最终确定的最佳模型为:
LNY=C
(1)*LNX1+C
(2)*LNX2+C(3)*LNX4+C(4)
LNY=6.291250+0.013474LNX1+0.043830LNX2+0.006984LNX4
2)相关检验:
异方差检验
ARCH检验
ARCHTest:
F-statistic
0.690242
Probability
0.590436
Obs*R-squared
2.565725
Probability
0.463530
TestEquation:
DependentVariable:
RESID^2
Method:
LeastSquares
Date:
12/03/05Time:
21:
19
Sample(adjusted):
19932002
Includedobservations:
10afteradjustingendpoints
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
1.68E-05
7.67E-06
2.194611
0.0706
RESID^2(-1)
-0.448661
0.383436
-1.170108
0.2863
RESID^2(-2)
-0.200080
0.405390
-0.493550
0.6392
RESID^2(-3)
-0.369318
0.439846
-0.839652
0.4333
R-squared
0.256572
Meandependentvar
8.93E-06
AdjustedR-squared
-0.115141
S.D.dependentvar
1.05E-05
S.E.ofregression
1.11E-05
Akaikeinfocriterion
-19.69723
Sumsquaredresid
7.34E-10
Schwarzcriterion
-19.57620
Loglikelihood
102.4861
F-statistic
0.690242
Durbin-Watsonstat
2.228547
Prob(F-statistic)
0.590436
WHITE检验
WhiteHeteroskedasticityTest:
F-statistic
0.545186
Probability
0.788841
Obs*R-squared
8.067457
Probability
0.527363
TestEquation:
DependentVariable:
RESID^2
Method:
LeastSquares
Date:
12/10/05Time:
11:
24
Sample:
19902002
Includedobservations:
13
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
0.003720
0.005133
0.724579
0.5211
LNX1
-0.001226
0.001069
-1.147176
0.3345
LNX1^2
0.000158
0.000182
0.869500
0.4486
LNX1*LNX2
0.000231
0.000207
1.112397
0.3471
LNX1*LNX4
-0.000207
0.000187
-1.108734
0.3484
LNX2
-0.002101
0.002009
-1.045924
0.3724
LNX2^2
-0.000225
0.000132
-1.710851
0.1856
LNX2*LNX4
0.000257
0.000139
1.848031
0.1617
LNX4
0.001254
0.000885
1.415890
0.2518
LNX4^2
-5.48E-05
3.11E-05
-1.763382
0.1760
R-squared
0.620574
Meandependentvar
7.90E-06
AdjustedR-squared
-0.517706
S.D.dependentvar
9.42E-06
S.E.ofregression
1.16E-05
Akaikeinfocriterion
-19.81735
Sumsquaredresid
4.04E-10
Schwarzcriterion
-19.38278
Loglikelihood
138.8128
F-statistic
0.545186
Durbin-Watsonstat
2.737966
Prob(F-statistic)
0.788841
因为ARCH检验和WHITE检验中的P值都较大,说明模型通过了异方差检验,无异方差的存在。
自相关检验
DW检验
N=13,K=3,DL=0.715,DU=1.816
DW=1.880757,即无自相关。
五、模型评价与经济意义分析:
将模型经过对数化修正得到模型二,
LNY=6.291250+0.013474LNX1+0.043830LNX2+0.006984LNX4
经济意义:
成都市园林绿地面积每变化1%(公顷),将引起成都市人口数1.3474%(万人)的变化;成都市居民
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成都 人口 规模 因素 分析