建模范文Word格式文档下载.docx
- 文档编号:3821289
- 上传时间:2023-05-02
- 格式:DOCX
- 页数:38
- 大小:351.55KB
建模范文Word格式文档下载.docx
《建模范文Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《建模范文Word格式文档下载.docx(38页珍藏版)》请在冰点文库上搜索。
1982年第三次人口普查得到的出生婴儿性别比是108.47,1995年0~4岁人口的平均性别比是118.38,1996年是119.98,1997年是120.14。
2000年第五次人口普查得到的0~4岁人口的平均性别比是120.17。
以107为最高警戒线,我国婴幼儿人口的性别比比正常值高出了许多。
世界城市化历史表明,如果一个国家或地区的城市化水平超过30%,这个国家或地区就会进入快速城市化时期[1]。
第五次人口普查发现,我国城市人口占全国总人口的比重已经超过36%。
在2000年之后,如果城市人口占总人口的比重每年再增长一个百分点,那么现在中国的城市化水平已经达到了39%——这就预示着我国城市人口的总量已经接近或者超过了5亿人。
从中国的实际情况和人口增长的特点出发,根据相关数据及文献,建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;
并在最后给出模型中的优点与不足之处,在此基础上,提出模型的推广。
2模型的假设
2.1假设在预测时间范围内,我国的相关人口政策、政治及自然灾害不会出现特别大的变动,以免引起人口出生率、死亡率和自然增长率大的波动。
2.2人口增长中短期为1-20年,长期为20年以上。
2.3老年人口年龄从65岁开始计算,劳动人口年龄为15-64岁。
3模型符号的说明
符号
符号说明
r
年龄
t
时间
[r1,r2]
妇女育龄区间
(r,t)
死亡率
(t)
育龄妇女总和生育率
R(r,t)
女性比例函数
h(r,t)
妇女生育模式
p(r,t)
人口年龄密度函数,表示t时刻r年龄的人口数
F(t)
人口总数关于时间变化的函数
4模型的建立与求解
在整个人口预测过程中,我们需要中国自改革开放以来历年的人口数据。
如我国1978-2005年人口总数、年出生率、死亡率、自然增长率、老年人口比例、城镇人口比例和性别比等等,但附录2只给出2001-2005年5年内的部分数据,作预测时,可能偏差较大,因此我们参考国家统计局公布的第五次人口普查数据,建立模型进行人口增长预测。
由于根据附录2提供的全国市、镇、乡的人口总数,推算出全国人口总数与实际人口总数相差很大,所以我们根据实际人口总数和给出普查的市、镇、乡人口的比例得到实际各地区的人口数,即:
镇实际人口数和乡实际人口数同理都可以得到。
接下来所用的数据,如果不加特殊说明,数据来源一是来源于题目中附录,二是参照历年的《中国人口统计年鉴》。
结合我国的实际情况和人口增长的特点,按以下流程图进行预测分析:
4.1人口数量的模型建立与求解
4.1.1人口数量特点的分析
从人口转变角度看,中国历史上的人口始终处在传统阶段。
而到20世纪中叶以后,人口才开始进入转变阶段,使得出生率和死亡率的差距拉大,人口增长急剧加快,形成了现代人口的高速增长。
1950-1995年间,中国人口实际的年平均增长率达到17.3‰,是历史上和平时期年平均增长率(以7‰计)的2.5倍。
考虑到70年代以来计划生育因素的影响,这样,以1970年为分界来看人口增长率,1950-1970年年平均增长率为20.48‰,1971-1995年为14.75‰,前者比后者高出近6个千分点。
假设1971-1995年继续保持1950-1970年的高人口增长率,那么1995年的总人口将是近14亿,而不是12亿,多出2亿人。
进入到21世纪,人口增长率继续降低,并且一直维持在个位数。
综上所述,我国人口数量在不断增长的大背景下,增长的幅度逐渐降低。
鉴于此,根据我国的实际情况,结合假设1,建立数学模型,并逐步改进模型的缺点,得到我国人口数量的未来总趋势。
4.1.2人口总数的模型建立及求解
模型一:
时间序列分析
由于70年代计划生育政策使得1970年的人口增长率波动很大,之后趋于稳定变化。
在这里,我们取1978-2005年的人口总数量进行时间序列分析预测。
时间序列分析中,包括AR模型(自回归模型)、MA模型(移动平均模型)和ARMA模型(自回归移动平均模型)。
具有如下结构的模型称为p阶自回归模型,简记为AR(p):
特别当
=0时,称为中心化AR(p)模型,称yt为xt的中心化序列,令
,
,引进延迟算子B,中心化AR(p)模型又可简记为:
,自回归系数多项式为:
具有如下结构的模型称为q阶自回归模型,简记为MA(q):
时,称为中心化MA(q)模型。
引进延迟算子B,中心化MA(q)模型又可简记为:
,q阶移动平均系数多项式为
。
具有如下结构的模型称为自回归移动平均模型,简记为ARMA(p,q):
时,称为中心化ARMA(p,q)模型。
引进延迟算子B,中心化ARMA(p,q)模型又可简记为:
,p阶自回归系数多项式为:
q阶移动平均系数多项式为:
根据上述理论知识,建立模型,利用SAS软件得到(程序见附录1):
(1)人口总数模型:
,
(2)人口增长率模型:
xt表示第t年人口数,xt-1表示第t-1年的人口数。
表1人口总数模型的参数检验
参数
估计值
标准误
t值
Pr>
|t|
-0.69094
0.18808
3.67
0.0011
表2人口增长率模型的参数检验
-0.87532
0.14690
-5.96
<
0.0001
从上述两个表,可以发现人口总数模型和人口增长率模型个参数都能通过检验。
接下来得到50年内的人口总数如下表3及人口总数预测值曲线和预测值95%的置信区间曲线如图1,人口增长率变化趋势如图1:
表32001-2050年人口预测总数单位:
万人
年份
总人口
2001
127627
2011
135440
2021
141120
2031
145260
2041
148270
2002
128453
2012
136030
2022
141590
2032
145600
2042
148520
2003
129230
2013
136640
2023
142040
2033
145940
2043
148770
2004
129988
2014
137230
2024
142470
2034
146260
2044
149000
2005
130756
2015
137830
2025
142900
2035
146570
2045
149230
2006
131680
2016
138420
2026
143320
2036
146880
2046
149450
2007
132540
2017
139010
2027
143740
2037
147170
2047
149670
2008
133500
2018
139580
2028
144140
2038
147460
2048
149880
2009
134130
2019
140130
2029
144530
2039
147740
2049
150080
2010
134880
2020
140640
2030
144900
2040
148010
2050
150270
图1人口总数和自然增长率变化趋势
从表1和图1可以发现,我国人口总数在2030年将达到14.49亿,2050年人口总数为15.027亿。
但是从图1中获人口增长率模型中,我们可以知道经过22年之后,人口增长率为负数,这就意味着人口将不再继续增长。
因此我们根据预测的人口增长率推出以后每年的人口总数,得出每年总人口和人口增长率变化趋势如图2:
图2人口总数与自然增长率变化趋势
从图2中,可直观的发现:
当人口增长率在2027年降低到负数时,人口总数达到最高峰。
但上述时间序列预测法考虑的只是时间参数,没有考虑生育规律和政策干预进行控制的情况,不太符合实际情况,其结果仅供参考;
而人口发展方程结合政策控制因素,比较真实反映了人口动态变化的过程,并且有效考虑到每年的自然增长率,因此,我们将利用人口发展方程预测我国未来人口总数。
模型二:
人口发展方程
人口发展方程是一种控制人口模型。
反映人口发展过程的最基本的特征量是人口分布密度p(r,t)(即人口的按龄构成或称人口状态),而p(r,0)正是根据由人口统计数据给出的初始条件,通过求解人口发展方程而得到。
人口发展方程的基本形式为:
(1)
在人口系统中,人口的总数的变化受到生育率,死亡率,移民三方面的直接控制。
这一规律可用一定的数学公式给予描述(暂不考虑移民的影响)。
在固定时间区间
内,t时刻(t通常以年为单位),人口的变化可由
(1)式简化为:
(2)
具体简化过程见参考文献[2]。
方程
(2)得解可由如下方程给出:
可得:
上式的离散形式为:
(tm=T,m为正整数)(3)
在式(3)中,出生率(t),死亡率(t)与原人口系统中的上述概念不同。
在人口普查中可直接得出上述参量的统计值,t以年为单位,生育率(t),等于当年生育妇女数/妇女总数,可以从当年新出生的婴儿数与t年人口总数的统计中得出;
死亡率(t)等于当年死亡人数/上年人口总数,也可直接从统计结果中得出。
故生育率,死亡率和女性比例函数都是关于时间t的阶梯函数,人口总数的计算公式为:
(4)
式(4)在实际中计算非常方便。
编程输入初态人口总数
和各年的出生率、死亡率、女性比例函数,即可得出各年的人口总数。
自然增长率=(t)*R(t)-(t),
=F(2001)=1276270000。
因为出生率必须要大于零,在这里假设中国在未来50年的出生率不小于0.4%,自然死亡率约为0.612%,且当出生率达到0.4%时,就不再降低。
根据2001~05年的年均自然增长率,进行线性拟合(程序见附录2)。
得到自然增长率y与时间t的模型:
y=-0.27t+547.044。
根据自然增长率y=(-0.27t+547.044)*0.001=0.001*(4.5-6.12),可得当t=39时,自然增长率开始维持在-0.212%,运用MATLAB软件得到人口总数的预测值(程序见附录3),如图3和表4:
图3人口总数变化趋势
表4人口总数预测值单位:
总人数
127630
135290
139590
140140
138580
128530
135880
139820
139980
129400
136430
140010
139830
138270
130250
136950
140160
139670
138120
131060
137440
140280
139510
137960
131850
137890
140360
139360
137810
132600
138300
140400
139200
137650
133320
138680
139050
137500
134010
139020
140370
138890
137340
134660
139320
140300
138740
137190
从图3和表4中看出,预测的人口总数在2027年达到最高峰14.04亿,与第一种模型预测的高峰期相同,但数值上存在差异。
分析发现,自然增长率降低比较缓和,而上述拟合的自然增长率降低过快,因此,改进原先的自然增长率模型,得到新的模型:
y=-0.2691t+547.044。
当t=39时,自然增长率将维持在-0.212%,使用MATLAB软件得到预测人口总数图表,如下:
图4改进后人口总数变化趋势
表5改进后的人口预测总数单位:
137750
144730
148020
147200
128760
138600
145230
148140
129870
139420
145700
148210
130950
140200
146120
148250
132010
140950
146510
148240
145950
133040
141670
146860
148200
145640
134040
142360
148110
145340
135010
143000
147440
147990
145030
135960
143610
147680
147820
144720
136870
144190
147870
147510
144410
从表5和图4中,我们得知中短期和长期的人口预测总数。
在2034年人口总数达到最高峰14.825亿。
至此,我国人口总数的中短期和长期预测结束,本文将在第五部分模型的评价中具体说明上述预测模型的优点和缺点。
4.2人口结构变化趋势
4.2.1出生率和死亡率变化趋势
参考2002年中国人口统计年鉴,得到1978-2001年每年的出生率和死亡率。
然后利用时间序列分析分别预测2002之后的出生率和死亡率(具体方法参照前面4.1中的介绍,SAS程序见附录4,模型都通过检验)。
得到图5:
图5我国出生率与死亡率的五阶段
早期,朗德里和汤普逊等人口学家曾经试图用分类的方法描述由高出生、高死亡状况向低出生、低死亡状况的转变。
1947年,布莱克把人口转变过程分为以下五个阶段:
第一,高静止阶段(HS)。
其特征是高出生率和高死亡率,人口处于基本上没有增长的静止状态。
第二,初期膨胀阶段(EE)。
其特征是出生率保持高水平不变,死亡率开始下降。
死亡率下降是由于在经济发展的刺激下公共保健服务的增加,但下降速度很缓慢,因为还缺乏资金、药物、病床和医生等必备条件。
第三,后期膨胀阶段(LE)。
其特征是经济进一步发展后,死亡率下降到接近可能达到的最低限度,出生率也迅速下降,但出生率仍高于死亡率。
人口增长的速度开始缓慢下来。
第四,低静止阶段(LS)。
其特征是彼此抵消的低出生率和低死亡率,人口在此基础上达到新的平衡。
通常这一阶段,工业化、城市化都达到了较高水平。
第五,下降阶段(D)。
其特征是低出生率和低死亡率,但死亡率超过了出生率,人口处在绝对减少的状态[3]。
布莱克的人口转变论的五阶段划分,根据图5显示,较好的说明了我国人口出生率和死亡率的变化趋势。
但可能由于我国计划生育政策和基本国情的影响,在时间期限上存在误差。
4.2.2城镇化人口比例预测
我们从2002年《中国统计年鉴》和附录2所给的数据,得到1990-2005年我国城镇化比例。
利用SAS软件拟合数据,得到Logistic模型(程序见附录5):
,y表示第t年城镇化人口比例。
模型检验如下:
整个模型拟合的效果很好,而且各参数都通过检验。
所以可以接下来进行预测。
利用SAS软件画出历年的城镇化人口比例及拟合模型的曲线,如图6:
图6Logistic模型预测城镇化人口比例趋势
在这里,我们假设我国城镇化人口比例将趋于70%.从图7可清晰地看出我国近些年城镇化人口比例不断上升,到2030年后,增长速度开始放慢,大概在2050年趋于70%。
4.2.2.1城镇化人口比例与GDP的关系
采用1990-2005年中国城镇化人口比例和GDP值进行模型拟合。
根据所得的城镇化比例与GDP的散点图7,利用一元线性回归模型进行拟合。
运用SAS软件得到模型为(程序见附录6):
y=8203.83618*x-191369。
模型的检验如下:
图7城镇化比例与GDP的散点图与拟合曲线图
模型不仅在整体上效果较好,而且各参数都通过检验。
也由此模型反映了GDP和城镇化比例有很强的线性关系。
但可以发现,该模型只能对近期预测,因为当城镇化人口比例达到一个值不变时,GDP可能会变,对于该模型的优缺点会在第五部分详细说明。
4.2.2.2城镇化与劳动人口率的关系
可以得到2001-2005年我国城镇化人口比例与城镇劳动人口城镇人口的比率,参考它们的散点图,同样建立一元回归,运用SAS软件得到拟合模型(程序与上面相似,故省略):
y=1.85901*x。
检验如下:
模型的常数没有通过检验,变量通过检验。
模型为一个正比例函数,即当自变量城镇劳动人口占城镇总人口比例为零时,因变量城镇化人口比例也为零,这种结论是非常符合实际的。
4.2.2.3城镇化与老年化的关系
我们选用1997-2003年城镇化人口比例与老年化比例的数据,利用SAS软件进行拟合,方法与上面一致(程序略),得到模型:
y=0.03572+0.09871*x,y表示老年化比例,x为城镇化人口比例。
从模型中清晰发现,城镇化人口比例增加,老年化比例也随着增加。
随着我国经济的不断发展,农村和城市的生活水平也随之不断提高,但总的来说,城市生活水平高于农村生活水平。
因此,当农村人口城镇化,生活水平提高,在一定程度上会使人的寿命增加,即老年化比例增加。
4.2.2.4城镇化与乡村劳动力之间的关系
选用1990-2005年的数据,得到我国城镇化与乡村劳动力之间的模型:
y=-73.88967+0.00229x,y表示城镇化比例,x表示乡村劳动力。
检验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 建模 范文