大学论文影响考研人数的因素分析.docx
- 文档编号:1957014
- 上传时间:2023-05-02
- 格式:DOCX
- 页数:25
- 大小:142.07KB
大学论文影响考研人数的因素分析.docx
《大学论文影响考研人数的因素分析.docx》由会员分享,可在线阅读,更多相关《大学论文影响考研人数的因素分析.docx(25页珍藏版)》请在冰点文库上搜索。
大学论文影响考研人数的因素分析
影响考研人数的因素分析
摘 要
随着经济的不断发展,一方面社会对人才的需求日渐提高,另一方面我国的就业形势日趋严峻,这样直接导致越来越多的大学生选择考研,考研人数总的发展趋势是增加的,与此同时近年研究生的就业也存在也日趋严峻的问题,所以系统地研究考研人数及其影响因素是很有必要的.本文的主要研究内容就是要通过运用统计预测与决策、数学模型及相关知识来分析影响考研人数变化的部分主要因素,通过这些分析,我们将看到统计预测与决策及数学模型在发展趋势预测类问题研究中的重要作用,并最终建立合理的数学模型来预测分析考研人数发展趋势.
关键词:
统计预测与决策趋势分析干预分析多元回归
AnalysisofTheNumberofPostgraduateEntranceExamination
GePengfeiDirectedbyInstructorJiangShutao
ABSTRACT
Withthecontinuouseconomicdevelopment,increasingsocialdemandsfortalentsontheonehand,ontheotherhandourcountry'semploymentsituationisgettingworse,whichleddirectlytomoreandmorestudentsarechoosingarticlesbytheexaminationoveralldevelopmenttrendistheincreaseinthenumber,whileemploymentofthegraduatesinrecentyearsarebecomingincreasinglyseriousproblemsalsoexist,sosystematicstudyofpostgraduateentranceexaminationanditsinfluencingfactorsinthenumberisnecessary.Themaincontentofthisarticleistousestatisticalknowledgeaboutmathematicalmodelforforecastinganddecisionmaking,andtoanalysethefactorsaffectingthearticlesbysomeofthemainchangesinthenumber,andthroughtheseanalyses,wewillseethestatisticalandmathematicalmodelforforecastinganddecisionintheimportantroleofdevelopmenttrendinthestudyofsuchproblems,andultimatelytoestablisharationalanalysisofmathematicalmodelstopredictgraduatepopulationtrends.
KEYWORDS:
Statisticalforecastinganddecision-makingTrendanalysisInterventionanalysisMultipleregression
前 言
最近几年考研人数发展总趋势是持续增长的,为何会有这么多的学生选择考研呢?
2014年之前近20年内除了2008年以外考研报名人数增长率均大于零,2014年全国硕士研究生招生考试报名人数大约为172万,比2013年减少4万人;但是其中专业学位硕士报名人数68万人,有所增长比2013年增加了9万人.
《2014年全国研究生招生数据调查报告》显示,2014年全国硕士研究生报考热度趋缓,近20年内,考研报名人数继2008年首次下降之后,2014年出现第二次下降.全国各地考研报名人数均呈现不同程度下降趋势,如北京、河北、湖北分别下降7.6%、3.8%、1.24%.
随着社会的不断发展,越来越多的大学生不再满足于本科学历,同时还有就业压力的负面影响,对于大学生考研的研究,越来越受学者们的青睐,各类研究方法层出不穷.
与此同时随着大数据时代的来临,以及电子计算机技术的迅猛发展,统计学的越来越被各类知名学府所重视,统计学被广泛的应用在预测各类问题的发展,发现事物内部各因素之间的关系,本文主要应用了统计学里的统计预测与决策这一工具来分析影响考研人数的因素,进而抓住主要因素,构建合理预测模型,尽量相对准确的预测未来考研人数增长的趋势.
虽然2014年考研大军的增速有所减缓,但是考研人数发展的大趋势还是增长的,本文运用所学统计学知识,干预分析就是从定量分析的角度来评估政策干预或突发事件对经济环境和经济过程的具体影响,而多元回归分析就是研究影响因变量的主要因素的一种模型,所以主要是应用了干预分析模型和多元回归分析两种方法排除某些干预因素研究考研人数发展趋势及分析对考研人数增减有影响的部分主要因素,建立考研人数关于失业率,教育经费及大学生基数等等主要因素的回归模型,相对准确的预测考研人数,并找出影响考研人数的最主要因素,最后给出相应的不成熟的针对性的建议,将对小到学校院系合理制定针对本系本科生考研的激励政策,大到国家政府制定科教兴国,解决大学生就业问题等的重大举措,都有一定的参考意义,合理的人才结构是一个社会健康发展所必不可少的条件,考研人数变化的背后,是各种因素影响的结果。
我们研究研究生人数发展的主要影响因素,进而检验社会各方面采取合理措施,合理改善这些方面因素的影响,使得研究生人数变动真正成为我国人才结构合理化发展的晴雨表.
1知识储备
1.1统计预测的基础介绍
预测就是根据过去和现在的数据来估计未来,预测未来.统计预测归属于预测方法研究范畴,即怎样利用科学的统计学方法对事物的未来发展进行定量推测[1].
1.1.1应用与方法
在市场经济条件下,预测的作用通常是经由各个企业或行业内部的行动计划和决策来实现的;统计预测作用的大小主要是由预测结果所产生的效用的多少决定的.
统计预测方法可归纳分为定性预测方法和定量预测方法两类,其中定量预测法又可大致分为回归预测法和时间序列预测法;按预测时间长短,分为近期预测、短期预测、中期预测和长期预测[2].本文主要应用的方法是定量预测法,其中主要运用了多元线性回归预测法和干预分析模型预测法.
1.1.2统计预测的原则和步骤
原则:
连贯原则,指事物的发展是按一定规律进行的,在其发展过程中,这种规律贯彻始终,不应受到破坏,它的未来发展与其过去和现在的发展没有什么根本的不同;类推原则,指事物必须有某种结构,其升降起伏变动不是杂乱无章的,而是有章可循的,事物变动的这种结构性可用数学方法加以模拟,根据所测定的模型,类比现在,预测未来[3].
步骤:
第一步:
确定预测目标,第二步:
搜索审核资料,第三步:
选择预测模型和方法,第四步:
分析预测误差,改进预测模型,第五步:
提出预测报告.
1.2应用预测分析方法概述及实施
定量预测法注重于事物发展在数量方面的分析,重视对事物发展变化的程度做数量变化的描述,更多地依据历史统计资料,较少受主观因素的影响[4].本文主要运用干预分析模型预测法、多元线性回归预测法.
1.2.1干预分析模型预测法
干预的含义:
时间序列经常会受到某些特殊事件及态势的影响,称这类外部事件为干预.
研究干预分析的目的是从定量分析的角度来评估政策干预或突发事件对经济环境和经济过程的具体影响.
利用干预影响发生前的已知数据,建立一个单变量的时间序列模型,然后利用该模型进行外推预测,求得新的预测值,作为不受干预影响的具体数值,最后用实际值减去预测值,得到的是受干预影响的具体结果,利用这些结果就可以求估干预模型的各个参数.
一是:
利用干预影响产生前的数据,建立单变量的时间序列模型.然后利用此模型进行外推预测,得到的预测值,作为不受干预影响的数值.
二是:
将实际值减去预测值,得到受干预影响的具体结果,利用这些结果估算干预影响的参数.
三是:
利用排除干预影响后的全部数据,识别与估计出一个单变量的时间序列模型.
最后:
求出总的干预分析模型.
1.2.2多元线性回归预测法
社会经济现象的发展变化往往会受到多个因素的影响,因此,一般要进行多元回归分析,我们把包括两个或两个以上自变量的回归分析称为多元回归分析.多元回归与一元回归类似,一般运用最小二乘法估计模型参数,最后需要对模型及模型参数进行统计检验.
(1)二元线性回归模型(以二元线性回归模型为例)
类比使用最小二乘法的方法对参数进行估计.
(2)拟合优度指标检验
标准误差:
对y值与模型估计值之间的离差的一种度量.
其计算公式为:
(3)可决系数的计算及检测
可决系数公式:
表示回归模型不能对因变量y的变差做出任何解释;
表示回归模型对因变量y的全部变差做出解释.
(4)置信范围的计算
置信区间的计算公式为:
置信区间=
其中
是自由度为
的统计量数值表中的数值,
是观察值的个数,
是包括因变量在内的变量的个数.
(5)自相关和多重共线性问题
自相关检验:
多元线性回归模型的基本假设之一就是模型的随机干扰项相互独立即不相关,实际问题中的自相关往往是由于:
变量固有惯性、模型设定偏误、数据的“编造”等原因,如果存在自相关会对参数的估计产生许多不良后果,主要运用D-W检验法检验.
D-W值的计算
其中:
多重共线性检验:
模型中的各个自变量所提供的是各个不同因素的信息,并且回归分析的基本假定里,假定各自变量同其他自变量之间是显著无关的,但是,实际上两个自变量之间可能存在相关关系,这种关系会导致建立错误的回归模型以及得出使人误解的结论.为了避免这个问题,有必要对自变量之间相关与否进行检验[5].
任何两个自变量之间的相关系数为:
经验法则认为,两个自变量的相关系数的绝对值小于0.75或者0.5,表示这两个自变量之间不存在多重共线性问题.如果某两个自变量之间存在高度相关的关系,就有必要把模型中的其中一个自变量删去.
2变量的选取
影响考研人数的定量因素有很多例如:
应届本科毕业生人数、就业情况、GDP、招生人数、教育投入、在校学习成绩等等,考虑到数据的可获性及对考研人数影响的重要性,选取影响考研人数变动的的几个主要定量因素如下:
失业率
—代表就业情况;普通本科生毕业数
—代表研究生人数的基数;教育经费
—代表国家对大学生考研的助力;研究生招生人数
—代表社会和国家对研究生的需求量.
3模型的建立
3.1制作曲线图观查曲线走势
运用spss软件制作考研人数随时间变化的时间序列线性图3-1
图3-1
由曲线走势图3-1看出2008年和2014年数据走势和大体走势明显有差异,绝对数也验证了这一点2008年和2014年是近20年内仅有的两次人数下降,由于2014年后的数据缺失本文以2008年为例运用干预分析模型进行分析,建立模型预测考研人数.(数据见附录)
3.1.1确立初步模型
根据1998~2007年的数据建立一个时间序列模型:
其中,t为自变量,t表示时间,
表示干预事件对因变量的影响,它的确定是整个模型的关键.由于干预的影响是逐渐加强的,它的作用又是长期并且深远的,因此,干预变量可选以下的形式:
其中:
对1998~2007年的数据建立一个时间增长模型,由图像看出比较接近多项式增长模型
运用spss软件对多项式增长模型做以下模型分析和检验
表3-1F检验表
模型
平方和
Df
均方
F
Sig.
1
回归
13787.617
2
6893.809
139.568
.000a
残差
345.757
7
49.394
-
-
总计
14133.374
9
-
-
-
表3-2R方检验表
模型
R
R方
调整R方
标准估计的误差
1
.988a
.976
.969
7.02807
由表3-2看出R,R方,调整R方以及表3-1的F值数值都说明该模型拟合度较好,可以通过参数的显著性检验和整个回归方程的显著性检验.
3.1.2分离数据,估算参数
在此基础上分离出干预因素影响的具体数值,并估算干预模型的参数,用刚才的模型进行2008到2014年考研人数的预测,然后用实际值减去预测值得到的差值,就是08年产生的干预值,记为Zt.所求具体数值见下表3-3:
表3-3干预值表
T
2008
2009
2010
2011
2012
2013
2014
Zt
-35.025
-48.1013
-50.5756
-59.348
-64.9184
-75.3868
-101.053
利用上表3-3的数据,可以估算出干预模型:
的参数
与
,实际上是自回归方程:
的参数:
即:
3.1.3计算净化序列建立拟合模型
净化序列是指消除了干预影响后计算得到的序列,它是由实际的观察序列值减去干预影响值后得到的,即:
对净化系列
建立时间序列模型如下:
表3-4F值检验表
模型
平方和
Df
均方
F
Sig.
1
回归
198126.859
2
99063.430
1436.318
.000a
残差
965.585
14
68.970
总计
199092.445
16
a.预测变量:
(常量),t,VAR00001
b.因变量:
VAR00003
表3-5R方检验表
模型
R
R方
调整R方
标准估计的误差
1
.998a
.995
.994
8.30484
a.预测变量:
(常量),VAR00004,VAR00001
R,R方,调整R方均比优化前优越说明:
该模型拟合度较好,可以通过参数的显著性检验和整个回归方程的显著性检验.
3.1.4组建干预模型
通过以上各步的参数估计,可以组建最终的干预分析模型如下:
其中:
3.1.5预测对比
利用干预分析模型计算出的预测值
与原始数值
比较如下表:
表3-6预测值表
1998
1999
2000
2001
2002
2003
2004
2005
2006
27.143
32.271
39.585
49.085
60.771
74.643
90.701
108.945
129.375
2007
2008
2009
2010
2011
2012
2013
2014
132.097
106.743
107.578
131.803
145.619
168.024
182.819
169.404
进一步做对比图3-2:
图3-2
该图说明预测值和实际值的重合度很高,直观的说明了干预模型取得了相当不错的效果.
3.2多元线性回归预测模型
由于统计年鉴只更新到2013年,故该模型的建立选取了1998年到2012年15组数据运用excl和spss软件进行分析(注:
若无特殊说明,本文中的各类数据检验显著性水平均为0.05).(数据均来自统计年鉴、教育网)(数据见附录)
3.2.1模型的建立
建立以下线性回归模型:
(1)
用spss软件得到如下结果回归模型为:
(2)
3.2.2模型的检验
(6)
拟合优度检验
表3-7R方检验表
模型
R
R方
调整R方
标准估计的误差
1
.986a
.972
.961
9.10733
a.预测变量:
(常量),招生数,失业率,教育经费,毕业生数.
由该表3-7可以看出R=0.986,R方=0.972,调整R方为0.961,意味着回归模型对y的百分之九十六以上变差做出解释,说明该模型总体拟合较好.
(7)F值检验
表3-8F值检验表
模型
平方和
df
均方
F
Sig.
1
回归
28810.442
4
7202.611
86.838
.000a
残差
829.434
10
82.943
总计
29639.876
14
a.预测变量:
(常量),招生数,失业率,教育经费,毕业生数.
b.因变量:
VAR00001
上表3-8格为F值检验可以看到F值为86.838,F值对应p值显著小于0.05,说明在为0.05置信水平下显著通过了F值检验.
小结:
由以上两个检验得,在0.05置信水平下模型显著的通过了拟合优度检验,模型整体能够解释对因变量y百分之九十六以上的变差,模型整体拟合度较好.
(8)变量的显著性t值检验
表3-9系数显著性检验表
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
11.568
16.570
.698
.501
失业率
-2.523
8.011
-.028
-.315
.759
毕业生数
-.011
.218
-.022
-.049
.962
教育经费
7.521
.000
-.123
.459
.056
招生数
2.964
.895
1.133
3.310
.008
a.因变量:
VAR00001
由上述表3-9可以看出四个变量只有最后一个变量研究生招生人数
能通过t值检验,但是模型整体显著的通过了检验,估计存在多重共线性或者自相关.
(9)自相关检验
表3-10D-W检验表
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.986a
.972
.961
9.10733
1.867
a.预测变量:
(常量),招生数,失业率,教育经费,毕业生数.
b.因变量:
VAR00001
以上该表3-10可以看出D-W值为1.867,查表得
=0.49,
=1.70,D-W值在
-2之间故该模型不存在自相关,最大的可能是存在多重共线性.
(10)多重共线性检验
表3-11相关性检验表
失业率
毕业生数
教育经费
招生数
失业率
Pearson相关性
1
.858**
.670*
.471
显著性(双侧)
.001
.006
.077
N
15
15
15
15
毕业生数
Pearson相关性
.858**
1
.968**
.483
显著性(双侧)
.001
.000
.072
N
15
15
15
15
教育经费
Pearson相关性
.670*
.968**
1
.335
显著性(双侧)
.006
.000
.080
N
15
15
15
15
招生数
Pearson相关性
.471
.483
.335
1
显著性(双侧)
.077
.072
.080
N
15
15
15
15
*.在0.05水平(双侧)上显著相关.
**.在.01水平(双侧)上显著相关.
由以上表3-11可以看出变量x3与x1,x2以及x2和x1之间有高度相关性,特别是x2和x1之间,高度相关性就会表现为多重共线性,这应该就是回归模型没有通过t值检验的主要原因.
由变量显著t检验的表3-9可以看出研究生人数(y)和招生数之间的线性拟合度最好,所以应该保留变量x4,再顺次加入其它变量x3、x2、x1对原始模型运用spss软件进行修正逐步回归,如下表:
表3-12系数显著性检验表
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
6.948
5.281
1.316
.213
教育经费
9.113
.000
8.182
1.334
.017
招生数
3.018
.357
1.154
8.451
.000
a.因变量:
y
该表3-12显示两个变量t值对于P值均明显小于0.05,故在0.05置信水平下两变量均显著的通过了t值检验,然后观察R检验表格如下:
表3-13拟合优度检验表
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.996a
.992
.994
8.35751
b.预测变量:
(常量),招生数,教育经费.
表3-14F值检验表
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
28801.701
2
14400.850
206.174
.000a
残差
838.176
12
69.848
总计
29639.876
14
a.预测变量:
(常量),招生数,教育经费.
b.因变量:
VAR00001
对比表3-13和修正前表3-7的
发现
有了很大的改善,所以必须保留下x3,同理将其他新变量逐步添加进来进行修正逐步回归,添加新的变量x2发现有两项检验不能通过,第一是t值检验通不过,第二是系数为负数,即考研人数和毕业本科生人数呈负相关,不符合经济意义检验,实际生活中两者应该呈正相关关系,所以x2应该被删除.添加新变量x1其参数仍为负数,一般来说失业率增长应该会导致更多的本科毕业生选择考研,从而提高自己的素质和就业能力,两者必将呈现正相关关系,所以x1变量也应该剔除.最后通过一系列的检验及校正,得出以下结果
(3)
以上分析在统计意义上进行了各种检验说明,之前选择的四个变量中失业率
和普通本科生毕业数
对考研人数的影响没有想象的那么大,数据表明删除两个变量后,模型的预测效果有了较为明显的改善.
(11)经济意义检验
由(3)式得x3和x4表示的变量教育经费和研究生招生人数都是影响考研人数的主要因素,另外两个变量虽然有一定影响但是系数的正负所表示的经济意义是错误的.该模型的
=0.996,调整
=0.994,都相对较大,说明模型的拟合程度比较高,F值也证明了这一点.
此外失业率
和普通本科生毕业数
对考研人数的影响,从经济意义上来讲都应该是正相关的失业率增加更多的本科生应该会选择考研,毕业生数是考研的基数,从统计概率意义上来说,毕业生数增加考研人数也应该是增加才对,但是
(2)式中明显的系数符号错误,与经济意义不符.
(12)图表拟合检验
用校正后的拟合模型(3)计算历年考研人数的预测值并做折线图3-3
图3-3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 论文 影响 考研 人数 因素 分析