全国城镇居民消费水平的逐步回归分析Word格式文档下载.docx
- 文档编号:7957881
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:28
- 大小:72.62KB
全国城镇居民消费水平的逐步回归分析Word格式文档下载.docx
《全国城镇居民消费水平的逐步回归分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《全国城镇居民消费水平的逐步回归分析Word格式文档下载.docx(28页珍藏版)》请在冰点文库上搜索。
908
871.8
1983.7
1627.(
2009
15127
1284.2
1228.9
786.9
856.4
1682.6
1472.8
2008
14061
1165.9
1145.4
691.8
786.2
14仃.1
1358.3
2007
12480
1042
982.3
601.8
699.1
1357.4
1329.2
2006
10739
901.8
904.2
498.5
620.5
1147.1
1203
2005
9832
800.5
808.7
446.5
600.9
996.7
1097.5
2004
8880
686.8
733.5
407.4
528.2
843.6
1032.8
2003
8104
637.7
699.4
410.3
476
721.1
934.4
2002
7745
590.9
624.4
388.7
430.1
626
902.3
2001
7324
533.7
548
438.9
343.3
457
690
2000
6999
500.5
565.3
374.5
318.1
427
669.6
1999
6351
482.4
454
395.5
245.6
310.6
567.1
1998
5909
480.9
408.4
356.8
205.2
257.2
499.4
1997
5645
520.9
358.6
316.9
179.7
232.9
448.4
1996
5382
528
300.9
298.2
143.3
199.1
375
1995
4769
479.2
283.8
263.4
110.1
183.2
331
2.2线性回归模型的建立与分析
为了研究全国城镇居民消费水平与各种影响因素的关系,必须要建立他们之
间的数学模型。
数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。
而实际生活中,影响城镇居民消费水平的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立数学模型往往是很难的。
为了便于研究,我们先假定一些前提条件,然后在这些条件下得到简化后的近似模型。
我们假定的前提条件是:
城镇居民家庭人均食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等因素对全国城镇居民消费水平的影响显著,并且成正的线性关系。
由此假设,我们可以建立全国城镇居民消费水平与各种影响因素的线性回归模型,模型如下:
丫1X12X23X34X45X56X67X78X8(2-1)
其中,丫是因变量,Xi是自变量,i是各个自变量的系数。
各变量符号的定义见表2-2。
表2-2线性回归模型中各变量的含义
丫
Xi
X2
X3
X4
X5
X6
X7
X8
全国城镇居民消费水平
城镇居民家庭人均食品消费支出
城镇居民家庭人均衣着消费支出
城镇居民家庭人均居住消费支出
城镇居民家庭人均家庭设备及用品消费支出
城镇居民家庭人均医疗保健消费支出
城镇居民家庭人均交通和通信消费支出
城镇居民家庭人均文教娱乐服务消费支出
城镇居民家庭人均其他消费支出
将数据录入统计软件EXCEL建立统计数据库,首先建立全国城镇居民消费水平与各影响因素的散点图,如图2-1至图2-8所示。
城镇居民消费水平与城镇居民人均食品支出
限
叱DO
图2-1城镇居民消费水平与城镇居民人均食品消费支出的散点图
IK
疾
01:
Qsa
S
城镇居民消费水平与城镇居民人均衣着支出
图2-2城镇居民消费水平与城镇居民人均衣着消费支出的散点图
城镇居民消费水平与城镇居民人均居住支出
15000
10000
5000
*
八八
5001000
城镇居民人均居住支出(元)
5
图2-3城镇居民消费水平与城镇居民人均居住消费支出的散点图
城«
居民消费水平与城镇居民人均家庭设备及用品支出
2?
0)0
13030
15030
12030
100)0
3030
□030
1010
20JO
♦
♦
7^
•
+
200
■too
aoQ
1Q0Q
1200
城tag民人均家處長备眨用是支出<元)
图2-4城镇居民消费水平与城镇居民人均家庭
设备及用品消费支出的散点图
城镇居民s费水平与城镇居民入均医保支出
图2-5城镇居民消费水平与城镇居民人均医保
消费支出的散点图
城镇居民消费水平与城镇居民人均交窗na信支岀
羽
叱
图2-6城镇居民消费水平与城镇居民人均交通
与通信消费支出的散点图
城镇居民Y甫费水平与城镇居民人均文娱支出
20000
18000
16000
14000
IZOOO
lOOOO
6000
eooo
4000
幸护•
—♦
2004C06006001000120014D0160013002DOO
1)^笹居民人均文戻盂出(云)
图2-7城镇居民消费水平与城镇居民人均文娱消费支出的散点图
城镇居民消费水平与城镇居民人均其也支岀
IU
7
图2-8城镇居民消费水平与城镇居民人均其他
从以上的图中不难发现,城镇居民消费水平与城镇居民人均食品消费支出,人均居住消费支出,人均医疗保健消费支出,以及人均交通和通信消费支出等基本具有线性关系。
而城镇居民消费水平与人均衣着消费支出,人均家庭设备及用品消费支出,人均家庭其他消费支出的关系出现了波动,而且从图中也可以看出,这三者对城镇居民消费水平的贡献比较小,它们的变化不足以引起城镇居民消费水平的变化。
除了EXCEL自带的插入图表的功能,同样也可以使用SPSS软件制作散点图,其操作步骤是:
(1)选择菜单GRAPHS/SCATTER/DOT
rransformAnalyze
n~疋倉品支出0
6
2
4
GraphsUtilitiesWirrdciw
Gallery
Interactive
Map
Help
3
9
2.23657
16盯86
1.43274
1.26170:
_75758
3S394
.20948
.04&
31
-_17&
61
-.29309
-.49471
-.620loj-.5587&
-.5628:
^
-^505£
-.53019
-63397
-.55731
-124223
-k377&
Bar—
3*DBar...
Line...
Area...
Pie...
High-Low.,!
Pareto...匚ontrol..,
Boxplot..
ErrorBd畑
P口pul曰tionPyramids.
£
catter/iDot.»
Histogram...
P-P...
Q-Q-
Suqu商FKE
ROCCurve...
Tim普Series
J
557
|03Z
阿
'
1J7
342
30?
泊94
435
977
664
oTT
莎
图2-9SPSS绘制散点图步骤
(2)选择SIMPLESCATTER单击DEFINE。
1Simple
1Scatter
MatrixScatter
Simple
Dot
iDdiwi
■、••—1
*弓L
t
Uhl
Cancel
OvertayScatter
Scatter
丄mri—pI
Scatter/Dot
Jcri-Li"
图2-10SPSS绘制散点图步骤二
⑶丫轴为因变量,选择“城镇居民消费水平”,X轴为自变量,依次选择为“城镇居民家庭人均食品消费支出”,“衣着消费支出”,“居住消费支出”,“家庭设备及用品消费支出”,“医疗保健消费支出”,“交通和通信消费支出”等。
每选择一次点击一次0KSPSS自动绘制相应的散点图。
會Year
“⑥食品吏出
⑥医保去出矽交a夹出斛文娱支岀
⑥ZSG。
就肖畫水平)I苓會Z3匚呢借品支也国岸g>
Zscore倨住地直启⑥加。
昭医保支出}【湮4>
^core(x通支出J
^StandardizedResidual
Yte:
I食消费水平I
XAM9:
I券居住支出
$1Markersby:
LabelCasesby:
P^nelby
Fk^s;
厂Je“sumbl戻(厂心emFyto典Z
Colimns.
厂"
■Jujt■dirahlc:
[noemptycolurnrs)
OK
Paste
Peset
Hdp
SimpleSeatterplot
Templaie
厂IJgectiart;
specificationsfrum:
Fre...I
Thles...IOptions...I
图2-11SPSS绘制散点图步骤三
⑷SPSS绘制的散点图仅做一例,如下图所示,相比于EXCEL自带的图表功能,
SPSS勺图表功能更加简单快捷。
20000.Q0-
15000.00-
10000.00-
5000.00-
0.00-
D.0D
?
00.00
600.1X1900jOQ
1200CO
150D.CO
图2-12SPSS绘制散点图步骤四
经过对所有散点图的分析,我们发现人均衣着消费支出,人均家庭设备及用品消费支出,人均家庭其他消费支出与城镇居民消费水平的线性关系不显著,其原因主要有:
衣服和家庭设备用品都属于耐用品,居民购买的频率不大;
而且它们的价格范围很大,对城镇居民消费水平的反映缺乏真实性。
其他消费支出都在千元以下,对城镇居民消费水平的影响不显著。
综上,人均衣着消费支出,人均家庭设备及用品消费支出和人均家庭其他消费支出这三者都与我们之前的显著性假设相悖,为使得到的模型有显著的线性关系,我们首先从回归模型中排除了这三者。
然后我们用逐步回归的方法对剩下的五个因素进行筛选:
将城镇居民人均食品消费支出,人均居住消费支出,人均医疗保健消费支出,人均交通和通信消费支出,以及人均文教娱乐服务消费支出纳入自变量,使用逐步回归法,选择的判据是变量进入回归方程的F的概率不大于0.05,剔除的判
据是变量进入回归方程的F的概率不小于0.10。
输出结果如表2-3和表2-4所示:
表2-3引入或剔除的变量
Model
VariablesEntered
VariablesRemoved
Method
城镇居民人均文娱消费支出
城镇居民人均食品消费支出
城镇居民人均食品消费支出
城镇居民人均食品消费支出,城镇居民人均文娱
Stepwise(Criteria:
Probability-of-F-to-enter<
=.050,
Probability-of-F-to-remove>
=.100).Stepwise
(Criteria:
=.100).
aDependentVariable:
城镇居民消费水平
表2-4拟合过程小结
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.996(a)
.992
409.57439
.998(b)
.995
322.54440
aPredictors:
(Constant),bPredictors:
(Constant),消费支出
由上面的两个表可以看出:
①.选择的过程是,最先引入了变量X1,建立了模型1;
接着引入变量X,
没有变量被剔除,建立了模型2(含有X1、X7);
最终的模型中含有变量X1
o
②.各模型的拟合情况,模型1的复相关系数R=0.996,可决系数R2=0.992,
调整可决系数为0.992;
模型2的复相关系数R=0.998,可决系数R2=0.995,调
整可决系数为0.995。
可见模型2的拟合度较高,变量Xi、X7的作用显著。
城镇居民消费水平
表2-5方差分析
SumofSquares
df
MeanSquare
F
Sig.
Regression
3539042
353904221.
.000(a)
21.137
137
2109.69
Residual
2851770.021
17
167751.178
Total
3567559
91.158
18
3550914
177545716.
.000(b)
32.917
459
1706.59
1664558
.241
16
104034.890
8
(Constant),
bPredictors:
cDependentVariable:
表2-5的方差分析结果表明,当回归方程为模型1、2时,其显著性概率值
P(Sig)均小于0.001,即拒绝总体回归系数均为0的原假设。
因此,最终的回归方程应当包含城镇居民人均食品消费支出,城镇居民人均
文娱消费支出这2个自变量,且方程拟和效果很好。
Beta
In
Partial
Correlation
Collinearity
Statistics
Toleranee
城镇居民人均居住消费支出
.271(a
)
3.318
.00
.638
.044
城镇居民人均医保消费支出
.166(a
2.285
.03
.496
.072
城镇居民人均交通消费支出
.274(a
2.421
.02
.518
.029
城镇居民人均文娱消费支出
.217(a
3.378
.645
.071
.131(b
.715
.48
.181
.009
-.323(b
-1.83
.08
-.429
.008
.051(b
.333
.74
.086
.013
表2-6逐步回归过程
中排除出模型的变量
aPredictorsintheModel:
(Constant),城镇居民人均食品消费支出
bPredictorsintheModel:
均文娱消费支出
城镇居民人均食品消费支出,城镇居民人
cDependentVariable:
表2-6显示了方程外各模型变量的有关统计量,即标准化偏回归系数Beta、回归系数显著性检验的t值、P(Sig)值、偏相关系数PartialCorrelation、共线性统计的容差CollinearitystatisticToleranee
可见,模型2以外的各变量偏回归系数经检验,P值均较大,考虑到简化方程的需要,排除了这些变量。
表2-7回归计算过程中的方程系数表
Co
efficients(a)
Mol
de
Unstandardized
Coefficients
Standardized
B
Std.Error
(Constan
t)
-795.5
39
232.624
-3.42
.003
城镇居民人均食品消费支出
3.568.
078
.996
45.93
.000
(Constant)
-474.7
25
206.347
-2.30
.035
2.819.
230
.787
12.24
城镇居民人均文娱消费支出
1.956.
579
.217
.004
消费水平
表2-7显示各模型的偏回归系数B、标准差Std.Error、常数Constant、标准化偏回归系数Beta、回归系数显著性检验的t值和P(Sig)值。
按照模型2建立的多元线性回归方程为:
(2-2)
12.819、71.956,
方程中的常数项0474.725,偏回归系数
Y=-474.725+2.819X1+1.956X7
0.004,按a=0.10水平,均
经t检验0,a1,a7的P值分别为0.035、0.000、
有显著性意义。
3.讨论
3.1离群点的筛选
计算残差统计量如下表所示:
表3-1残差统计
Minimum
Maximum
Mean
Std.
Deviation
N
PredictedValue
2887.23
18666.2
8978.78
4441.5427
19
00
090
95
Std.Predicted
Value
StandardErrorof
-1.371
2.181
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 全国 城镇居民 消费水平 逐步回归 分析