多元线性回归实例分析.docx
- 文档编号:9495422
- 上传时间:2023-05-19
- 格式:DOCX
- 页数:26
- 大小:237.23KB
多元线性回归实例分析.docx
《多元线性回归实例分析.docx》由会员分享,可在线阅读,更多相关《多元线性回归实例分析.docx(26页珍藏版)》请在冰点文库上搜索。
多元线性回归实例分析
SPSS--回归-多元线性回归模型案例解析!
(一)
多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理
差不多,区别在于影响因素(自变量)更多些而已,例如:
一元线性回归方程为:
丫=十卩©十£
毫无疑问,多元线性回归方程应该为:
Y=0十艮&十角兀2+…十£
上图中的x1,x2,xp分别代表自变量”xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:
记n组样本分别是心…,备=12…・丹)■令
那么,多元线性回归方程矩阵形式为:
r=
yi
■
■
*
<1
1
■w
■
■
工|1
X2I
兀12
X22
*»tv]
厂A?
A
■
■
■
■£二
&2
1儿J
J
…兀即丿
和不可解释的误
其中:
代表随机误差,其中随机误差分为:
可解释的误差
差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)
2:
无偏性假设,即指:
期望值为0
3:
同共方差性假设,即指,所有的随机误差变量方差都相等
4:
独立性假设,即指:
所有的随机误差变量都相互独立,可以用协方差解释。
今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据
为例,分析汽车特征与汽车销售量之间的关系。
通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。
数据如下图所示:
sales
nestle
type
price
eng:
ine_s
horsepow
wheelbas
width
length
curt
1691?
16.360
0
21.5D0
1.8
140
101.2
673
172.4
39384
19675
0
28.400
3.2
225
1081
703
192.9
14.1U
18.225
0
+
3.2
225
106.9
70.5
192.0
858&
29725
0
42000
35
210
1146
71.4
1966
20.397
22255
0
23.990
1.8
150
102.S
69.2
178.0
13.780
23.555
0
33950
28
200
1087
76.1
192.0
1380
39000
0
62.000
4.2
310
1130
740
1982
19747
-
0
26.990
2.5
170
107.3
68.4
1760
9231
2S675
0
33400
28
193
107J
635
1760
17637
36.125
0
38.900
2.8
193
111.4
70.9
188.0
91561
12475
0
21975
3.1
175
1090
727
1946
39.360
13740
0
25.300
38
240
109.0
727
1962
27.851
20190
0
31.965
3.8
205
1138
74.7
2068
33257
13360
0
27.8S5
36
205
1122
735
200.0
6372&
22525
0
39.B95
4.6
275
115.3
74.5
2072
16943
27.100
0
44475
46
275
112.2
750
2010
6.536
25725
0
39.665
4.6
275
108.D
75.5
2006
11185
18225
0
31.010
30
200
1074
70.3
194.a
1478S
-
1
46.226
5.7
255
117.5
77.0
201.2
U5.51&
9250
0
13.260
2.2
115
104.1
679
ieo9
135126
11225
0
16535
3.1
170
1070
694
190.4
24.62&
10310
0
18.890
3.1
175
107.5
72.S
2009
42.S93
11525
Q
19390
34
130
1105
721
197.9
将销售量”作为因变量”拖入因变量框内,将车长,车宽,耗油率,车净重等10个自变
量拖入自变量框内,如上图所示,在方法”旁边,选择逐步”当然,你也可以选择其它
的方式,如果你选择进入”默认的方式,在分析结果中,将会得到如下图所示的结果:
(所有的自变量,都会强行进入)
輸入/曙去的娈量&
输入的娈量
稷去的夷量
方法
1
车竄Priceintliausancts,Vehicletype*车毘Enginesize,Fuelcapacity,Wneelbase,车痒圭Horse
a.已输入所有请茨的吏量•
to.因变呈:
Losa-transformedsales
如果你选择逐步”这个方法,将会得到如下图所示的结果:
(将会根据预先设定的“F统计
量的概率值进行筛选,最先进入回归方程的自变量”应该是跟因变量”关系最为密切,贡
献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概
率值必须小于0.05,当概率值大于等于0.1时将会被剔除)
验入/静去的吏量日
輛入的变量
移去的变量
1
Priceinttiousands
1
歩进(准则:
F-to-enter的輕$<=0SQ‘F-to-remove的IS率匸100)*
2
Whe创b幅e
i
歩进(准则;F-to-enter的梱率*=.05$FF-to^remove的棚率匸100)-
a.囲变董:
Log-transformedsales
选择变量(E)"框内,我并没有输入数据,如果你需要对某个自变量”进行条件筛选,可以
将那个自变量,移入选择变量框”内,有一个前提就是:
该变量从未在另一个目标列表中
出现!
,再点击规则”设定相应的筛选条件”即可,如下图所示:
点击统计量”弹出如下所示的框,如下所示:
在回归系数”下面勾选估计,在右侧勾选”模型拟合度“和”共线性诊断“两个选项,再勾选个案诊断”再点击离群值”一般默认值为“3”(设定异常值的依据,只有当残差超过3
倍标准差的观测才会被当做异常值)点击继续。
提示:
共线性检验,如果有两个或两个以上的自变量之间存在线性相关关系,就会产生多重共线性现象。
这时候,用最小二乘法估计的模型参数就会不稳定,回归系数的估计值很容易引起误导或者导致错误的结论。
所以,需要勾选共线性诊断”来做判断
通过容许度可以计算共线性的存在与否?
容许度T0L=1-RI平方或方差膨胀因子
(VIF):
VIF=1/1-RI平方,其中RI平方是用其他自变量预测第I个变量的复相关系数,
显然,VIF为TOL的倒数,TOL的值越小,VIF的值越大,自变量XI与其他自变量之间存在共线性的可能性越大。
提供三种处理方法:
1:
从有共线性问题的变量里删除不重要的变量
2:
增加样本量或重新抽取样本。
3:
采用其他方法拟合模型,如领回归法,逐步回归法,主成分分析法。
再点击绘制”选项,如下所示:
上图中:
DEPENDENT因变量)ZPRED(标准化预测值)ZRESID(标准化残差)DRESID(易V
除残差)ADJPRED(修正后预测值)SRSID(学生化残差)SDRESID(学生化剔除残
差)
一般我们大部分以自变量”作为X轴,用残差”作为Y轴,但是,也不要忽略特殊情况,这里我们以“ZPRE(标准化预测值)作为"X"轴,分别用“SDRESID(血生化剔除残差)”和“ZRESID标准化残差)作为Y轴,分别作为两组绘图变量。
再点击”保存按钮,进入如下界面:
如上图所示:
勾选距离"下面的“cook距离"选项(cook距离,主要是指:
把一个个案从计算回归系数的样本中剔除时所引起的残差大小,cook距离越大,表明该个案对回归系数
的影响也越大)
在预测区间”勾选均值”和单值”点击继续”按钮,再点击确定按钮,得到如下所示的分析结果:
(此分析结果,采用的是逐步法”得到的结果)
模型汇总。
模型
R
R方
调整R方
标准估计的误差
1
5521
.304
.300
1.115534
2
.655b
.430
.422
1.013572
B量tra
虽量L
测测变
预预因
Anovac
模型
平方和
df
均方
F
Sig
1回归
残差
总计
81.720
186.662
269.383
1
150
151
81720
1.244
65.670
2回归
残差
总计
115.311
153.072
269.383
2
149
151
57.656
1.027
66.122
・00妙
a.预测玉虽:
(重量)!
Priceinthousands*
b.预测变量:
③量iPriceinthousands.Wheelbase*
c.因芟园Log-transformedsales
己排陈的克量c
模型
BetaIn
t
Sig.
偏相关
共线性统计量
VIF
最小容差
1
Vehicletype
.251a
3.854
.000
.301
•998
1.002
•998
Enginesize
.342a
4.129
・00D
.320
.611
1.636
.611
Horsepower
.257a
2.062
.041
.167
.293
3.417
.293
Wheelbase
.356a
5718
.000
.424
.988
1.012
.988
车觅
.244J
3.517
.001
.277
.892
1.121
.892
车扶
.308a
4.790
•000
.365
.9帀
1.025
.976
车净重
.346a
4.600
.000
.353
.722
1.385
•了22
Fuelcapacity
.2661
3.68?
.289
.820
1.219
・8刘
耗油壷迈倂
-.198a
-2.584
.011
-.207
•了58
1.319
•了58
2
Vehicletype
.129b
1.928
.056
.157
.835
1.197
.827
Enginesize
.145b
1.576
.117
.128
.445
2.246
.445
Horsepower
.028b
.229
.819
.019
.256
3.910
.256
车宽
-,025b
-.275
.784
-.023
.470
2.126
.470
车扶
.027b
.237
.813
.020
.290
3.448
.290
车净重
.105b
1.028
.306
.084
.365
2.741
.365
Fuelcapacity
002b
.024
.981
.002
.443
2.259
.443
耗油量:
迈倂
.014b
.164
.870
.014
・5B9
1.790
.559
a揆型中的预测变量(常虽),Priceinthousands。
b模型申的*鹼ij麥量:
備和,Priceinthousands,Wheelbase®c因娈量Log-transformedsales
系数耳
模型
非标准化系数
标准系数
t
Sig.
共线性统计虽
B
标准:
谋差
试用版
容差
VIF
1(常量)
Priceinthousands
4.684
-.051
.194
.006
-.552
2i.090
•8.104
.000
.000
1.000
1.000
2(僖屋)
Priceinthousands
Wheelbase
-1.822
-.055
.061
1.161
.006
.011
-.590
.356
-1.683
-9.487
5.718
.116
.000
.000
.988
.988
1.012
1.012
a・因变量:
Log-transformedsales
共线性诊断n
模型
维数
特征値
条件素引
方差比例
(MS)
Priceinthousands
Wheelbase
1
1
1.885
1.000
.06
.06
2
.115
4.051
.94
.94
2
1
2.847
1.000
.00
.02
.00
2
.150
4.351
.01
.97
.01
3
.003
33.412
.99
.00
.99
a.因变量Log-transformedsales
残差统计量11
极小値
极大値
均値
标准價差
N
预测値
-.24540
5.64204
3.29052
.868512
155
标准预测fii
-4.045
2.693
.002
156
预测値的标准误差
.082
.354
.130
155
调整的預测値
-44042
5.67214
3.28907
.874840
155
残差
-4.971113
2.327782
.005131
・998146
155
标准蹊差
-4.905
2.297
・9°5
155
Student化残差
-4.950
2.307
.006
.994
155
己刪除的残差
-5.063155
2.348876
.006580
1.017413
155
Student化已删除的殘差
-5.397
2.341
.002
1.016
165
Mahal距离
.001
17.416
1.964
3423
155
Cook的距畜
.000
.151
.006
.017
155
居中杠杆値
.000
.115
.013
.023
155
图表
直方图
H?
ifi=0.01
回归标净化钱差
散点图
因变蚤:
Log-transformedsales
-6-
17.518
13.10831932D39
6^3515.35
O
74.97
0
71.02Q69725°0355
45.705
69.7499
-鯛爛
5233424.40
46305°+3
34匹需甘丁或畀劇呼
20.2321,41U
翳#鑑了盘益19.46
呷澎0°
一_〜 百喀E强2£伪31518.575 Qd016.2425.345Q 1人5°口13.535 1904519340 16.08 2545 -4 1429 16.145 O -202 回旧林准-ILWitr値 SPSS-回归一多元线性回归结果分析 (二) ,最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却 无能为力,也许要学习步步惊心”里面四阿哥”的座右铭: 行到水穷处”,”坐看云起时接着上一期的多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示: 结果分析1: 验入/静去的吏量日 輛入的变量 移去的变量 方法 1 Priceinttiausands 1 歩进讎则;F-to-enter的輕$<=050'F-to-remove的橱率y1003* 2 Wheelbase i 歩进t准则;F-to-enterBwt率y.050FF-to^remove的棚率匸100)- a.囲变量: Log-transformedsales 由于开始选择的是逐步”法,逐步法是向前”和向后”的结合体,从结果可以看出,最先进 入线性回归模型"的是“priceinthousands"建立了模型1,紧随其后的是 “Wheelbase"建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时, 进入线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时, 从线性模型中”剔除 慌型汇总〜 襪型 R方 调整尺方 标准估计曲谣差 1 552fl .304 .300 1.115534 2 655b 4^0 422 1.013672 a预测变屋: 需虽丄PriceHthousands' b丽冊寺i■: f寫量iPriceinthousandshWheelbase^c.因娈量: Log-trarsforrnedsales Anovac 模型 苹方和 df 均片 F Sig. 1胡 总计 S1.720 130.662 263.3B3 1 150 151 81720 1.24+ 65.670 .0003 总计 115311 153.072 263.393 2 14S 151 57656 1,02J 56122 .000? a预测芟虽: 岸量hPricein'thousfinds* b预测娈量: i窜量iPriceinHiousands,Wheelbase*c.SSia;: Log-transformedsales 结果分析: 1: 从模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2拟合优度来看,模 型2的拟合优度明显比模型1要好一些 (0.422>0.300) 2: 从“Anova表中,可以看出模型2”中的回归平方和”为115.311,残差平方和”为 153.072,由于总平方和=回归平方和+残差平方和,由于残差平方和(即指随即误差,不可 解释的误差)由于回归平方和”跟残差平方和”几乎接近,所有,此线性回归模型只解释 了总平方和的一半, 3: 根据后面的“I统计量"的概率值为0.00,由于0.00<0.01,随着自变量"的引入,其显著性概率值均远小于0.01,所以可以显著地拒绝总体回归系数为0的原假设,通过 ANOVA方差分析表可以看出销售量”与价格”和轴距”之间存在着线性关系,至于线性关 系的强弱,需要进一步进行分析。 己讲除的歪賢 BetaIn t 8ig 兵线性统计蚤 容羞 VIF 最小容盍 1 Vehicletype .251a 3S54 000 .301 .998 1.QD2 .998 Engine和ze 34^ +.12B .oco .320 .6-11 1.636 .611 Horsepower 257d 2.062 .041 .167 2S3 3.417 J93 .350a 5.71S ..ooo 124 1.012 -93B 2*4- 3.517 .001 .277 892 1.121 .892 车氏 .30&5 4.790 .000 .365 .976 1.025 .Q7G 车净重 ,346d 4.6QD .ooo 353 722 1.306 .722 Fuelcapacity 26&J 3.087 ..ODD .289 820 1.219 .020 耗油量: 辺聊 -2.534 .011 -.W 7S6 1.31S 75S 2 VehicJetype .12" .0£G 157 935 1J97 .S27 Enginssiie .145b 1.576 .117 129 .445 2.246 .445 Horsepower .028b .819 .019 25b 3.310 256 车宽 -,025b -.275 ..7S4 -.023 .470 2.126 .470 0271 .227 .913 020 290 3.448 jgo .1時 102S .306 .084 .365 2.741 .305 Fuelcapacity 002h .024 .961 002 443 2.259 .443 耗油虽;迈坍 014b .164 .570 .014 .569 1,790 .559 a择型中的预测夷量*Priceinthousands• b摆毋中Priceinthousands,Wheelbase» c.因爻邑Lxg-transformed骷也& 结果分析: 1: 从已排除的变量”表中,可以看出: 模型2”中各变量的T检的概率值都大于“0.05所' 以,不能够引入线性回归模型”必须剔除。 非标建化磁 标准系数 t Sig. 共妊性统计星 日 掠窿谓茬 诃用飯 WF 1噹量) PriceInthousands 4684 *.051 丁3厂 .000 -552 24090-6.104 .000 .000 1.000 1.000 2(常屋) Priceinthousand
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 实例 分析