SPSS数据分析混合线性模型.docx
- 文档编号:17429927
- 上传时间:2023-07-25
- 格式:DOCX
- 页数:15
- 大小:363.36KB
SPSS数据分析混合线性模型.docx
《SPSS数据分析混合线性模型.docx》由会员分享,可在线阅读,更多相关《SPSS数据分析混合线性模型.docx(15页珍藏版)》请在冰点文库上搜索。
SPSS数据分析混合线性模型
之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并没有突破方差分析三个原有的假设条件,即正态性、方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所有对因变量产生影响的因素逐一摘出,但是如果各观测值之间相互影响,这样在细分影响因素的时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。
虽然随机抽样会最大程度的使数据满足独立性,但是有时候这种方法并不奏效,比如随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立的,然而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区,从个体角度讲,他们确实是独立的人,之间没有任何联系,但是如果从分析H的角度讲,山于区域因素他们之间的消费特征是趋于相似的,而产生这种相似性,正是山于相互作用导致,这些人是存在相互影响关系的,也就类以于相关样本,与此同时,这种相互作用也使得不同城市间的消费特征产生差异,我们称这种数据为具有层次聚集性的数据。
数据的聚集性除了表现在聚集因素间抬标的均值水平不同外,还表现在不同城市间的指标离散度上。
从层次聚集性数据也可以看出,随机抽样只能保证数据被抽到的概率相同,但是对于抽到的是什么样的数据,却无法控制了。
对于这种具有层次结构的数据,如果分析H的仅限于这儿种层次,比如就分析这儿个城市,那么可以把它当做一种固定因子,只分析固定效应而不用考虑这种聚集性,但是如果想把结果推广到所有城市,那就不能忽略这种特征,否则会降低结果的准确性,因此还要加入随机效应。
混合线性模型就是同时包含固定效应和随机效应的线性模型,是解决此类层次聚集性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生相互影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中,将所有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓展,对随机误差的分解也越来越精细,结果也越来越准确。
【例】我们想分析哪些因素会对16岁时毕业成绩的影响,显然毕业成绩和学校有关,好学校的学生成绩会好一些,而差学校的学生成绩会差一些,那么学校这个因素就是上述的层次因素,它使得因变量产生相关性,而且我们是想把结果推广到所有学校,因此学校这个变量应该被定为随机变量,我们首先按照一般线性模型来分析,不考虑层次因素分析一一般线性模型一单变量
因变量为16岁成绩.协变量?
ni岁成绩?
随机因子为学校'不做其他设定,不考虑二者交互作用,直接分析其主敷应
在按照一般线性模型分析之后,我们再来看看按照混合线性模型分析的结果会有什么不同
分析一混合模型一线性
对于具有无相共唤的棋烈•请单击飪垓•
对于農禺相天的燼机效黑的I炮•诵1碇空体英蚤•在awn飲®内便用相关廉眇横型拖疋畫复責崖及後试対t■
畫复协方基删电>y.
I畤1畫畫®)〔就月「厲助]
性和,更析是检成此之线,似做例分否是均因因量素合框类型本来杲就平,他变因混话型模。
先素也的异其因次的对模对盖首因,様差何入层入主性以设们个素学有任迭好进的线可的我这因同否入只S,型般此细,较次不杲纳,设后模一在详中学层验绩不子
S?
(F):
[school]出学生(stuwnfl”r恃屁壊fsbndK]Ott»J(genderl2字歿5ER[scngenfi]4学枝平均朋lavsl世
mat©
〔眈Jlite©Mtfi»^ftj(
我并,聚所应中初如中的亠疋,,中次么绩图的,其异设中距合层那成在线等明变始框截组杲,均现归相说么开0话含入不话平体回距,那最素对包选校的的,有截等二疋因机定校学素校同所即相异就校随选学果因学相是点不变源学在们将如集有该就始果有耒的
満要境计量「
□慈》殛[
禾票处理周婆◎
礙概计逢
H够数估计(日
V协方歪参釵检验G)
□参热估值的相共堆(切驴啟估计的协方逹(世)测I或果的协方査迥)卿建的协方蓬电)叵对比张製矩麻©矍馆区间出:
|95[%
乜堡Ji竺jWW
以些,数数差来素可一值参参方用因,的验择差协是集钮出检选方中就聚按输和们协其验次量要量我和,检层计择计此计验数脸统选统在估检蓼检的
TTT
7^r<£
5W
•H
囲定效(2帧
1
1
1
7磁成分
1
1
2
3
弘因唆St18岁欣站•
!
•••11.5RANDOMH•aKjrtL
总・您的命令话法可傩产生來阿于先防腋本的洁臬・存厲旳朋寒彳仁zu.•用许・
:
选霉耦隔以了解更妙佗息
型况入简亠疋动还效型可设梗情纳很固手,机类也改是的有要的前距龍构,更的型设摘出之截里结分中出複们此输和应这差成框输是我因认,敘意方差话先张于•默腿机注协方对首也由子有截龍-的的机中■■因只的的差距认随果数要何,应盖残砺默在结维摘任单效设有应为以置
-2受约朿的对数似然值
Akaike的信息条件(AIC)
Huwich和Tsai的条汗(AICC)
Bozdogan的条件(CAIC)Schwarz的Bayesian条件(BIC)
11014.624
11018.624
11018.627
11033.241
11031.241
•涪息条科f
以"较少为较好"的格式显示信息条伴,
乳因变爲6岁成细
接下来输出的是信息条件,也就是一些信息准则,用来判断模型中引入的因素是否有统计学意义
固定效应
一E
…df
F
显薯性
藏距
1
62.529
.060
.807
固定效应的检脸饗型Ilf
N因变虽;167成紺
接不来输出固圭效应複型,原假设为所有学校的成绩均值为S由于没有纳入任何因子,因此
P=0.807>0.05-是不能拒绝原假设的
协方差参数
助方他/致僞汁'
J、•
—
WMdZ
05・.-tr
1Q.:
<-*•
847751
018971
<4687
000
811173
865761
«>?
Sschool]
5.103
000
MW«7
2$1?
6O
3,.・1a
趣后输出的检方差参数结果■苏是对随机部分的分析结果,也就是对学校是香是层次聚集因素的最终走论。
此处•原假设为随机效应的方差为0,也菰是不存在賁异。
等同于不同学梭见的成绩均值爰有差异・可见school的估计值并不为S检验结果也是拒绝原假设,因此可以判斷,学校确实是一个层次聚集因表。
上方的炭差表示每个观测值・也號是学生之回是否存在个体差异■也是拒绝原假设,即认为学生之间是存在个体差异的
经过以上分析,我们知道学校确实是一个层次聚集因素,不能按照一般线性模型进行分析,那么影响16岁考试成绩的原因有很多,我们继续加入变量进行分析。
首先加入11岁时的入学成绩,先将其加入固定因素,并观测和之前不加人任何因子相比有何变化
将11岁入学成绩纳入,由于是连续娈量,因此选入协变量,并目在固定按钮中'将其选入模型
首先模型概况中固定敷应多了新加入的变量,其次各个信息条件的值,也比之前隆低,说明有韶分变异襖新加入的变量所解释。
固定效应
07总眦曲依F
ttif-
df
1
W»K
95%、
上B!
nni
00-2319
040354
S0.732
.057
954
•079381
083020
standin
563305
012468
4050.074
45180
.000
.53&861
587749
3WM:
”抄虑沽
协方並鏗敬估计'
Wald2
95%買仁P间
T®
上PH
.565861
.012667
44.672
』00
.541571
.591241
45—scnooi)
.093838
.018986
4943
JOO
.063119
139508
2.因交敢:
16岁戒《5・
此时我们再来看随机部分的分析结果・诂计值比原来小很多*说明之前被归在随机效应中的变异祓新加入固定效应中的竟重所解释璋了,也说明新加入的叢里快得原数攥的层次漿集性减弱
通过以上分析,我们看到,在固定因素中加入入学成绩这个变量以后,对于层次聚集性起到了减弱的效果,但是该影响仍然存在,说明还需要引入其他变量以完
善模型,之前讲过,数据聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同聚集因素间的指标离散度上,我们现在将11岁时的入学成绩这个变量加入随机因素中。
点随机按钮,将变量
纳入模型
佶息条件曰
■2受约束的对数似甕值
9335.677
Akaike的信息条伴(AIC)
9341.677
Hurvich和Tsai的条件(AICC)
9341.683
Bozdogan的条汁(CAIC)
9363.602
Schwarz的Bayesian(BIC)
9360.602
以"较少为较妒的格式显示信息策件。
a.因岁成:
信息条件值进一步降低,说明将该变量引入至随机效应中是有效果的
佶息条件曰
■2受约束的对数1W值
9335.677
Akaike的信息条伴(AIC)
9341.677
Hurvich和Tsai的条件(AICC)
9341.683
Bozdogan的条件(CAIC)
9363.602
Schwarz的Bayesian条什(BIC)
9360.602
以昭为较炉的楷式显示信息条门
a.3娈寂:
16岁
信息条件值进一步降低,说明将该变量引入至随机效应中是有效果的
It
F
•
1
60.466
041
841
1
56,936
768.207
o»o
a.刃各
ta定5ft図怙if
*
1
df
t
95鴛带
•MMbi
.046084
&0M6
202
-.flee282«72O73
g伽伽
5«7021
020097
5-6936
27717
.000516777i97266
固定效应结果浸有太大变化,检验结果也相同
协方差参数
询力轮狰散估卄■
•
WaldZ
IrSWIl
95%巴
PR!
HR
.553626
012492
44.319
.000
52967&
578659
WEK'Cfc=school)
.091949
.&1S766
4.900
.000
.061635
137174
standlrt|**ft=schioolj">*
.014743
&04640
3.177
at
007956
027319
随机效应检骏中,可叹看出新加入的娈量是有统计学意义的,说明11岁入学成绩度对16岁是存在影响的,并目残差和聚集性因素的方差也进一步降低,说明该变量的引入杲有效果的。
在将11岁毕业成绩引入到随机效应之后,层次聚集性乂进一步减弱了,实际上我们可以不断的引入变量,这样最终层次聚集性就会消失,下面我们再来引入性别、学校类型、各学校学生在11岁入学时的平均成这三个变量。
由于性别和学校类型属于分类变量,囲此选入因子选框,而学校平均成绩是连续变量,需要选入协变量选框
儿矿:
「目
个佑公謨
固定效应魚距
1
1
gender
2
1
schgend
3
2
Staftdlrt
1
1
avslrt
1
1
圈口茨应貳距•standlrtb
2
2
school
钱垂
1
es4
10
9
模型讹疣
a.
h干生斗门・5・RANDOM予命令盯上已更改•您盯晶令:
••丄口储
宀牛卜同千七丽肮*町貉爭"早匡TT讦圧用^11说壬・清對刃门前
由于我们认为学校是层次聚集性因素,因此新加入的变量都选入固定效应中,輸出的模型摘要结果如左图
■2受约東的对数:
似然値Akaike的信息条件(AIC)Hurvich^OTsai的条件(AICC)
Bozdogan的条件(CAIC)Schwarz的Bayesian条件(BIC)
9305.974
9311.974
9311.980
9333.896
9330.896
信忌条牢
\r^少为牧弟的信式显〒信息条件
a.因变量:
16岁成妫:
信息粲件值进一步降低,说明引入变量起到作用.实际上我们可以逐步引入变量进行比较
煩
号干df
分母dT
F
显著性
飲距
1
56.856
.464
.499
gender
1
4032.716
24.597
.000
schgend
2
61.942
2.573
.084
standlrt
1
57.164
726.996
.000
avslrt
1
61.156
11.578
.001
固定效应旳检验熒型Ilf
乳因娈量门6歹成绩二
随后输岀的效应类型检验中,新引入的变量中,学校类型是没用窥计学童义的
罔定效应•佔讣a
参教
估计
df
t
显菁性
95%置信区间
下頂
上限
截距
.145373
.063753
54.369
2.280
・027
.017575
・273171
[genden=0]
-.167903
.033855
4032.716
-4.959
.000
-.234278
-.101529
[gendgr=d]
ob
0
[schgend二1]
-.144522
.081750
60.413
-1.768
.002
-.308023
・018980
[schgend=2]
.042889
.116224
68.042
.369
713
-.189030
.274808
[schgend二3]
ob
0
standlrt
.548445
.020341
57.164
26.963
.000
.507716
.589175
avslrt
.363210
.106746
61.156
3.403
.001
.149770
.576650
a因变童16岁成绩。
b•因为此参数冗余:
所以将其设为窮
协方差参数
根据以上思路,我们可以继续将变量引入随机效应、或者分析变量间的交互作用等,对数据进行更进一步的分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 数据 分析 混合 线性 模型