spss回归分析Word文档格式.docx
- 文档编号:6478090
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:28
- 大小:70.51KB
spss回归分析Word文档格式.docx
《spss回归分析Word文档格式.docx》由会员分享,可在线阅读,更多相关《spss回归分析Word文档格式.docx(28页珍藏版)》请在冰点文库上搜索。
88.0
87.6
88.5
89.0
87.7
89.5
88.8
90.4
90.6
91.2
11.0
11.8
12.0
12.3
13.1
13.7
14.4
14.9
15.2
16.0
8.1.2.1数据准备
激活数据管理窗口,定义变量名:
体表面积为Y,保留3位小数;
身高、体重分别为X1、X2,1位小数。
输入原始数据,结果如图8.1所示。
图8.1原始数据的输入
8.1.2.2统计分析
激活Statistics菜单选Regression中的Linear...项,弹出LinearRegression对话框(如图8.2示)。
从对话框左侧的变量列表中选y,点击钮使之进入Dependent框,选x1、x2,点击钮使之进入Indepentdent(s)框;
在Method处下拉菜单,共有5个选项:
Enter(全部入选法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。
本例选用Enter法。
点击OK钮即完成分析。
图8.2线性回归分析对话框
用户还可点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析;
点击Plots...钮选择是否作变量分布图(本例要求对标准化Y预测值作变量分布图);
点击Save...钮选择对回归分析的有关结果是否作保存(本例要求对根据所确定的回归方程求得的未校正Y预测值和标准化Y预测值作保存);
点击Options...钮选择变量入选与剔除的α、β值和缺失值的处理方法。
8.1.2.3结果解释
在结果输出窗口中将看到如下统计数据:
****MULTIPLEREGRESSION****
ListwiseDeletionofMissingData
EquationNumber1DependentVariable..Y
BlockNumber1.Method:
EnterX1X2
Variable(s)EnteredonStepNumber
1..X2
2..X1
MultipleR.94964
RSquare.90181
AdjustedRSquare.87376
StandardError.14335
AnalysisofVariance
DFSumofSquaresMeanSquare
Regression21.32104.66052
Residual7.14384.02055
F=32.14499SignifF=.0003
------------------VariablesintheEquation------------------
VariableBSEBBetaTSigT
X1.068701.074768.215256.919.3887
X2.183756.056816.7576603.234.0144
(Constant)-2.8564766.017776-.475.6495
EndBlockNumber1Allrequestedvariablesentered.
结果显示,本例以X1、X2为自变量,Y为应变量,采用全部入选法建立回归方程。
回归方程的复相关系数为0.94964,决定系数(即r2)为0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。
回归方程为Y=0.0687101X1+0.183756X2-2.856476。
本例要求按所建立的回归方程计算Y预测值和标准化Y预测值(所谓标准化Y预测值是指将根据回归方程求得的Y预测值转化成按均数为0、标准差为1的标准正态分布的Y值)并将计算结果保存入原数据库。
系统将原始的X1、X2值代入方程求Y值预测值(即库中pre_1栏)和标准化Y预测值(即库中zpr_1栏),详见图8.3。
图8.3计算结果的保存
本例还要求对标准化Y预测值作变量分布图,系统将绘制的统计图送向ChartCarousel窗口,双击该窗口可见下图显示结果。
图8.4对标准化Y预测值所作的正态分布图
第二节CurveEstimation过程
8.2.1主要功能
调用此过程可完成下列有关曲线拟合的功能:
1、Linear:
拟合直线方程(实际上与Linear过程的二元直线回归相同,即Y=b0+b1X);
2、Quadratic:
拟合二次方程(Y=b0+b1X+b2X2);
3、Compound:
拟合复合曲线模型(Y=b0×
b1X);
4、Growth:
拟合等比级数曲线模型(Y=e(b0+b1X));
5、Logarithmic:
拟合对数方程(Y=b0+b1lnX)
6、Cubic:
拟合三次方程(Y=b0+b1X+b2X2+b3X3);
7、S:
拟合S形曲线(Y=e(b0+b1/X));
8、Exponential:
拟合指数方程(Y=b0eb1X);
9、Inverse:
数据按Y=b0+b1/X进行变换;
10、Power:
拟合乘幂曲线模型(Y=b0Xb1);
11、Logistic:
拟合Logistic曲线模型(Y=1/(1/u+b0×
b1X)。
8.2.2实例操作
[例8.2]某地1963年调查得儿童年龄(岁)X与锡克试验阴性率(%)Y的资料如下,试拟合对数曲线。
年龄(岁)
X
锡克试验阴性率(%)
Y
57.1
76.0
90.9
93.0
96.7
95.6
96.2
8.2.2.1数据准备
锡克试验阴性率为Y,年龄为X,输入原始数据。
8.2.2.2统计分析
激活Statistics菜单选Regression中的CurveEstimation...项,弹出CurveEstimation对话框(如图8.5示)。
从对话框左侧的变量列表中选y,点击钮使之进入Dependent框,选x,点击钮使之进入Indepentdent(s)框;
在Model框内选择所需的曲线模型,本例选择Logarithmic模型(即对数曲线);
选Plotmodels项要求绘制曲线拟合图;
点击Save...钮,弹出CurveEstimation:
Save对话框,选择Predictedvalue项,要求在原始数据库中保存根据对数方程求出的Y预测值,点击Continue钮返回CurveEstimation对话框,再点击OK钮即可。
图8.5曲线拟合对话框
8.2.2.3结果解释
ndependent:
X
DependentMthRsqd.f.FSigfb0b1
YLOG.913552.32.00161.325920.6704
在以X为自变量、Y为应变量,采用对数曲线拟合方法建立的方程,决定系数R2=0.913(接近于1),作拟合优度检验,方差分析表明:
F=52.32,P=0.001,拟合度很好,对数方程为:
Y=61.3259+20.6704lnX。
本例要求绘制曲线拟合图,结果如图8.6所示。
图8.6对数曲线拟合情形
根据方程Y=61.3259+20.6704lnX,将原始数据X值代入,求得Y预测值(变量名为fit_1)存入数据库中,参见图8.7。
图8.7计算结果的保存
第三节Logistic过程
8.3.1主要功能
调用此过程可完成Logistic回归的运算。
所谓Logistic回归,是指应变量为二级计分或二类评定的回归分析,这在医学研究中经常遇到,如:
死亡与否(即生、死二类评定)的概率跟病人自身生理状况和所患疾病的严重程度有关;
对某种疾病的易感性的概率(患病、不患病二类评定)与个体性别、年龄、免疫水平等有关。
此类问题的解决均可借助逻辑回归来完成。
特别指出,本节介绍的Logistic过程,应与日常所说的Logistic曲线模型(即S或倒S形曲线)相区别。
用户如果要拟合Logistic曲线模型,可调用本章第二节CurveEstimation过程,系统提供11种曲线模型,其中含有Logistic曲线模型(参见上节)。
在一般的多元回归中,若以P(概率)为应变量,则方程为P=b0+b1X1+b2X2+…+bkXk,
但用该方程计算时,常会出现P>
1或P<
0的不合理情形。
为此,对P作对数单位转换,即logitP=ln(P/1-P),于是,可得到Logistic回归方程为:
eb0+b1X1+b2X2+…+bkXk
P=———————————
1+eb0+b1X1+b2X2+…+bkXk
8.3.2实例操作
[例8.3]某医师研究男性胃癌患者发生术后院内感染的影响因素,资料如下表,请通过Logistic回归统计方法对主要影响因素进行分析。
术后感染
(有无)
年龄
(岁)
X1
手术创伤程度
(5等级)
X2
营养状态
(3等级)
X3
术前预防性抗菌
X4
白细胞数
(×
109/L)
X5
癌肿病理分度
(TNM得分总和)
X6
有
无
69
72
57
41
32
65
58
54
55
59
64
36
42
48
50
5.6
4.4
9.7
11.2
10.4
7.0
3.1
6.6
7.9
6.0
9.1
8.4
5.3
4.6
12.8
8.3.2.1数据准备
术后感染为Y(字符变量,有输入Y、无输入N),年龄为X1,手术创伤程度为X2,营养状态为X3,术前预防性抗菌为X4(字符变量,有输入Y、无输入N),白细胞数为X5,癌肿病理分度为X6。
按要求输入原始数据。
8.3.2.2统计分析
激活Statistics菜单选Regression中的Logistic...项,弹出LogisticRegression对话框(如图8.8示)。
从对话框左侧的变量列表中选y,点击钮使之进入Dependent框,选x1、x2、x3、x4、x5和x6,点击钮使之进入Covariates框;
点击Method处的下拉按钮,系统提供7种方法:
图8.8逻辑回归对话框
1、Enter:
所有自变量强制进入回归方程;
2、Forward:
Conditional:
以假定参数为基础作似然比概率检验,向前逐步选择自变量;
3、Forward:
LR:
以最大局部似然为基础作似然比概率检验,向前逐步选择自变量;
4、Forward:
Wald:
作Wald概率统计法,向前逐步选择自变量;
5、Backward:
以假定参数为基础作似然比概率检验,向后逐步选择自变量;
6、Backward:
以最大局部似然为基础作似然比概率检验,向后逐步选择自变量;
7、Backward:
作Wald概率统计法,向后逐步选择自变量。
本例选用Forward:
Conditional法,以便选择有主要作用的影响因素;
点击Options...钮,弹出LogisticRegression:
Options对话框,在Display框中选取Atlaststep项,要求只显示最终计算结果,点击Continue钮返回LogisticRegression对话框,再点击OK钮即可。
8.3.2.3结果解释
DependentVariableEncoding:
OriginalInternal
ValueValue
y0
n1
Parameter
ValueFreqCoding
(1)
X4n51.000
y10-1.000
系统先对字符变量进行重新赋值,对于应变量Y,回答是(Y)的赋值为0,回答否(X)的赋值为1;
对于应变量X4,回答是(Y)的赋值为-1,回答否(X)的赋值为1。
DependentVariable..Y
BeginningBlockNumber0.InitialLogLikelihoodFunction
-2LogLikelihood19.095425
*Constantisincludedinthemodel.
BeginningBlockNumber1.Method:
ForwardStepwise(COND)
Improv.ModelCorrect
StepChi-Sq.dfsigChi-Sq.dfsigClass%Variable
18.5101.0048.5101.00480.00IN:
X3
26.7661.00915.2762.00093.33IN:
X6
Nomorevariablescanbedeletedoradded.
EndBlockNumber1PIN=.0500Limitsreached.
FinalEquationforBlock1
Estimationterminatedatiterationnumber12because
LogLikelihooddecreasedbylessthan.01percent.
-2LogLikelihood3.819
GoodnessofFit3.000
Chi-SquaredfSignificance
ModelChi-Square15.2762.0005
Improvement6.7661.0093
ClassificationTableforY
Predicted
ynPercentCorrect
y|n
Observed+———+———+
yy|4|1|80.00%
+———+———+
nn|0|10|100.00%
Overall93.33%
----------------------VariablesintheEquation-----------------------
VariableBS.E.WalddfSigRExp(B)
X3-30.5171298.0526.01051.9184.0000.0000
X6-10.2797107.9559.00911.9241.0000.0000
Constant123.40531155.1065.01141.9149
结果表明,第一步自变量X3入选,方程分类能力达80.00%;
第二步自变量X6入选,方程分类能力达93.33%(参见结果中的分类分析表);
方程有效性经χ2检验,χ2=15.276,P=0.0005。
Logistic回归的分类概率方程为:
e123.4053-30.5171X3-10.2797X6
P=——————————————
1+e123.4053-30.5171X3-10.2797X6
根据该方程,若一胃癌患者营养状态评分(X3)为3,癌肿病理分度(X6)为9,则其P=4.5×
10-27≈0,这意味着术后将发生院内感染;
另一胃癌患者营养状态评分(X3)为1,癌肿病理分度(X6)为4,则其P=0.98105≈1,这意味着术后将不会发生院内感染。
第四节Probit过程
8.4.1主要功能
调用此过程可完成剂量-效应关系的分析。
通过概率单位使剂量-效应的S型曲线关系转化成直线,从而利用回归方程推算各效应水平的相应剂量值。
8.4.2实例操作
[例8.4]研究抗疟药环氯胍对小白鼠的毒性,试验结果如下表所示。
试计算环氯胍的半数致死剂量。
剂量(mg/kg)
动物数
死亡数
12
19
34
38
11
17
8.4.2.1数据准备
剂量为DOSE、试验动物数为OBSERVE、死亡动物数为DEATH。
然后输入原始数据。
8.4.2.2统计分析
激活Statistics菜单选Regression中的Probit...项,弹出ProbitAnalysis对话框(如图8.9示)。
从对话框左侧的变量列表中选death,点击钮使之进入ResponseFrequency框;
选observe,点击钮使之进入TotalObserved框;
选dose,点击钮使之进入Covariate(s)框,并下拉Transform菜单,选Logbase10项(即要求对剂量进行以10为底的对数转换)。
图8.9剂量-效应关系分析对话框
系统在Model栏中提供两种模型,一是概率单位模型(Probit),另一是比数比自然对数模型(Logit)。
本例选用概率单位模型。
点击Options...钮,弹出ProbitAnalysis:
Options对话框,在NaturalResponseRate栏选Calculatefromdata项,要求计算各剂量组的实际反应率。
之后点击Continue钮返回ProbitAnalysis对话框,再点击OK钮即可。
8.4.2.3结果解释
系统首先显示,共有7组原始数据采概率单位模型进行分析。
回归方程的各参数在经过14次叠代运算后确定,即PROBIT=5.95215-4.66313X。
该方程拟合优度χ2检验结果,χ2=0.833,P=0.934,拟合良好。
DATAInformation
7unweightedcasesaccepted.
0casesrejectedbecauseofmissingdata.
0casesareinthecontrolgroup.
0casesrejectedbecauseLOG-transformcan'
tbedone.
MODELInformation
ONLYNormalSigmoidisrequested.
NaturalResponseratetobeestimated
CONTROLgroupisnotprovided.
Parameterestimatesconvergedafter14iterations.
Optimalsolutionfound.
ParameterEstimates(PROBITmodel:
(PROBIT(p))=Intercept+BX):
RegressionCoeff.StandardErrorCoeff./S.E.
DOSE5.952152.398322.48180
InterceptStandardErrorIntercept/S.E.
-4.663132.19942-2.12017
EstimateofNaturalResponseRate=.000000withS.E.=.26448
PearsonGoodness-of-FitChiSquare=.833DF=4P=.934
SinceGoodness-of-FitChisquareisNOTsignificant,noheterogeneity
factorisusedinthecalculationofconfidencelimits.
Covariance(below)andCorrelation(above)MatricesofParameterEstimates
DOSENATRESP
DOSE5.75192.82927
NATRESP.52601.06995
接着,系统显示剂量对数值(DOSE)、实际观察例数(NumberofSubjects)、试验动物反应数(ObservedResponses)、预期反应数(ExpectedResponses)、残差(Residual)和效应的概率(Prob)。
之后,显示各效应概率水平的剂量值及其95%可信区间值,按本例要求,环氯胍的半数致死剂量(即Prob=0.50时)为6.07347,其95%可信区间为1.86305—7.54282。
ObservedandExpectedFrequencies
NumberofObservedExpected
DOSE
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 回归 分析