应用统计学实验.docx
- 文档编号:15961365
- 上传时间:2023-07-09
- 格式:DOCX
- 页数:14
- 大小:63.42KB
应用统计学实验.docx
《应用统计学实验.docx》由会员分享,可在线阅读,更多相关《应用统计学实验.docx(14页珍藏版)》请在冰点文库上搜索。
应用统计学实验
实验二均值假设检验、相关与回归分析
一、实验目的
掌握使用SPSS进行均值假设检验的方法,完成单样本t检验、两个独立样本t检验、配对样本t检验和方差分析,熟练使用SPSS统计表格中的概率P值判断原假设是否成立。
掌握使用SPSS检验变量之间的关系,熟悉SPSS的相关分析,能够根据实际问题构造回归模型,采用SPSS完成回归分析。
(本次实验4学时)
二、实验步骤及要求
(1)打开实验二数据中的“01单个样本t检验.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去,例如学号后两位为08,则把SPSS数据文件第8行数据删去(以下方法相同)。
设计假设H0、H1,检验灯泡的平均寿命是否为3800小时。
用SPSS单样本t检验输出统计结果,用三种方法判断原假设是否成立。
【作出假设,单样本t检验统计结果表格复制到实验报告中,并对该表格作出分析说明】
(2)打开实验二数据中的“02两个独立样本t检验.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
设计假设H0、H1,用SPSS独立样本t检验来检验这两个班的统计学学习情况是否存在显著差异,输出统计结果,判断原假设是否成立。
【作出假设,独立样本t检验统计结果表格复制到实验报告中,并对该表格作出分析说明】
(3)打开实验二数据中的“03配对样本t检验.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
设计假设H0、H1,用SPSS配对样本t检验判断喝茶前体重和喝茶后体重是否有显著差别,输出统计结果,判断原假设是否成立。
【作出假设,配对样本t检验统计结果表格复制到实验报告中,并对该表格作出分析说明】
(4)打开实验二数据中的“04单因素方差分析.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
设计假设H0、H1,用SPSS单因素方差分析判断商品颜色的不同对销量是否有显著影响,输出统计结果,判断原假设是否成立,完成多重比较分析。
【作出假设,方差分析检验统计结果表格复制到实验报告中,并对各表格作出分析说明】
(5)打开实验二数据中的“05正态分布检验.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
按照题目要求利用SPSS单样本K—S检验输出统计结果,判断该数据是否服从正态分布。
【单样本K—S检验统计结果表格复制到实验报告中,并对各表格作出分析说明】
(6)打开实验二数据中的“06相关分析与偏相关分析.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
按照题目要求设计假设H0、H1,用SPSS相关分析来判断“游客增长率”、“商业投资”、“景区经济增长”两两之间是否存在显著的相关关系,输出统计结果,说明相关方向和程度。
【作出假设,相关分析统计结果表格复制到实验报告中,并对该表格作出分析说明】
(7)打开实验二数据中的“06相关分析与偏相关分析.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
用SPSS偏相关分析排除“游客增长率”变量后,“商业投资”与“景区经济增长”两变量之间的偏相关关系。
【偏相关分析统计结果表格复制到实验报告中,并对该表格作出分析说明】
(8)打开实验二数据中的“08信度分析.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
用SPSS分析六个变量之间的信度。
【信度分析统计结果表格复制到实验报告中,并对该表格作出分析说明】
(9)打开实验二数据中的“09一元回归.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
试构建销售量与价格之间的一元线性回归方程,用SPSS回归分析输出统计结果,如能建立起来,写出该一元线性回归方程。
【回归分析统计结果表格复制到实验报告中,并对该表格作出分析说明】
(10)打开实验二数据中的“10多元回归分析.sav”数据文件,找到自己学号最后两位对应的数据行,将该行数据删去。
试构建不良贷款与其他变量之间的一元或多元线性回归方程,用SPSS回归分析输出统计结果,完成多重共线性分析。
如能建立起来,写出该一元或多元线性回归方程,比较采用“Enter”和“Stepwise”两种方法最终回归结果是否有差异。
【回归分析统计结果表格复制到实验报告中,并对各表格作出分析说明】
三、实验操作步骤及结果分析
(注:
此内容需按照我们做实验的步骤列出试验内容及结果,如截图、SPSS输出表格等,并需对此作出必要的解释说明。
请同学们把你们实验报告的内容写在此项目下。
)
(1)
1步骤:
点击‘Analye’→‘CompareMean’→‘One-SampleTTest’→将‘灯泡寿命’选入‘TestVaribles’中→在‘TestValue’中输入‘3800’→点击‘OK’
2.构建的假设:
H0:
灯泡的平均寿命为3800小时
H1:
灯泡的平均寿命不为3800小时
3.分析:
下表为单样本t检验统计结果表格,从表中可知
1)P值为0.975>0.05,所以接受原假设H0,即灯泡的平均寿命为3800小时
2)Lower=-79.8535Upper=89.9037,即含有‘0’点,所以接受原假设H0,即灯泡的平均寿命为3800小时
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
灯泡寿命
199
3.8050E3
607.17501
43.04150
One-SampleTest
TestValue=3800
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
灯泡寿命
.117
198
.907
5.02513
-79.8535
89.9037
(2)
1.步骤:
点击‘Analye’→‘CompareMean’→‘Independent-SampleTTest’→把‘统计学成绩’和‘班级’分别选入TestValue和GroupingValue中→点击DefineGroups,→在Group1中输入‘1’Group中输入‘2’→点击‘OK’
2.分析:
第一步:
判断两个总体方差是否相等
构建的假设:
H0:
两个总体方差相等
H1:
两个总体方差不相等
从表中可知,P值为0.358<0.05,所以接受备择假设,即两个总体方差不相等
第二步:
判断两个班的统计学学习情况是否存在显著差异
构建的假设:
H0:
两个班的统计学学习情况不存在显著差异
H1:
两个班的统计学学习情况存在显著差异
从表中可知,P值为0.073>0.05,所以接受原假设H0,两个班的统计学学习情况不存在显著差异。
GroupStatistics
班级
N
Mean
Std.Deviation
Std.ErrorMean
统计学成绩
一班
20
81.95
8.236
1.842
二班
19
86.32
6.430
1.475
(3)
1.步骤:
点击‘Analye’→‘CompareMean’→‘Paired-SampleTTest’→将‘喝茶前体重’和‘喝茶后体重’选入PairedValues中→点击‘OK’。
2.构建假设
H0:
喝茶前体重和喝茶后体重没有显著差别
H1:
喝茶前体重和喝茶后体重有显著差别
3.分析:
下表为配对样本t检验统计结果表格,从表中可知
P值为0<0.05,所以拒绝原假设H0,即喝茶前体重和喝茶后体重有显著差别
PairedSamplesStatistics
Mean
N
Std.Deviation
Std.ErrorMean
Pair1
喝茶前体重
89.3590
39
5.50353
.88127
喝后体重
69.7949
39
5.76824
.92366
(4)
1.步骤:
点击‘Analye’→‘CompareMean’→‘One-WayAnova’→将‘销量’和‘商品颜色’分别选入dependentlist和factor中→点击options→在Descriptives前打勾→点击continu→点击ok
2.构建假设
H0:
商品颜色的不同对销量是没有显著影响
H1:
商品颜色的不同对销量是有显著影响
3.分析:
下表为方差分析检验统计结果表格,从表中可知
P值为0<0.05,所以拒绝原假设H0,即商品颜色的不同对销量是有显著影响
ANOVA
销量
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
799374.734
3
266458.245
8.847
.000
WithinGroups
1054088.856
35
30116.824
Total
1853463.590
38
(5)
1.步骤:
点击‘Analye’→‘Non-Parametric’→‘1-SampleK-S’→将‘销售额’选入‘TestVaribleList’中→选择‘Normal’→点击ok
2.分析:
下表为单样本K—S检验统计结果表格,从表中可知
P值为0.195>0.05,又因为K-S检验的原假设是总体服从正态分布,所接受原假设,即销售额数据服从正态分布
One-SampleKolmogorov-SmirnovTest
销售额
N
31
NormalParametersa
Mean
33.52
Std.Deviation
12.407
MostExtremeDifferences
Absolute
.194
Positive
.194
Negative
-.092
Kolmogorov-SmirnovZ
1.079
Asymp.Sig.(2-tailed)
.195
a.TestdistributionisNormal.
(6)
1.步骤:
点击‘Analye’→‘Correlate’→‘Bivarite’→将变量选入Variable中→在‘Pearson’前打勾→点击ok
2.构建假设
H0:
“游客增长率”、“商业投资”、“景区经济增长”两两之间不相关
H1:
“游客增长率”、“商业投资”、“景区经济增长”两两之间相关
3.分析:
下表为相关分析统计结果表格
观察表格,第二列是‘商业投资’与其他变量之间的相关分析结果。
以‘商业投资’和‘游客增长率’的相关分析为例,Pearson的相关系数为0.912,相应p值为0<0.05,拒绝原假设,认为两者存在显著相关关系,相关系数大于0.9,说明商业投资’和‘游客增长率’存在正向强相关关系。
其他的同理分析
Correlations
商业投资
游客增长率
景区经济增长
商业投资
PearsonCorrelation
1
.912**
.871**
Sig.(2-tailed)
.000
.000
N
31
31
31
游客增长率
PearsonCorrelation
.912**
1
.910**
Sig.(2-tailed)
.000
.000
N
31
31
31
景区经济增长
PearsonCorrelation
.871**
.910**
1
Sig.(2-tailed)
.000
.000
N
31
31
31
**.Correlationissignificantatthe0.01level(2-tailed).
(7)
1.步骤:
点击‘Analye’→‘Correlate’→‘Partial’→将变量“商业投资”、“景区经济增长”选入Variable中,变量“游客增长率”选入ControllingFor中→点击ok
2.分析:
下表为偏相关分析统计结果表格,从表中可知
在剔除“游客增长率”变量后,“商业投资”与“景区经济增长”的相关系数为0.239,p值为0.203>0.05,所以接受两个变量不相关的原假设,即在剔除“游客增长率”变量后,“商业投资”与“景区经济增长”不存在显著相关关系
Correlations
ControlVariables
商业投资
景区经济增长
游客增长率
商业投资
Correlation
1.000
.239
Significance(2-tailed)
.
.203
df
0
28
景区经济增长
Correlation
.239
1.000
Significance(2-tailed)
.203
.
df
28
0
(8)
1.步骤:
点击‘Analye’→‘Scale’→‘ReliabilityAnalye’→将六个变量选入Items中,Model下拉列表中选择‘Alpha’→点击ok
2.分析:
下表为信度分析统计结果表格,从表中可知
ronbach'sAlpha为0.836,在0.9>α>0.8,根据判断标准,表明六个测量内部一致信度很高
ReliabilityStatistics
Cronbach'sAlpha
NofItems
.836
6
(9)
由表1可知p值为0<0.05,拒绝原假设认为各回归系数不同时为0,表示β1和0有显著差异,说明自变量与因变量之间存在线性关系。
由表2可知p值为0<0.05,拒绝原假设认为各回归系数不同时为0,表示β1和0有显著差异。
据此,可得非标准化回归方程y=92435.786-1.441x,标准化回归方程y=—0.303x
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
6.570E10
1
6.570E10
15.323
.000a
Residual
6.517E11
152
4.288E9
Total
7.174E11
153
a.Predictors:
(Constant),Priceinthousands
b.DependentVariable:
Salesinthousands
Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
95%ConfidenceIntervalforB
B
Std.Error
Beta
LowerBound
UpperBound
1
(Constant)
92435.786
11397.439
8.110
.000
69917.936
114953.636
Priceinthousands
-1.441
.368
-.303
-3.914
.000
-2.168
-.714
a.DependentVariable:
Salesinthousands
(10)
由表2可知,模型a调整后的多重判定系数AdjustedRSquare为0.711,模型,b调整后的多重判定系数AdjustedRSquare为0.746,要优于模型a,所以后续值分析模型b的数据。
由表3可知,p值为0<0.05,拒绝原假设认为各回归系数不同时为0,说明自变量与因变量之间存在线性关系。
由表4可知,各项贷款余额的回归系数β1=0.3,p值为0<0.05,,表示β1和0有显著差异,进入回归方程;本年固定资产投资额的回归系数β2=0.163,p值为0.034<0.05表示β2和0有显著差异,进入回归方程。
据此,可得非标准化回归方程y=—1.331+0.3x1+0.163x3,标准化回归方程y=0.665x1+0.276x3
表1Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
CollinearityStatistics
B
Std.Error
Beta
Tolerance
VIF
1
(Constant)
-1.144
.719
-1.592
.123
各项贷款余额
.033
.008
.742
4.279
.000
.264
3.788
本年累计应收贷款
.157
.071
.265
2.209
.036
.553
1.809
本年固定资产投资额
-.024
.012
-.259
-1.949
.062
.451
2.219
贷款项目个数
.060
.067
.140
.898
.377
.325
3.081
a.DependentVariable:
不良贷款
表2ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.849a
.721
.711
1.8359
2
.873b
.763
.746
1.7212
a.Predictors:
(Constant),各项贷款余额
b.Predictors:
(Constant),各项贷款余额,本年累计应收贷款
表3ANOVAc
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
252.181
1
252.181
74.818
.000a
Residual
97.748
29
3.371
Total
349.928
30
2
Regression
266.981
2
133.491
45.062
.000b
Residual
82.947
28
2.962
Total
349.928
30
a.Predictors:
(Constant),各项贷款余额
b.Predictors:
(Constant),各项贷款余额,本年累计应收贷款
c.DependentVariable:
不良贷款
表4Coefficientsa
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
CollinearityStatistics
B
Std.Error
Beta
Tolerance
VIF
1
(Constant)
-.750
.623
-1.205
.238
各项贷款余额
.038
.004
.849
8.650
.000
1.000
1.000
2
(Constant)
-1.331
.639
-2.083
.047
各项贷款余额
.030
.006
.665
5.384
.000
.555
1.801
本年累计应收贷款
.163
.073
.276
2.235
.034
.555
1.801
a.DependentVariable:
不良贷款
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 实验