最新spss练习题及简答要点.docx
- 文档编号:15749534
- 上传时间:2023-07-07
- 格式:DOCX
- 页数:34
- 大小:302.81KB
最新spss练习题及简答要点.docx
《最新spss练习题及简答要点.docx》由会员分享,可在线阅读,更多相关《最新spss练习题及简答要点.docx(34页珍藏版)》请在冰点文库上搜索。
最新spss练习题及简答要点
spss练习题及简-答要点
SPSS练习题
1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。
先排序data---sortcases再合并data---mergefiles
2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。
转换Data---transpose,输题目
3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
选取数据data---selectcases
4、利用第2题数据,将其按常住地(升序)、收入水平(升序)存款金额(降序)进行多重排序。
排序data---sortcases一个一个选,加
5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算transform---count按个输,把所有课程选取,define设区间,再排序
6、根据第1题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。
描述性统计,先转换Data---transpose学号放下面,全部课程(poli到his)放上面,ok,analyze---descriptivestatistics---descriptives,全选,options。
先拆分data---splitfile按性别拆分,analyze---descriptivestatistics---descriptives全选所有课程options---mean
7、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
数据分组Transform---recode---下面一个,输名字,change,old,range,newvalue---add挨个输,从小加到大,等距
8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
(计算transform---count或)选取data---selectcases
9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
Analyze---descriptivestatistics---frequencies
10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,进一步,对不同常住地住房存款金额的基本特征进行对比分析。
AnDSdAnalyze---DescriptiveStatistics---Descriptives,选择存款金额到Variable(s)中。
按Option,然后选择Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Variablelist.然后按continue,ok
11、将第1题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异;试分析哪些课程的平均差异不显著。
Transformcompute课程平均分=mean()analyze->comparemeans->independent-samplesT;选择若干变量作为检验变量到testvariables框(课程平均分);选择代表不同总体的变量(sex)作为分组变量到groupingvariable框;.定义分组变量的分组情况DefineGroups...:
(填1,2)。
1.两总体方差是否相等F检验:
F的统计量的观察值为0.257,对应的P值为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式的方差无显著差异.看eaualvariancesassumend。
2.两总体均值的检验:
.T统计量的观测值为-0.573,对应的双尾概率为0.569,T的P值>显著水平0.05,故不能推翻原假设,所以女生男生的课程平均分无显著差异。
配对差异:
analyze->comparemeans->paired-samplesT…pairedvariables框中每科与不同科目配对很麻烦略
12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75,现从雇员中随机随出11人参加考试,得分如下:
80、81、72、60、78、65、56、79、77、87、76,请问该经理的宣称是否可信?
步骤:
采用单样本T检验(原假设H0:
u=u0,总体均值与检验值之间不存在显著差异.);菜单选项:
Analyze->comparemeans->one-samplesTtest;指定检验值:
在test后的框中输入检验值(填75),最后ok!
分析:
N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(stderrormean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
13、利用促销方式数据,试分析这三种推销方式是否存在显著差异,绘制各组均值的对比图,并利用LSD方法进行多重比较检验。
单因素方差分析对比图为options中的descriptivesLSD为post…中的P值大于a接受所以无关
14、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所示,问两组病死亡率相差是否显著?
(example1.sav)(显著性水平为5%)
表1:
急性心肌梗塞患者治疗后24小时生死情况
生存
死亡
用单参注射液
187
11
未用单参注射液
36
6
合计
223
17
·提出假设:
H0:
是否接受治疗的急性心肌梗塞患者的病死率相差不显著
H1:
是否接受治疗的急性心肌梗塞患者的病死率相差显著
·操作步骤:
1、打开数据文件:
file-open-data-example1.sav
2、对count变量进行weightcases处理:
data-weightcases
选中weightcasesby;在Frequenciesvariable中加入变量count。
3、对数据进行交叉汇总,如得出的下列频次交叉表,如图表3-1:
用descriptive-crosstab过程,column填status,row填group。
在cell选项中,选中percentages,以计算频数百分比。
·统计表格及分析:
表3-1是否接受治疗与生存状况的相关性检验成果表(Chi-SquareTests)
Value
df
Asymp.Sig.(2-sided)
PearsonChi-Square
6.040(b)
1
.014
Linear-by-LinearAssociation
6.015
1
.014
有效个案数
240
表3-1是相关性卡方检验成果表。
表中依次列出了Pearson卡方系数、线性相关的值(Value)、自由度(df)和双尾检验的显著水平(Asymp.Sig.(2-sided))。
表3-2显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存和死亡状况频数和所占总数的百分比。
表3-2急性心肌梗塞患者是否治疗与生死情况的列联表
状况(status)
总数
生存
死亡
分组(group))
用单参注射液
Count
185
10
195
%within分组(group)
94.9%
5.1%
100.0%
未用单参注射液
Count
38
7
45
%within·分组(group)
84.4%
15.6%
100.0%
总数
Count
223
17
240
%within·分组(group)
92.9%
7.1%
100.0%
·结论:
根据表3-1可以看出,双侧检验的显著性概论为0.014,小于显著性水平0.05;因此否定原假设,接受备择假设,即两组患者的完全缓解率之间差别显著。
15、已知数据如表2所示,比较单用甘磷酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别?
(example2.sav)(显著性水平为5%)
表2:
两化疗组的缓解率比较
治疗组
缓解
未缓解
合计
单纯化疗
2
10
12
复合化疗
14
13
27
合计
16
23
39
同上小于拒绝显著
16、已知数据如表3所示,问我国南北方鼻咽癌患者(按籍贯分)的病理组织学分类的构成比有无差别?
(example3.sav)(显著性水平为5%)同上小于拒绝显著
表3:
我国南北方鼻咽癌患者病理组织学分类构成
地域
淋巴上皮癌
未分化癌
磷癌
其他
合计
南方四省
71
6
16
18
111
东北三省
89
18
22
51
180
合计
160
24
38
69
291
17、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。
1、打开数据文件:
file-open-data-child.sav
2、均值比较与检验:
Analyze-Comparemeans-means
3、在independentVar.中选性别,dependentVar.中选体重和身高
4、在option子框中选择median/mean/Std.Deviation
1、男性儿童的平均身高为109.962厘米;平均体重为18.202千克;中位身高为109.10厘米;中位体重为17.50千克;身高的标准差为6.084厘米;体重的标准差为2.786千克。
2、女性儿童的平均身高为109.896厘米;平均体重为18.389千克;中位身高为109.450厘米;中位体重为17.750千克;身高的标准差为5.770厘米;体重的标准差为3.235千克。
3、两性儿童的平均身高为109.930厘米;平均体重为18.292千克;中位身高为109.250厘米;中位体重为17.605千克;身高的标准差为5.905厘米;体重的标准差为2.995千克。
18、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高与体重是否分别受到性别与年龄的影响?
(显著性水平为5%)
·提出假设:
1、H0:
身高与体重受到年龄的影响不显著
H1:
身高与体重受到年龄的影响显著
2、H0:
身高与体重受到性别的影响不显著
H1:
身高与体重受到性别的影响显著
·操作步骤:
1、打开数据文件:
file-open-data-child.sav
2、均值比较与检验:
analysis-comparemeans-means
3、在independentVar.中选性别和年龄,dependentVar.中选体重和身高
4、在option子框中选择median/mean/Std.Deviation
在statisticforfirstlayer区域内勾上ANOVAtableandeta复选框
·统计表格及分析:
表7-1体重、身高与年龄的方差分析表
SumofSquares
df
MeanSquare
F
Sig.
体重(x4,kg)*年龄(age)
BetweenGroups
286.215
2
143.107
23.518
.000
WithinGroups
565.918
93
6.085
Total
852.133
95
身高(x5,cm)*年龄(age)
BetweenGroups
1757.707
2
878.853
52.567
.000
WithinGroups
1554.855
93
16.719
Total
3312.562
95
在表7-1中,分别列出了平方和(SumofSquares)、自由度(df)、均方差(MeanSquare)、F值以及F值的显著性水平(Sig.)。
F对应的概率值P(sig)<α(α=0.05);故拒绝原假设,接受备择假设,即身高与体重受到年龄的影响显著。
表7-2体重、身高与性别的方差分析表
df
MeanSquare
F
Sig.
体重(x4,kg)*性别(x2)
BetweenGroups
1
.839
.093
.762
WithinGroups
94
9.056
Total
95
身高(x5,cm)*性别(x2)
BetweenGroups
1
.105
.003
.956
WithinGroups
94
35.239
Total
95
在表7-2中,F对应的概率值P(sig)>α(α=0.05);故接受原假设,即身高与体重受到性别的影响不显著。
19、文件example.sav中列出了某学校四个年级同学接受专业训练前后的铁饼成绩,问接受专业训练后同学们的铁饼成绩有无显著提高?
(显著性水平为5%)
统计表格及分析:
表8-1配对样本的相关性分析表
N
Correlation
Sig.
Pair1
铁饼(训练前)&铁饼(训练后)
24
.976
.000
H0:
铁饼(训练前)和铁饼(训练后)的数据之间不存在线性关系
H1:
铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系
表8-1列出了配对样本的个数(N)、相关系数(Correlation)、显著性概率(Sig.)。
显著性概率趋近于0,远小于0.05,所以认为铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系。
表8-2配对样本T检验的成果表
PairedDifferences
t
df
Sig.(2-tailed)
Mean
Std.Deviation
Std.ErrorMean
95%ConfidenceIntervaloftheDifference
Lower
Upper
Pair1
铁饼(训练前)-铁饼(训练后)
-.2417
.4323
.0882
-.4242
-.0591
-2.739
23
.012
表8-2中为铁饼(训练前)和铁饼(训练后)的数据的T检验结果。
表中前4项分别为配对样本数据差异的均值(Mean)、标准离差(Std.Deviation)、均值的标准差(Std.ErrorMean)以及95%置信区间。
后3项为t值(t)、自由度(df)和双尾显著性概率(Sig.(2-tailed))。
表中双尾显著性概率为0.012,远小于0.05,故拒绝原假设,接受备择假设,认为配对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩提高显著。
·结论:
铁饼(训练前)和铁饼(训练后)的数据之间存在线性关系。
且配对样本之间有显著差异,即接受专业训练后同学们的铁饼成绩有显著提高。
20、文件example.sav中列出了某学校四个年级同学的外语与中文成绩,问男女生总成绩(英文+中文)之间有无显著差异?
(显著性水平为5%)做法:
先计算出总成绩,计算方法:
Transform菜单栏下的ComputeVariable选项
总成绩计算出来之后,选择Analyze选项下CompareMeans选项下“两独立样本T检验”选项卡
将总成绩放入TestVariable一栏中,性别放入GroupingVariable一栏中并为其定义。
点Ok即可得出结果。
结果分析:
方差齐次性,采用F检验,0.235,大于0.05,所以认为男女生总成绩两样本的的方差是没有显著性差异的;
校正t检验的显著性水平Sig(2-tailed)为0.951,大于0.05,所以男女生总成绩之间没有显著性差异。
21、根据以往的资料,学生中文的平均成绩为80分。
文件example.sav中列出了某学校四个年级学生的中文成绩,问学生中文成绩有无显著的下降?
(显著性水平为5%)
·提出假设:
H0:
μ=50(μ-50=0);即学生中文成绩无显著的下降。
H1:
μ≠50(μ-50≠0);即学生中文成绩有显著的下降。
·操作步骤:
1、打开数据文件:
file-open-data-example.sav
2、单一样本的均值检验:
analysis-comparemeans-OneSampleTTest
3、在testvalue中输入80,在testVariable中选“中文”。
4、在options中输入显著性水平5%
·统计表格及分析:
表9-1数据统计量表
N
Mean
Std.Deviation
Std.ErrorMean
中文
24
78.54
11.159
2.278
表9-1为单样本数据的统计量表,列出了变量“中文”对应的数据个数(N)、均值(mean)、标准离差(Std.Deviation)、均值的标准差(Std.ErrorMean)。
表9-2单样本均值检验成果表
TestValue=80
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
中文
-.640
23
.528
-1.458
-6.17
3.25
表9-2为单样本均值检验的成果表。
表中分别为t值(t)、自由度(df)和双尾显著性概率(Sig.(2-tailed))均值差(MeanDifference)以及均值差的95%置信区间。
表中的显著性概率为0.528,远大于0.05;因此,可以认为该样本数据的均值与总体均值之间没有显著差异。
故接受原假设,即学生中文成绩无显著的下降。
·结论:
样本数据的均值与总体均值之间没有显著差异,即学生中文成绩无显著的下降。
22、文件example.sav中列出了某学校四个年级同学的英文成绩,问学生英文成绩是否受到年级因素的影响?
(显著性水平为5%)
H0:
μ1=μ2=μ3;即学生英文成绩不受年纪影响。
H1:
μ1、μ2、μ3不完全相等;即学生英文成绩受年纪影响。
·操作步骤:
1、打开数据文件:
file-open-data-example.sav
2、单因方差分析检验:
Analysis→CompareMeans→One-WayANOVA
3、在“dependentlist”列表中输入变量名“英语”;在“factor”文本框中输入变量名“年纪”。
4、在options中输入显著性水平5%
·统计表格及分析:
表10-1数据方差分析表
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
105.000
3
35.000
.283
.837
WithinGroups
2475.000
20
123.750
Total
2580.000
23
表10-1中分别列出了方差来源、平方和(SumofSquares)、自由度(df)、均方差(MeanSquare)、F值以及F值的显著性水平(Sig.)。
由于表中的显著性水平为0.837,远大于0.05;故接受原假设,即认为学生英文成绩不受年级影响。
23、已知10名20岁男青年身高与臂长的数据,请计算其相关系数,身高与臂长间存在显著的相关关系吗?
(显著性水平为5%)(example4.sav)
表4青年身高与臂长的数据
身高(cm)
170
173
160
155
173
188
178
183
180
165
臂长(cm)
45
42
44
41
47
50
47
46
49
43
·提出假设:
H0:
身高与臂长间不存在显著的相关关系。
H1:
身高与臂长间存在显著的相关关系。
·操作步骤:
1、打开数据文件:
file-open-data-example4.sav
2、相关性检验:
Correlation-Bivariate
3、选择Pearson(积距相关);在option子框中选择means/Sd.
·统计表格及分析:
表11-1描述统计量表
Mean
Std.Deviation
N
身高(cm)
172.50
10.341
10
臂长(cm)
45.40
2.951
10
表11-1为描述统计量表。
表中列出的统计量包括变量的均值(Mean)、标准离差(Std.Deviation)和数据个数(N)。
表11-2相关分析成果表
身高(cm)
臂长(cm)
身高(cm)
PearsonCorrelation
1
.823(**)
Sig.(1-tailed)
.002
N
10
10
臂长(cm)
PearsonCorrelation
.823(**)
1
Sig.(1-tailed)
.002
N
10
10
**Correlationissignificantatthe0.01level(1-tailed)
表11-2为相关分析成果表,表中列出了2个变量之间的Pearson相关系数、单侧显著性检验概率(Sig.(1-tailed))和数据组数(N)。
脚注内容显示相关分析结果在0.01的水平上显著。
另外,从表中可以看出,显著性概率为0.002,远小于0.05,故拒绝原假设,接受备择假设;可以认为身高和臂长的数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 spss 练习题 要点