参数检验原理及操作过程.docx
- 文档编号:16778027
- 上传时间:2023-07-17
- 格式:DOCX
- 页数:16
- 大小:275.32KB
参数检验原理及操作过程.docx
《参数检验原理及操作过程.docx》由会员分享,可在线阅读,更多相关《参数检验原理及操作过程.docx(16页珍藏版)》请在冰点文库上搜索。
参数检验原理及操作过程
参数检验
一、单样本t检验:
One-SamplesTTest过程
1.单样本t检验的含义
单样本t检验是检验某个变量的总体均值与指定的检验值之间是否存在显著差异。
它是比较样本均值与总体均值的假设检验。
例如,某区商业系统对员工进行技术考核,得出员工考核的平均分为87分,该区的某个超市随机抽取了9名员工得到考核的平均技术成绩为82.67分,问该超市员工的考核的平均得分与全区是否一致?
单样本t检验的前提是要求样本来自的总体应服从正态分布或者近似服从正态分布。
2.单样本t检验的步骤
单样本t检验作为假设检验的一种方法,它的基本步骤如下:
首先,根据实际问题提出零(原)假设H0:
样本均值与指定检验值之间不存在显著差异,即H0:
μ=μ0,H1:
μ≠μ0,其中,μ为总体均值,μ0为指定检验值。
其次,选择检验统计量。
由于抽样误差的存在,虽然样本均值呈现出差异性,但样本均值的抽样分布是可以确定的,当总体分布为正态分布X~N(μ,σ2)时,样本均值的抽样分布仍为正态分布,该正态分布的均值为μ,方差为
,即
(1-1)
其中,μ为总体均值,σ2为总体方差,n为样本容量。
当总体的分布近似服从正态分布时,我们就选择较大样本容量的样本,由中心极限定理可知,n较大时,样本均值近似第服从(1-1)式的正态分布。
再将样本进行标准化转换,可以构造Z检验统计量,为:
(1-1)
Z统计量服从标准正态分布。
通常总体方差σ2是未知的,我们可以用样本方差S2替代,得到的检验统计量就是t统计量,为:
(1-3)
其中,μ用μ0代入,t统计量服从自由度为n-1的t分布。
第三,计算检验统计量的值和概率P值。
SPSS将自动计算t值,并根据t分布表给出t值对应的概率P值。
最后,给出显著性水平
,并给出结论。
如果概率P值小于给出的显著性水平
,则拒绝H0,认为总体的均值与检验值之间存在显著差异。
如果概率P值大于给出的显著性水平
,则不应拒绝H0,可以认为总体均值与检验值之间不存在显著差异。
3.背景材料
对某市11~15岁青少年的身高进行抽样调查,试在5﹪的显著性水平下,推断该市该年龄段的青少年是否达到了160厘米的标准身高,具体资料见数据文件青少年身高.sav。
4.实训步骤
4-1打开数据文件后依次单击“Analyze”→“CompareMeans”→“One-SampleTTest”菜单命令,进入单样本t检验过程,如图1-1所示。
图1-1单样本t检验的主对话框
4-2进入主对话框后,选中对话框左边矩形框中的变量“heigh”,点击
按钮使之进入TestVariable(s)框(可以同时选入多个变量),在“TestValue”检验值栏中填入160,如图1-2所示。
图1-2设置后的单样本t检验的主对话框
4-3单击“Options”选项,弹出的子对话框如图1-3所示。
图1-3Options子对话框
此对话框主要包括如下两个选项:
ConfidenceInterval:
设置样本均值与总体均值之差的置信区间,系统默认值为95%。
MissingValues:
设置缺失值处理方式。
共有两种处理方式:
Excludecasesanalysisbyanalysis是仅当数据要分析的变量值缺失时才剔除该数据;Excludecaseslistwise是只要数据中有变量值缺失时就剔除该数据。
为了保留更多的数据样本,系统默认是前者。
4-4单击“OK”按钮完成操作,结果如表1-1、表1-2所示。
5.实训解析
1-1表1-1给出了数据的基本描述统计量。
包括样本容量(N)、样本均值(Mean)、样本标准差(Std.Deviation)、标准误均值(Std.ErrorMean)。
本例中样本均值为152.14,与总体均值160有些差距。
表1-1单样本统计量One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
身高
36
152.14
4.304
.717
5-2表1-2是单样本t检验表,包括总体均值(TestValue)、检验统计量(t)、自由度(df)、双侧检验的显著性水平(Sig.(2-tailed))、样本均值与总体均值之差(MeanDifference)、样本均值与总体均值之差的置信区间(95%ConfidenceIntervaloftheDifference)。
本例中t统计量取值为-10.959。
由于双侧t检验的显著性水平Sig.取值为0.000,小于0.05,所以拒绝原假设,即该市该年龄段的青少年的身高达没有达到160厘米的标准身高。
表1-2单样本检验One-SampleTest
TestValue=160
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
身高
-10.959
35
.000
-7.861
-9.32
-6.40
二、独立样本t检验:
Independent-SamplesTTest过程
1.两独立样本t检验的含义
两独立样本t检验就是根据样本数据对它们来自的两独立总体的均值是否有显著差异进行推断。
它是比较两个总体均值的假设检验。
比如利用某市11~15岁青少年的抽样调查数据,推断该市男青少年总体与女青少年总体的平均身高是否有显著差异。
两独立样本t检验的前提是样本来自的总体应该服从或者近似服从正态分布,并且要求两样本相互独立,即从一个总体中抽取一批样本对从另一个总体中抽取一批样本没有任何影响,两组样本的个案数目可以不同,个案顺序可以随意调整。
2.两独立样本t检验的步骤
两独立样本t检验作为假设检验的一种方法,它的基本步骤如下:
首先,根据实际问题提出零(原)假设H0:
两总体均值之间不存在显著差异,即H0:
μ1-μ2=0,H1:
μ1-μ2≠0,其中,μ1为第一总体均值,μ2为第二总体均值。
其次,选择检验统计量。
两总体均值差的推断是建立在来自两个总体样本均值差的基础之上的,即利用两组样本的均值差去估计两总体的均值差。
当两总体分布为分别为N(μ1,σ12)和N(μ2,σ22)时,两样本的均值差的抽样分布仍为正态分布,而且该正态分布的均值为μ1-μ2,方差为
。
而
是未知的,我们要通过样本数据来对它进行估计,在不同的情况下,
有不同的估计方式。
情况一是当两总体方差未知且相等,即σ12=σ22时,我们采用合并的方差作为两总体方差
的估计,定义为:
(2-1)
其中,
,
分别为第一组样本和第二组样本的方差,n1,n2为别为第一组样本和第二组样本的样本容量。
此时两样本均值差的抽样分布的方差
为:
(2-2)
情况二是当两总体方差未知且不相等,即σ12≠σ22时,分别采用各自的方差作为两总体方差的估计,此时两样本均值差的抽样分布的方差
为:
当总体的分布近似服从正态分布时,我们就选择较大样本容量的样本,由中心极限定理可知,n较大时,样本均值近似第服从(1-1)式的正态分布。
再将样本进行标准化转换,可以构造Z检验统计量,为:
(2-3)
于是,两总体均值差检验的检验统计量为t统计量,定义为:
(2-4)
其中,当原假设成立时,μ1-μ2=0,在上述情况一下,t统计量服从自由度为n1+n2-2个自由度的t分布;在情况二下,t统计量服从修正自由度的t分布;修正自由度定义为:
(2-5)
由此可见,如何计算抽样分布的方差关键是看两总体方差是否相等,因此,有必要通过有效的方式对两总体方差是否相等进行统计检验。
两总体方差是否相等检验的原假设H0:
σ12=σ22,即两总体方差无显著差异。
SPSS中通过LeveneF方法采用F统计量进行检验。
LeveneF方法借单因素方差分析方法来实现,其主要思路是:
先对来自两个不同总体的两组样本分别计算样本均值;然后,计算各个样本与本样本均值差的绝对值,得到两组绝对值数据;最后,利用单因素方差分析方法判断这两组绝对差值的均值是否存在显著的差异,即判断两组的平均绝对值差是否存在显著的差异。
可见,LeveneF方法正是通过判断两组样本方差是否相等进而间接判断两总体方差是否有显著差异的。
第三,计算检验统计量的值和概率P值。
SPSS将自动依据单因素方差分析方法计算F统计量和概率P值,并自动计算出t统计量的观测值和相应概率P值。
最后,给出显著性水平
,并给出结论。
给出显著性水平
后,SPSS的统计决策分为以下两步:
第一步,利用F检验判断两总体方差是否相等。
并据此决定抽样分布的方差和自由富的计算方法和计算结果。
如果F检验统计量的概率P值小于显著性水平
,就拒绝原假设,认为两总体方差有显著差异;如果F检验统计量的概率P值大于显著性水平
,就拒绝原假设,认为两总体方差无显著差异。
第二步,利用t检验判断两总体均值是否存在显著差异。
如果t检验统计量的概率P值小于给定的显著性水平
,则拒绝原假设H0,认为两总体的均值有显著的差异。
如果概率P值大于给定的显著性水平
,则不应拒绝H0,可以认为两总体均值无显著差异。
3.背景材料
利用SPSS做两独立样本t检验之前,正确地组织数据是一个非常关键的任务。
SPSS要求两独立样本的数据必须存放在一个SPSS变量中,即存放在一个SPSS列上。
同时,为区分哪些样本属于哪个总体,还必须事先定义一个SPSS变量,它存放的是标识数据,以标识每个样本的所属总体,进而保证SPSS能够对样本来自的总体加以区分。
仍然利用数据文件“青少年身高.sav”,在10﹪的显著性水平下,比较该市11~15岁青少年中,男、女青少年的身高是否有显著性差异。
4.实训步骤
4-1选择菜单“Analyze”→“CompareMeans”→“IndependentSamplesTest”,进入两独立样本检验界面,出现如图2-1所示的主对话框。
图2-1两独立样本t检验主对话框
4-2从左侧的候选变量框中选择height进入TestVariable(s)框中,选择sex进入GroupingVariable框中,如图2-2所示。
图2两独立样本t检验主对话框
4-3单击“DefineGroups”按钮,弹出如图2-3所示的窗口,定义需要相互比较的两组的分组变量值。
图2-3DefineGroups子对话框
其中,Usespecifiedvalues表示用特定的变量值分组。
当变量的取值等于Group1框中自定义值时将其划为第一组;当变量的取值等于Group2框中自定义值时将其划为第二组;Cutpoint定义分割点值。
当变量的取值大于或者等于分割点值时将其作为第一组,小于分割点值时作为第二组。
本例中以性别变量作为分组标志,在“Group1”中输入“0”,在“Group2”中输入“1”,单击“Continue”按钮,返回“IndependentSamplesTest”主对话框。
4-4两独立样本t检验的Options选项和One-SamplesTTest对话框的Options选项完全相同。
4-5.单击“OK”按钮完成操作,输出结果如表2-1、表2-2所示。
5.实训解析
5-1表2-1给出了青少年身高的基本描述统计量。
包括样本容量(N)、样本均值(Mean)、样本标准差(Std.Deviation)、标准误均值(Std.ErrorMean)。
表2-1青少年身高描述统计量GroupStatistics
性别
N
Mean
Std.Deviation
Std.ErrorMean
身高
0
19
152.21
4.417
1.013
1
17
152.06
4.308
1.045
5-2表2-2是两独立样本t检验结果表。
此表列出了两种t检验的结果。
分别为在样本方差相等(Equalvariancesassumed)情况下的一般t检验的结果和在样本方差不相等(Equalvariancesnotassumed)情况下的校正t检验的结果。
那么应该选择两种结果中的哪一个呢?
这就取决于表-2中的Levene’sTestforEqualityofVariances项,即方差齐次性检验结果。
本例中F统计量值为1.586,由于其显著性水平Sig.为0.165,大于0.05,所以认为两样本的方差是相等的。
因本结果属于方差齐性,故采用第一行结果:
t=0.104,P=0.918,应接受原假设,即可以认为该市男女青少年的身高不存在显著差异。
表2-2独立样本t检验结果IndependentSamplesTest
身高
Equalvariancesassumed
Equalvariancesnotassumed
Levene'sTestforEqualityofVariances
F
.165
Sig.
.687
t-testforEqualityofMeans
t
.104
.104
df
34
33.729
Sig.(2-tailed)
.918
.918
MeanDifference
.152
.152
Std.ErrorDifference
1.458
1.455
95%ConfidenceIntervaloftheDifference
Lower
-2.810
-2.807
Upper
3.114
3.111
三、配对样本t检验:
Paired-SamplesTTest过程
1.两配对样本t检验的含义
两配对样本t检验是利用来自两个总体的配对样本数据,推断两个总体的均值是否存在显著的差异。
两配对样本t检验和两独立样本t检验的差别之一是要求样本是配对的。
两配对样本通常具有两个特征:
一是两组样本的样本数目相同;二是两组样本的观察值的先后顺序一一对应,不能随意更改。
两配对样本t检验的前提要求,一是,两样本应是配对的。
二是,样本来自的两个总体应服从或者近似服从正态分布。
2.两配对样本t检验的步骤
两独立样本t检验的基本步骤如下:
首先,根据实际问题提出零(原)假设H0:
两总体均值之间不存在显著差异,即H0:
H0:
μ1-μ2=0,H1:
μ1-μ2≠0,其中,μ1为第一总体均值,μ2为第二总体均值。
其次,选择检验统计量。
两配对样本t检验所采用的检验统计两与单样本t检验完全相同,也采用t统计量。
两配对样本t检验是间接通过单样本t检验实现的。
它首先对两组样本分别计算出每对观测值的差值得到差值样本;然后利用差值样本,通过对其均值是否显著为0的检验来推断两总体均值的差是否显著为0。
显然,如果差值样本的均值与0有显著差异,则可以认为两总体均值的差值有显著差异;否则,如果差值样本的均值与0无显著差异,则可以认为两总体均值的差值不存在显著差异。
第三,计算检验统计量的值和概率P值。
SPSS将自动计算出t统计量的值和相应的概率P值。
最后,给出显著性水平
,并给出结论。
给出显著性水平
后,如果t检验统计量的概率P值小于给定的显著性水平
,则拒绝原假设H0,认为差值的总体均值与0有显著不同,两总体的均值有显著的差异。
反之,如果概率P值大于给定的显著性水平
,则不应拒绝H0,可以认为两总体均值无显著差异。
3.背景材料
已知7种商品在两种不同促销形式下的销售额数据,如表3-1所示。
试分析两种不同促销形式对商品销售额的影响是否具有显著性差异。
表3-1不同促销形式下的7种商品的销售额
商品
促销形式A
促销形式B
1
2
3
4
5
6
7
65
73
73
30
73
56
73
34
36
37
26
43
37
60
两配对样本t检验的数据准备工作比较简单直接,只需要将两组配对样本数据依次存放在两个SPSS变量中即可,具体的SPSS数据,见促销形式和促销额.sav。
4.实训步骤
4-1选择菜单“Analyze”→“CompareMeans”→“PairedSamplesTest”,进入配对样本t检验主对话框,如图3-1所示。
图3-1配对样本t检验主对话框
4-2从对话框左侧的变量列表(只显示可以进行t检验的变量)中选择进行t检验的变量“a”、“b”,使“a”、“b”进入“PairedVariables”框中,如图3-2所示。
图3-2设置后的配对样本t检验主对话框
4-3两配对样本t检验的Options选项和One-SamplesTTest对话框的Options完全相同。
4-4单击“OK”按钮,完成操作,所得输出结果如表3-2、表3-3、表3-4所示。
5.实训解析
5-1表3-2是A种促销形式和B种促销形式的销售额的分组统计量。
包括样本均值(Mean)、样本容量(N)、样本标准差(Std.Deviation)、标准误均值(Std.ErrorMean)。
从中可以看出,A种促销形式的商品销售额明显大于B种形式的销售额(63.29>39.00)。
表3-2配对样本分组统计量表PairedSamplesStatistics
Mean
N
Std.Deviation
Std.ErrorMean
Pair1
形式A
63.29
7
16.028
6.058
形式B
39.00
7
10.551
3.988
5-2表3-3是配对样本的相关性分析结果。
其相关系数为0.624,对应的显著性水平Sig.为0.134,大于0.05,即认为两样本的相关性不显著。
表3-3配对样本的相关分析表PairedSamplesCorrelations
N
Correlation
Sig.
Pair1
形式A&形式B
7
.624
.134
5-3表3-4是两配对样本t检验的结果。
t统计量为5.124,P值=0.002<0.05,应拒绝原假设,表明两种促销形式对商品销售额的影响具有显著差异。
表3-4配对样本t检验表PairedSamplesTest
Pair1
形式A-形式B
PairedDifferences
Mean
24.286
Std.Deviation
12.539
Std.ErrorMean
4.739
95%ConfidenceIntervaloftheDifference
Lower
12.689
Upper
35.883
t
5.124
df
6
Sig.(2-tailed)
.002
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 检验 原理 操作过程
![提示](https://static.bingdoc.com/images/bang_tan.gif)