第五章抽样分布.pptx
- 文档编号:14142225
- 上传时间:2023-06-21
- 格式:PPTX
- 页数:54
- 大小:460.47KB
第五章抽样分布.pptx
《第五章抽样分布.pptx》由会员分享,可在线阅读,更多相关《第五章抽样分布.pptx(54页珍藏版)》请在冰点文库上搜索。
统计学统计学-从典型案例到问题和思想从典型案例到问题和思想经济管理类“十三五”规划教材经济管理类“十三五”规划教材主讲人:
朱芳芳主讲人:
朱芳芳典型案例【典型案例【6】第一节抽样分布基本概念第一节抽样分布基本概念第二节几个常见的抽样分布第二节几个常见的抽样分布第五章抽样分布第五章抽样分布【典型案例【典型案例6】如何决定是否购买一批】如何决定是否购买一批苹果?
苹果?
俗话说俗话说“一日一苹果,医生远一日一苹果,医生远离我。
离我。
”假如现在面对一批苹果,人们如何假如现在面对一批苹果,人们如何了解它们口感的均值和差异值,以便作出是了解它们口感的均值和差异值,以便作出是否购买这批苹果的更好决策呢?
否购买这批苹果的更好决策呢?
众所周之,不可能通过将所有的众所周之,不可能通过将所有的苹果都咬一口品尝来解决这个问题,因为这苹果都咬一口品尝来解决这个问题,因为这样做苹果就全部报废了,对买卖双方都毫无样做苹果就全部报废了,对买卖双方都毫无益处!
益处!
人们常用作法:
从这批苹果中随机挑人们常用作法:
从这批苹果中随机挑出几个品尝后,得出这几个苹果口感的均出几个品尝后,得出这几个苹果口感的均值和差异值,以此作为这批苹果口感的均值和差异值,以此作为这批苹果口感的均值和差异值,从而作出是否购买这批苹果值和差异值,从而作出是否购买这批苹果的更好决策。
从统计学角度来讲,挑出的的更好决策。
从统计学角度来讲,挑出的这几个苹果口感的均值和差异值就这几个苹果口感的均值和差异值就是是样本样本平均数平均数和和样本方差样本方差,这批苹果口感,这批苹果口感的的均值和差异值是总体平均数均值和差异值是总体平均数和和总体方差总体方差。
【典型案例【典型案例6】如何决定是否购买一批】如何决定是否购买一批苹果?
苹果?
这种用商品质量数据的样本平均数这种用商品质量数据的样本平均数、样本方差、样本方差作为总体平均数作为总体平均数、总体、总体方差方差的作法,是人们购买商品时常用的有的作法,是人们购买商品时常用的有效效估计方法,其理论依据是本章将要学习的估计方法,其理论依据是本章将要学习的内容。
内容。
【典型案例【典型案例6】如何决定是否购买一批】如何决定是否购买一批苹果?
苹果?
第一节抽样分布基本概念第一节抽样分布基本概念n一、样本容量和样本个数一、样本容量和样本个数n二、参数和统计量二、参数和统计量n三、抽样分布三、抽样分布n四、抽样分布的数字特征四、抽样分布的数字特征总体总体是研究的所有个体构成的集合是研究的所有个体构成的集合,其中的个体的数目常用表示。
其中的个体的数目常用表示。
从中从中随机抽取部分个体随机抽取部分个体构成一个样本构成一个样本,构成样本的个体的数目构成样本的个体的数目,常用表示,称,常用表示,称为样本容量,也称样本量。
为样本容量,也称样本量。
例如,典型案例例如,典型案例6中,一批苹果有中,一批苹果有400个,从中抽取个,从中抽取8个进行品尝,那么个进行品尝,那么,而。
显然,从中可以得到很多个样而。
显然,从中可以得到很多个样本。
本。
从一个含有从一个含有N个个体的总体中,随机个个体的总体中,随机第一节抽样分布基本概念第一节抽样分布基本概念Nn400N=8n=抽取样本容量为抽取样本容量为n的样本,可得到很多个的样本,可得到很多个样本,此即样本的个数。
例如,从一个含样本,此即样本的个数。
例如,从一个含有有5个个体的总体中,随机抽取样本容量个个体的总体中,随机抽取样本容量为为2的样本(假设采取重复抽样方式),的样本(假设采取重复抽样方式),则可以得到则可以得到52=25个样本。
个样本。
典型案例典型案例6中,将中,将400个苹果编个苹果编号,则号,则随机抽取的样本可能是由编号为随机抽取的样本可能是由编号为18的这的这8个苹果构成,也可能是由编号为个苹果构成,也可能是由编号为101108的的8个苹果构成等等。
个苹果构成等等。
第一节抽样分布基本概念第一节抽样分布基本概念参数是参数是用来描述总体数量特征用来描述总体数量特征的,如的,如总体均值、总体比例、总体方差总体均值、总体比例、总体方差等;等;统计量是统计量是用来描述样本数量特征用来描述样本数量特征的,的,是由样本构造的函数,如样本均值、样是由样本构造的函数,如样本均值、样本比例、样本方差等。
本比例、样本方差等。
由于总体是唯一的、固定不变的,故由于总体是唯一的、固定不变的,故参数往往是一个未知的常数;而样本不唯参数往往是一个未知的常数;而样本不唯一,且一旦抽取出来,就成为已知,故统一,且一旦抽取出来,就成为已知,故统计量是随机变量,其取值随着样本的变化计量是随机变量,其取值随着样本的变化第一节抽样分布基本概念第一节抽样分布基本概念mp2sXp2S而改变。
而改变。
抽样的目的就是要根据样本统计抽样的目的就是要根据样本统计量去量去估计或推断总体参数。
估计或推断总体参数。
比如,常用样本均值去推断比如,常用样本均值去推断总体均总体均值、用样本比例去推断总体比例值、用样本比例去推断总体比例、用样本方差去推断总体方差。
用样本方差去推断总体方差。
以上做法的理论依据就是样以上做法的理论依据就是样本统本统计量的抽样分布。
计量的抽样分布。
第一节抽样分布基本概念第一节抽样分布基本概念xmpp2s2s统计量是随机变量。
抽样分布就统计量是随机变量。
抽样分布就是是统统计量的概率分布计量的概率分布。
如样本均值的概率分布、样本比如样本均值的概率分布、样本比例的例的概率分布、样本方差的概率分布等都称为概率分布、样本方差的概率分布等都称为抽样分布。
抽样分布。
以下将以样本均值为例说明统计以下将以样本均值为例说明统计量的量的抽样分布。
抽样分布。
第一节抽样分布基本概念第一节抽样分布基本概念【例【例5-15-1】设有一个总体,含有】设有一个总体,含有55个个个个体:
体:
1010、2020、3030、4040、5050,即。
,即。
采采取重复抽样的方式从中抽取样本容量为取重复抽样的方式从中抽取样本容量为22的样本,即。
的样本,即。
试写出样本均值的抽样分布。
试写出样本均值的抽样分布。
解:
由于解:
由于=5,=2,从总体,从总体中采取重中采取重复抽样的方式抽取样本,则样本共有复抽样的方式抽取样本,则样本共有=52=25个。
计算出这个。
计算出这25个样本的均值,个样本的均值,其结其结果如表果如表5-1所示。
所示。
第一节抽样分布基本概念第一节抽样分布基本概念5N=2n=XNnnNX样本样本序号序号样本样本个体个体样本样本均值均值样本均值样本均值的概率的概率1110,1010,1010101251252210,2010,2015152252253310,3010,3020203253254410,4010,4025254254255510,5010,5030305255256620,1020,1015157720,2020,2020208820,3020,3025259920,4020,403030101020,5020,503535425425111130,1030,102020121230,2030,202525表5-1n=2时样本均值的抽样及其取值情况时样本均值的抽样及其取值情况样本样本序号序号样本样本个体个体样本样本均值均值样本均值样本均值的概率的概率131330,3030,303030141430,4030,403535151530,5030,504040325325161640,1040,102525171740,2040,203030181840,3040,303535191940,4040,404040202040,5040,504545225225212150,1050,103030222250,2050,203535232350,3050,304040242450,4050,404545252550,5050,505050125125表表5-2=2时样本均值的抽样分时样本均值的抽样分布布从而,样本均值的概率分布如表从而,样本均值的概率分布如表5-2所示。
所示。
第一节抽样分布基本概念第一节抽样分布基本概念101520253035404550123454321252525252525252525XP在例在例5-15-1中,若样本容量中,若样本容量n=4=4,则样,则样本本共有共有=54=625=54=625个个,并且例并且例5-15-1中的总体中的总体是一个非常小的总体,现实世界中,我们是一个非常小的总体,现实世界中,我们面对的总体往往很大,进而样本数目将很面对的总体往往很大,进而样本数目将很可观,不可能将所有的样本都抽取出来。
可观,不可能将所有的样本都抽取出来。
因此抽样分布实质上是一种理论分布。
因此抽样分布实质上是一种理论分布。
它可能是精确的某已知分布,也可能是以它可能是精确的某已知分布,也可能是以某已知分布为极限的极限分布。
某已知分布为极限的极限分布。
第一节抽样分布基本概念第一节抽样分布基本概念抽样分布理论在推断统计中具抽样分布理论在推断统计中具有重要有重要的作用,它是后续参数估计和假设检验的的作用,它是后续参数估计和假设检验的理论依据和基础。
理论依据和基础。
第一节抽样分布基本概念第一节抽样分布基本概念在例在例5-1中,样本均值的平均数中,样本均值的平均数总体均值总体均值样本均值的方差样本均值的方差总体方差总体方差由于由于n=2,从而验证了(,从而验证了(5.1)的)的正确性。
正确性。
第一节抽样分布基本概念第一节抽样分布基本概念1217502525252510155030Xmm=+=+=LL1(1020304050)305mm=+=+=222()()1000900100XEXEXss=-=-=-=-=222()()1100900200EXEXss=-=-=-=-=由式由式(5.1)可知:
的平均数为,可知:
的平均数为,方差为。
随着的增大,其方差越来越方差为。
随着的增大,其方差越来越小,从而的取值越来越向着靠拢,故用小,从而的取值越来越向着靠拢,故用去估计理论依据成立。
去估计理论依据成立。
由此可见,典型案例由此可见,典型案例6中,人们中,人们用挑选用挑选出的几个苹果口感的均值去估计这批苹果出的几个苹果口感的均值去估计这批苹果口感的均值口感的均值的做法是站得住脚的。
的做法是站得住脚的。
第一节抽样分布基本概念第一节抽样分布基本概念以上结论均建立在重复抽样情形下以上结论均建立在重复抽样情形下,若是在重复抽样情形下,方差需要用系若是在重复抽样情形下,方差需要用系数进行修正,从而样本均数进行修正,从而样本均值的数字特征为:
值的数字特征为:
(5.2)可见:
用去估计理论依据同样成立。
可见:
用去估计理论依据同样成立。
第一节抽样分布基本概念第一节抽样分布基本概念()XEXmmmm=221XNnnNssss-=-比例:
比例:
总体(或样本)中具有某总体(或样本)中具有某种属种属性的个体数与全部个体数之比性的个体数与全部个体数之比,总体比例,总体比例记为。
记为。
现有,采现有,采取重复抽样的取重复抽样的方式从中抽取独立同分布的样本:
,方式从中抽取独立同分布的样本:
,。
样本中变量值。
样本中变量值1出现次数记为出现次数记为,那,那么变量值么变量值1出现次数所占的比例为出现次数所占的比例为,即,即为样本比例。
为样本比例。
(二)样本比例的数字特征
(二)样本比例的数字特征第一节抽样分布基本概念第一节抽样分布基本概念根据根据数学期望数学期望和方差的性质,可和方差的性质,可推出推出样本比例的数学期望、方差与总体的样本比例的数学期望、方差与总体的平平均数、方差之间的关系:
均数、方差之间的关系:
(5.3)由式(由式(5.3)可知:
的平均数)可知:
的平均数为总体为总体比例,方差为。
随比例,方差为。
随着的增大,方差越来越小,从而的着的增大,方差越来越小,从而的取值越来越向靠拢,故用去估计取值越来越向靠拢,故用去估计理论依据成立。
理论依据成立。
第一节抽样分布基本概念第一节抽样分布基本概念()pEpmpmp=2
(1)pnpps-=n以上结论均建立在重复抽样情形下以上结论均建立在重复抽样情形下,若是在不重复抽样情形下,当样本容量很若是在不重复抽样情形下,当样本容量很大时,方差需要用系数进行修正,从而样大时,方差需要用系数进行修正,从而样本比例的数字特征为:
本比例的数字特征为:
(5.4)可见:
用去估计理论依据同样成立。
可见:
用去估计理论依据同样成立。
第一节抽样分布基本概念第一节抽样分布基本概念()pEpmpmp=2
(1)1pNnnNppppss-=-设总体的方差为,采取设总体的方差为,采取重复抽样重复抽样的方式,从中抽取独立同分布的样本:
的方式,从中抽取独立同分布的样本:
,。
根据,。
根据数学期望数学期望和方差的性质,和方差的性质,可可推出样本方差的数学期望、方差与总体的推出样本方差的数学期望、方差与总体的方差之间的关系为:
方差之间的关系为:
(5.5)(三)样本方差的数字特征(三)样本方差的数字特征第一节抽样分布基本概念第一节抽样分布基本概念22()ESs=24221Snssss=-由式由式(5.5)可知:
样本方差的平均可知:
样本方差的平均数为数为,方差为,随着的增大,方差为,随着的增大,其方差其方差越来越小,从而的取值越来越向着越来越小,从而的取值越来越向着靠拢,故用去估计理论依据成立靠拢,故用去估计理论依据成立。
由此可见,典型案例由此可见,典型案例6中,人们中,人们用用挑选挑选出的几个苹果口感的差异值去估计这批苹出的几个苹果口感的差异值去估计这批苹果口感的差异值果口感的差异值的做法是站得住脚的。
的做法是站得住脚的。
第一节抽样分布基本概念第一节抽样分布基本概念以上结论均建立在重复抽样情形下以上结论均建立在重复抽样情形下,若是在不重复抽样情形下,方差需要用系若是在不重复抽样情形下,方差需要用系数进行修正,从而样本方差的数字特征为数进行修正,从而样本方差的数字特征为:
(5.6)可见:
用去估计理论依据同样成立。
可见:
用去估计理论依据同样成立。
第一节抽样分布基本概念第一节抽样分布基本概念22()ESs=242211SNnnNssss-=-2S2s统计量抽样分布的标准差统计量抽样分布的标准差,称为统计,称为统计量的量的标准误标准误,也称,也称标准误差标准误差。
标准误可用于说明抽样误差的大小。
标准误可用于说明抽样误差的大小。
抽样误差是指由抽样的随机性引起的样本抽样误差是指由抽样的随机性引起的样本结果与总体的真实值之间的差异,它描述结果与总体的真实值之间的差异,它描述的是所有样本可能的结果与总体真值之间的是所有样本可能的结果与总体真值之间的平均性差异。
的平均性差异。
若若总体标准差未知,可用总体标准差未知,可用样本标准差代替,此时的标准误称为样本标准差代替,此时的标准误称为估计估计标准误。
标准误。
(四)标准误(四)标准误第一节抽样分布基本概念第一节抽样分布基本概念样本比例样本比例的标准误为。
当总体的标准误为。
当总体比例未知时,可用样本比例代替,此比例未知时,可用样本比例代替,此时得到的时得到的标准误称为估计标准误。
标准误称为估计标准误。
样本方差样本方差的标准误为。
当总体的标准误为。
当总体标准标准差未知时,可用样本标准差代替,此时得差未知时,可用样本标准差代替,此时得到的标准误称为估计标准误。
到的标准误称为估计标准误。
样本均值样本均值的标准误为。
当总体标的标准误为。
当总体标准准差未知时,可用样本标准差代替,此时得差未知时,可用样本标准差代替,此时得到的标准误称为估计标准误。
到的标准误称为估计标准误。
第一节抽样分布基本概念第一节抽样分布基本概念ps2SsXsn一、样本均值的抽样分布一、样本均值的抽样分布n二、样本比例的抽样分布二、样本比例的抽样分布n三、样本方差的抽样分布三、样本方差的抽样分布n四、四、t分布和分布和F分布分布第二节几个常见的抽样分布第二节几个常见的抽样分布抽样分布即统计量的概率分布。
抽样分布即统计量的概率分布。
本节本节将分别对样本均值、样本比例以及样本方将分别对样本均值、样本比例以及样本方差的抽样分布作详细的讨论。
差的抽样分布作详细的讨论。
如无特别说明,本章中的抽样方式如无特别说明,本章中的抽样方式均均指重复抽样。
指重复抽样。
第二节几个常见的抽样分布第二节几个常见的抽样分布样本均值的抽样分布样本均值的抽样分布,就是采取重复就是采取重复抽样的方式,选取容量为的所有样本,抽样的方式,选取容量为的所有样本,由样本均值所有可能的取值形成的概率分由样本均值所有可能的取值形成的概率分布布。
它是推断总体均值的理论基础。
它是推断总体均值的理论基础。
以下分两种情况来讨论样本均值以下分两种情况来讨论样本均值的的抽样分布类型。
抽样分布类型。
第二节几个常见的抽样分布第二节几个常见的抽样分布正态分布正态分布:
若的概率密度函数为:
若的概率密度函数为(5.7)图图5-1正态分布概率密度函数图正态分布概率密度函数图其中,和都是常数,且其中,和都是常数,且,则称,则称服从参数为和的正态分布,记作服从参数为和的正态分布,记作。
其概率密度函数图。
其概率密度函数图像见图像见图5-1。
第二节几个常见的抽样分布第二节几个常见的抽样分布e22()21()2xfxxmmssss-=-+=-+特别地,当参数特别地,当参数=0=0,=1=1时,这时,这样的样的正态分布为标准正态分布,记为,其正态分布为标准正态分布,记为,其概率密度函数为:
概率密度函数为:
第二节几个常见的抽样分布第二节几个常见的抽样分布e221()()2。
xxxjj-=-+=-221221222
(2)()
(2)(4)nnnDXnnn+-+-=-2(4)n对于给定的,称满足条件:
对于给定的,称满足条件:
的点为分布的上的点为分布的上分位点。
有结论:
。
分位点。
有结论:
。
以下是关于以下是关于F分布的两个常见结论分布的两个常见结论。
随机变量,则。
这随机变量,则。
这个个结论在后面回归分析的回归系数显著性检结论在后面回归分析的回归系数显著性检验中有用到。
验中有用到。
第二节几个常见的抽样分布第二节几个常见的抽样分布(01)aa=12(,)FnnaFa11221(,)1/(,)FnnFnnaa-=()Ttn:
2(1,)TFn:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 抽样 分布