第一章-第四节-总体分布的估计-人教版.ppt
- 文档编号:14667130
- 上传时间:2023-06-25
- 格式:PPT
- 页数:46
- 大小:1.48MB
第一章-第四节-总体分布的估计-人教版.ppt
《第一章-第四节-总体分布的估计-人教版.ppt》由会员分享,可在线阅读,更多相关《第一章-第四节-总体分布的估计-人教版.ppt(46页珍藏版)》请在冰点文库上搜索。
1144总体分布的估计总体分布的估计知识回顾知识回顾2、前面我们学习了常用的几种抽样方法,要注意这、前面我们学习了常用的几种抽样方法,要注意这几种抽样方法的联系与区别几种抽样方法的联系与区别3、初中时我们学习过样本的频率分布、初中时我们学习过样本的频率分布包括频数、频率的概念,频率分布表和频率包括频数、频率的概念,频率分布表和频率分布直方图的制作分布直方图的制作1、用样本去估计总体,是研究统计问题的一个基本思、用样本去估计总体,是研究统计问题的一个基本思想想4.频率分布频率分布样本中所有数据(或数据组)的频数和样本容量的比,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的就是该数据的频率频率。
所有数据(或数据组)的频数的分布变化规律叫做所有数据(或数据组)的频数的分布变化规律叫做样本的样本的频率分布频率分布。
5.频率分布的表示形式有频率分布的表示形式有:
样本频率分布表样本频率分布表样本频率分布条形图样本频率分布条形图样本频率分布直方图样本频率分布直方图在初中我们学习过样本的频率分布,在初中我们学习过样本的频率分布,在此基础上我们来研究在此基础上我们来研究总体的分布及其估计总体的分布及其估计我们从前面学习概率时介绍的历史上我们从前面学习概率时介绍的历史上所做的抛掷硬币的大量重复试验入手,在那里所做的抛掷硬币的大量重复试验入手,在那里曾介绍了如下试验结果曾介绍了如下试验结果在这个问题中,抛掷硬币试验的结果在这个问题中,抛掷硬币试验的结果的全体构成一个总体(为便于研究问题,可的全体构成一个总体(为便于研究问题,可把出现“正面向上”的结果记为把出现“正面向上”的结果记为0,把出现,把出现“反面向上”的结果记为“反面向上”的结果记为1),每次抛掷硬币),每次抛掷硬币试验的结果是总体中的一个个体,那么,上试验的结果是总体中的一个个体,那么,上面的表格就是从总体中抽取的容量为面的表格就是从总体中抽取的容量为72088的相当大的样本的频率分布表这个频率分的相当大的样本的频率分布表这个频率分布表还可用如图布表还可用如图11所示的条形图表示所示的条形图表示图1-1我们看到,随着试验次数的不断增我们看到,随着试验次数的不断增加,出现“正面向上”和“反面向上”的加,出现“正面向上”和“反面向上”的频率值都越来越接近频率值都越来越接近0.5,在它附近摆动,在它附近摆动当试验次数无限增大时,两种试验结果当试验次数无限增大时,两种试验结果的频率值就成为相应的概率,得到下表的频率值就成为相应的概率,得到下表我们看到,随着试验次数的不断我们看到,随着试验次数的不断增加,出现“正面向上”和“反面向上”增加,出现“正面向上”和“反面向上”的频率值都越来越接近的频率值都越来越接近0.5,在它附近摆动,在它附近摆动当试验次数无限增大时,两种试验结果当试验次数无限增大时,两种试验结果的频率就成为相应的概率上表排除了抽的频率就成为相应的概率上表排除了抽样造成的误差,样造成的误差,精确精确地反映了总体取值的地反映了总体取值的概率分布规律概率分布规律这种总体取值的这种总体取值的概率分布概率分布规律规律通常称为通常称为总体分布总体分布再来看下面的例子再来看下面的例子从规定尺寸为从规定尺寸为25.40mm的一堆产的一堆产品中任取品中任取100件,测得它们的实际尺寸如件,测得它们的实际尺寸如下:
下:
25.3925.3625.3425.4225.4525.3825.3925.4225.4725.3525.4125.4325.4425.4825.4525.4325.4625.4025.5125.4525.4025.3925.4125.3625.3825.3125.5625.4325.4025.3825.3725.4425.3325.4625.4025.4925.3425.4225.5025.3725.3525.3225.4525.4025.2725.4325.5425.3925.4525.4325.4025.4325.4425.4125.5325.3725.3825.2425.4425.4025.3625.4225.3925.4625.3825.3525.3125.3425.4025.3625.4125.3225.3825.4225.4025.3325.3725.4125.4925.3525.4725.3425.3025.3925.3625.4625.2925.4025.3725.3325.4025.3525.4125.3725.4725.3925.4225.4725.3825.39如果把这堆产品中产品尺寸的全体如果把这堆产品中产品尺寸的全体看作一个总体,那么上面数据就是从总体中看作一个总体,那么上面数据就是从总体中抽取的一个容量为抽取的一个容量为100的样本与前一个例子的样本与前一个例子不同的是,这里的总体可以在一个实数区间不同的是,这里的总体可以在一个实数区间内取值(称为连续型总体)运用在初中内取值(称为连续型总体)运用在初中“统计初步”里学过的方法,可以得到这些“统计初步”里学过的方法,可以得到这些数据的以下数据的以下频率分布表频率分布表和和频率分布直方图频率分布直方图(图(图12)具体步骤如下:
)具体步骤如下:
一一、计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。
二、决定组距与组数(将数据分组)组距:
指每个小组的两个端点的距离,组距=极差/组数极差为:
25.5625.24=0.3三.决定分点可以令分点比数据多1位小数,并且把第1小组的起点稍微减少一点组数:
将数据分组,当数据在100个以内时,按数据多少分成512组分分组组个数累计个数累计频数频数频频率率累计频率累计频率25.235,25.265)一一10.010.0125.265,25.295)T20.020.0325.295,25.325)正正50.050.0825.325,25.355)正正正正T120.120.2025.355,25.385)正正正下正正正下180.180.3825.385,25.415)正正正正正正正正正正250.250.6725.415,25.445)正正正一正正正一160.160.7925.445,25.475)正正下正正下130.130.9225.475,25.505)TT40.040.9625.505,25.535)T20.020.9825.535,25.565)T20.021.00合合计计1001.00四.列出频率分布表00.050.10.150.20.250.31频率频率/组组距距产品尺寸产品尺寸(mm)五.画频率分布直方图注意:
直方图的纵轴表示频率与组距的比值,长方形的面积率频距组距率组频思考:
频率分布条形图和频率分布直方图是两个相同的概念吗?
有什么区别?
频率分布的条形图和频率分布直方图的区别频率分布的条形图和频率分布直方图的区别两者是不同的概念;横轴:
两者表示内容相同纵轴:
两者表示的内容不相同频率分布条形图的纵轴(长方形的高)表示频率频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组据上长方形的面积。
长方形的面积率频距组距率组频频率分布直方图频率分布直方图图图12表明了所抽取的表明了所抽取的100件产品件产品中,尺寸落在各个小组内的频率的大小样中,尺寸落在各个小组内的频率的大小样本容量越大,所分组数越多,各组的频率就本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率设想越接近于总体在相应各组取值的概率设想样本容量无限增大,分组的组距无限缩小,样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条那么频率分布直方图就会无限接近于一条光光滑曲线滑曲线总体密度曲线总体密度曲线,如图,如图13所示所示总体密度总体密度曲线曲线反映了反映了总体分布总体分布,即反映了总,即反映了总体在各个范围内取值的概率根据这条曲线体在各个范围内取值的概率根据这条曲线,图中带斜线部分的,图中带斜线部分的面积面积,就是总体,就是总体在区间在区间(a,b)内取值的概率)内取值的概率通常,我们不易知道一个总体的分布通常,我们不易知道一个总体的分布情况在实践中,往往是从总体中抽取一个情况在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布样本,用样本的频率分布去估计总体分布一般地,样本容量越大,这种估计就越精确一般地,样本容量越大,这种估计就越精确比如说,利用表比如说,利用表13中的频率中的频率分布表,可对总体分布进行估计从表中分布表,可对总体分布进行估计从表中看到,样本数据落在看到,样本数据落在25.355到到25.445之间之间的频率为的频率为0.59,说明产品尺寸在这个范围,说明产品尺寸在这个范围内的概率约为内的概率约为0.59例例1
(1)某厂生产的产品可分为)某厂生产的产品可分为一等品、二等品、等外品三类一等品、二等品、等外品三类抽查检验的记录为一等品抽查检验的记录为一等品96个,二等品个,二等品195个,等外品个,等外品9个、估计产品中的一等品个、估计产品中的一等品率、二等品率、等外品率,并画出频率分布率、二等品率、等外品率,并画出频率分布条形图条形图123设设=解:
(解:
(1)一等品率的估计)一等品率的估计二等品率的估计二等品率的估计;等外品率的估;等外品率的估计;计;频率分布条形图如下:
频率分布条形图如下:
196
(1)32%300pPx=2195
(2)65%300pPx=39(3)3%300pPx=
(2)如果已知产品的一等品率、二等品率、)如果已知产品的一等品率、二等品率、等外品率分别是等外品率分别是32,65,3设设的定义与的定义与相同,求相同,求的概率分布及其条形的概率分布及其条形图,将这个图形与频率分布条形图进行比较图,将这个图形与频率分布条形图进行比较。
(2)的分布列为的分布列为的概率分布条形图与(的概率分布条形图与
(1)中的图形)中的图形相同。
相同。
例例2为了解某地儿童生长发育情况,为了解某地儿童生长发育情况,抽查了抽查了100名名7岁女童的身高(岁女童的身高(cm),),已按数据的大小排列如下:
已按数据的大小排列如下:
84.484.585.285.786.286.486.987.187.387.687.988.288.488.488.588.789.089.089.189.289.389.389.489.890.090.l90.290.390.490.690.790.891.191.191.191.491.791.791.791.891.992.192.592.592.792.792.892.892.992.993.093.193.293.293.493.593.693.693.693.893.994.094.394.394.494.494.494.594.694.794.894.995.095.195.195.195.595.695.696.096.296.396.496.596.897.097.297.397.397.998.398.498.799.299.399.499.5100.7100.9101.5(l)列出样本数据的频率分布表;)列出样本数据的频率分布表;
(2)画出频率分布直方图;)画出频率分布直方图;(3)利用频率直方图,估计身高在第)利用频率直方图,估计身高在第4、第第5两个组的概率;两个组的概率;(4)估计身高不小于)估计身高不小于90cm的概率;的概率;(5)利用频率分布表估计身高的平均值)利用频率分布表估计身高的平均值解:
(解:
(1)样本数据的极差(最大值与)样本数据的极差(最大值与最小值之差)为最小值之差)为R=101.584.4=17.1,将,将组距定为组距定为2,第,第1小组起点取为小组起点取为84,则组,则组数为数为8,样本的频率分布表为,样本的频率分布表为身身高高84,86)86,88)88,90)90,92)92,94)94,96)96,98)98,100)100,102)合计频频数数47131720181173100频频率率.04.07.13.17.20.18.110.070.031.00
(2)频率分布直方图)频率分布直方图(3)身高在第)身高在第4第第5两个小组内的概率的两个小组内的概率的估计为其频率为估计为其频率为0.170.20=0.37(4)身高不小于)身高不小于90cm的频率为第的频率为第3至第至第9组内的频率之和组内的频率之和0.76,即身高不小于,即身高不小于90cm概率的估计值为概率的估计值为0.76(5)身高的均值的估计为)身高的均值的估计为1(8548771013)92.86100x=+L例例3某工厂甲、乙两个车间包装同一种产某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔品,在自动包装传送带上,每隔1小时抽小时抽一包产品,称其重量是否合格,分别记录一包产品,称其重量是否合格,分别记录抽查数据如下:
抽查数据如下:
甲车间:
甲车间:
102,101,99,98,103、98,99乙车间:
乙车间:
110,105,94,95,109,89,98问:
(问:
(1)这种抽样是何种抽样方法?
)这种抽样是何种抽样方法?
(2)估计甲、乙两车间包装重量的均值)估计甲、乙两车间包装重量的均值与方差,并说哪个均值的代表性好?
哪个与方差,并说哪个均值的代表性好?
哪个车间包装重量较稳定?
车间包装重量较稳定?
解:
(解:
(1)根据系统抽样方法的定义可知)根据系统抽样方法的定义可知这是系统抽样方法这是系统抽样方法
(2)先计算)先计算,1(10210199)1007x=+=L1(11010598)1007x=+=L再计算再计算2221(102100)(99100)3.42867s=-+-=L22221(110100)(98100)567ss=-+-=L?
因为因为这说明甲车间包装重量比乙车这说明甲车间包装重量比乙车间稳定,甲车间的均值间稳定,甲车间的均值100的代表强的代表强222,xxss=练习题练习题练习题练习题1在频率分布直方围中,各个小长方形的在频率分布直方围中,各个小长方形的面积表示(面积表示()(A)落在相应各组的数据的频数)落在相应各组的数据的频数(B)相应各组的频率)相应各组的频率(C)该样本所分成的组数)该样本所分成的组数(D)该样本)该样本的样本容量的样本容量B2可用于总体数学期望的估计是(可用于总体数学期望的估计是()()(A)样本均值)样本均值(B)样本极差)样本极差R=max(x1,xn)min(x1,xn)(C)样本)样本方差方差(D)样本平均差)样本平均差A3以下可以描述总体稳定性的统计量是(以下可以描述总体稳定性的统计量是()(A)样本均值)样本均值(B)样本中位数)样本中位数(C)样本方差)样本方差s2(D)样本最大值)样本最大值S(n)C4在已分组的数据中,每组的频数是指在已分组的数据中,每组的频数是指,每组的频率是指,每组的频率是指。
落入该组的数据的个数落入该组的数据的个数落入该组数据个数与数据总数的比落入该组数据个数与数据总数的比值值5某电视栏目收视情况的调查结果为:
某电视栏目收视情况的调查结果为:
抽查抽查100户,有户,有30户收看此栏目,则此栏户收看此栏目,则此栏目的收视率的估计是目的收视率的估计是。
306某医院急诊中心关于其病人等待急诊某医院急诊中心关于其病人等待急诊的时间记录如下:
的时间记录如下:
用上述分组资料计算得病人平均等待时间的用上述分组资料计算得病人平均等待时间的估计值估计值=,病人等待时间标,病人等待时间标准差的估计值准差的估计值s=。
0.5(分钟分钟)5.34(分钟)(分钟)1(2.547.5822.51)0.520+L22221(2.59.5)4(7.59.5)8(22.59.5)28.5,205.34ss=-+-=L7假定下述数据是甲、乙两个供货商的交假定下述数据是甲、乙两个供货商的交货天数。
甲:
货天数。
甲:
10,9,10,10,11,11,9,11,10,10;乙:
;乙:
8,10,14,7,10,11,10,8,15,12估计两个供货商的交货情况,并问估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性货时间较具一致性与可靠性解:
解:
(10+9+10)=10.1,110x=(8+10+12)=10.5,110x=(102+92+102)10.12=0.49,2110s=(82+102+122)10.52=6.052110s=从交货天数的平均值来看,甲供从交货天数的平均值来看,甲供货商的供货天数短一些;从方差来看,甲货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此是较具一供货商的交货天数较稳定,因此是较具一致性与可靠性的厂商致性与可靠性的厂商8设一组数据的方差是设一组数据的方差是s2,将这组数据的,将这组数据的每个数据都乘以每个数据都乘以10,所得到的一组新数据,所得到的一组新数据的方差是(的方差是()(A)0.1s2(B)s2(C)10s2(D)100s2D解:
设原数据组为解:
设原数据组为x1,x2,xn,方差,方差为为2211(),niisxcn=-11niixxn=新数据组为新数据组为10x1,10x2,10xn,方,方差为差为2211(10),niisxa=-111010niiaxxn=其中其中222211111(1010)100()100nniiiisxxxxsnn=-=-=邋9为了检验某自来水消毒设备的效果,现为了检验某自来水消毒设备的效果,现从消毒后的水中随机抽取从消毒后的水中随机抽取50升,化验每升升,化验每升水中大肠杆菌的个数化验结果如下:
水中大肠杆菌的个数化验结果如下:
则所取则所取50升水中平均含有大肠杆菌升水中平均含有大肠杆菌个升,估计全部消毒过的自来水中平个升,估计全部消毒过的自来水中平均每升水的大肠杆菌的含量为均每升水的大肠杆菌的含量为个个11课后练习课堂小结总体分布反映了总体在各个范围内取值的概率,对于所取不同数值较少的总体,常用条形图来表示相应样本的频率分布;对于所取不同数值较多或可以在实数区间内取值的总体,常用频率分布直方图来表示相应样本的频率分布。
由于总体分布通常不易知道,我们往往是用样本的频率分布去估计总体分布,一般样本容量越大,这种估计就越精确。
课外作业习题1.42,329P练习:
1,228P小结与练习
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 第四 总体 分布 估计 人教版