随机抽样、用样本估计总体、正态分布.pptx
- 文档编号:14142064
- 上传时间:2023-06-21
- 格式:PPTX
- 页数:68
- 大小:2.82MB
随机抽样、用样本估计总体、正态分布.pptx
《随机抽样、用样本估计总体、正态分布.pptx》由会员分享,可在线阅读,更多相关《随机抽样、用样本估计总体、正态分布.pptx(68页珍藏版)》请在冰点文库上搜索。
第第6969讲随机抽样、用样本估计总体、正态分布讲随机抽样、用样本估计总体、正态分布1会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法2了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点3理解样本数据标准差的意义和作用,会计算数据标准差,并能做出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想会用统计思想解决一些简单的实际问题5通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特点及曲线所表示的意义()()()121._.231nxnxxxx平均数:
一组数据的平均数,记为设有个数据,则平均数为中位数:
一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数当这组数据的个数为奇数时,中位数为中间一个数;当这组数据的个数为偶数时,中位数为中间数据的基本数字特征的两个数的平均数众数:
一组数据中出现次数最多的数()()()2245s_.6.ss=极差:
一组数据中最大数与最小数的差方差:
一组数据中所有数与平均数的差的平方和的平均数,记为,即标准差:
方差的算术平方根,记作()()()12()()()()()()23基本统计图表:
象形、条形、折线、直方图、茎叶图频率分布直方图的画图步骤:
求极差;决定组距与组数;将数据分组;频率列频率分布表;画频率分布直方图以为纵坐标组距频率分布折线图:
连接频率分布直方图中各小长方形上端的中点所主要统计图表得的折线()()45()总体密度曲线:
随着样本容量的增加,作频率分布折线图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,则称这条光滑曲线为总体密度曲线茎叶图:
中间的数字表示数据的十位十位和百位数字,旁边的数字分别表示两组数据中各个数据的个位数字()1Nn(nN)_.()_3Nnn简单随机抽样:
从含有个个体的总体中逐个不放回地抽取个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做有两种常用方法:
就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中取出一个号签,连续抽取次,就得到一个容量抽样方法为的样本()()()_2()()()1()()3_.Nkllk:
利用随机数表、随机数骰子或计算机产生的随机数进行抽样系统抽样:
按下列步骤进行抽样:
先将总体的个个体编号;确定分段间隔,对编号进行分段;在第段用简单随机抽样确定第一个个体编号;按照一定的规则抽取样本分层抽样:
即()()()21_.()()d_4_.baxNabPabxxmsmsxjmsxmsxmsxxjx=,如果随机变量的概率密度为其中、分别表示总体的平均数与标准差,称服从参数为、的正态分布,记作,函数图象称为正态密度曲线,简称正态曲线一般的,如果对于任何实数,随机变量满足,则称正态分布的分布为()()()()2_0,10,13()()()NNxxxxmsxmm=标准正态分布在正态分布中,当,时,正态总体称为标准正态总体,正态分布,称为标准正态分布,记作正态曲线的性质曲线在轴的上方,与轴不相交;曲线关于直线对称;曲线在时位于最高点;()x()xxmmmsss当时,曲线上升;当时,曲线下降,并且当曲线向左、右两边无限延伸时,以轴为渐近线向它无限靠近;当一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中()()()22224().5()()0.6826(22)0.9544(33)0.9974.6()_3NEDXNPXPXPXNXxmsxmxsmsmsmsmsmsmsmsmss=-=-=-=若,则,若,则,通常认为服从正态分布,的随机变量只取,并简称之为原则222221212()2.1()201(33)nnxxxxxxxxxxnnexmspsmsms-+(-)+(-)+(-)-+;简单随机抽样;抽签法;随机数表法;在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽出一定数量的个体,将各层取出的个体合在一起作为样本;,;正态分布;,【要点指南】之间的值1.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为()A10人B12人C24人D30人【解析】抽取男的人运动员数为2148364812人,故选B.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均值为x,则()AmemoxBmemoxCmemoxDmomex【解析】由图可知30名学生的得分情况依次为2人得3分,3人得4分,10人得5分,6人得6分,3人得7分,2人得8分,2人得9分,2人得10分,则中位数为第15,16个数为5和6的平均数,即me5.5,5出现次数最多,故mo5,x233410566372829210305.97,于是momex,故选D.3.有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为()A18B36C54D72【解析】由可知本据在图样数10,12)的率内频为0.18,本据在则样数区间10,12)的内频数为36,故选B.4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s23.2.【解析】因为x15(106856)7,所以s215(107)2(67)2(87)2(57)2(67)23.2.5.已知随机变量X服从正态分布N(2,2),且P(X4)0.8,则P(0X2)0.3.【解析】因为2,所以P(X4)1P(X4)0.8,所以P(X4)P(X2)0.2,所以P(0X2)12P(0X4)12(120.2)0.3.一一用样本估计总体用样本估计总体【例1】在某次测验中,有6位同学的平均成绩为75分用xn表示编号为n(n1,2,6)的同学所得成绩,且前5位同学的成绩如下:
(1)求第6位同学的成绩x6,以及这6位同学成绩的标准差s;
(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率【解析】
(1)因为这6位同的平均成学绩为75分,所以16(7076727072x6)75,所以x690,即第6位同的成学数学绩为90分,这6位同成的方差学绩为s216(7075)2(7675)2(7275)2(7075)2(7275)2(9075)249,所以准差标s7.
(2)前从5位同中机取学随选2位同,共有学C2510种果,恰有一位同的成在结学绩(68,75)中有(70,76),(76,72),(76,70),(76,72)共4果,故所求率种结概为P4100.4.【点评】用本估体即用本的平均、方差、样计总样值标准差估体的平均、方差和准差计总值标素材素材1设矩形的长为a,宽为b,其比满足ba5120.618,这种矩形给人以美感,称为黄金矩形黄金矩形常应用于工艺品设计中下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:
0.5980.6250.6280.5950.639乙批次:
0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()A甲批次的总体平均数与标准值更接近B乙批次的总体平均数与标准值更接近C两个批次总体平均数与标准值接近程度相同D两个批次总体平均数与标准值接近程度不能确定【解析】甲批次的平均数为0.617,乙批次的平均数为0.613.所以,可以估甲批次的体平均准更计总数与标值接近,故选A.【点评】本估体即以本的平均、方差样计总样数估体的平均、方差计总数二茎叶图及应二茎叶图及应用用【例2】(2011深圳第一次调研)第26届世界大学生夏季运动会将于2011年8月12日到23日在深圳举行,为了搞好接待工作,组委会在某学院招募了12名男志愿者和18名女志愿者将这30名志愿者的身高编成如下所示的茎叶图(单位:
cm):
若身高在175cm以上(包括175cm)定义为“高个子”,身高在175cm以下(不包括175cm)定义为“非高个子”,且只有“女高个子”才担任“礼仪小姐”
(1)如果用分层抽样的方法从“高个子”和“非高个子”中抽取5人,再从这5人中选2人,那么至少有一人是“高个子”的概率是多少?
(2)若从所有“高个子”中选3名志愿者,用表示所选志愿者中能担任“礼仪小姐”的人数,试写出的分布列,并求的数学期望【解析】
(1)根据叶,有茎图“高子个”12人,“非高子个”18人,用分抽的方法,每人被抽中的率是层样个概53016,所以中的选“高子个”有12162人,“非高子个”有18163人用事件A表示“至少有一名高子个被中选”,的立则它对事件A表示“有一名没高子个被中选”,则P(A)1C23C251310710.因此,至少有一人是“高子个”的率是概710.
(2)依意,题的可能取值为0,1,2,3,则P(0)C38C3121455,P
(1)C14C28C3122855,P
(2)C24C18C3121255,P(3)C34C312155.因此,的分布列如下:
所以E01455128552125531551.【点评】了解叶的制思想,由叶原本茎图绘会茎图还样据,能用本估体的思想分析解数并应样计总决实际问题素材素材2随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:
cm),获得身高数据如下:
甲班:
182,158,162,170,179,163,168,179,171,168乙班:
159,168,162,170,173,165,181,176,178,179
(1)根据甲、乙两班身高的数据画出对应的茎叶图,并依据茎叶图判断哪个班的平均身高较高;
(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率【解析】
(1)叶如下:
茎图由叶可知:
甲班同的身高集中于茎图学160cm179cm之,而乙班同的身高集中于间学170cm180cm之,因此,间乙班同的平均身高高于甲班学
(2)x15816216316816817017117917918210170(cm)甲班的样本方差为110(158170)2(162170)2(163170)2(168170)2(168170)2(170170)2(171170)2(179170)2(179170)2(182170)257.2.(3)设身高为176cm的同学被抽中的事件为A.从乙班10名同学中抽取两名身高不低于173cm的同学有:
(181,173),(181,176),(181,178),(181,179),(179,173),(179,176),(179,178),(178,173),(178,176),(176,173),共10个基本事件而事件A含有4个基本事件,所以P(A)41025.【点评】叶原始据的再,方便察分析茎图为数现观平均和方差,同也方便添加新的据数时数三直方图及应三直方图及应用用【例3】某班同学在“两会”期间进行社会实践活动,对25,55岁的人群随机抽取n人进行了一次当前投资生活方式“房地产投资”的调查,得到如下统计表和各年龄段人数频率分布直方图:
(1)补全频率分布直方图并求n,a,p的值;
(2)从年龄在40,50)岁的“房地产投资”人群中采用分层抽样法抽取18人参加投资管理学习活动,其中选取3人作为代表发言,记选取的3名代表中年龄在40,45)岁的人数为X,求X的分布列和期望EX.【解析】
(1)由意可知,第二的率题组频为1(0.040.040.030.020.01)50.3,所以第二的组率频距组0.350.06,率分布直方如下:
频图第一的人组数为1200.6200,率频为0.0450.2,所以n2000.21000;第二的率组频为0.3,所以第二人组数为10000.3300,故p1953000.65;第四的率组频为0.0350.15,所以第四人组数为10000.15150,所以a1500.460.
(2)因率在为频40,45)的岁“房地投产资”人年数与在龄45,50)的岁“房地投产资”人的比数为60302.所以采取分抽法抽取的层样18人,年在龄40,45)岁的有12人,在45,50)的有岁6人P(X0)C012C36C3185204,P(X1)C112C26C3181568,P(X2)C212C16C3183368,P(X3)C312C06C31855204.X的分布列如下:
期望数学EX0520411568233683552042.素材素材3在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,数据分组如下表:
(1)完成频率分布表,并在给定的坐标系中画出频率分布直方图;
(2)估计纤度落在1.38,1.50)中的概率及纤度小于1.40的概率是多少?
(3)统计方法中,同一组数据常用该组区间的中点值(例如区间1.30,1.34)的中点值是1.32)作为代表据此,估计纤度的期望【解析】
(1)率分布表:
频为
(2)度落在纤1.38,1.50)中的率概约为0.300.290.100.69,度小于纤1.40的率概约为0.040.25120.300.44.(3)体据的期望总数约为1.320.041.360.251.400.301.440.291.480.101.520.021.4088.备选例题备选例题已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是.【解析】由中位的定知数义ab210.5,x10.s211022323272a2b212213.7218.3220210102,当ab,时s2有最小,此值时a10.5,b10.5.1的基本思想方法是用本估体,即用局统计样计总部推整体,就要求本具有很好的代表性,断这样应而本良好客的代表性,完全依抽方法样观赖样三抽方法的比:
种样较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相等的;均属于不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少分层抽样将总体分成几层进行抽取各层抽样时采用简单随机抽样总体由差异明显的几部分组成系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多2.率分布直方使本的一些字特征更明,频图会样数显制率分布直方,要合理分,以便使据中绘频图时组数的特征能更好地反映出来体分布估中,总计
(1)先确定分的,其方组组数法是:
最大据最小据之差除距得数与数组组数
(2)算每中的及率,其中率计组频数频频=.(3)出画直方图3叶的步如下:
画茎图骤
(1)每据分将个数为茎(高位)和叶(低位)部分两;
(2)最小和最大之按大小次序排成一列,将茎茎间数在左写(右);侧(3)各据的叶按大小次序在其右将个数写茎(左)侧;频数总数4用本的字特征样数(、中位、平均众数数数)估体字特征计总数5正分布用十分广泛,用正分布的态应应态关键是通形合,利用正分布曲分析求解,过数结态线或化“转为,2,3原”求解则问题6由正曲点态线过(a,0)和点(b,0)的两条x的轴垂,及线x所成的平面形的面,就是轴围图积随机量变落在区间(a,b)的率的近似,且正概值曲态线与x成的面轴围总积为1.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 抽样 样本 估计 总体 正态分布