三种抽样方法的概念和一般步骤.docx
- 文档编号:13858853
- 上传时间:2023-06-18
- 格式:DOCX
- 页数:27
- 大小:186.08KB
三种抽样方法的概念和一般步骤.docx
《三种抽样方法的概念和一般步骤.docx》由会员分享,可在线阅读,更多相关《三种抽样方法的概念和一般步骤.docx(27页珍藏版)》请在冰点文库上搜索。
三种抽样方法的概念和一般步骤
一:
情景引入
1.要考察某公司生产的500袋装牛奶的质量是否达标,现从中抽取60袋进行检验,则总体是?
总体个数N是?
样本是?
样本个数n?
2.如何判断一锅汤的味道的好坏?
A全部喝完
B舀上面油多的一勺汤品尝
C舀下面味道重的一勺汤品尝0
D搅拌均匀后再随机舀一勺汤品尝
思考:
要获取一个有代表性的好的样本,关键是。
二、新课:
(一)简单随机抽样
1.思考:
例1.要在我们班选出五个人去参加劳动,怎样选才是最公平的呢?
2.简单随机数法的概念:
P58
3.简单随机抽样必须具备下列特点:
(1)总体个数N是限的。
(2)样本个数n总体的个数N。
(3)放回的抽样。
(4)每个个体被抽到的机会.
4.简单随机抽样的方法有和
5.既学即练:
(1)下列抽样的方式是否属于简单随机抽样?
为什么?
A.从无限多个个体中抽取50个个体作为样本.
B.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.
(2)为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是
A.总体是240
B、个体是每一个学生
C、样本是40名学生
D、样本容量是40
(3)从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是。
(二)系统抽样
1.思考:
例2.我校为了了解高一年级学生对教师教学的意见,打算从高一年级的500名学生中抽取50名进行调查.你怎样进行操作呢?
P60
2.系统抽样概念:
P60
3.进行系统抽样的步骤:
,,和P60
4.既学即练:
(1)下列抽样中不是系统抽样的是()
A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到
大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样
B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
(三)分层抽样
1.思考:
例3.假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
2.分层抽样定义:
P63
3.分层抽样的步骤:
,,和.
4.分层抽样应遵循以下要求:
(1)分层遵循不重复、不遗漏的原则。
(2)在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
5.既学即练:
(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行()
A、每层等可能抽样
B、每层不等可能抽样
C、所有层按同一抽样比等可能抽样
(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n样本,那么每个个体被抽到的可能性为()
A.
B.
C.
D.
(3)某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()
A.15,5,25B.15,15,15
C.10,5,30D.15,10,20
(4)某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=。
(四)简单随机抽样、系统抽样、分层抽样的比较
类别
共同点
各自特点
联系
适用
范围
简单
随机
抽样
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
将总体均分成几部分,按预先制定的规则在各部分抽取
在起始部分采样时采用简随机抽样
总体个数较多
系统
抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
分层
抽样
五.体验探究:
1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()
A.简单随机抽样
B.系统抽样
C.分层抽样
D.先从老人中剔除1人,然后再分层抽样
2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为人,A型血应抽取的人数为人,B型血应抽取的人数为人,AB型血应抽取的人数为人。
3.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()
A.5,10,15,20,25
B、3,13,23,33,43
C.1,2,3,4,5
D、2,4,6,16,32
4、一个地区共有5个乡镇,人口3万人,其中人口比例为3:
2:
5:
2:
3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?
并写出具体过程。
二、新课:
(一)频率分布直方图的作法:
1.探究:
P67
①确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?
为了较为合理地确定出这个标准,需要做哪些工作?
②给出100位居民的月均用水量表,讨论:
如何分析数据?
2.频率分布表和频率分布图,是从各个小组数据在样本容量中的角度,来表示数据分布的规律。
〈一〉频率分布的概念:
频率分布是指一个样本数据在各个小范围内所占。
一般用频率分布直方图反映样本的频率分布。
其一般步骤为:
,,
,和
3.动手作图
以课本P68制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。
4.既学即练:
(1)频率分布直方图2.2-1纵坐标表示?
(2)直方图是用表示在各个区间内取值的频率,小长方形面积的和为.
(3)频率分布直方图2.2-1表示每月用水量在1吨到3吨之间的居民所占比例是
0
(4)如果当地政府希望使88%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,那么制定月用水量标准是吨?
(二)频率分布折线图、总体密度曲线
1.定义频率分布折线图:
2.定义总体密度曲线:
3.既学即练:
(1)下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(ⅰ)列出样本频率分布表﹔
(ⅱ)画出频率分布直方图;
(ⅲ)估计身高小于134cm的人数占总人数的百分比.
解:
(1)样本频率分布表如下:
(2)其频率分布直方图如下:
122
126
130
134
138
142
146
150
158
154
身高(cm)
o
0.01
0.02
0.03
0.04
0.05
0.06
0.07
频率/组距
(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
(2)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:
4:
17:
15:
9:
3,第二小组频数为12.
(ⅰ)第二小组的频率是多少?
样本容量是多少?
90
100
110
120
130
140
150
次数
o
0.004
0.008
0.012
0.016
0.020
0.024
0.028
频率/组距
0.032
0.036
(ⅱ)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(ⅲ)在这次测试中,学生跳绳次数的中位数落在哪个小组内?
请说明理由。
分析:
在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。
解:
(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小
因此第二小组的频率为:
又因为频率=
所以
(2)由图可估计该学校高一学生的达标率约为
(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。
〈三〉茎叶图
1.茎叶图的概念:
当数据是两位有效数字时,用中间的数字表示,即第一个有效数字,两边的数字表示,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
2.茎叶图的特征:
(1)用茎叶图表示数据有两个优点:
一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
3.既学即练:
试将下列两组数据制作出茎叶图,并计算两组数据的平均数和方差.
甲得分:
13,51,23,8,26,38,16,33,14,25,39,
乙得分:
49,24,12,31,60,31,44,36,15,37,24
《同步》
(一)、众数、中位数、平均数
1.已知数据:
10,11,12,12,13,13,13,14,15,根据初中所学的知识,中位数是
、众数是
、平均数是
2.在样本数据的频率分布直方图中
是众数。
3.在频率分布直方图中,矩形的大小正好表示对应组的频率的大小,即中位数左边和右边的直方图的
相等。
4.估计平均数:
频率分布直方图中每个小矩形的
乘以小矩形
之和
5.众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.
(二)、标准差、方差
1.标准差
考察样本数据的分散程度的大小,最常用的统计量是标准差。
标准差是
,一般用s表示。
其计算公式为:
。
2.
(1)标准差用来表示
,标准差越大,数据的离散程度就
,也就越
.
(2)标准差为0的样本数据的特点是
(3)
几乎包含了所有样本数据.
(4)习惯用标准差的平方
——方差来表示数据的分散程度,
即
.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.
周末练习《同步》①P.23—P.26的
(1)—(16)
②P.62—P.66的
(1)—(19)
变量之间的相关关系
一.创设情境:
1.某种笔记本每个5元,买x
{1,2,3,4}个笔记本的钱数记为y(元),试写出以x为自变量的函数y的解析式,并画出这个函数的图像
2.关于“名师出高徒”解释正确的是()
A.教师的水平越高,则学生的成绩一定越好
B.学生的成绩越好,则教师的水平越高
C.从总体来看教师的水平越高,则学生的成绩越好的可能性更大
D.教师的水平越高与学生的成绩越好没有关系
二、讲授新课:
(一)相关关系的概念
1.函数关系:
两个变量之间的关系是_________的关系(当自变量取值一定时,因变量也确定,则为确定关系)。
2.相关关系的概念:
两个变量之间的关系是_________的关系。
(当自变量取值一定时,因变量带有随机性),这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系。
(二)散点图
例1.出示例题:
在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:
年龄
23
27
38
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
分析数据:
大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加。
我们可以作散点图来进一步分析。
2.散点图的概念:
将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。
(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有_________关系.
(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有_________关系。
(3).如果所有的样本点都落在某一直线附近,变量之间就有_________关系。
3.正相关与负相关概念:
(1)如果散点图中的点散布在从________到_________的区域内,称为正相关。
(2)如果散点图中的点散布在从_________到_________的区域内,称为负相关。
(三).回归直线:
1.从例1散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近。
如果散点图中的点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫_________,直线方程叫_________。
2.提问:
怎样确定这条直线呢?
P91
(讨论:
1.选择能反映直线变化的两个点。
2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。
3.多取几组点对,确定几条直线方程。
再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。
)。
教师:
分别分析各方法的可靠性。
3.回归直线的求法
(1)求回归直线,关键是使得样本数据的点_______。
到它的距离的平方和最小
(2)回归公式见课本P.92
例2.三点
的线性回归方程是 ( )
A
B
C
D
D0
4.求线性回归方程的步骤:
(1)计算平均数
、
,
(2)计算
与
的积,求
(3)计算
,0
(4)将上述有关结果代入公式,求
,写出回归直线方程.
例3.有一间商店,为了研究气温对冰箕淋销售的影响。
经过统计,得到一个卖出的冰箕淋与当天气温的对比表。
气温
-5
0
4
12
19
21
23
27
31
36
冰箕淋个数
2
10
26
75
104
143
128
132
145
156
(1)画出散点图。
(2)求回归方程。
(3)如果气温是25,预测这天卖出的冰箕淋个数。
点评:
对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数
的计算公式,算出
.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:
计算平均数
;计算
与
的积,求
;计算
;将结果代入公式求
;用
求
;写出回归直线方程.
(07#18)(本小题满分12分)
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量
(吨)与相应的生产能耗
(吨标准煤)的几组对照数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出
关于
的线性回归方程
;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据
(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:
)
18.解:
(1)如下图
(2)
=3
2.5+4
3+5
4+6
4.5=66.5,
=
=4.5,
=
=3.5,
,
,
=3.5-0.7
4.5=0.35
故线性回归方程为y=0.7x+0.35
(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7
100+0.35=70.35,
故耗能减少了90-70.35=19.65(吨)
补充作业:
1.一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:
零件个数
(个)
10
20
30
40
50
60
70
80
90
100
加工时间
(分)
62
68
75
81
89
95
102
108
115
122
请判断
与
是否具有线性相关关系,如果
与
具有线性相关关系,求线性回归方程.
2.已知10只狗的血球体积及红血球数的测量值如下:
45
42
46
48
42
35
58
40
39
50
6.53
6.30
9.52
7.50
6.99
5.90
9.49
6.20
6.59
8.72
(血球体积
),
(红血球数,百万)
(1)画出上表的散点图;
(2)求出回归直线度且画出图形.
练习1.一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:
零件个数
(个)
10
20
30
40
50
60
70
80
90
100
加工时间
(分)
62
68
75
81
89
95
102
108
115
122
请判断
与
是否具有线性相关关系,如果
与
具有线性相关关系,求线性回归方程.
解:
在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:
∴
∴
∴所求线性回归方程为
2.已知10只狗的血球体积及红血球数的测量值如下:
0
45
42
46
48
42
35
58
40
39
50
6.53
6.30
9.52
7.50
6.99
5.90
9.49
6.20
6.59
8.72
(血球体积
),
(红血球数,百万)
(1)画出上表的散点图;
(2)求出回归直线度且画出图形.
解:
(1)图略
(2)
=
设回归直线方程为
,
则
,
=
所以所求回归直线的方程为
图形:
(略)0
3.以下是收集到的新房屋销售价格
与房屋的大小
的数据:
房屋大小
(
)
80
105
110
115
135
销售价格
(万元)
18.4
22
21.6
24.8
29.2
(1)画出数据的散点图;
(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线;
(3)计算此时
和
的值,并作比较.
解:
(1)图略
(2)
所以,线性回归方程为
.
(3)
,
由此可知,求得的
是函数
取最小值的
值.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 方法 概念 一般 步骤