高三复习统计案例分析及典型例题Word格式.doc
- 文档编号:7888271
- 上传时间:2023-05-09
- 格式:DOC
- 页数:27
- 大小:1.04MB
高三复习统计案例分析及典型例题Word格式.doc
《高三复习统计案例分析及典型例题Word格式.doc》由会员分享,可在线阅读,更多相关《高三复习统计案例分析及典型例题Word格式.doc(27页珍藏版)》请在冰点文库上搜索。
例3(14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人
的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?
并写出具体过程.
解应采取分层抽样的方法. 3分
过程如下:
(1)将3万人分为五层,其中一个乡镇为一层. 5分
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.
300×
=60(人);
=40(人);
=100(人);
=60(人), 10分
因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分
(3)将300人组到一起即得到一个样本. 14分
练习:
一、填空题
1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为.
答案15,10,20
2.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;
从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为.
答案系统抽样,简单随机抽样
3.下列抽样实验中,最适宜用系统抽样的是(填序号).
①某市的4个区共有2000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样
②某厂生产的2000个电子元件中随机抽取5个入样
③从某厂生产的2000个电子元件中随机抽取200个入样
④从某厂生产的20个电子元件中随机抽取5个入样
答案③
4.(2013·
重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是.
答案分层抽样法
5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是(填序号).
①高一学生被抽到的概率最大
②高三学生被抽到的概率最大
③高三学生被抽到的概率最小
④每名学生被抽到的概率相等
6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是.
答案6
7.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.
答案10
8.将参加数学竞赛的1000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为.
答案0795
9.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?
解用分层抽样抽取.
(1)∵20∶100=1∶5,
∴=2,=14,=4
∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.
(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;
对一般干部可用随机数表法抽取14人.
(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.
10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;
如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.
解总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取工程师×
6=(人),
抽取技术人员×
12=(人),
抽取技工×
18=(人).
所以n应是6的倍数,36的约数即n=6,12,18,36.
当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为,因为必须是整数,所以n只能取6,即样本容量为6.
总体分布的估计与总体特征数的估计
1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为.
答案5
2.(2008·
山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为.
答案303.6
3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|=.
答案
4.(2008·
山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为.
分数
5
4
3
2
1
人数
20
10
30
5.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是.
答案40
典型例题:
例1在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比?
(2)哪组上交的作品数量最多?
有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高?
解
(1)第三组的频率为=
又因为第三组的频数为12,∴参评作品数为=60.
(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×
=18(件).
(3)第四组的获奖率是=,第六组上交的作品数量为60×
=3(件),
∴第六组的获奖率为=,显然第六组的获奖率高.
例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30min抽取一包产品,称其重量,分别
记录抽查数据如下:
甲:
102, 101, 99, 98, 103, 98, 99;
乙:
110, 115, 90, 85, 75, 115, 110.
(1)这种抽样方法是哪一种?
(2)将这两组数据用茎叶图表示;
(3)将两组数据比较,说明哪个车间产品较稳定.
解
(1)因为间隔时间相同,故是系统抽样. 2分
(2)茎叶图如下:
5分
(3)甲车间:
平均值:
=(102+101+99+98+103+98+99)=100, 7分
方差:
s12=[(102-100)2+(101-100)2+…+(99-100)2]≈3.4286. 9分
乙车间:
=(110+115+90+85+75+115+110)=100, 11分
s22=[(110-100)2+(115-100)2+…+(110-100)2]≈228.5714. 13分
∵=,s12<s22,∴甲车间产品稳定. 14分
1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.
(1)求第四小组的频率;
(2)参加这次测试的学生人数是多少?
(3)在这次测试中,学生跳绳次数的中位数落在第几小组内?
解
(1)第四小组的频率=1-(0.1+0.3+0.4)=0.2.
(2)设参加这次测试的学生人数是n,
则有n==5÷
0.1=50(人).
(3)因为0.1×
50=5,0.3×
50=15,0.4×
50=20,0.2×
50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内.
1.下列关于频率分布直方图的说法中不正确的是.
①直方图的高表示取某数的频率
②直方图的高表示该组上的个体在样本中出现的频率
③直方图的高表示该组上的个体数与组距的比值
④直方图的高表示该组上的个体在样本中出现的频率与组距的比值
2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:
6,8,9,9,8;
10,7,7,7,9.则这两人的射击成绩比稳定.
答案甲乙
4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:
右图是得到的频率分布直方图.
设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为.
答案0.9,35
6.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩
分别是x甲、x乙,则x甲x乙,比稳定.
答案<乙甲
7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是.
答案10.5、10.5
二、解答题
10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?
样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?
请说明理由.
解
(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为:
=0.08.
又因为频率=,
所以样本容量===150.
(2)由图可估计该学校高一学生的达标率约为
×
100%=88%.
(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.
线性回归方程基础自测
1.下列关系中,是相关关系的为(填序号).
①学生的学习态度与学习成绩之间的关系;
②教师的执教水平与学生的学习成绩之间的关系;
③学生的身高与学生的学习成绩之间的关系;
④家庭的经济条件与学生的学习成绩之间的关系.
答案①②
2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).
①直线l1,l2有交点(s,t)
②直线l1,l2相交,但是交点未必是(s,t)
③直线l1,l2由于斜率相等,所以必定平行
④直线l1,l2必定重合
答案①
3.下列有关线性回归的说法,正确的是(填序号).
①相关关系的两个变量不一定是因果关系
②散点图能直观地反映数据的相关程度
③回归直线最能代表线性相关的两个变量之间的关系
④任一组数据都有回归直线方程
4.下列命题:
①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过回归直线=+及回归系数,可以估计和预测变量的取值和变化趋势.
其中正确命题的序号是.
5.已知回归方程为=0.50x-0.81,则x=25时,的估计值为.
答案11.69
例1下面是水稻产量与施化肥量的一组观测数据:
施化肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
(1)将上述数据制成散点图;
(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?
水稻产量会一直随施化肥量的增加而增长吗?
解
(1)散点图如下:
(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.
例2(14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出
的关系,该市统计部门随机调查了10个家庭,得数据如下:
家庭编号
6
7
8
9
xi(收入)千元
0.8
1.1
1.3
1.5
1.8
2.0
2.2
2.4
2.8
yi(支出)千元
0.7
1.0
1.2
1.7
2.5
(1)判断家庭平均收入与月平均生活支出是否相关?
(2)若二者线性相关,求回归直线方程.
解
(1)作出散点图:
5分
观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分
(2)=(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,
=(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42, 9分
=≈0.8136,
=1.42-1.74×
0.8136≈0.0043, 13分
∴回归方程=0.8136x+0.0043. 14分
例3下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据.
x
y
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据
(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:
3×
2.5+4×
3+5×
4+6×
4.5=66.5)
解
(1)散点图如下图:
(2)==4.5,==3.5
=3×
3+4×
5+6×
4.5=66.5.
=32+42+52+62=86
∴===0.7
=-=3.5-0.7×
4.5=0.35.
∴所求的线性回归方程为=0.7x+0.35.
(3)现在生产100吨甲产品用煤
y=0.7×
100+0.35=70.35,
∴降低90-70.35=19.65(吨)标准煤.
1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.
年平均气温
12.51
12.84
13.69
13.33
12.74
13.05
年降雨量
748
542
507
813
574
701
432
(1)试画出散点图;
(2)判断两个变量是否具有相关关系.
解
(1)作出散点图如图所示,
(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.
2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:
温度(x)
50
70
溶解度(y)
66.7
76.0
85.0
112.3
128.0
由资料看y与x呈线性相关,试求回归方程.
解=30,==93.6.
=≈0.8809.
=-=93.6-0.8809×
30=67.173.
∴回归方程为=0.8809x+67.173.
3.某企业上半年产品产量与单位成本资料如下:
月份
产量(千件)
单位成本(元)
73
72
71
69
68
(1)求出线性回归方程;
(2)指出产量每增加1000件时,单位成本平均变动多少?
(3)假定产量为6000件时,单位成本为多少元?
解
(1)n=6,=21,=426,=3.5,=71,
=79,=1481,
===-1.82.
=-=71+1.82×
3.5=77.37.
回归方程为=+x=77.37-1.82x.
(2)因为单位成本平均变动=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有:
产量每增加一个单位即1000件时,单位成本平均减少1.82元.
(3)当产量为6000件时,即x=6,代入回归方程:
=77.37-1.82×
6=66.45(元)
当产量为6000件时,单位成本为66.45元.
1.观察下列散点图,则①正相关;
②负相关;
③不相关.它们的排列顺序与图形对应顺序是.
答案a,c,b
2.回归方程=1.5x-15,则下列说法正确的有个.
①=1.5-15
②15是回归系数a
③1.5是回归系数a
④x=10时,y=0
答案1
3.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为=8.25x+60.13,下列叙述正确的是.
①该地区一个10岁儿童的身高为142.63cm
②该地区2~9岁的儿童每年身高约增加8.25cm
③该地区9岁儿童的平均身高是134.38cm
④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高
答案②
4.三点(3,10),(7,20),(11,24)的回归方程是.
答案=1.75x+5.75
5.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y与x有相关关系,得到回归直线方程=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为.
答案83%
6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得=52,=228,=478,=1849,则其线性回归方程为.
答案=11.47+2.62x
7.有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是.
答案①③④
8.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:
使用年限x
维修费用y
3.8
5.5
6.5
7.0
若y对x呈线性相关关系,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 复习 统计 案例 分析 典型 例题