届高考数学二轮复习第二篇专题通关攻略专题5统计与概率专题能力提升练十三251统计统计案例.docx
- 文档编号:15417229
- 上传时间:2023-07-04
- 格式:DOCX
- 页数:30
- 大小:329.61KB
届高考数学二轮复习第二篇专题通关攻略专题5统计与概率专题能力提升练十三251统计统计案例.docx
《届高考数学二轮复习第二篇专题通关攻略专题5统计与概率专题能力提升练十三251统计统计案例.docx》由会员分享,可在线阅读,更多相关《届高考数学二轮复习第二篇专题通关攻略专题5统计与概率专题能力提升练十三251统计统计案例.docx(30页珍藏版)》请在冰点文库上搜索。
届高考数学二轮复习第二篇专题通关攻略专题5统计与概率专题能力提升练十三251统计统计案例
专题能力提升练十三统计、统计案例
(45分钟 80分)
一、选择题(每小题5分,共30分)
1.(2018·资阳二模)为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:
根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【解析】选B.由等高条形图可知,服用药物A患病与未患病的比例数差异更加明显,所以药物A的预防效果优于药物B的预防效果.
2.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)内的频率为0.8,则样本中在[40,60)内的数据个数为( )
A.15 B.16 C.17 D.19
【解析】选A.因为样本中数据在[20,60)上的频率为0.8,由图知,样本中数据在[20,40)上的频率为4+5=9,所以样本中数据在[20,40)上的频率为9÷30=0.3.所以样本在[40,50),[50,60)内的数据的频率和为0.8-0.3=0.5,所以样本在[40,50),[50,60)内的数据的个数和为30×0.5=15.
3.下表是我国某城市在2017年1月份至10月份各月最低温与最高温(℃)的数据一览表.
月份
1
2
3
4
5
6
7
8
9
10
最高温
5
9
9
11
17
24
27
30
31
21
最低温
-12
-3
1
-2
7
17
19
23
25
10
已知该城市的各月最低温与最高温具有相关关系,根据该一览表,则下列结论错误的是( )
A.最低温与最高温为正相关
B.每月最高温与最低温的平均值在前8个月逐月增加
C.月温差(最高温减最低温)的最大值出现在1月
D.1月至4月的月温差(最高温减最低温)相对于7月至10月,波动性更大
【解析】选B.A项,由表格前两行(最高温、最低温)可知最低温大致随最高温增大而增大,故A项正确,不符合题意.B项,由表格可知,3月最高温与最低温的平均值为5℃,4月最高温与最低温的平均值为4.5℃<5℃,在前8个月不是逐月增加,故B项错误,符合题意.C项,由表格可知,月温差(最高温减最低温)的最大值出现在1月,故C项正确,不符合题意.D项,由表格可知,1月至4月的月温差(最高温减最低温)的平均值为
×(17+12+8+13)=12.5,则方差
=
×[(17-12.5)2+(12-12.5)2+(8-12.5)2+(13-12.5)2]=10.25.7月至10月的月温差(最高温减最低温)的平均值为
×(8+7+6+11)=8,则方差
=
×[(8-8)2+(7-8)2+(6-8)2+(11-8)2]=3.5,
>
1月至4月的波动性更大,故D项正确,不符合题意.
4.在某校连续5次考试中,统计甲、乙两名同学的数学成绩得到如图所示的茎叶图.已知甲同学5次成绩的平均数为81,乙同学5次成绩的中位数为73,则x+y的值为( )
A.3B.4
C.5D.6
【解析】选A.因为81=
所以x=0,因为乙同学5次成绩的中位数为73,
所以y=3,所以x+y=3.
【加固训练】
在一次马拉松比赛中,35名运动员的成绩(单位:
分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )
A.3 B.4C.5 D.6
【解析】选B.由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.
5.(2018·泸州三模)某中学兴趣小组为调查该校学生对学校食堂的某种食品喜爱与否是否与性别有关,随机询问了100名性别不同的学生,得到如下的2×2列联表:
男生
女生
总计
喜爱
30
20
50
不喜爱
20
30
50
总计
50
50
100
附K2=
.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
根据以上数据,该数学兴趣小组在犯错误的概率不超过多少的前提下认为“喜爱该食品与性别有关”?
( )
A.0.01B.0.025
C.0.05D.0.15
【解析】选C.k=
=4>3.841,所以该数学兴趣小组在犯错误的概率不超过0.05的前提下认为“喜爱该食品与性别有关”.
6.我国古代数学名著《九章算术》中有如下问题“今有北乡八千七百五十八,西乡七千二百三十六,南乡算八千三百五十六,凡三乡,发役三百七十八人,欲以算数多少出之,何各几何?
”意思是:
北乡有8758人,西乡有7236人,南乡有8356人,现要按人数多少从三乡共征集378人,问从各乡征集多少人?
在上述问题中,需从西乡征集的人数是( )
A.102B.112C.130D.136
【解析】选B.北乡有8758人,西乡有7236人,南乡有8356人,现要按人数多少从三乡共征集378人,需从西乡征集的人数是378×
≈112.
二、填空题(每小题5分,共10分)
7.某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为________.
【解析】样本数据落在[30,40)上的频率为0.038×10=0.38,落在[10,20)上的频率为0.012×10=0.12,因为支出在[30,40)元的同学比支出在[10,20)元的同学多26人,所以0.38n-0.12n=26,解得n=100.
答案:
100
【加固训练】
(2018·绵阳二模)交通部门利用测速仪测得成绵高速公路绵阳段2018年元旦期间某时段车速的数据(单位:
km/h),从中随机抽取2000个样本,作出如图所示的频率分布直方图,则绵阳段车速的中位数的估计值为____________.(精确到个位)
【解析】根据中位数的定义与频率分布直方图可得,在这2000个样本中,因为(0.010+0.030)×10=0.4,(0.010+0.030+0.035)×10=0.75>0.5,所以中位数在90~100之间,具体为90+
≈92.857,精确到个位为93.由样本估计整体,可得绵阳段车速的中位数的估计值为93.
答案:
93
8.已知由样本数据点集合{(xi,yi)|i=1,2,…,n}求得的回归直线方程为=1.5x
+0.5,且=3.现发现两个数据点(1.1,2.1)和(4.9,7.9)误差较大,去除后重新求得的回归直线l的斜率为1.2,那么,当x=2时,y的估计值为______.
【解题导引】解答本题的主要依据是回归直线必过样本点的中心,关键是分析出去除这两个数据点后,样本点的中心不变.
【解析】将=3代入=1.5x+0.5得=5.所以样本点的中心为(3,5),由数据点(1.1,2.1)和(4.9,7.9)知:
=3,
=5,故去除这两个数据点后,样本点的中心不变.
设新的回归直线方程为=1.2x+b,将样本点的中心的坐标代入得:
b=1.4,所以,当
x=2时,y的估计值为3.8.
答案:
3.8
三、解答题(共40分)
9.(12分)(2018·山东省实验中学模拟)某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东西两部各5个城市,得到观看该节目的人数(单位:
千人)如下茎叶图所示,其中一个数字被污损.
(1)求东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数的概率.
(2)节目的播出极大地激发了观众对成语知识的学习与积累的热情.现从观看节目的观众中随机统计了4位观众的周均学习成语知识的时间y(单位:
小时)与年龄x(单位:
岁),并制作了对照表(如下表所示):
年龄x
20
30
40
50
周均学习成语知识时间y
2.5
3
4
4.5
由表中数据分析,x,y呈线性相关关系,试求线性回归方程=x+,并预测年龄为60岁观众周均学习成语知识的时间.
参考数据:
线性回归方程中,的最小二乘估计分别是=
=-.
【解析】
(1)设被污损的数字为a,则a有10种情况.令88+89+90+91+92>83+
83+87+90+a+99,
则a<8,东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数,有8种情况,其概率为
=
;
(2)由题意可知=35,=3.5,
xiyi=525,
=5400
所以=
=
所以=
x+
.
当x=60时,=
·60+
=
=5.25小时.
预测60岁观众的学习成语的时间为5.25小时.
10.(12分)为推动实施健康中国战略,树立国家大卫生、大健康概念.手机APP也推出了多款健康运动软件,如“微信运动”.杨老师的微信朋友圈内有600位好友参与了“微信运动”,他随机选取了40位微信好友(女20人,男20人),统计其在某一天的走路步数.其中,女性好友的走路步数数据记录如下:
男性好友走路的步数情况可分为五个类别:
A(0-2000步)(说明:
“0-2000”表示大于等于0,小于等于2000.下同),B(2001-5000步),C(5001-8000步),
D(8001-10000步),E(10001步及以上),且B,D,E三种类别人数比例为1∶3∶4,将统计结果绘制成如图所示的条形图.
若某人一天的走路步数超过8000步被系统认定为“卫健型”,否则被系统认定为“进步型”.
(1)若以杨老师选取的好友当天行走步数的频率分布来估计所有微信好友每日走路步数的概率分布,请估计杨老师的微信好友圈里参与“微信运动”的600名好友中,每天走路步数在5001~10000步的人数.
(2)请根据选取的样本数据完成下面的2×2列联表并据此判断能否有95%以上的把握认为“认定类型”与“性别”有关?
卫健型
进步型
总计
男
20
女
20
总计
40
(3)若按系统认定类型从选取的样本数据中在男性好友中按比例选取10人,从中任意选取3人,记选到“卫健型”的人数为x;女性好友中按比例选取5人,从中任意选取2人,记选到“卫健型”的人数为y,求事件“|x-y|>1”的概率.
附:
K2=
P(K2≥k0)
0.10
0.05
0.025
0.010
k0
2.706
3.841
5.024
6.635
【解析】
(1)在样本数据中,男性好友B类别设为x人,则由题意可知1+x+3+3x+
4x=20,可知x=2,故B类别有2人,D类别有6人,E类别有8人,走路步数在5001~10000步的包括C,D两类别共计9人;女性好友走路步数在5001~10000步共有16人.
用样本数据估计所有微信好友每日走路步数的概率分布,则:
600×
=375人.
(2)根据题意选取的40个样本数据的2×2列联表为:
卫健型
进步型
总计
男
14
6
20
女
8
12
20
总计
22
18
40
得到k=
≈3.636<3.841,
故没有95%以上的把握认为“认定类型”与“性别”有关.
(3)在男性好友中“卫健型”与“进步型”的比例为7∶3,则选取10人,恰好选取“卫健型”7人,“进步型”3人;在女性好友中“卫健型”与“进步型”的比例为2∶3,选取5人,恰好选取“卫健型”2人,“进步型”3人;
“|x-y|>1”包含“x=3,y=1”,“x=3,y=0”,“x=2,y=0”,“x=0,y=2”.
P(x=3,y=1)=
×
=
P(x=3,y=0)=
×
=
.
P(x=2,y=0)=
×
=
P(x=0,y=2)=
×
=
故P(|x-y|>1)=
+
+
+
=
.
【加固训练】
1.近代统计学的发展起源于二十世纪初,它是在概率论的基础上发展起来的,统计性质的工作可以追溯到远古的“结绳记事”和《二十四史》中大量的关于人口、钱粮、水文、天文、地震等资料的记录.近几年,雾霾来袭,对某市该年11月份的天气情况进行统计,结果如下:
表一
日期
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
天气
晴
霾
霾
阴
霾
霾
阴
霾
霾
霾
阴
晴
霾
霾
霾
日期
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
天气
霾
霾
霾
阴
晴
霾
霾
晴
霾
晴
霾
霾
霾
晴
霾
由于此种情况某市政府为减少雾霾于次年采取了全年限行的政策.
下表是一个调査机构对比以上两年11月份(该年不限行30天、次年限行30天共60天)的调查结果:
表二
不限行
限行
总计
没有雾霾
a
有雾霾
b
总计
30
30
60
(1)请由表一数据求a,b,并求在该年11月份任取一天,估计该市是晴天的概率.
(2)请用统计学原理计算若在犯错误的概率不超过0.1的前提下不能认为雾霾与限行有关系,则限行时有多少天没有雾霾?
(由于不能使用计算器,所以表中数据使用时四舍五入取整数)
P(K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
K2=
.
【解析】
(1)根据题意知,a=10,b=30-10=20,
在该年11月份任取一天,估计该市是晴天的概率为P=
=
.
(2)设限行时x天没有雾霾,则有雾霾为(30-x)天,由题意得,k=
≤3,
化简为21x2-440x+1500≤0,x∈[0,30],且x∈N*,
即(7x-30)(3x-50)≤0,
解得
≤x≤
所以5≤x≤16,且x∈N*,
所以在犯错误的概率不超过0.1的前提下不能认为雾霾与限行有关系,则限行时有5~16天没有雾霾天气.
2.(2018·珠海模拟)某兴趣小组进行“野岛生存”实践活动,他们设置了200个取水敞口箱.其中100个采用A种取水法,100个采用B种取水法.如图甲为A种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图,图乙为B种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图.
(1)设两种取水方法互不影响,设M表示事件“A法取水箱水量不低于1.0kg,B法取水箱水量不低于1.1kg”,以样本估计总体,以频率分布直方图中的频率为概率,估计M的概率.
(2)填写下面2×2列联表,并判断是否在犯错误的概率不超过0.01的前提下认为箱积水量与取水方法有关.
箱积水量<1.1kg
箱积水量≥1.1kg
箱数总计
A法
B法
箱数
总计
附:
K2=
.
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
【解析】
(1)设“A法取水箱水量不低于1.0kg”为事件E,“B法取水箱水量不低于1.1kg”为事件F,
则P(E)=(2+1+0.3)×0.1=0.33,
P(F)=(5+3+0.2+0.1)×0.1=0.83,
P(M)=P(EF)=P(E)×P(F)=0.33×0.83=0.2739,
故M发生的概率为0.2739.
(2)填写2×2列联表如下:
箱积水量<1.1kg
箱积水量≥1.1kg
箱数总计
A法
87
13
100
B法
17
83
100
箱数总计
104
96
200
根据列联表中的数据,
得到k=
≈98.157>6.635,
因此,在犯错误的概率不超过0.01的前提下认为箱积水量与取水方法有关.
11.(16分)(2018·成都二模)随着移动互联网的快速发展,基于互联网的共享单车应运而生,某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司最近六个月内的市场占有率进行了统计,并绘制了相应的折线图:
(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系,求y关于x的线性回归方程,并预测M公司2017年4月的市场占有率.
(2)为进一步扩大市场,公司拟再采购一批单车,现有采购成本分别为1000元/辆和1200元/辆的A,B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致单车使用寿命各不相同.考虑到公司运营的经济效益,该公司决定先对这两款车型的单车各100辆进行科学模拟测试,得到两款单车使用寿命的频数表如下:
寿命
车型
1年
2年
3年
4年
总计
A
20
35
35
10
100
B
10
30
40
20
100
经测算,平均每辆单车每年可以带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且以频率作为每辆单车使用寿命的概率.如果你是M公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?
参考公式:
回归直线方程为=x+,其中=
=-.
【解析】
(1)由题意,=3.5,=16,
(xi-)(yi-)=35,
(xi-)2=17.5.
=
=2,=-·=16-2×3.5=9,
所以=2x+9,x=7时,=2×7+9=23,
即预测M公司2017年4月份(即x=7时)的市场占有率为23%.
(2)由频率估计概率,每辆A款单车可使用1年,2年,3年,4年的概率分别为0.2,0.35,0.35,0.1,
所以每辆A款车的利润数学期望为(500-1000)×0.2+(1000-1000)×0.35+
(1500-1000)×0.35+(2000-1000)×0.1=175元,
每辆B款单车可使用1年,2年,3年,4年的概率分别为0.1,0.3,0.4,0.2,
所以每辆B款车的利润数学期望为(500-1200)×0.1+(1000-1200)×0.3+
(1500-1200)×0.4+(2000-1200)×0.2=150元.
所以采购A款车型.
(建议用时:
50分钟)
1.一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为
( )
A.9 B.3 C.17 D.-11
【解析】选A.设这个数为x,则平均数为
众数为2,
若x≤2,则中位数为2,此时x=-11;
若2 +2,x=3; 若x≥4,则中位数为4,2×4= +2,x=17. 所有可能值为-11,3,17,故其和为-11+3+17=9. 【加固训练】 某篮球运动员在最近5场比赛中所得分数分别为12,a,8,15,23,其中a>0,若该运动员在这5场比赛中得分的中位数为12,则得分的平均数不可能为( ) A. B. C. D.14 【解题导引】根据中位数为12,得出a≤12,计算平均数得出结论. 【解析】选C.若中位数为12,则a≤12, 所以平均分为 ≤14= 由选项知平均数不可能为 . 2.某同学用收集到的6组数据对(xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为=x+,相关系数为r.现给出以下3个结论: ①r>0;②直线l恰好过点D;③>1;其中正确结论是( ) A.①②B.①③C.②③D.①②③ 【解析】选A.由图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数r>0; 因为= =3, = =3, 所以回归直线l的方程必过点(,)=(3,3), 即直线l恰好过点D. 因为直线l斜率接近于AD斜率,而kAD= = <1, 所以③错误,综上,正确结论是①②. 3.下列说法中正确的是( ) A.若分类变量X和Y的随机变量K2的观测值k越大,则“X与Y相关”的可信程度越小 B.对于自变量x和因变量y,当x取值一定时,y的取值具有一定的随机性,x,y间的这种非确定关系叫做函数关系 C.相关系数r2越接近1,表明两个随机变量线性相关性越弱 D.若分类变量X与Y的随机变量K2的观测值k越小,则两个分类变量有关系的把握性越小 【解析】选D.对于选项A,若分类变量X和Y的随机变量K2的观测值k越大,则“X与Y相关”的可信程度越大,所以A错误;对于选项B,对于自变量x和因变量y,当x取值一定时,y的取值具有一定的随机性,x,y间的这种非确定关系叫做相关关系,所以B错误;对于选项C,相关系数r2越接近1,表明两个随机变量线性相关性越强,所以C错误;对于选项D,若分类变量X与Y的随机变量K2的观测值k越小,则两个分类变量有关系的把握性越小,所以D正确. 4.某工厂有120名工人,其年龄都在20~60岁之间,各年龄段人数按[20,30), [30,40),[40,50),[50,60]分成四组,其频率分布直方图如图所示.工厂为了开发新产品,引进了新的生产设备.现采用分层抽样法从全厂工人中抽取一个容量为20的样本参加新设备培训,培训结束后进行结业考试. 已知各年龄段培训结业考试成绩优秀的人数如表所示: 年龄分组 培训成绩优秀人数 [20,30) 5 [30,40) 6 [40,50) 2 [50,60] 1 若随机从年龄段[20,30)和[40,50)的参加培训工人中各抽取1人,则这两人培训结业考试成绩恰有一人优秀的概率为________. 【解析】由频率分布直方图可知,年龄段[20,30),[30,40),[40,50),[50,60]的人数的频率分别为0.3,0.35,0.2,0.15,所以年龄段[20,30),[30,40),[40,50), [50,60]应抽取人数分别为6,7,4,3,若随机从年龄段[20,30)和[40,50)的参加 培训工人中各抽取1人,则这两人培训结业考试成绩恰有一人优秀的概率为 P= = . 答案: 5.“共享单车”的出现,为我们提供了一种新型的交通方式.某机构为了调查人们对此种交通方式的满意度,从交通拥堵不严重的A城市和交通拥堵严重的B城市分别随机调查了20个用户,得到了一个用户满意度评分的样本,并绘制出茎叶图如图: (1)根据茎叶图,比较两城市满意度评分的平均值的大小及方差的大小(不要求计算出具体值,给出结论即可). (2)若得分不低于80分,则认为该用户对此种交通方式“认可”,否则认为该用户
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考 数学 二轮 复习 第二 专题 通关 攻略 统计 概率 能力 提升 十三 251 案例