20总结 数据的分析.docx
- 文档编号:588603
- 上传时间:2023-04-29
- 格式:DOCX
- 页数:17
- 大小:84.75KB
20总结 数据的分析.docx
《20总结 数据的分析.docx》由会员分享,可在线阅读,更多相关《20总结 数据的分析.docx(17页珍藏版)》请在冰点文库上搜索。
20总结数据的分析
20.1数据的集中趋势
20.1.1平均数
1、简单的算术平均数和加权平均数
1、简单的算术平均数:
一般地,对于n个数
,我们把
叫做这n个数的算术平均数,简称平均数。
记做
,即
。
(平均数反映了一组数据的集中程度,是度量一组数据波动大小的基准。
)
例题:
1、已知下面的一组数据:
1,7,10,8,x,6,0,3,它们的平均数是5,那么x等于()
A、6B、5C、4D、3
2、为了增强市民的环保意识,某初中八年级
(二)班的50名学生在星期天调查了各自家庭丢弃旧塑料袋的情况.统计数据如下表:
每户丢弃旧塑料袋的个数
2
3
4
5
户数
6
16
15
13
请根据以上数据回答:
⑴50户居民每天丢弃废旧塑料袋的平均个数是_____个.
⑵该校所在的居民区有1万户,则该居民区每天丢弃的废旧塑料袋约____万个.
3、若一组数据
的平均数是12,那么另一组数据
的平均数是多少?
4、已知a1、a2、a3、a4、1、2、3、4八个数平均数是4,则a1、a2、a3、a4的平均数是_________
2、加权平均数:
一般地,若n个数
的权分别是
,则
叫做这n个数的加权平均数;
3、算术平均数与加权平均数的联系与区别:
①联系:
若各个数据的权相同,则加权平均数就是简单的算术平均数,因此可以看出简单的算术平均数实质上是加权平均数的一种特例。
②区别:
简单的算术平均数是指一组数据的和除以数据的总个数,加权平均数是指在实际问题中,一组数据的“重要程度”未必相同,即各个数据的权未必相同,因此在计算上与简单的算术平均数有所不同。
例题:
1、某班有40名学生,其中14岁的有10人,15岁的有20人,16岁的有10人,这个班学生的平均年龄为_15______岁。
2、加权平均数的计算公式:
一组数据x1,x2,x3,…,xk中,x1,x2,x3,…,xk所占的比例分别为f1,f2,f3,…,fk,则这组数据的平均数为
=_x1f1+x2f2+x3f3+…+xkfk_,其中f1,f2,f3,…,fk分别叫做x1,x2,x3,…,xk的权数,且f1十f2+f3+…+fk=1.
加权平均数的计算公式:
一组数据x1,x2,x3,…,xk中,x1,x2,x3,…,xk所占的比例分别为f1,f2,f3,…,fk,则这组数据的平均数为
=x1f1+x2f2+x3f3+…+xkfk中,其中f1,f2,f3,…,fk分别叫做x1,x2,x3,…,xk的权数,且f1十f2+f3+…+fk=1.
故答案为x1f1+x2f2+x3f3+…+xkfk;若n个数x1,x2,x3,…,xn的权分别是w1,w2,w3,…,wn,则
叫做这n个数的加权平均数.
3、计算下列加权平均数.
(1)数据21,32,43,54以
,
,
,
为权数;
(2)数据21,32,43,54以0.2,0.3,0.1,0.4为权数.
解:
(1)平均数=21×
+32×
+43×
+54×
=33.1;
(2)平均数=21×0.2+32×0.3+43×0.1+54×0.4=39.7.
4、某商场用加权平均数来确定什锦糖的单价,由单价为15元/千克的甲种糖果10千克,单价为12元/千克的乙种糖果20千克,单价为10元/千克的丙种糖果30千克混合成的什锦糖果的单价应定为(B)
A.11元/千克B.11.5元/千克C.12元/千克D.12.5元/千克
单价=(15×10+12×20+10×30)÷(10+20+30)=11.5
5、某校规定学生的数学期末总评成绩由三部分组成,平时参与数学小组活动占25%,作业完成情况占35%,期末考试成绩占40%.小明平时参与数学活动、作业完成情况和期末考试得分依次为84分、92分、88分,
则小明的数学期末总评成绩是__88.4__分.
小明的数学期末总评成绩=84×25%+92×35%+88×40%=88.4(分).
3、用样本的平均数估计总体的平均数
在抽样调查中,被抽查的部分个体组成一个样本,被考察的所有对象的全体就是总体,样本中所有个体的平均数叫做样本平均数,总体中所有个体的平均数叫做总体平均数。
在统计学中,常用样本平均数估计总体平均数。
例题、某学校抽查了某班级某月10天的用电量,数据如下表(单位:
度):
度数
9
10
12
13
14
15
天数
3
1
1
1
2
2
(1)求这10天的平均用电量是多少?
(2)已知该校共有24个班级,该月共计30天,试估计该校该月总的用电量.
解:
(1)∵(9×3+10×1+12×1+13×1+14×2+15×2)÷10=12,
∴这个班级平均每天的用电量为12度.
(2)∵24×30×12=8640(度),
∴估计该校该月总的用电量为8640度.
【基础知识训练】
1.如果一组数据5,x,3,4的平均数是5,那么x=___8____.
2.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,•则20名女生的平均身高为___165cm _____.
3.某校八年级
(一)班一次数学考试的成绩为:
100分的3分,90分的13人,80•分的17人,70分的12人,60分的2人,50分的3人,全班数学考试的平均成绩是_79分______(结果保留到个位)
4.某中学举行歌咏比赛,六位评委对某位选手打分如表:
77、82、78、95、83、75去掉一个最高分和一个最低分后的平均分是____80 ____分.
5.(2005,宁波市)在航天知识竞赛中,包括甲同学在内的6•名同学的平均分为74分,其中甲同学考了89分,则除甲以外的5名同学的平均分为__71 _____分.
【创新能力应用】
6.如果一组数据x1,x2,x3,x4的平均数是x,那么另一组数据x1,x2+1,x3+2,x4+3的平均数是( C )
A.
B.
+1 C.
+1.5 D.
+6
7.有m个数的平均数是x,n个数的平均数是y,则这(m+n)个数的平均数为
8.x1,x2,x3,……,x10的平均数是5,x11,x12,x13,……,x20的平均数是3,则x1,x2,x3,……,x20的平均数是( B )
A.5 B.4 C.3 D.8
9.某居民院内月底统计用电情况,其中3户用电45度,5户用电50度,6户用电42度,则平均每户用电( C )
A.41度 B.42度 C.45.5度 D.46度
10.甲、乙、丙三种糖果售价分别为每千克6元,7元,8元,若将甲种8千克,乙种10千克,丙种3千克混在一起,则售价应定为每千克(B )
A.6.7元 B.6.8元 C.7.5元 D.8.6元
11.为了增强市民的环保意识,某初中八年级
(二)班的50名学生在今年6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况.统计数据如下表:
每户丢弃旧塑料袋的个数
2
3
4
5
户 数
6
16
15
13
请根据以上数据回答:
(1)50户居民每天丢弃废旧塑料袋的平均个数是___3.7___个.
(2)该校所在的居民区有1万户,则该居民区每天丢弃的废旧塑料袋约___3.7__万个.
12.某商场四月份随机抽查了6天的营业额,结果分别如下(单位:
万元):
2.8,3.2,3.4,3.0,3.1,3.7,试估算该商场四月份的总营业额,大约是__96 ____万元.
13.随机抽查某城市30天的空气状况统计如下:
污染指数(w)
40
60
90
110
120
天数(t)
3
3
9
10
5
其中,w≤50时,空气质量为优;50 (1)请用扇形统计图表示这30天中空气质量的优、良、轻微污染的分布情况; (2)估计该城市一年(365)天有多少空气质量达到良以上. 解 (1)设30天中空气质量分别为优、良、轻微污染的扇形图的圆心角依次为n1、n2、n3,n1= ×360°=36°,n2= ×360°=144°,n3= ×360°=180°. 扇形统计图为: (2)一年中空气质量达到良以上的天数约为: ×365+ ×365=182.5(天) 15.老王家的鱼塘中放养了某种鱼1500条,若干年后,准备打捞出售,为了估计鱼塘中这种鱼的总质量,现从鱼塘中捕捞三次,得到数据如下表: 鱼的条数 平均每条鱼的质量/千克 第1次 15 2.8 第2次 20 3.0 第3次 10 2.5 (1)鱼塘中这种鱼平均每条重约多少千克? (2)若这种鱼放养的成活率是82%,鱼塘中这种鱼约有多少千克? (3)如果把这种鱼全部卖掉,价格为每千克6.2元,那么这种鱼的总收入是多少元? 若投资成本为14000元,这种鱼的纯收入是多少元? (1) ≈2.821(kg) (2)2.82×1500×82%≈3468(kg) (3)总收入为3468×6.2≈21500(元)纯收入为21500-14000=7500(元) 16.(2006,淄博,枣庄)某单位欲从内部招聘管理员一名,对甲、乙、丙三名候选人进行了笔试和面试两项测试,三人的测试成绩如下表所示: 测试项目 测试成绩 甲 乙 丙 笔试 75 80 90 面试 93 70 68 根据录用程序组织200名职工对三人利用投票推荐的方式进行民主评议,三人得票(没有弃权票,每位职工只能推荐1人)如上图所示,每得一票记作1分. (1)请算出三人的民主评议得分; (2)如果根据三项测试的平均成绩确定录用人选,那么谁将被录用(精确到0.01)? (3)根据实际需要,单位将笔试、面试、民主评议三项测试得分按4: 3: 3的比例确定个人的成绩,那么谁将被录用? (1)甲、乙、丙的民主评议得分分别为: 50分,80分,70分. (2)甲的平均成绩为: ≈72.67(分), 乙的平均成绩为: ≈76.67(分), 丙的平均成绩为: ≈76.00(分). 由于76.67>76>72.67,所以候选人乙将被录用. (3)如果将理论考试、面试、民主评议三项测试得分按4: 3: 3的比例确定个人成绩, 那么甲的个人成绩为: =72.9(分), 乙的个人成绩为: =77(分). 丙的个人成绩为: =77.4(分). 由于丙的个人成绩最高,所以候选人丙将被录用 某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变,有关数据如下表所示: 景点 A B C D E 原价(元) 10 10 15 20 25 现价(元) 5 5 15 25 30 平均日人数(千人) 1 1 2 3 2 (1)该风景区称调整后这5个景点门票的平均收费不变,平均日总收入持平,问风景区是怎样计算的? (2)另一方面,游客认为调整收费后风景区的平均日总收入相对于调价前,实际上增加了约9.4%,问游客是怎样计算的? (3)你认为风景区和游客哪一个说法较能反映整体实际? (1)风景区的算法是: 调整前的平均价格为: ×(10+10+15+20+25)=16(元); 调整后的平均价格为: ×(5+5+15+25+30)=16(元), 而日平均人数没有变化,因此风景区的总收入没有变化; (2)游客的计算方法: 调整前风景区日平均收入为: 10×1+10×1+15×2+20×3+25×2=160(千元); 调整后风景区日平均收入为: 5×1+5×1+15×2+25×3+30×2=175(千元), 所以风景区的日平均收入增加了 ×100%≈9.4%; (3)游客的说法较能反映整体实际. 2、中位数和众数 1、中位数: 将一组数据按照由小到大(或者由大到小)的顺序排列,若数据的个数是奇数,则处于中间位置的数据称为这组数据的中位数;若数据的个数是偶数,则中间两个数据的平均数称为这组数据的中位数。 2、众数: 一组数据中出现次数最多的数据称为称为这组数据的众数。 如果一组数据中有多个数据的频数一样,都是最大的,那么这几个数据都是这组数据的众数。 3、众数、中位数与平均数的异同 (1)联系: 平均数、中位数、众数都是描述一组数据集中趋势的量,平均数是最重要的量。 (2)①平均数的大小与一组数据里的每个数据均有关系,任何一个数据的变动都会引起平均数的变动; ②中位数仅与数据的排列顺序有关,某些数据的变动对中位数没有影响。 当一组数据中的个别数据变动较大时,可用中位数来描述其集中趋势; ③众数主要研究各数据出现的频数,其大小只与这组数据中的某些数据有关,当一组数据中有不少数据多次重复出现时,我们往往只关心众数。 例题1、某校在一次考试中,甲、乙两班学生的数学成绩统计如下: 分数 50 60 70 80 90 100 人数 甲班 1 6 12 11 15 5 乙班 3 5 15 3 13 11 请根据表格提供的信息回答下面问题: 请根据表格提供的信息回答下面问题: (1)甲班的众数为分,乙班的众数为分,从众数来看成绩较好的是; (2)甲班的中位数是分,乙班的中位数是分,甲班中成绩在中位数以上(包括中位数)的学生所占的百分比是%,乙班中成绩在中位数以上(包括中位数)的学生所占的百分比是%,从中位数来看成绩较好的是; (3)若成绩在85分以上的为优秀,则甲班的优秀率为%,乙班的优秀率为%,从优秀率来看成绩较好的是班. 解: (1)甲班中90分的学生最多,众数为90分,乙班中70分的最多,众数为70分,从众数看甲班更好; (2)甲班中共有1+6+12+11+15+5=50人,中位数应为第25和第26人的平均数,观察表格得第25和第26人的分数为80分,故中位数为80分; 乙班中共有3+5+15+3+13+11=50人,中位数应为第25和第26人的平均数,观察表格得第25和第26人的分数为80分,故中位数为80分; 甲班中位数以上的学生31人,占62%;乙班中位数以上的有19人,占38%,从中位数看成绩较好的是甲班; (3)甲班的优秀率为 ,乙班的优秀率为 ,从优秀率看成绩较好的是乙班. 故答案为: 90,70,甲班;80,80,62,38,甲班;40,48,乙班. 2.公园里有甲、乙两群游客正在做团体游戏,游客的年龄如下(单位: 岁): 甲群: 13、13、14、15、15、15、15、16、17、17. 乙群: 3、4、4、5、5、6、6、6、54、57. 请解答下列各题: (1)甲群游客的平均年龄是岁,中位数是岁,众数是岁,其中能较好的反映甲群游客年龄特征的是; (2)乙群游客的平均年龄是岁,中位数是岁,众数是岁,其中能较好的反映乙群游客年龄特征的是. 解: (1)甲群游客的平均年龄=(13+13+14+15+15+15+15+16+17+17)÷10=15(岁), 中位数=(15+15)÷2=15(岁),众数是15(岁), 其中能较好反映甲群游客年龄特征的是: 平均数、中位数或众数; (2)乙群游客的平均年龄=(3+4+4+5+5+6+6+6+54+57)÷11=15(岁), 中位数是(5+6)÷2=5.5(岁),众数是6(岁),平均数受到极端值的影响很大,所以其中能较好反映乙群游客年龄特征的是: 中位数、众数. 故答案为: 15,15,15,平均数、中位数或众数;15,5.5,6,中位数、众数. 3.下列说法,错误的个数是( ) ①在一组数据中添入一个新数据,那么平均数就一定会跟着变动; ②只要一组数据中有一个数据变动,那么中位数就一定会跟着变动; ③给定一组数据,那么这组数据的平均数也随之确定; ④给定一组数据,那么这组数据的中位数也随之确定. A.1个 B.2个 C.3个 D.4个 解: ①在一组数据中添入一个新数据,那么平均数就一定会跟着变动,正确; ②只要一组数据中有一个数据变动,那么中位数就一定会跟着变动,错误; ③给定一组数据,那么这组数据的平均数也随之确定,正确; ④给定一组数据,那么这组数据的中位数也随之确定,正确, 4.对于数据: 3,3,2,3,6,3,3,6,3,2.则在下列结论中: ①这组数据的众数是3;②这组数据的众数与中位数的数值不等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等,其中正确的结论有( ) A.1个 B.2个 C.3个 D.4个 5.八年级 (1)班的教室里3位同学正在为谁的数学成绩最好而争论,他们的5次数学成绩(单位: 分)分別是: 张凯 72 84 95 98 95 王超 62 62 97 99 100 顾贝 60 72 80 99 99 他们都认为自己的成绩比另外两位同学好,请问: 他们分别从哪一方面来说的? 解: 三人的众数依次是95分,62分,99分,所以顾贝是充众数方面说自己成绩最好; 三人的中位数依次是95,97,98分,所以王超从中位数角度说自己成绩最好; 三人的最高成绩一次是98分,100分,99分,所以张凯从最好成绩角度说自己成绩最好. 6.甲,乙,丙三个家电厂家在广告中都声称,他们的某种电子产品在正常情况下的使用寿命都是8年,经质量检测部门对这三家销售的产品的使用寿命进行跟踪调查,统计结果如下(单位: 年): 甲厂: 4,5,5,5,5,7,9,12,13,15 乙厂: 6,6,8,8,8,9,10,12,14,15 丙厂: 4,4,4,6,7,9,13,15,16,16 请回答下列问题: (1)分别求出以上三组数据的平均数,众数,中位数; (2)这三个厂家的推销广告分别利用了哪一种表示集中趋势的特征数? 经调查,50名男同学所穿运动鞋尺码如下: 尺码 39 40 41 42 43 44 数量 2 6 25 11 5 1 ①请问这组数据的平均数,中位数和众数分别是多少? ②这组数据的平均数,中位数和众数中,哪个指标是学校商店最不感兴趣的? 哪个指标是学校商店最感兴趣的? ③你认为学校商店应进哪种尺码的男式运动鞋比较合算. 解: (1)甲厂: 平均数为(4+5+5+5+5+7+9+12+13+15)÷10=8,众数为5,中位数为6; 乙厂: 平均数为(6+6+8+8+8+9+10+12+14+15)÷10=9.6,众数为8,中位数为8.5; 丙厂: 平均数为(4+4+4+6+7+9+13+15+16+16)÷10=9.4,众数为4,中位数为8; (2)甲厂用的是平均数,乙厂用的是众数,丙厂用的是中位数; ①这组数据的平均数是: (39×2+40×6+41×25+42×11+43×5+44×1)÷50=41.28,中位数是41,众数是41, ②这组数据的平均数,中位数和众数中,平均数是学校商店最不感兴趣的,众数是学校商店最感兴趣的; ③学校商店应进41尺码的男式运动鞋比较合算.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 20总结 数据的分析 20 总结 数据 分析