统计学第一章作业.docx
- 文档编号:944103
- 上传时间:2023-04-30
- 格式:DOCX
- 页数:11
- 大小:604.29KB
统计学第一章作业.docx
《统计学第一章作业.docx》由会员分享,可在线阅读,更多相关《统计学第一章作业.docx(11页珍藏版)》请在冰点文库上搜索。
统计学第一章作业
第一章描述性统计
1.某生产车间50名工人日加工零件数如下(单位:
个)。
试在minitabe下画直方图,并分析数据特征。
117
122
124
129
139
107
117
130
122
125
108
131
125
117
122
133
126
122
118
108
110
118
123
126
133
134
127
123
118
112
112
134
127
123
119
113
120
123
127
135
137
114
120
128
124
115
139
128
124
121
1.给数据排序2.拿数据最大值减最小值,确定组数3.由于组距一般为5或10,因此确定组距为54.计算频数5.绘制直方图,再编辑横轴和纵轴的区间。
数据特征:
大多数人的日加工零件数在120到125之间。
2.为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如下数据,试画多元箱线图展示该数据并进行分析
原材料供应商
员工编号
1
2
3
4
5
6
7
甲
0.379
0.331
0.259
0.233
0.223
0.289
0.396
甲
0.400
0.305
0.277
0.231
0.434
0.475
0.329
乙
0.267
0.325
0.299
0.372
0.157
0.257
0.399
乙
0.098
0.617
0.236
0.219
0.305
0.212
0.334
丙
0.266
0.451
0.304
0.423
0.274
0.299
0.173
丙
0.299
0.546
0.392
0.434
0.312
0.318
0.218
丁
0.122
0.342
0.176
0.242
0.427
0.265
0.136
丁
0.248
0.258
0.269
0.172
0.303
0.390
0.034
由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,但从工人的箱线图看出,工人的数据起伏波动较大,尤其是工人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商对加工零部件误差的影响要小于工人对加工零部件的影响。
3.甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
考试成绩
人数
甲班
乙班
优
3
6
良
6
15
中
18
9
及格
9
8
不及格
4
2
(1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、环形图和图饼图。
(2)比较两个班考试成绩分布的特点。
(3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。
(1)
(2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。
甲班的不及格人数比乙班的不及格人数多。
(3)
从上图可知,甲乙两班考试成绩的分布不相似。
4.随机抽取25个网络用户,得到他们的年龄数据(单位:
周岁)如下:
网民年龄
15
16
17
18
19
19
19
20
20
21
22
22
23
23
23
24
24
25
27
29
30
31
34
38
(1)计算众数、中位数。
(exlce数据分析:
众数19,中位数22.5)
(2)根据定义公式计算四分位数(上四分位数的位置为3(24+1)/4=18.75,所以上四分位数是26.5,下四分位数的位置是(24+1)/4=6.25,所以下四分位数是19)。
(3)计算平均数和标准差(平均数是23.29,标准差是5.75)。
(4)计算偏态系数和峰态系数(偏态系数是0.93,峰度系数是0.59)。
(5)对网民年龄的分布特征进行综合分析。
(根据以上的分析得出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数,峰态系数大于0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。
)
5.某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:
一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为7.2分钟,标准差为,1.97分钟,第二种排队方式的等待时间(单位:
min)如下:
排队时间
5.5
6.6
6.7
6.8
7.1
7.3
7.4
7.8
7.8
(1)计算第二种排队方式等待时间的平均数和标准差(平均数是7,标准差是0.71)。
(2)比较两种排队方式等待时间的离散程度(因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数0.274,第二种排队方式的离散系数是0.102,所以第一种排队方式等待时间的离散程度大于第二种排队方式)。
(3)如果让你选择一种排队方式,你会选择哪一种?
试说明理由(选择第二种,因为平均等待时间短,而且离散程度小)。
6.在某地区抽取的120家企业按利润额进行分组,结果如下
按利润额分组
企业数
200—300
19
300—400
30
400—500
42
500—600
18
600以上
11
合计
120
(1)计算120家企业利润额的均值和标准差;
(2)计算分布的偏态系数和峰态系数;
(3)画直方图,阶段企业利润的分布特性。
(1)利用加权均值的公式(ppt77),得均值为427,利用总体组距分组差公式,得标准差为116。
(2)利用偏态系数公式,得偏态系数为1.34,利用峰度系数公式得,峰度系数为2.29
(3)
由上图可知,企业的利润大多分布在400-500,偏态系数大于0,说明企业的利润分布呈现右偏分布,即利润达不到600以上的企业占绝大多数,峰态系数大于0,说明企业的利润分布为尖峰分布,表明利润较小的企业占较大比重
7.2005年4月北京亚运村市场汽车交易市场的汽车销售数据(单位:
辆)如下:
国产车销售排行前10名
销售量
进口车销售排行前10名
销售量
福美来
556
丰田
149
夏利
541
现代
102
捷达
370
日产
68
松花江
298
奔驰
30
富康
277
宝马
30
哈飞路宝
200
大众汽车
23
高尔夫
190
克莱斯勒
17
东方之子
181
本田
16
长安奥拓
145
雷克萨斯
10
爱丽舍
117
奥迪
6
(1)画出国产汽车和进口汽车销售量的对比条形图和环形图。
(2)分别画出国产汽车和进口汽车销售量的帕累托图。
(1)
(2)首先计算出各车的累计频率。
然后制图。
频数
累计频率
频数
累计频率
福美来
556
2875
19.34%
19.34%
丰田
149
451
33.04%
33.04%
夏利
541
2875
18.82%
38.16%
现代
102
451
22.62%
55.65%
捷达
370
2875
12.87%
51.03%
日产
68
451
15.08%
70.73%
松花江
298
2875
10.37%
61.39%
奔驰
30
451
6.65%
77.38%
富康
277
2875
9.63%
71.03%
宝马
30
451
6.65%
84.04%
哈飞路宝
200
2875
6.96%
77.98%
大众汽车
23
451
5.10%
89.14%
高尔夫
190
2875
6.61%
84.59%
克莱斯勒
17
451
3.77%
92.90%
东方之子
181
2875
6.30%
90.89%
本田
16
451
3.55%
96.45%
长安奥拓
145
2875
5.04%
95.93%
雷克萨斯
10
451
2.22%
98.67%
爱丽舍
117
2875
4.07%
100.00%
奥迪
6
451
1.33%
100.00%
8.对10名成年人和10名幼儿的身高(单位:
cm)进行抽样调查,结果如下:
成年组
166
169
172
177
180
170
172
174
168
173
幼儿组
68
69
68
70
71
73
72
73
74
75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?
为什么?
(2)比较分析哪一组的身高差异大?
(1)离散系数,因为它消除了不同组数据水平高低的影响。
(2))利用离散系数的公式,得成年组身高的离散系数:
0.024幼儿组身高的离散系数:
0.035。
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第一章 作业