李成 数理统计Word下载.docx
- 文档编号:4433977
- 上传时间:2023-05-03
- 格式:DOCX
- 页数:19
- 大小:86.31KB
李成 数理统计Word下载.docx
《李成 数理统计Word下载.docx》由会员分享,可在线阅读,更多相关《李成 数理统计Word下载.docx(19页珍藏版)》请在冰点文库上搜索。
非参数假设检验;
正态分布;
区间估计;
夺冠积分;
拜仁慕尼黑;
目录
一、问题提出,问题分析·
·
1
二、数据描述·
1
三、建立模型·
6
(1)提出假设条件,明确概念,引进参数·
(2)模型构建·
(3)模型求解·
四、计算方法设计·
7
五、结论及结果分析·
六、结果分析与检验·
七、参考文献·
8
一、问题提出,问题分析
目前各国的足球联赛正在如火如荼的进行中,西甲联赛中皇马和巴塞罗那争夺的不可开交,但是巴塞罗那凭借稳定发挥已经基本将冠军揽入怀中,意大利足球甲级联赛中,AC米兰凭借德比战中对国际米兰的完胜,一只手已经触到了意甲奖杯,本文所分析的德国足球甲级联赛多特蒙德依靠上半程的一骑绝尘,已经揽入69分,夺冠基本不成问题。
那我们就不禁有了一个疑问,球队究竟得到多少积分才可以夺冠呢,最后夺冠的分数有着什么样的规律。
在稍后的文章中我们就用47的数据来分析一下这个大家都关心的问题。
正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。
例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;
同一种生物体的身长、体重等指标;
同一种种子的重量;
测量同一物体的误差;
弹着点沿某一方向的偏差;
某个地区的年降水量;
以及理想气体分子的速度分量,等等。
一般来说,如果一个量是由许多微小的独立随机因素影响的结果,根据中心极限定理,那么就可以认为这个量具有正态分布。
我们把47年来的历届德国足球甲级联赛的夺冠分数作为样本进行分析,因为夺冠分数是由许多微小的独立随机因素影响的结果,所以我们可以假设夺冠分数是服从正态分布的,然后我们根据非参数假设检验的相关理论进行分析,检验夺冠分数是否接受原假设,服从正态分布。
二、数据描述
在网上查阅大量的数据资料,并对资料进行整理后得到63-64赛季到09-10赛季47年德国足球甲级联赛夺冠积分表,如下表1所示:
表1:
原始夺冠积分数据
赛季
冠军
场次
胜
平
负
积分
09-10
拜仁慕尼黑
34
20
10
4
70
08-09
沃尔夫斯堡
21
69
07-08
22
2
76
06-07
斯图加特
05-06
9
3
75
04-05
24
5
77
03-04
不莱梅
74
02-03
23
01-02
多特蒙德
00-01
19
62
99-00
73
98-99
78
97-98
凯泽斯劳滕
11
68
96-97
71
95-96
94-95
49
93-94
17
44
92-93
48
91-92
38
52
90-91
89-90
88-89
12
50
87-88
86-87
13
53
85-86
84-85
83-84
82-83
汉堡
81-82
18
80-81
79-80
78-79
77-78
科隆
76-77
门兴格拉德巴赫
75-76
16
45
74-75
73-74
72-73
25
54
71-72
55
70-71
69-70
51
68-69
46
67-68
纽伦堡
47
66-67
布劳恩斯威格
43
65-66
慕尼黑1860
64-65
30
15
41
63-64
由于94-95赛季以前的积分规则是胜一场积2分,平一场积1分,输一场积0分。
94-95赛季以后的积分规则是胜一场积3分,平一场积1分,输一场积0分。
由于积分的规则不一样,那么我们就要对数据进行修正,按照现在胜一场积3分,平一场积1分,输一场积0分的标准进行数据的修正以做到数据的标准化。
将表1进行数据修正后得到以下表2:
表2:
积分规则统一后的积分数据
61
67
72
66
79
64
60
56
进行了第一次的数据修正后,我们仍然发现由于历年的比赛场次不尽相同,有一年比赛34场的,有一年比赛场数为30场的,所以我们将积分进行标准换算,都按照34场的标准进行换算,比如表2中63-64赛季的冠军科隆夺冠积分是62分,由于比赛进行的场次是30场,与34场的标准不相同,我们可以把冠军在34场的比赛中积分按比例计算得到相当于现在积分的34/30*62分,那么我们就可以得到球队在标准化后的积分是70分,这样我们便得到了场次标准化后的表三。
表3:
比赛场次标准化积分后的积分数据
63
三、模型建立
(1)提出假设条件,明确概念,引进参数
设X表示历年夺冠的分数,
表示09-10赛季夺冠分数,以此类推
表示第i年的夺冠分数,X的分布函数为
,统计假设是:
(2)模型构建
将X的取值区间划分为65分以下,65分到70分,70分到75分,75分以上。
划分后我们得到m=4个事件:
。
对样本均值进行计算得到
=70+69+……70≈70
在
成立的条件下,计算参数
和
的最大似然估计值
,
通过计算得
=
≈
=
(3)模型求解
成立的条件下,
的概率理论估计值为
当
时拒绝域为
由于m=4,r=2,n=47,那么我们可以通过查表计算得到拒绝域为:
同时
通过计算得到
的样本值,如果
,那么我们否定原假设,认为该分布不服从正态分布,相反我们就接受原假设,认为该分布服从正态分布。
四、计算方法设计和计算机实现
计算
的样本值。
计算过程见下表
i
n
0.1446
6.80
0.0059
0.3554
16.70
1.3228
0.6521
0.2118
471.0000472.1926
由于
得样本值为2.1926,落在拒绝域外,因而接受
,所以,德国足球甲级联赛历年的夺冠积分符合正态分布。
五、主要的结论或发现。
通过上述非参数假设检验建模以及样本数据计算分析,可以得到结论,意大利足球甲级联赛的积分符合正态分布,正态分布的均值为70,方差为
六、结果分析与检验
根据上述的结论,意大利足球甲级联赛的积分符合正态分布,正态分布的均值为70,方差为
那么我们可以进一步求出夺冠积分X的置信度为0.95的置信区间为
那么,把已知数据代入进去计算,即
我们就可以得到X的置信区间为(60.788,79.212),那么也就是说得分在区间(60.788,79.212)的概率为95%,小于60.788并夺冠的积分是2.5%,是小概率事件,我们认定在一次事件中小概率事件不发生,那么德国足球甲级联赛的球队想要夺得冠军就至少要得到61分,如果小于61分我们就认为夺冠无望,同样积分大于79.212的概率也为2.5%,是小概率事件,那么如果球队积分达到80分以上,那么我们就认为该球队基本上确定夺冠。
就像本文开头所提到的,多特蒙德截止2011年4月18日时候已经拿到了69分,目前联赛还剩四轮,多特蒙德极有可能(90%)能达到79分,故根据区间估计以及假设检验的结论,这已经接近小概率事件,所以本赛季多特蒙德基本上确定夺冠。
参考资料
[1]杨虎,刘琼荪,钟波.数理统计[M].北京:
高等教育出版社,2004.10
[2]盛骤,谢式千.概率论与数理统计[M].北京:
高等教育出版社,2006.
[3]澳客网德甲数据.
[4]中国网德甲数据统计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 李成 数理统计