应用统计实验三Word格式.docx
- 文档编号:4530081
- 上传时间:2023-05-03
- 格式:DOCX
- 页数:11
- 大小:226.79KB
应用统计实验三Word格式.docx
《应用统计实验三Word格式.docx》由会员分享,可在线阅读,更多相关《应用统计实验三Word格式.docx(11页珍藏版)》请在冰点文库上搜索。
随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据如下:
航空公司编号
航班正点率(%)
投诉次数(次)
1
81.8
21
2
76.6
58
3
85
4
75.7
68
5
73.8
74
6
72.2
93
7
71.2
8
70.8
122
9
91.4
10
68.5
125
1.绘制散点图,说明二者之间的关系形态。
散点图显示,航班正点率与顾客投诉次数之间存在比较明显的负相关线性关系
2.用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义。
(要求用回归系数公式计算)(10分)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
(常量)
430.189
72.155
5.962
.000
正点率
-4.701
.948
-.869
-4.959
.001
a.因变量:
投诉次数
计算可得,估计的回归方程为
。
回归系数
表示航班正点率每增加一个单位(1%),顾客投诉次数平均减少4.7次。
3.检验回归系数的显著性(α=0.05)。
相应的P值为0.001108,小于0.05,拒绝原假设,t统计量是显著的,回归系数显著,正点率的系数显著.
4.如果航班正点率为80%,估计顾客投诉次数。
如果航班正点率为80%,估计顾客投诉次数为54次.
5.求航班正点率为80%时,顾客投诉次数95%的置信区间和预测区间。
查表得
,点估计值为54.1396元,标准误差为18.887,故置信区间为
即区间(37.6597,70.61949)。
而预测区间为
即区间(7.57204,100.7071)
练习题3
一家电器销售公司的管理人员认为,月销售收入是广告费用的函数,并想通过广告费用对月销售收入做出估计。
下面是近8个月的月销售收入与广告费用数据:
月销售收入
电视广告费用
报纸广告费用
96
5.0
1.5
90
2.0
95
4.0
2.5
3.0
3.3
94
3.5
2.3
4.2
1.用电视广告费用作自变量,月销售收入作因变量,建立估计的回归方程。
(2分)
2.用电视广告费用和报纸广告费用作自变量,月销售收入作因变量,建立估计的回归方程。
3.上述1和2所建立的估计的回归方程,电视广告费用的系数是否相同?
对其回归系数分别进行解释。
4.根据问题2所建立的估计的回归方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?
5.根据问题2所建立的估计的回归方程,检验回归系数是否显著(α=0.05)。
练习题4
某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下:
收获量Y
降雨量X1
温度X2
2250
25
3450
33
4500
45
6750
105
13
7200
110
14
7500
115
8250
120
17
1.试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。
2.解释回归系数的实际意义。
(7分)
在温度不变的情况下,降雨量每增加1mm,收获量增加22.386kg/hm2;
在降雨量不变的情况下,温度每增加一度,收获量增加327.672kg/hm2。
3.根据你的判断,模型中是否存在多重共线性?
相关性
降雨量
温度
Pearson相关性
.965**
显著性(双侧)
N
**.在.01水平(双侧)上显著相关。
共线性统计量
容差
VIF
-.591
505.004
-.001
.999
22.386
9.601
.415
2.332
.080
.069
14.567
327.672
98.798
.590
3.317
.029
a.因变量:
收获量
相关性表得出降雨量和温度的相关系数为0.965,说明两变量高度相关.
再看VIF值是14.567大于10,说明模型存在强的多重共线性。
练习题5
一家房地产评估公司想对某城市的房地产销售价格(y)与地产估价(x1)、房产估价(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。
为此,收集了20栋住宅的房地产评估数据。
房地产编号
销售价格y(元/m2)
地产估价x1(万元)
房产产估价x2(万元)
使用面积x3(m2)
6890
596
4497
18730
4850
900
2780
9280
5550
950
3144
11260
6200
1000
3959
12650
11650
1800
7283
22140
850
2732
9120
3800
800
2986
8990
8300
2300
4775
18030
5900
810
3912
12040
4750
2935
17250
11
4050
730
4012
10800
12
4000
3168
15290
9700
2000
5851
24550
4550
2345
11510
15
4090
2089
11730
8000
1050
5625
19600
5600
400
2086
13440
3700
450
2261
9880
19
5000
340
3595
10760
2240
150
578
9620
用Excel进行回归,回答下面的问题:
1.写出估计的多元回归方程。
148.700
574.421
.259
.799
地产估价(万元)
.815
.512
.193
1.591
.131
.434
2.303
房产估价(万元)
.821
.211
.556
3.888
.313
3.197
使用面积(㎡)
.135
.066
.277
2.050
.057
.351
2.852
销售价格(元/㎡)
多元回归方程:
=148.7+0.815X1+0.821X2+0.135X3
2.在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
模型汇总
R
R方
调整R方
标准估计的误差
.947a
.897
.878
791.682
a.预测变量:
(常量),使用面积(㎡),地产估价(万元),房产估价(万元)。
回归中,R2=0.8975,在销售价格的总变差中,被估计的回归方程所解释的比例是89.75%。
(调整R2为0.878)
3.检验回归方程的线性关系是否显著(α=0.05)。
Anovab
平方和
df
均方
F
回归
87803505.456
29267835.152
46.697
.000a
残差
10028174.544
626760.909
总计
97831680.000
b.因变量:
提出假设
至少一个不为0
因为Fα(3,16)=3.344,F>
Fα(3,16),拒绝原假设,P值为0.000<
0.05,因此,回归的线性关系是显著的,也就是销售价格与房产评估、使用面积和地产估价之间的线性关系是显著的。
4.检验各回归系数是否显著(α=0.05)。
,
,P1,P2,P3值分别为0.131,0.001和0.057,所以只有β2通过检验(P1<
0.05),可以拒绝原假设,说明只有房产评估的影响是显著的,使用面积和地产估价不显著,如果选自变量来预测销售价格应该选房产估价.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 实验