计量地理学实验报告分解Word文档下载推荐.docx
- 文档编号:3623992
- 上传时间:2023-05-02
- 格式:DOCX
- 页数:29
- 大小:313.55KB
计量地理学实验报告分解Word文档下载推荐.docx
《计量地理学实验报告分解Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《计量地理学实验报告分解Word文档下载推荐.docx(29页珍藏版)》请在冰点文库上搜索。
1592.1
704.7
64.59
1998
1956.7
613.7
75.31
实验步骤:
(1)在DPS系统中对原始数据进行回归分析,将上表中数据编辑、定义成数据块;
(2)在“多元分析”菜单下选择“回归分析”中的“线性回归”,系统给出下图界面
点击右下角的“返回编辑”,得到以下数据:
多元线性回归分析结果:
方差来源
平方和
df
均方
F值
p值
回归
461.3979
2
230.6989
38.0527
0.0004
剩余
36.3757
6.0626
总的
497.7736
8
62.2217
相关系数R=0.962768决定系数RR=0.926923调整相关R'
=0.950034
变量
回归系数
标准系数
偏相关
标准误
t值
p-值
b0
26.3907
21.6685
1.2179
0.2627
b1
0.0201
0.9914
0.9523
0.0026
7.6450
0.0001
b2
0.0125
0.0568
0.1760
0.0284
0.4379
0.6746
press=117.3509剩余标准差sse=2.4622
预测误差标准差MSPE=4.4225Durbin-Watsond=2.2597
序号
观察值
拟合值
残差
标准残差
学生残差
cook距离
1
51.5400
53.7836
-2.2436
-0.9112
-1.3434
0.7061
63.7100
63.3429
0.3671
0.1491
0.1774
0.0044
54.4400
52.5106
1.9294
0.7836
0.9332
0.1214
4
56.7800
58.9766
-2.1966
-0.8921
-0.9563
0.0454
5
53.4500
52.4554
0.9946
0.4039
0.5048
0.0477
65.9200
62.8219
3.0981
1.2582
1.3518
0.0940
7
67.5800
68.8541
-1.2741
-0.5175
-0.5965
0.0390
64.5900
67.1881
-2.5981
-1.0552
-1.2416
0.1976
9
75.3100
73.3868
1.9232
0.7811
1.4858
1.9270
通径系数分析
直接作用
通过x1
通过x2
x1
-0.0298
x2
-0.5206
剩余通径系数=0.270327
成果处理:
经过以上分析,由上表可知,该区地下水流量计算模型为:
通过对回归方程进行F显著性检验,该地下水流量预测模型显著性很好,符合该地区的实际情况,因此可以通过该模型对研究区地下水流量进行预测。
另外从实例的计算结果可知,把降雨量及人工开采量这两个因素作为地下水流量影响的主要因素是可行的。
2.实验名称:
逐步回归分析
通过建立逐步回归分析,建立“最优”的回归方程。
使之包括所有对Y有显著影响的变量而不包含对Y影响不显著的变量。
以某地1989年到2003年共计15组数据(下表所示)建立回归模型。
设工业总产值为
亿元。
农业总产值设
亿元,建筑业总产值为
亿元;
社会消费总额为
亿元,人口数为
万人,受灾面积为
,国民财政收入为y亿元。
工业产值
/亿元
农业产值
建筑业产值/亿元
消费总额
人口数
/万人
受灾面积/
财政收入
6484
4100.6
794
8101.4
112704
46991
2664.9
6858
4954.3
859.4
8300.1
114333
38474
2937.1
8087.1
5146.4
1015.1
9415.6
115823
55472
3149.48
10284.5
5588
1415
10993.7
117171
51333
3483.37
14143.8
6605.1
2284.7
12462.1
118517
48829
4348.95
19359.6
9169.2
3012.6
16264.7
119850
55043
5218.1
24718.3
11884.6
3819.6
20620
121121
45821
6242.2
29082.6
13539.8
4530.5
24774.1
122389
46989
7407.99
32412.1
13852.5
4810.6
27298.9
123626
53429
8651.14
33387.9
14241.6
5231.4
29152.5
124761
50145
9875.95
35087.2
14106.2
5470.6
31134.7
125786
49981
11444.08
39047.3
13873.6
5888
34152.6
126743
54668
13395.23
42374.6
14462.8
6375.4
37595.2
127627
52125
16386.04
45975.2
14931.5
7005
42027
128453
47119
18903.64
53092.9
14870.1
8181.3
45842
129227
54506
21715.25
(1)将财政收入y设为因变量,
设为因变量,将数据定义成数据块;
(2)在“多元分析”菜单下进入“回归分析”,选择“逐步回归”功能,考虑引入自变量,按“yes”按钮,系统会自动将
引入,如下图所示。
由于调整的相关系数比原来的大,而且回归模型诊断各个回归系数的偏相关系数的显著水平最好也不大于0.05,所以这里的
引入变得不合适,按“No”剔除。
当模型既不能引入新的变量,也不能从回归方程中剔除一个方差贡献小的变量时,点击“OK”,输出分析结果。
所求回归模型为:
y=2654.155286-0.8914381010
+0.6109577445
+0.6377787735
-0.03418200925
逐步回归分析结果:
相关系数
X1
X2
X3
X4
X5
X6
Y
显著水平P
1.0000
0.9449
0.9989
0.9961
0.9839
0.3267
0.9587
0.9495
0.9249
0.9532
0.2667
0.8201
0.0002
0.9926
0.9855
0.3209
0.9515
0.9774
0.3100
0.9751
0.3690
0.9257
0.2948
0.2861
Y=2654.155286-0.8914381010
t检验值
r(y,X2)
-0.9627
11.2459
r(y,X3)
0.3963
1.3648
0.1996
r(y,X4)
0.9466
9.2877
r(y,X6)
-0.4452
1.5723
0.1442
相关系数R=0.9989F值=1101.8360Df=(4,10)p值=0.0001
样本
观测值
拟合误差
2664.9000
3044.4788
-379.5788
2937.1000
2741.2696
195.8304
3149.4800
2795.5669
353.9131
3483.3700
3794.1878
-310.8178
4348.9500
4440.9622
-92.0122
5218.1000
4812.7524
405.3476
6242.2000
5978.1287
264.0713
7407.9900
7546.4224
-138.4324
8651.1400
8828.9307
-177.7907
9875.9500
10033.6036
-157.6536
11
11444.0800
11570.2564
-126.1764
12
13395.2300
13797.1601
-401.9301
16386.0400
15852.2476
533.7924
14
18903.6400
18816.7127
86.9273
15
21715.2500
21770.7401
-55.4901
Durbin-Watson统计量d=2.0491598
成果分析:
从相关系数矩阵可以看出,此例还存在多重共线性。
对于
,它与
具有最大相关系数,为0.999;
同理,对于
具有最大相关系数,为0.953;
具有最大相关系数,为0.996;
,没有显著相关。
因此
,
之间高度相关,具有多重共线性。
同样,
该结论与模型是吻合的。
事实上,在模型中,由于
之间的共线性,
和
可由
来表征;
由于
的共线性,
来表征。
从实际情况看,工业的发展为建筑业的崛起提供了基础,而建筑业的兴旺又会拉动工业总产值的增长,两者之间是物资交换过程经过社会商品零售总额反映出来。
同时,由于我国农业生产力相对落后,农业人口占总人口的比重过大,农业总产值与人口总数有直接关系。
这些说明模型有合理的实际意义。
第二次实验
主成分回归分析
在保持原始数据信息损失最少的前提下,通过线性变换将原始自变量集合由高维空间映射到一个低维空间,从而实现数据的降维。
以法国有关进口总额经济分析为例,考虑的因变量Y是法国进口总额,自变量分别是法国国内生产总值
存储量
和总消费量
.
149.3
4.2
108.1
15.9
161.2
4.1
114.8
16.4
171.5
3.3
123.2
19
175.5
3.1
126.9
19.1
180.8
1.1
132.1
18.8
190.7
2.2
137.7
20.4
202.1
2.1
146
22.7
212.4
5.6
154
26.5
226.1
162.3
28.1
231.9
5.1
164.3
27.6
239
0.7
167.6
26.8
(1)在DPS系统中,点击“多元分析”→“有偏回归分析”→“主成分回归”,界面上出现三个特征根(如右图),按大小依次顺序为
=199.8185,
=99.9162,
=0.2653。
第3个特征根较前面两个相比,已是很小,故选择保留两个特征根(主成分个数为2),输出结果如下表:
一般线性回归分析表
平均值
标准差
膨胀系数VIF
194.5909
29.9995
188.6830
3.3182
1.6479
1.0150
x3
139.7273
20.6275
188.7524
y
21.9364
4.5944
自变量主成分分析与特征向量(转置)
No
特征值
百分率%
累计百分率%
1.9982
66.6062
0.9992
33.3054
99.9116
0.0027
0.0884
100.0000
z1
0.7067
0.0296
0.7069
z2
-0.0254
0.9995
-0.0165
z3
0.7070
0.0062
-0.7072
方差分析表
209.2834
69.7611
270.9885
1.8020
0.2574
211.0855
21.1085
相关系数R=0.995722决定系数RR=0.991463调整相关R'
=0.993883
变量z
0.1581
138.7362
3.1784
0.9779
0.1173
27.0926
0.8387
0.1825
0.8727
0.1659
5.0553
0.0007
剩余标准差sse=0.5244Durbin-Watsond=2.6812
标准化回归方程:
标准化变量系数
std(xi)的表达式:
2.224988std(x1)
std(x1)=(x1-194.5909)/29.9995
0.932468std(x2)
std(x2)=(x2-3.3182)/1.6479
2.232791std(x3)
std(x3)=(x3-139.7273)/20.6275
主成分回归方程:
y=-9.498114+0.074167x1+0.565846x2+0.108244x3
从上述结果可以看出,主成分回归模型统计检查F值270.9885,显著水平P<
0.0001,复相关系数R为0.9957,这表明模型拟合良好。
对比普通最小二乘回归,主成分回归舍弃了一个约等于0的特征值,也就是去掉了了一个复共线性关系(第三个特征量):
+
0.0062-
0.7072
这就使得整个回归模型在拟合未来资料时,会表现出较好的稳定性。
从上述分析过程来看,主成分回归的过程是先得到代表原始自变量集合大部分信息的新综合变量,然后使用这些综合变量对因变量进行回归分析。
由于得到的新综合变量之间是相互正交的,所以避免了直接利用最小二乘法所遇到的“病态问题”,提高了预测的准确性和可靠性。
因为因变量可以表示为新综合变量的线性组合,同时新综合变量又均可以表示为原始变量集合的线性组合,因此,可以将因变量表示为原始自变量集合线性组合的形式。
单因素方差分析
通过试验数据分析测试某一控制变量的不同水平是否给观察变量造成显著差异和变化。
以某河流断面浮游植物观测数据为例,针对浮游植物这个指标分析各断面之间是否存在显著差异。
河流断面
样本数
浮游植物观测值/(
个/
)
29
28
23
26
25
24
21
16
18
对上表中的数据做方差分析,以判断四个断面在浮游植物之间是否存在显著差异。
在DPS系统中依次选择“试验统计→完全随机设计→单因素试验统计分析”,在“方差分析参数设置”中选“LSD”法。
得出以下数据:
处理
均值
95%置信区间
处理1
25.9000
3.0714
0.9713
23.7029
28.0971
处理2
22.2000
3.4897
1.1035
19.7036
24.6964
处理3
20.0000
2.9439
0.9309
17.8940
22.1060
处理4
19.6000
2.9515
0.9333
17.4887
21.7113
方差分析表:
变异来源
自由度
均方
F值
处理间
249.8750
83.2917
8.5450
处理内
350.9000
36
9.7472
总变异
600.7750
39
LSD多重比较表(下三角为均值差,上三角为显著水平):
No.
5%显著水平
1%显著水平
0.0119
a
A
3.7000
0.1238
0.0708
b
AB
5.9000
2.2000
0.7761
B
6.3000
2.6000
0.4000
在方差分析中,显著水平P值是推断试验处理间差异程度的指标。
由于P值小于0.001(方差分析表中),可以认为存在显著差异。
要进一步研究这种差异的具体形式,检验各个处理之间的差异,只有当显著水平P<
=0.05时,才能进一步做多重比较分析。
首先对四个断面浮游植物的平均值(
)做初步分析,经过计算(LSD法多重比较表),断面1的平均值最大,为25.9;
断面3、4的平均值非常接近,分别为20.0和19.6;
而断面2的平均值大体介于断面1和断面3、4的中间,为22.2。
根据初步分析大致可以认为断面3和4的平均值之间没有显著区别,而断面1的平均值显著地大于断面3、4(因为方差分析结果是显著的)。
问题在于2,它可能与断面1有(或没有)显著差别,也可能与断面3、4有(或没有)显著差别。
无论何种情况,需要做多重比较检验。
3.实验名称:
双因素方差分析
对影响总体均值的两个或两个以上的因素进行考虑,,并对它们的联合影响(交互作用)做出估计。
对“存在交互作用的双因素方差”进行分析
现有一组土壤、肥料试验数据,A因素为三种肥料处理,B因素为三种土壤处理,每组合包含三次重复。
试根据试验结果(小麦产量)分析施肥、土壤以及它们的交互作用对小麦产量的影响。
肥料
土壤
重复
A1
B1
21.4
21.2
20.1
B2
19.6
B3
17.6
16.6
17.5
A2
14.2
12.1
13.7
13.3
13.9
A3
12.8
13.8
13.6
14.6
根据表中数据,在DPS系统中,选择“试验统计→完全随机设计→二因素有重复试验统计分析”。
系统提示输入A因素处理(a)和B因素处理数(b),
然后再按提示数据转换方式,最后进行运算分析,并输出结果(如下表)。
方差分析表(随机模型)
A因素间
179.3807
89.6903
18.6450
0.0094
B因素间
3.9607
1.9803
0.4120
0.6877
AxB
19.2415
4.8104
5.1850
0.0059
误差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 地理学 实验 报告 分解