应用统计学课程设计.docx
- 文档编号:18609411
- 上传时间:2023-08-20
- 格式:DOCX
- 页数:32
- 大小:112.38KB
应用统计学课程设计.docx
《应用统计学课程设计.docx》由会员分享,可在线阅读,更多相关《应用统计学课程设计.docx(32页珍藏版)》请在冰点文库上搜索。
应用统计学课程设计
应用统计学课程设计
学院
专业
年级
姓名
学号
第一章应届毕业生对母校的怀念程度影响因素的多元线性回归
1.1引言
1.1.1研究背景
今年是管理与经济学部成立三十周年,很幸运的是,我们刚一入学就参与了各种院庆活动。
眼见各行各业、各个年龄段的校友齐聚一堂,或携其家眷,或白发斑斑,不远千里而来,我的心中很是感动。
大学的四年是我们一生中最宝贵的时光,我们的青春在这里挥洒绽放。
不管将来到了什么地方,从事什么样的工作,我们都时刻感恩母校对自己的培养、怀念母校的一草一木。
另一方面,大学的繁荣昌盛、生生不息也在于培养出来的学生,能够投桃报李、感恩母校。
而一个学生对自己的母校的眷恋、怀念程度,也影响着他对母校的反馈。
这一反馈,既体现在他对母校的宣传,比如支持其子女亲属报考母校,也体现在他对母校的物质贡献上,比如捐赠。
国内外已经有关于捐赠影响因素的研究。
1.1.2问题的提出与描述
本文采用多元回归的方法,对应届毕业生怀念母校程度的影响因素进行分析,数据来源于自编的调查问卷。
其中,把应届毕业生对母校的怀念程度,作为因变量。
它的测量,借鉴了南安普顿怀旧量表(SouthamptonNostalgiaScale,SNS),主要测量个人怀念母校的频率和重要性,量表使用7点计分标准。
这一量表,在以往对英国和美国被试的研究中问卷具有较好的信度(0>0.9),经过初步修订后的中文版量表,在本次研究中的a系数为0.872。
作为自变量的影响应届毕业生对母校怀念程度的因素,本文选取就业与否、学校层次、学习成绩、科研竞赛、学生干部、社团实践、网络活跃度几个指标,让被调查者选择适合自己的状态,从而进行计分。
另外要说明的是,之所以选择应届毕业生,是考虑到随着毕业年份增加、阅历不断增加的情况下,尤其是到暮年之后,可能对母校的怀念,更多的转化为青葱岁月的追忆,而且个人进入社会后,不同的工作环境、生活阅历会对人的性格态度造成比较大的影响,而这些,是很难测量的。
另一方面,应届毕业生的数据,对于本人来说,是更容易获取的。
1.1.3数据来源及样本特征
本文的数据来源于自编的网上调查问卷,回收有效问卷71份。
样本特征如下:
男性校友38人,女性校友33人;状态为“工作”的46人,状态为“深造”的25人;学校层次上,985院校6人,211院校18人,普通一本23人,二本18人,三本及以下6人。
该样本各种特征还是比较符合高等院校的特点的,有比较强的代表性。
1.2建模与分析
1.2.1模型建立
因变量:
Y(应届毕业生对母校的怀念程度)
自变量:
X1(虚拟变量,表示状态,1表示就业,0表示深造)
X2(学校层次)
X3(学习成绩)
X4(竞赛科研)
X5(学生干部)
X6(社团实践)
X7(网络活跃度)
1.2.2运算与结果分析
采用SPSS18进行多元线性回归分析,相关输出结果如下及分析如下:
(1)回归方程的建立
表1.1
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
-.184
.392
-.470
.640
状态
.353
.170
.162
2.075
.042
.653
1.531
学校层次
.208
.084
.218
2.491
.015
.522
1.914
学习成绩
.059
.080
.054
.728
.469
.718
1.392
竞赛科研
.070
.101
.066
.699
.487
.454
2.203
学生干部
.178
.106
.182
1.684
.097
.343
2.918
社团实践
.291
.107
.340
2.722
.008
.256
3.901
网络活跃度
.250
.061
.297
4.067
.000
.747
1.338
a.因变量:
怀念程度
则由表1.1,可初步建立多元线性回归方程Y=-0.184+0.353X1+0.208X2+0.059X3+0.070X4+0.178X5+0.209X6+0.250X7
下面根据软件输出结果对方程的可行性进行分析。
(2)回归方程的拟合优度检验
表1.2
模型汇总b
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.865a
.748
.720
.55367
2.121
a.预测变量:
(常量),网络活跃度,竞赛科研,状态,学习成绩,学生干部,学校层次,社团实践。
b.因变量:
怀念程度
由表1.2可以看出,R的平方=0.748,调整后的R的平方=0.720。
样本决定系数和调整样本系数比较接近于1,拟合度比较高,故通过拟合优度检验,认为解释变量应该对被解释变量有比较好的解释能力。
(3)回归方程的显著性检验
表1.3
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
57.447
7
8.207
26.771
.000a
残差
19.313
63
.307
总计
76.760
70
a.预测变量:
(常量),网络活跃度,竞赛科研,状态,学习成绩,学生干部,学校层次,社团实践。
b.因变量:
怀念程度
由表1.3可以看出,F统计量的Sig.<0.05,方程线性关系显著。
(4)回归方程系数的显著性检验
由表1.1,除常数项外各系数t统计量的Sig.值分别为0.042、0.015、0.469、0.487、0.097、0.008、0.000,可知自变量X1、X2、X6、X7显著,即状态、学校层次、社团实践、网络活跃度对因变量怀念母校的程度具有显著的影响。
另外几个自变量对因变量的回归不显著,可能是存在多重共线性的缘故,我们下面进行多重共线性的检验。
(5)回归方程多重共线性的诊断
表1.4
系数相关a
模型
网络活跃度
竞赛科研
状态
学习成绩
学生干部
学校层次
社团实践
1
相关性
网络活跃度
1.000
-.048
-.045
.149
.046
.306
-.310
竞赛科研
-.048
1.000
.257
-.512
.122
-.547
-.286
状态
-.045
.257
1.000
-.150
-.133
-.237
-.233
学习成绩
.149
-.512
-.150
1.000
-.033
.343
.063
学生干部
.046
.122
-.133
-.033
1.000
.038
-.701
学校层次
.306
-.547
-.237
.343
.038
1.000
-.132
社团实践
-.310
-.286
-.233
.063
-.701
-.132
1.000
协方差
网络活跃度
.004
.000
.000
.001
.000
.002
-.002
竞赛科研
.000
.010
.004
-.004
.001
-.005
-.003
状态
.000
.004
.029
-.002
-.002
-.003
-.004
学习成绩
.001
-.004
-.002
.006
.000
.002
.001
学生干部
.000
.001
-.002
.000
.011
.000
-.008
学校层次
.002
-.005
-.003
.002
.000
.007
-.001
社团实践
-.002
-.003
-.004
.001
-.008
-.001
.011
a.因变量:
怀念程度
表1.5
相关性
怀念程度
状态
学校层次
学习成绩
竞赛科研
学生干部
社团实践
网络活跃度
Pearson相关性
怀念程度
1.000
.553
.428
.082
.385
.690
.792
.476
状态
.553
1.000
.271
.037
.075
.498
.522
.190
学校层次
.428
.271
1.000
-.013
.549
.243
.373
-.136
学习成绩
.082
.037
-.013
1.000
.405
.033
.056
-.093
竞赛科研
.385
.075
.549
.405
1.000
.205
.384
-.008
学生干部
.690
.498
.243
.033
.205
1.000
.798
.297
社团实践
.792
.522
.373
.056
.384
.798
1.000
.378
网络活跃度
.476
.190
-.136
-.093
-.008
.297
.378
1.000
Sig.(单侧)
怀念程度
.
.000
.000
.250
.000
.000
.000
.000
状态
.000
.
.011
.378
.267
.000
.000
.056
学校层次
.000
.011
.
.456
.000
.020
.001
.129
学习成绩
.250
.378
.456
.
.000
.393
.320
.221
竞赛科研
.000
.267
.000
.000
.
.043
.000
.474
学生干部
.000
.000
.020
.393
.043
.
.000
.006
社团实践
.000
.000
.001
.320
.000
.000
.
.001
网络活跃度
.000
.056
.129
.221
.474
.006
.001
.
N
怀念程度
71
71
71
71
71
71
71
71
状态
71
71
71
71
71
71
71
71
学校层次
71
71
71
71
71
71
71
71
学习成绩
71
71
71
71
71
71
71
71
竞赛科研
71
71
71
71
71
71
71
71
学生干部
71
71
71
71
71
71
71
71
社团实践
71
71
71
71
71
71
71
71
网络活跃度
71
71
71
71
71
71
71
71
关于多重共线性的诊断,我们可以从以下角度分析:
由表1.4可以看出,学校层次与科研竞赛、学习成绩与科研竞赛、学生干部与社团实践,都存在比较强的相关关系,模型存在多重共线性现象。
由表1.5可以看出,竞赛科研与学校层次、社团实践与状态、社团实践与学生干部,具有相关关系,模型存在多重共线性现象。
由表1.1可得,自变量的VIF都是小于10的,但是状态、学习成绩、网络活跃度的容差接近1,说明存在共线性。
(6)自相关检验
由表1.2可知,D-W统计量为2.121,DL=1.46,DU=1.77,模型无自相关问题。
1.2.3模型的修正再运算与结果分析
对模型应用逐步回归法进行修正,SPSS的输出结果及相关分析如下:
(1)修正后回归方程的建立
表1.6
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
共线性统计量
B
标准误差
试用版
下限
上限
容差
VIF
1
(常量)
1.187
.196
6.068
.000
.797
1.578
社团实践
.678
.063
.792
10.764
.000
.553
.804
1.000
1.000
2
(常量)
.819
.232
3.536
.001
.357
1.282
社团实践
.612
.065
.714
9.386
.000
.482
.742
.857
1.167
网络活跃度
.172
.064
.205
2.700
.009
.045
.300
.857
1.167
3
(常量)
.198
.288
.687
.495
-.377
.773
社团实践
.507
.069
.592
7.376
.000
.370
.645
.673
1.486
网络活跃度
.239
.063
.285
3.787
.000
.113
.365
.767
1.303
学校层次
.234
.072
.245
3.270
.002
.091
.378
.771
1.297
4
(常量)
.214
.280
.765
.447
-.345
.773
社团实践
.438
.074
.511
5.952
.000
.291
.584
.555
1.803
网络活跃度
.236
.061
.281
3.849
.000
.113
.358
.767
1.304
学校层次
.219
.070
.229
3.129
.003
.079
.359
.763
1.310
状态
.371
.164
.171
2.264
.027
.044
.699
.721
1.388
a.因变量:
怀念程度
由表1.6,得到4个回归方程:
Y=1.187+0.678X6
Y=0.819+0.612X6+0.172X7
Y=0.198+0.234X2+0.507X6+0.239X7
Y=0.214+0.371X1+0.219X2+0.438X6+0.236X7
(2)修正后回归方程的拟合优度检验
表1.7
模型汇总e
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.792a
.627
.621
.64437
2
.814b
.663
.653
.61686
3
.842c
.709
.696
.57711
4
.855d
.730
.714
.56012
2.130
a.预测变量:
(常量),社团实践。
b.预测变量:
(常量),社团实践,网络活跃度。
c.预测变量:
(常量),社团实践,网络活跃度,学校层次。
d.预测变量:
(常量),社团实践,网络活跃度,学校层次,状态。
e.因变量:
怀念程度
由表1.7知,模型1,模型2,模型3,模型4的拟合优度都比较不错,并且是越来越高的。
(3)修正后回归方程的显著性检验
表1.8
Anovae
模型
平方和
df
均方
F
Sig.
1
回归
48.110
1
48.110
115.870
.000a
残差
28.650
69
.415
总计
76.760
70
2
回归
50.885
2
25.442
66.862
.000b
残差
25.875
68
.381
总计
76.760
70
3
回归
54.445
3
18.148
54.491
.000c
残差
22.315
67
.333
总计
76.760
70
4
回归
56.054
4
14.013
44.667
.000d
残差
20.706
66
.314
总计
76.760
70
a.预测变量:
(常量),社团实践。
b.预测变量:
(常量),社团实践,网络活跃度。
c.预测变量:
(常量),社团实践,网络活跃度,学校层次。
d.预测变量:
(常量),社团实践,网络活跃度,学校层次,状态。
e.因变量:
怀念程度
由表1.8可知,模型1,模型2,模型3,模型4的F统计量的Sig.的值都小于0.05,都是显著的。
(4)修正后回归方程系数的显著性检验
由表1.6知,模型1,模型2,模型3,模型4的系数都是显著的。
(5)修正后回归方程的确立
综合以上分析可知,在都满足方程显著性和系数显著性的条件下,模型4具有最高的拟合优度,因此,模型4是最佳的回归方程模型,即
Y=0.214+0.371X1+0.219X2+0.438X6+0.236X7
1.3结论与思考
通过修正,我们得出的影响应届毕业生怀念母校程度的多元线性回归方程
Y=0.214+0.371X1+0.219X2+0.438X6+0.236X7
其中,X1代表状态(1表示就业,0表示深造),X2代表学校层次,X6代表社团实践,X7代表网络活跃度。
下面我们对模型与实际生活的吻合度做一下比较:
(1)从模型可以看出,状态、学校层次、社团实践、网络活跃度的系数都是正的。
就业的应届毕业生比深造的具有更高的对母校的怀念程度,这一点是非常可以理解的。
因为进入社会后,我们面临激烈的职场生活,在生活方式、作息习惯以及身边所接触的人等很多方面都要经过一段时间的不适应期,这时候时常怀念母校、怀念自己无拘无束的大学生活,是很正常的;而读研、出国等继续深造的学生,相对来说环境变化不是很大,可能被读研学校、出国城市的积极向上的环境所吸引,所以不至于产生很多思念母校的情感。
(2)学校层次越高,越容易对母校产生怀念,这一点更是显而易见。
高水平的大学,不仅在生活、学习条件上优越,更是有一种优良的传统。
校风校训,对人一生都会有很大的影响。
所以我们可以看到,越是优秀学校出来的学生,将来回母校捐赠的可能就越大。
因为他们更加认同母校,认为自己的母校可以产生很好的社会效益。
(3)社团实践、网络活跃度,都与怀念母校的程度成正向关系。
我们可以这样理解,拥有较多社团实践和网络活跃度的人,通常拥有较多的朋友,与学校相关机构的接触会更多。
而对一个事物了解的越多,对它的记忆就越深刻,也越容易产生认可,这样在将来就越容易怀念的感情。
另外,网络活跃度,是可以一直持续下来的。
在毕业后,在网络上更活跃的人,更容易和大学同学联系,也就更容易谈及关于大学的话题,这样就更容易产生思念。
(4)在模型中,学习成绩、竞赛科研、学生干部对因变量是不显著的。
这一方面与自变量间的共线性有关,比如学校的层次对学习成绩、竞赛科研是有很大的影响的,而学生干部与社团实践又是相关的。
当然,他们内在的交叉影响关系还有很多。
不过也说明,学习成绩以至于科研、学生干部这些因素,对怀念母校的程度影响比较微弱,即学霸和科研狂人不一定比学渣更怀念母校。
这可能是因为这些人在图书馆、实验室的时间比较多,没有机会深入的了解学校,而他们深造、工作后,可能也比较关注于当下的生活。
(5)我们还可以从样本来源的角度做一些分析,因为本次问卷是网上调查问卷,所以回答问卷的人,往往都是网络活跃度比较高、社团实践比较多的人。
总之,模型对现实生活的解释能力还是不错的,没有明显违背我们日常认可的地方,至于一些我们通常认为会对怀念母校程度有影响的学习成绩等因素的不显著,可能是很多原因造成的。
而本文所采取的样本量是远远不能说明问题的,要想得出更为准确的结论,还是要加大样本量的。
从本文的结论,我们可以对大学的建设提供一点参考,比如加强校园网络建设,如微信平台、公共主页等,从而加大学生的网络参与度,还有就是给予学生更多参与实践的机会,一些有意义的实践,比如支教或是校庆志愿者的活动,都是能给学生留下一生的美好回忆的。
总之,对学校丝丝缕缕的回忆,都是学生投桃报李、回馈母校的活力源泉。
第二章大学生对校园认可度影响因素的因子分析
2.1引言
2.1.1研究背景
评价一个大学的优劣,最有发言权的就是生活在其中的学生。
大学生,作为大学的服务、培养对象,对大学校园的认可度,直接影响到大学教育的质量。
一个学生,只有对自己所在大学拥有一个较高的认可度,才能以一个积极的心态度过在校期间的学习、生活时光,才能在毕业后怀着一种深深的美好的眷恋回馈母校。
本文旨在应用因子分析的方法,对影响学生对大学校园认可度的客观因素进行分析,探寻存在其中的规律,从而对大学校园的建设,提出合理化建议。
2.1.2问题的提出与描述
本文应用因子分析的方法,通过自编调查问卷获取数据,对影响大学生对校园认可度的15个客观因素进行分析。
这15个指标分别是校园自然环境、宿舍条件、浴室条件、超市书店、校训校风、学术报告、课程设置、文体活动、教师水平、学习氛围、网络使用、日常管理、信息化建设、奖励评价体系、图书馆条件。
其中要说明的是,网络使用指有线、无线网络的速度及便捷度,日常管理指校级和院级日常关于卫生、安全等事项的管理,信息化建设在学生层面指选课系统、网络课程等。
这些都在问卷中给予了解释说明。
2.1.3数据来源及样本特征
本文的数据来源于自编的网上调查问卷,回收问卷46份,其中有效问卷34份。
样本特征如下:
男同学18人,女性校友16人;基本上平衡了学校层次、专业大类以及地区水平。
2.2建模与分析
2.2.1模型建立
变量定义如下:
X1:
校园自然环境X2:
宿舍条件X3:
浴室条件
X4:
超市书店X5:
校训校风X6:
学术报告
X7:
课程设置X8:
文体活动X9:
教师水平
X10:
学习氛围X11:
网络使用X12:
日常管理
X13:
信息化建设X14:
奖励评价体系X15:
图书馆条件
2.2.2运算与结果分析
应用SPSS软件进行因子分析的输出结果及分析如下:
(1)因子分析方法适用性分析
表2.1
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.735
Bartlett的球形度检验
近似卡方
306.008
df
105
Sig.
.000
表2.2
相关矩阵
校园自然环境
宿舍条件
浴室条件
超市书店
校训校风
学术报告
课程设置
文体活动
教师水平
学习氛围
网络使用
日常管理
信息化建设
奖励评价
图书馆
相关
校园自然环境
1.000
.286
.173
.341
.381
.437
.323
.169
.403
.419
.004
.272
.249
.231
.397
宿舍条件
.286
1.000
.739
.284
.551
.535
.385
.283
.357
.293
.408
.575
.330
.336
.550
浴室条件
.173
.739
1.000
.175
.384
.370
.402
.172
.337
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 课程设计