定性数据分析论文讲解.docx
- 文档编号:13336686
- 上传时间:2023-06-13
- 格式:DOCX
- 页数:16
- 大小:47.01KB
定性数据分析论文讲解.docx
《定性数据分析论文讲解.docx》由会员分享,可在线阅读,更多相关《定性数据分析论文讲解.docx(16页珍藏版)》请在冰点文库上搜索。
定性数据分析论文讲解
2014—2015学年第一学期《定性数据》期末论文
题目不同年级与性别对奖助学金渴望度定性数据分析
姓名常XX
学号20120623104
学院数学与统计学院
专业统计专业
2014年12月18日
不同年级与性别对奖助学金渴望度定性数据分析
摘要:
定性数据分析是数据分析的一个重要内容,它在实践中有着广泛的应用,如问卷调查、产品检验、医学统计等领域中经常用到列联表的定性数据分析来。
列联表的定性数据分析不
2
仅可以分析分类特征之间的相互依赖关系,还可以进行2检验、似然比检验、相合性的度量和检验、计算相关系数作相关分析也可以进行一致性与读了性的检验。
本文主要采用2检验、似然比检验、相合性的度量和检验来对不同年级、不同性别的大学生对奖助学金渴望度的独立性、相合性检验,最终得到对奖助学金的渴望度与性别无关、与年级有关。
2
关键词列联表2检验似然比检验相合性度量
一、问题简述为了解高某校不同年级不同性别的大学生对奖助学的渴望程度,对某校大一年级、大二年级共80位同学关于奖助学金的调查,并取其中的年级、性别、渴望度三个指标生成列联表,对列联表做定性数据分析。
二、符号说明
2
2:
卡方统计量
2ln:
似然比统计量
U:
统计量
p:
概率
:
相合性度量统计量
三、理论方法
理论:
列联表一般来说,有二维的rc列联表,假设将n个个体根据两个属性A和B
进行分类,属性A有r类:
A1,,Ar,属性B有c类:
B1,,Bc。
n个个体中既属于Ai
类又属于Bj类的有nij个。
得如下二维的rc列联表:
表一
列属性B
合计
B1
B2
Bc
A1
n11
n12
n1c
n1
A2
n21
n22
n2c
n2
行属性A
Ar
nr1
nr2
nrc
nr
合计
n1
n2
nc
n
其中,nijnij,,i1,,r;njinij,j1,,c,nninj。
ij
如果n个个体根据三个或三个以上的属性分类,就会有三维或三维以上的列联表,对于高维的列联表一般将其压缩为二维列联表在对数据进行统计分析或对高维列联表进行分层在检验。
方法:
对二维表中的数据进行2检验、似然比检验、相合性的度量和检验。
四、数据的来源与数据处理
本数据的来自在2014年6月所做的《关于奖助学金的问卷调查》,本问卷共发放80份,实际回收77份。
其中选年级、性别、渴望程度三个指标统计数据得如下的三维224
的列联表:
(其问卷和原始数据以及选出的三个指标的数据见附录)
表二
A(非常渴
望)
B(一般渴
望)
C(渴望)
D(无所谓)
合计
A(大一年级)
A(男)
4
2
1
0
7
B(女)
8
9
13
0
30
B(大二年级)
A(男)
3
3
3
2
11
B(女)
11
9
3
6
29
合计
26
23
20
8
77
1、列联表的压缩列联表的压缩即把高维列联表某一属性不同情况的数据合并在一起得到低维列联表德尔过程。
将表二中不同年级、不同性别的人数分别合并在一起,将三维224列联表分别压缩为如下的二维列联表。
表三
A(非常渴望)
B(一般渴望)
C(渴望)
D(无所谓)
合计
A(男)
7
5
4
2
18
B(女)
19
18
16
6
59
合计
26
23
20
8
77
表四
A(非常渴望)
B(一般渴望)
C(渴望)
D(无所谓)
合计
A(大一年级)
12
11
14
0
37
B(大二年级)
14
12
6
8
40
合计
26
23
20
8
77
2、列联表的分层
列联表的分层即将高维列联表按某一个属性分成几个低维列联表,把表二按年级将三维列联表分为两个二维列联表。
表五
A(非常渴望)
B(一般渴望)
C(渴望)
D(无所谓)
合计
A(大一年级)
A(男)
4
2
1
0
7
B(女)
8
9
13
0
30
合计
12
11
14
0
37
表六
A(非常渴望)
B(一般渴望)
C(渴望)
D(无所谓)
合计
B(大二年级)
A(男)
3
3
3
2
11
B(女)
11
9
3
6
29
合计
14
12
6
8
40
五、检验与分析
5.1、描述性统计
对表二中的渴望度数据作柱形图和饼图,分析各渴望度所占的多少和比率。
渴望度柱形图
渴望度
是一般渴望,再次是渴望,最后是无所谓,也就是说大学生都比较渴望得到奖助学金的。
5.2、压缩列联表的检验与分析
2
1、2检验和似然比检验
(1)假设
H0:
pp1jpprj(属性相互独立)H1:
pp1jpprj(属性不独立)
p1prp1pr
(2)检验
p1jprj
当两个属性独立时,根据1jrj可知个体在每一类中的概率pij由p1,,pr
p1pr
和p1,pc完全确定,所以二维列联表的独立性检验实际上是带参数时的分类数据检验。
2
其统计量是自由度为r1c1的2统计量(2nij),在水平下
i1j1ninjn
2
2检验的拒绝域为2>2nij也就是说,此时可认为独立性不成立,否则,
i1j1ninjn
可认为独立性成立。
二维列联表的独立性检验的似然比检验的统计量为:
22
r1c1的2变量大于等于2统计量的值的概率,如果p值则拒绝原假设,如果p值,则不拒绝原假设。
对压缩后的列联即表三(性别与渴望度)用SPSS进行2检验得2值和p值如下:
卡方检验
值
df
渐进Sig.
(双侧)
Pearson卡方
.356a
3
.949
似然比
.355
3
.949
线性和线性组合
.129
1
.720
有效案例中的N
77
a.2单元格(25.0%)的期望计数少于5。
最小期望计数为1.87。
性别与渴望度的卡方检验表
由上表可知20.356,p0.9490.05且2ln0.355,p0.9490.05所以不拒绝原假设,独立性成立即性别与渴望度是相后独立,也就是说性别与奖助学渴望度无关。
对表四(年级与渴望度)用SPSS进行2检验得2值和p值如下:
卡方检验
值
df
渐进Sig.
(双侧)
Pearson卡方
11.298a
3
.010
似然比
14.462
3
.002
线性和线性组合
.406
1
.524
有效案例中的N
77
a.2单元格(25.0%)的期望计数少于5。
最小期望计数为3.84。
年级与渴望度的卡方检验表
由上表可知211.298,p0.010.05且2ln14.462,p0.0020.05,所以拒绝原假设,独立性不成立即年级与渴望度是相关的,也就是说年级与奖助学渴望度有关。
2.相合性的度量和检验
由于2检验和似然比检验得年级与渴望度是相关的,所以对年级和渴望度进行相合性度量和检验,属性之间的相合关系有正相合(属性A比较大的个体,属性B也往往比较大)、负相合(属性A比较大的个体,属性B却往往比较小)。
度量列联表相合性的方法有Kendall系数、Gamma系数和Somersd系数。
主要用Kendall系数来度量年级与渴望度的相合性,其统计量为:
z其中
[n(n1)/2TA][n(n1)/2TB
rni(ni1)cnj(nj1)
TAni(ni1),TBjj,|z|[n(n1)/2TA][n(n1)/2TB],而
Ai12Bj12AB
的值在-1和1之间,其值接近1,倾向于认为正相合;值接近于-1,倾向于认为负相合。
相合性的检验是原假设为属性A和属性B相互独立,备择属性A与属性B正相合的检验,其统计量为:
相合性检验并不显著,也就是说年级与渴望度不是正相合关系。
用检验得下表。
对称度量
值
渐进标准误差a
近似值Tb
近似值Sig.
按标量标定
φ
.383
.010
Cramer的V
.383
.010
相依系数
.358
.010
按顺序
Kendall'stau-b
.034
.106
.319
.750
Kendall'stau-c
.040
.127
.319
.750
γ
.055
.171
.319
.750
Spearman相关性
.037
.115
.318
c.752
按区间
Pearson的R
.073
.110
.634
.528c
一致性度量
Kappa
.d
有效案例中的N
77
a.不假定零假设。
b.使用渐进标准误差假定零假设。
c.基于正态近似值。
d.无法计算Kappa统计量。
它们需要一个第一个变量值与第二个变量值相匹配的对称双向表。
因为经检验得0.040但远远小于1,且接近于0,而p0.750.05也就是说要拒绝原假设,所以可以认为年级与奖助学金的渴望程度相合性的检验不通过。
5.3、分层列联表的检验与分析
用SPSS分别对分层列联表(表五、表六)进行2检验和似然比检验得:
卡方检验
值
df
渐进Sig.
(双侧)
Pearson卡方
2.895(a)
2
.235
似然比
2.981
2
.225
线性和线性组合
2.796
1
.094
McNemar-Bowker检验
.(b)
有效案例中的N
37
a3单元格(50.0%)的期望计数少于
5。
最小期望计数为2.08。
b仅对PxP
表计算,其中
P必须大于
1。
大一年级性别与渴望度的卡方检验表
从表中可以看出22.895,p0.2350.05且2ln2.981,p0.2250.05即
大一年级的男女对奖助学金的渴望度是独立的,也就是说性别与渴望度无关。
卡方检验
值
df
渐进Sig.
(双侧)
Pearson卡方
1.845(a)
3
.605
似然比
1.694
3
.638
线性和线性组合
.314
1
.575
McNemar-Bowker检验
.(b)
有效案例中的N
40
a5单元格(62.5%)的期望计数少于
5。
最小期望计数为1.65。
b仅对PxP
表计算,其中
P必须大于
1。
大二年级性别与渴望度卡方检验表
从表中可以看出21.845,p0.6050.05且2ln1.694,p0.6380.05即大二年级的男女对奖助学金的渴望度是独立的,也就是说性别与渴望度无关。
这与表三(性别与渴望度)的2检验和似然比检验的结果一致。
六、结论
经过分别对压缩列联表和分层列联表的2检验、似然比检验及相合性的度量和检验可以认为不同年级的大学生与奖助学金的渴望度有关系,而不同性别的大学生与奖助学金的渴望度是有关系。
参考文献
[1]王静龙,梁小筠.定性数据统计分析.北京:
中国统计出版社,
2008.7
10
附页(数据)
序号
1
2
3
4
5
6
7
年级
A
A
A
A
A
A
A
性别
A
A
B
B
B
A
B
渴望程度
B
B
C
B
C
A
B
序号
8
9
10
11
12
13
14
年级
A
A
A
A
A
A
A
性别
B
B
B
B
B
B
B
渴望程度
C
C
C
B
A
A
B
序号
15
16
17
18
19
20
21
年级
A
A
A
A
A
A
A
性别
A
B
B
B
B
B
B
渴望程度
A
C
B
B
B
A
B
序号
22
23
24
25
26
27
28
年级
A
A
A
A
A
A
A
性别
B
B
A
B
A
B
B
渴望程度
C
A
A
C
A
A
A
序号
29
30
31
32
33
34
35
年级
A
A
A
A
A
A
A
性别
B
B
B
B
B
A
渴望程度
C
B
A
A
C
C
A
序号
36
37
38
39
40
41
42
年级
A
A
A
B
B
B
B
性别
B
B
B
B
B
B
B
渴望程度
C
C
C
A
A
B
A
序号
43
44
45
46
47
48
49
年级
B
B
B
B
B
B
B
性别
B
B
B
B
B
A
B
渴望程度
A
B
B
A
A
C
C
序号
50
51
52
53
54
55
56
年级
B
B
B
B
B
B
B
性别
B
B
B
B
B
B
B
渴望程度
C
B
B
C
A
A
A
序号
57
58
59
60
61
62
63
年级
B
B
B
B
B
B
B
性别
B
A
A
A
A
B
B
渴望程度
A
B
C
A
D
D
B
序号
64
65
66
67
68
69
70
年级
B
B
B
B
B
B
B
性别
A
A
B
B
A
A
B
渴望程度
C
A
D
A
B
D
D
11
序号
71
72
73
74
75
76
77
年级
B
B
B
B
B
B
B
性别
A
A
B
B
B
B
B
渴望程度
B
A
B
D
B
D
D
12
附页(问卷)
关于奖助学金的问卷调查一.调查目的:
深入了解我院来自不同年级,不同环境,不同性别的大学生对奖助学金的使用情况。
二.调查方式:
共发放80份,分两组发放,每组发40份。
三.问卷设计:
1.你所在的年级:
___
A.大一B.大二
2.你的性别:
___
A.男B.女
3.你来自:
___
A.农村B.乡镇C.县城D.城市
4.你的主要经济来源?
___
A.勤工俭学B.助学金C.信用借贷D.家庭补助
5.你在学期间一个月的伙食费?
___
A.300元以下B.300到400C.400到500D.500元以上
6.你对奖助学金的渴望程度?
___
A.非常渴望B.一般渴望C.渴望D.无所谓
7.你觉得奖助学金对你帮助大吗?
___
A.很大B.一般C.很小D.没有帮助
8.请问你拿奖助学金的目的是:
___(多选题)A.为了得到荣誉B.为了经济上的帮助C.为了以后找工作增加砝D.没有注意奖助学金
E.其它____________
9.获得奖助学金的次数?
___
A.一次B.两次C.三次D.四次E.未获得过
10.当你拿到奖学金后,你是如何安排这笔费用的?
___(多选题)
A.请客送礼B.学习之用C.犒赏自己D.生活费用E.其它____________
11.拿了奖学金,你用在学习上的去向是什么?
___(多选题)
A.买参考书、资料书B.交学费C.买学习工具
D.买课外书E.其它____________
12.当你获得助学金时,你打算用多久?
___
A.一年B.半年C.一至三个月D.一个月以下
13.当你获得助学金时,会有什么感受:
___(多选题)A.非常开心,下决心科学使用B.蛮开心的,父母一定很欣慰
C无所谓D.习惯了E.郁闷,又要请客了
13
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定性 数据 分析 论文 讲解