国家开放大学《社会统计学》形考任务1-4参考答案.docx
- 文档编号:12221335
- 上传时间:2023-06-04
- 格式:DOCX
- 页数:12
- 大小:318.48KB
国家开放大学《社会统计学》形考任务1-4参考答案.docx
《国家开放大学《社会统计学》形考任务1-4参考答案.docx》由会员分享,可在线阅读,更多相关《国家开放大学《社会统计学》形考任务1-4参考答案.docx(12页珍藏版)》请在冰点文库上搜索。
国家开放大学《社会统计学》形考任务1-4参考答案
形考任务1
表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并
(1)对考试成绩进行排序和分组(40分),
(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。
请注意分组时按照下列标准:
等级
A
A-
B+
B
B-
C+
C
C-
D+
D
F
分数
90-100
86-89
83-85
80-82
76-79
73-75
70-72
66-69
63-65
60-62
0-59
表1某专业二年级同学社会统计学期末考试成绩(百分制)
学生
成绩
学生
成绩
学生
成绩
学生
成绩
学生
成绩
1
86
28
34
55
88
82
70
109
71
2
60
29
65
56
93
83
88
110
80
3
65
30
30
57
85
84
88
111
87
4
28
31
78
58
83
85
68
112
66
5
85
32
86
59
93
86
87
113
84
6
87
33
84
60
95
87
88
114
83
7
70
34
87
61
71
88
91
115
85
8
64
35
85
62
90
89
76
116
78
9
51
36
93
63
86
90
87
117
81
10
58
37
96
64
89
91
81
118
81
11
90
38
82
65
89
92
61
119
71
12
50
39
78
66
83
93
72
120
86
13
87
40
80
67
84
94
86
121
91
14
82
41
74
68
44
95
29
122
66
15
65
42
72
69
68
96
37
123
58
16
68
43
73
70
89
97
82
124
68
17
86
44
86
71
84
98
82
125
80
18
80
45
85
72
86
99
82
126
77
19
81
46
90
73
79
100
85
127
55
20
70
47
69
74
78
101
78
128
54
21
80
48
86
75
87
102
80
129
62
22
49
49
86
76
88
103
90
130
54
23
80
50
84
77
82
104
82
131
65
24
70
51
81
78
83
105
72
132
74
25
59
52
90
79
92
106
86
133
70
26
80
53
34
80
86
107
80
134
72
27
52
54
84
81
86
108
82
135
73
(1)排序和分组
步骤:
排序:
Date——SortCases——Sortby成绩(Ascending)
分组:
Transform——Recodeintodifferentvariables——成绩——output——成绩分组——1为90-100,2为86—89,3为83-85……以此类推。
详见作业1.sav。
(2)频数分布表如下图
步骤:
Analyze——DescriptiveStatistics——Frequencies——成绩分组
(3)频数分布图如下:
步骤:
Analyze——DescriptiveStatistics——Frequencies——成绩分组——Charts——Histograms(Withnormalcurve)。
形考任务2
形考任务3
形考任务4
形考任务2
表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件:
(1)计算学生上网时间的中心趋势测量各指标(9分)和离散趋势测量各指标(12分)。
(2)计算学生上网时间的标准分(Z值)及其均值和标准差。
(8分)
(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。
(6分)
表1某专业一年级同学一周上网时间(小时)
学生
上网时间
学生
上网时间
学生
上网时间
学生
上网时间
学生
上网时间
1
13
21
18
41
14
61
8
81
10
2
9
22
22
42
7
62
19
82
10
3
8
23
22
43
9
63
24
83
20
4
12
24
10
44
8
64
13
84
21
5
8
25
13
45
10
65
21
85
16
6
26
26
10
46
18
66
21
86
10
7
13
27
12
47
26
67
10
87
10
8
5
28
22
48
14
68
13
88
21
9
3
29
19
49
8
69
20
89
19
10
18
30
10
50
10
70
21
90
10
11
3
31
22
51
13
71
12
91
32
12
10
32
30
52
28
72
15
92
7
13
20
33
8
53
12
73
26
93
28
14
19
34
20
54
10
74
20
94
19
15
15
35
17
55
9
75
17
95
15
16
8
36
14
56
10
76
19
96
10
17
8
37
8
57
12
77
9
97
20
18
15
38
12
58
24
78
21
98
8
19
20
39
15
59
26
79
17
99
14
20
22
40
13
60
20
80
16
100
18
(1)集中趋势各指标:
均数为15.2、中位数为14.0、众数为10。
离散趋势:
四分位数分别为P25为10、P50为14、P75为20、方差为39.515、标准差为6.286、极差为29。
步骤:
Analyze——DescriptiveStatistics——Frequencies——上网时间——(勾选集中趋势指标:
mean,median,mode,minimum,maximun离散趋势指标:
quartiles,Variance,Std.deviation,Range)
(2)标准分Z值(详见作业2.sav)。
步骤Analyze——DescriptiveStatistics——Descriptive——Savestandardizedvaluesasvarianles即可。
均数位15.2,标准差6.286
步骤Analyze——DescriptiveStatistics——Descriptive——Options——勾选(mean,Std.deviation)
(3)一周上网时间超过20小时的学生所占比例21%。
步骤1:
Analyze——SelectCases——if上网时间>20h
步骤2:
Analyze——DescriptiveStatistics——Descriptive——上网时间超过20h。
得出上网时间超过20h人数为21人,占总人数的21%。
形考任务3
一、单项选择题(每题2分,共20分)
1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于()。
A.简单随机抽样
B.整群抽样
C.分层抽样
D.系统抽样
2.以下关于因变量与自变量的表述不正确的是()
A.自变量的变化是以因变量的变化为前提
B.因变量是由于其他变量的变化而导致自身发生变化的变量
C.自变量是引起其他变量变化的变量
D.因变量的变化不以自变量的变化为前提
3.某地区2001-2010年人口总量(单位:
万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据()。
A.茎叶图
B.环形图
C.饼图
D.折线图
4.以下关于条形图的表述,不正确的是()
A.条形图中条形的宽度是固定的
B.条形图中条形的长度(或高度)表示各类别频数的多少
C.条形图的矩形通常是紧密排列的
D.条形图通常是适用于所有类型数据
5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。
某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。
A.数学
B.语文
C.两门课程一样
D.无法判断
6.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是()
A.甲的离散程度小,稳定性水平低
B.甲的离散程度小,稳定性水平高
C.乙的离散程度小,稳定性水平低
D.乙的离散程度大,稳定性水平高
7.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组。
组别
按年龄分组(岁)
工作人员数(人)
1
20-24
6
2
25-29
14
3
30-34
24
4
35-39
18
5
40-44
12
6
45-49
18
7
50-54
14
8
55-59
6
合计
112
A.第3组
B.第4组
C.第5组
D.第6组
8.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间()
A.相关程度越大
B.相关程度越小
C.完全相关
D.完全不相关
9.回归平方和(SSR)反映了y的总变差中()
A.由于x与y之间的线性关系引起的y的变化部分
B.除了x对y的线性影响之外的其他因素对y变差的影响
C.由于x与y之间的非线性关系引起的y的变化部分
D.由于x与y之间的函数关系引起的y的变化部分
10.下列哪种情况不适合用方差分析()
A.性别对收入的影响
B.专业对收入的影响
C.年龄对收入的影响
D.行业对收入的影响
二、名词解释(每题5分,共20分)
11.非概率抽样:
根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。
12.二维表:
二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
13.置信水平:
置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。
14.卡方检验:
卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。
三、简答题(每题10分,共30分)
15.等距分组和不等距分组有什么区别?
请举例说明。
答:
(1)定类变量:
当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。
例如:
性别
(2)定序变量:
当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。
例如:
学历
(3)定距变量:
当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。
例如:
智商
(4)定比变量:
除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。
例如:
收入
16.简述相关系数的取值与意义
答:
相关系数的取值在-1~1之间;相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“-”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关
17.简述什么是简单回归分析?
其作用是什么。
答:
(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。
(2)回归分析的作用包括:
①从已知数据出发,确定变量之间的数学关系式;
②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;
③利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。
四、计算题(共30分)
18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。
请问:
(1)是男生体重差异大还是女生体重差异大?
为什么?
(2)男生中有多少比重的人体重在55千克-65千克之间?
(3)女生中有多少比重的人体重在40千克-60千克之间?
备注:
ф
(1)=0.8413,ф
(2)=0.9772
答:
19.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。
通过分析得到以下方差分析表:
变差来源
SS
df
MS
F
Sig
回归
1602708.6
B
D
F
0.000
残差
40158.08
C
E
-
-
总计
A
11
-
-
-
要求:
(1)计算上面方差分析表中A、B、C、D、E、F处的值。
(2)商品销售量的变差中有多少是由价格的差异引起的?
答:
形考任务4
一、单项选择题(每题2分,共20分)
1.以下关于因变量与自变量的表述不正确的是()
A.自变量的变化是以因变量的变化为前提
B.因变量是由于其他变量的变化而导致自身发生变化的变量
C.自变量是引起其他变量变化的变量
D.因变量的变化不以自变量的变化为前提
2.某班级学生平均每天上网时间可以分为以下六组:
1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为()
A.5小时
B.6小时
C.5.5小时
D.6.5小时
3.以下关于条形图的表述,不正确的是()
A.条形图中条形的宽度是固定的
B.条形图的矩形通常是紧密排列的
C.条形图中条形的长度(或高度)表示各类别频数的多少
D.条形图通常是适用于所有数据类型
4.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组
组别
按年龄分组(岁)
工作人员数(人)
1
20-24
6
2
25-29
14
3
30-34
24
4
35-39
18
5
40-44
12
6
45-49
18
7
50-54
14
8
55-59
6
合计
112
A.第3组
B.第4组
C.第5组
D.第6组
5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。
某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。
A.数学
B.语文
C.两门课程一样
D.无法判断
6.在假设检验中,不拒绝虚无假设意味着()
A.虚无假设是肯定正确的
B.虚无假设肯定是错误的
C.没有证据证明虚无假设是正确的
D.没有证据证明虚无假设是错误的
7.根据一个样本均值求出的90%的置信区间表明()
A.总体均值一定落人该区间内
B.总体均值有90%的概率不会落入该区间内
C.总体均值有90%的概率会落人该区间内
D.总体均值有10%的概率会落入该区间内
8.在回归方程中,若回归系数等于0,这表明()
A.因变量y对自变量x的影响是不显著的
B.自变量x对因变量y的影响是不显著的
C.因变量y对自变量x的影响是显著的
D.自变量x对因变量y的影响是显著的
9.中心极限定理认为不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为()、方差为()的正态分布。
A.μ,σ2
B.μ/n,σ2/n
C.μ,σ2/n
D.μ/n,σ2
10.下列哪种情况不适合用方差分析()
A.性别对收人的影响
B.年龄对收人的影响
C.专业对收人的影响
D.行业对收入的影响
二、名词解释(每题5分,共20分)
11.整群抽样:
先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。
12.Z值:
Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:
Z=(X-μ)/σ
13.二维表:
二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
14.误差减少比例:
在预测变量Y的值时,知道变量X的值时所减少的误差(-)与总误差的比值称为误差减少比例,简称PRE。
三、简答题(每题10分,共30分)
15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。
(1)网络供应商的姓名
(2)每月的网络服务费
(3)每月上网时间
(4)上网的目的
(5)上月网购次数
答:
(1)网络供应商的姓名:
定性
(2)每月的网络服务费:
定量、连续变量
(3)每月上网时间:
定量、连续变量
(4)上网的目的:
定性
(5)上月网购次数:
定量、离散变量
16.简述什么是简单回归分析?
其作用是什么?
答:
(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。
(2)回归分析的作用包括:
①从已知数据出发,确定变量之间的数学关系式;
②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;
17.如何对配对样本进行t检验。
答:
配对样本检验主要是判断不同的处理或试验结果是否有差异。
配对样本的t检验用于检验两个相关的样本是否来自具有相同均值的总体。
在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,如果差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。
四、计算题(共30分)
18.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。
(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。
以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。
注:
Z0.025=1.96
答:
19.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。
通过对每块试验田的产量进行分析得到下面的方差分析表。
请完成方差分析表。
变差来源
SS
df
MS
F
Sig
组间
A
C
320
F
0.000
组内
6048
D
E
-
-
总计
B
39
-
-
-
答:
12/12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会统计学 国家 开放 大学 社会 统计学 任务 参考答案