社会研究方法试题 第九章 社会研究的定量分析.docx
- 文档编号:13064566
- 上传时间:2023-06-10
- 格式:DOCX
- 页数:38
- 大小:136.04KB
社会研究方法试题 第九章 社会研究的定量分析.docx
《社会研究方法试题 第九章 社会研究的定量分析.docx》由会员分享,可在线阅读,更多相关《社会研究方法试题 第九章 社会研究的定量分析.docx(38页珍藏版)》请在冰点文库上搜索。
社会研究方法试题第九章社会研究的定量分析
第九章社会研究的定量分析
9.1调查资料的统计整理
统计分组和频数分布·频率分布与总体内部结构·图示法
9.2描述统计分析
集中趋势统计量(算术平均数、中位数、众数)·离中趋势统计量(全距、异众比、标准差)
9.3推论统计分析
概率与概率分布·分布函数·数学期望与变异数·假设检验与二项分布
的应用·正态分布与标准正态分布·中心极限定理与正态检验·点估计与区间估计
9.4相关与回归分析
变量之间的相互关系·皮尔逊相关系数·线性回归分析
9.5动态分析与指数分析
时间数列的构成及指标分析·时间数列的趋势分析·指数分析
一、填空
1.所谓(统计分组),就是将情况相同或相近的数据资料加以分门别类的归并,使之简单明晰,以便为统计分析中提取各种有用信息打下基础。
2.(频数分布)是统计分组的结果,它是指众多的调查数据在各个组(各类别、各等级或各区间)出现或发生的次数。
3.将原始资料编排成序列资料,实际上是在进行(统计汇总)。
4.(频率)就是各组人数占总体人数的比重,即P=f/N。
5.对随机变量而言,可能的某一结果发生的频率随试验次数增大而逐步稳定到某一数值这个经验事实,在概率论中便是(大数定律)。
6.对于连续变量的分布,可以用矩形图表示。
在等距分组的条件下,各矩形的(面积)同样可以用来表示各组的频数和频率,而且更加形象直观。
7.方条图适用于表示离散变量的资料。
方条图与矩形图基本相同,其(高度)表示各组的频数(或频率)。
对于定类变量和定序变量的测量,它的(宽度)是没有意义的。
8.在统计计算中,权数不仅用来衡量总体中各变量值在总体中作用,同时也反映了对象总体的内部结构,所以它有两种表现形式:
绝对数(频数)和相对数(频率)。
9.各变量值与算术平均数的(离差)的平方和为最小值。
10.某班级中男生人数所占比重是66.7%,则男生和女生的比例关系是(2/1)。
11.在频数分布图中,(众数)标示为曲线的最高点所对应的变量值。
12.对收集来的数据,数值最大者和最小者之差叫做(全距),又称之为(极差)。
13.所谓(异众比),是指非众数的频数与总体单位数的比值。
14.分布函数
和
或
的关系,就像向上累计频数和频率的关系一样。
所不同的是,
累计的是(概率)。
15.(大数定律)和(中心极限定理)为抽样推断提供了主要理论依据。
16.在抽样中,遵守(随机原则)是计算抽样误差的先决条件。
17.抽样平均误差和总体标志变动的大小成(正比),与样本容量的平方根成(反比)。
如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应(增大到16倍)。
18.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于(正态)分布。
19.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的(显著性水平),它决定了否定域的大小。
20.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(大),原假设为真而被拒绝的概率越(小)。
21.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
22.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
23.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)。
24.积差系数r是(协方差)与X和Y的标准差的乘积之比。
25.编制时间数列的目的是为了进行(动态)分析,分析所研究现象的发展过程和变动规律。
26.在对比两个时间的发展水平时,我们把所要研究的时间的发展水平称为(报告期水平)。
27.平均增长速度和增长速度之间(没有)直接联系。
28.用直线拟合法描述现象长期发展变动趋势,要求原始数据呈(线性)变动。
29.价格上涨后,用同样多的货币只能购买原商品的90%,则物价指数为(0.9)。
30.我国1987年的人口是1983年的105.17%,1986年的人口是1983年的103.67,则1987年的人口比1986年的人口增加了(1.447)%。
31.要计算某厂生产情况的产品产量总指数,同度量因数是(基期价格水平)。
32.产值总变动指数等于产品产量总指数和产品价格总指数的(积),产值实际发生的总差额等于产量因素引起的差额和价格因素引起的差额的和。
33.用逐期增长量与前期水平相比得到的是(环比增长速度);用累积增长量与固定基期水平相比得到的是(定基增长速度)。
34.在综合指数公式中,(同度量因素)还起着权衡被综合的各个变量值地位轻重的作用,所以它又常常被称为权数。
35.环比发展速度与定基发展速度之间存在以下数量关系:
一是定基发展速度等于相应时期内各环比发展速度的(之积);二是相邻两个定基发展速度(之比),即得环比发展速度。
36.某厂某种产品的产量经3年后增加到原来的8倍,该产品的平均发展速度是(200%),平均增长速度是(100%)。
37.(发展水平)是指时间数列中原有的各种统计指标数值,它反映现象在各个时期上所达到的规模或水平。
38.说明多种事物综合变动的指数称为(综合指数),其特点是各事物的度量单位不同,不能(直接相加)。
39.时间数列一般由两个基本要素构成,即被研究现象所属的(时间(t))和反映该现象的(统计指标数值)。
二、单项选择
1.分析统计资料,可能不存在的平均指标是()。
A众数B算术平均数C中位数D几何平均数
2.中位数只与变量值的(C)有关,因而它可以用于定距、定比资料,也可以用
于定序资料。
A、大小B、多少C、排序D、次数
3.由右边的变量数列可知:
()
完成生产定额数
工人数
10-20
20-30
30-40
40-50
50-60
35
20
25
10
15
A
>
;
B
>
;
C
>30
D
>30
4.关于算术平均数的性质,不正确的描述是()
A各变量值对算术平均数的偏差和为零;
B算术平均数受抽样变动影响微小;
C算术平均数受极端值的影响微小;
D各变量值对算术平均数的偏差的平方和,小于它们对任何其它数偏差的平方和。
5.分组数据中,若各组变量值都增加2倍,每组次数都减少一半,则其中位数的数值将()
A增加2倍B不变
C减少一半D无法判断
6.在统计检验中,那些不大可能的结果称为(D)。
如果这类结果真的发生了,
我们将否定假设。
A检验统计量B显著性水平C零假设D否定域
7.对于大样本双侧检验,如果根据显著性水平查正态分布表得Zα/2=1.96,则当零假设被否定时,犯第一类错误的概率是(C)。
A20%B10%C5%D.1%
8.关于二项分布,下面不正确的描述是(A)。
A它为连续型随机变量的分布;
B它的图形当p=0.5时是对称的,当p≠0.5时是非对称的,而当n愈大
时非对称性愈不明显;
C二项分布的数学期望
=
=
,变异数
=
=
;
D二项分布只受成功事件概率p和试验次数n两个参数变化的影响。
9.对于变异数D(X),下面数学表达错误的是(D)。
A.D(X)=E(X2)―μ2B.D(X)=E[(X―μ)2]
C.D(X)=E(X2)―[E(X)]2D.D(X)=σ
10.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间
存在(A)关系。
A直线正相关B直线负相关C曲线正相关D曲线负相关
11.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示(C)。
A无相关B低度相关C中等相关D高度相关
12.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有(D)。
A在相关分析中,相关的两变量都不是随机的;
B在回归分析中,自变量是随机的,因变量不是随机的;
C在回归分析中,因变量和自变量都是随机的;
D在相关分析中,相关的两变量都是随机的。
13.关于相关系数,下面不正确的描述是(B)。
A当0
1时,表示两变量不完全相关;
B当r=0时,表示两变量间无相关;
C两变量之间的相关关系是单相关;
D如果自变量增长引起因变量的相应增长,就形成正相关关系。
14.欲以图形显示两变量X和Y的关系,最好创建(D)。
A直方图B圆形图C柱形图D散点图
15.在完成了构造与评价一个回归模型后,我们可以(D)。
A估计未来所需样本的容量
B计算相关系数和判定系数
C以给定的因变量的值估计自变量的值
D以给定的自变量的值估计因变量的值
16.两变量的线性相关系数为0,表明两变量之间(D)。
A完全相关B无关系C不完全相关D不存在线性相关
17.身高和体重之间的关系是(C)。
A函数关系B无关系C共变关系D对等关系
18.在相关分析中,对两个变量的要求是(A)。
A都是随机变量B都不是随机变量
C其中一个是随机变量,一个是常数D都是常数
19.在回归分析中,两个变量(D)。
A都是随机变量B都不是随机变量
C自变量是随机变量D因变量是随机变量
20.下列关系中,属于正相关关系得是(A)。
A身高与体重B产品与单位成本
C正常商品的价格和需求量D商品的零售额和流通费率
21.
,式中同度量因素是(C)。
AQ0BQ1CP0DP1
22.某市连续五年人口增长数是稳定的,五年里其人口环比增长速度(A)。
A降低的B提高的C稳定不变的D先升后降的
23.用几何平均法计算平均发展速度,实际上只与数列的(A)有关。
A最初水平和最末水平B最初水平
C最末水平D中间水平
24.某种产品报告期与基期比较,产量增加了6%,单位产品成本下降6%,则生产费用是(B)
A增加B减少C不增不减D无法确定
25.已知某厂今年与去年相比产值增长速度为12%,则发展速度是(A)。
A112%;B88%;C-88%;D-112%。
26.某个体户开业三个月,收入情况是:
第一个400元,第二个月380元,第三个月420元,于是他每月平均收入为(B)。
A395B400C263D600
27.按指标性质不同,统计指数可以分为(D)。
A个体指数和总指数B静态指数和动态指数;
C综合指数和平均数指数D质量指标指数和数量指标指数。
28.在
式中,权数是(D)。
A
B
C
D
29.在下面综合指数中,属于数量指标综合指数的是(D)。
A
B
C
D
30.在下面综合指数中,属于质量指标综合指数的是(D)。
A
B
C
D
31.用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大
到原来的()。
A2倍B3倍C4倍D5倍
32.对区间估计,用样本指标推断总体指标,把握程度越高则()。
A误差范围越小B误差范围越大
C抽样平均误差越小D抽样平均误差越大
三、多项选择
1.下面可以用于定距资料也可以用于定类、定序资料的指标有(ACD)。
A、众数B、算术平均数C、中位数D、异众比率
E、标准差
2.统计推断的具体内容很广泛,归纳起来,主要是(BE)问题。
A抽样分布B参数估计
C方差分析D回归分析
E假设检验
3.对于抽样误差,下面正确的说法是(ABE)
A抽样误差是随机变量;
B抽样平均误差是一系列抽样指标的标准差;
C抽样误差是估计值与总体参数之间的最大绝对误差;
D抽样误差是违反随机原则而产生的偏差;
E抽样平均误差其值越小,表明估计的精度越高。
4.关于频率和概率,下面正确的说法是(ABCE)。
A.频率的大小在0与1之间;
B.概率的大小在0与1之间;
C.就某一随机事件来讲,其发生的频率是唯一的;
D.就某一随机事件来讲,其发生的概率是唯一的;
E.频率分布有对应的频数分布,概率分布则没有。
5.下列关于假设检验的陈述正确的是(ACDE)。
A假设检验实质上是对原假设进行检验;
B假设检验实质上是对备择假设进行检验;
C当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误;
D当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确;
E假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确。
6.关于积差系数,下面正确的说法是(ABCD)。
A积差系数是线性相关系数
B积差系数具有PRE性质
7.关于皮尔逊相关系数,下面正确的说法是()。
A皮尔逊相关系数是线性相关系数
B积差系数能够解释两变量间的因果关系
C在积差系数的计算公式中,变量X和Y是对等关系
D在积差系数的计算公式中,变量X和Y都是随机的
Er公式中的两个变量都是随机的
3.简单线性回归分析的特点是(ABE)。
A两个变量之间不是对等关系
B回归系数有正负号
C两个变量都是随机的
D利用一个回归方程,两个变量可以互相推算
E有可能求出两个回归方程
8.回归分析和相关分析的关系是(ABE)。
A回归分析可用于估计和预测
B相关分析是研究变量之间的相互依存关系的密切程度
C回归分析中自变量和因变量可以互相推导并进行预测
D相关分析需区分自变量和因变量
E相关分析是回归分析的基础
9.关于回归系数b,下面正确的说法是()。
Ab也可以反映X和Y之间的关系强度。
;
B回归系数不解释两变量间的因果关系;
Cb公式中的两个变量都是随机的;
Db的取值在1和-1之间;
Eb也有正负之分。
10.在其他条件不变的情况下,抽样极限误差的大小与置信度的关系是()。
A抽样极限误差范围越大,置信度越大
B抽样极限误差范围越大,置信度越小
C呈正比关系
D呈反比关系
E呈非线性关系
11.分层抽样误差的大小主要取决于()。
A总体标志值的变异程度B各层内标志值的变异程度
C各层间标志值得变异程度D各层样本容量的大小
E各层样本容量的分配方法
12.在概率度一定的条件下,()。
A置信区间越大,应抽取的单位数越多
B置信区间越大,应抽取的单位数越少
C抽样估计的效度要求越高,应抽取的单位数越少
D抽样估计的效度要求越低,应抽取的单位数越少
E抽样估计的信度要求越高,应抽取的单位数越少
13.生活质量指数有以下几个组成部分(BCD)。
A人均收入指数B婴儿死亡率指数
C1岁估计寿命指数D识字率指数
E人均GDP
14.就资料的时间过程来分,下面属于动态资料有(ABD)。
A粮食产量B住宅竣工面积C社区绿地面积
D工资收入E公路通车总里程
15.1990年,联合国开发计划署(UNDP)取(ACD)这几项指标,在进行指数化处理并加以算术平均后,构造了人文发展指数。
A收入B环境质量C期望寿命
D受教育水平E婴儿死亡率
四、名词解释
1.统计分组
所谓统计分组,就是将情况相同或相近的数据资料加以分门别类的归并,使之简单明晰,以便为统计分析中提取各种有用信息打下基础。
2.频数分布
频数分布是统计分组的结果,它是指众多的调查数据在各个组(各类别、各等级或各区间)出现或发生的次数。
3.“最小平方”性质
各变量值对算术平均数的离差的平方和,小于它们对任何其他数(
’)偏差的平方和。
4.中位数
5.众数
6.平均指标
7.数学期望
数学期望是反映随机变量X取值的集中趋势的理论均值(算术平均)。
8.零假设
概率分布的具体形式是由假设决定的,假设肯定不止一个。
在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。
9.第一类错误
零假设Ho实际上是正确的,却被否定了。
10.第二类错误
零假设Ho实际上是错误的,却没有被否定。
11.显著性水平
能允许犯第一类错误的概率叫做检验的显著性水平,它决定了否定域的大小。
12.总体参数
13.检验统计量
检验统计量是关于样本的一个综合指标,但与参数估计中讨论的统计量有所不同,它不用作估测,而只用作检验。
14.中心极限定理
如果从一个具有均值
和方差
的总体(可以具有任何形式)中重复抽取容量为n的随机样本,那么当n变得很大时,样本均值的抽样分布接近正态,并具有均值
和方差
/n。
15.置信区间
16.置信水平
17.确定性关系
当一个变量值确定后,另一个变量值夜完全确定了。
确定性关系往往表现成函数形式。
18.非确定性关系
在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。
19.因果关系
变量之间的关系满足三个条件,才能断定是因果关系。
1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。
20.正相关与负相关
正相关与负相关:
正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。
21.散点图
散点图:
将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。
22.皮尔逊相关系数r
皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。
23.发展水平
24.发展速度
25.动态指数
26.个体指数
27.逐期增长量
28.累积增长量
五、判断题
1.比重都小于1,经常用百分数来表达,它反映了对象总体的内部结构。
(√)
2.比重可以大于1,也可以小于1。
(×)
3.各变量值与算术平均数的离差之和等于0。
(√)
4.各变量值与算术平均数的离差平方之和等于0。
(×)
5.中位数只与变量值的排序有关,因而它可以用于定距、定比资料,也可以用于定序资料。
(√)
6.离势小,平均数的代表性高;离势大,平均数代表性低。
(√)
7.离势大,平均数的代表性高;离势小,平均数代表性低。
(×)
8.各标志值平方和的算术平均数是
。
(√)
9.中位数是处于任意数列中间位置的那个数。
(×)
10.对于连续型随机变量,讨论某一点取值的概率是没有意义的。
(√)
11.把随机现象的全部结果及其概率,或者把随机现象的或几个结果及其概率列举出来,就可以称作概率分布。
(×)
12.抽样误差的产生是由于破坏了抽样的随机原则而造成的。
(×)
13.所谓抽样分布,就是把具体概率数值赋予样本每个或每组结果的概率分布。
(√)
14.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。
(√)
15.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。
(√)
16.检验的显著性水平(用
表示)被定义为能允许犯第一类错误的概率,它决定了否定域的大小。
(√)
17.第一类错误是,零假设H0实际上是错的,却没有被否定。
第二类错误则是,零假设H0实际上是正确的,却被否定了。
(×)
18.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合
适。
(×)
19.不管相关关系表现形式如何,当
=1时,变量X和变量Y都是完全相关。
(√)
20.不管相关关系表现形式如何,当
=0时,变量X和变量Y都是完全不相关。
(×)
21.从分析层次上讲,相关分析更深刻一些。
因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。
(×)
22.平均发展速度与发展速度之间没有直接联系。
(√)
23.累积增长量是各报告期水平与前一期水平相减计算的增长量。
(×)
24.各分组平均数在不同时期同时上升,则总平均数一定也上升。
(×)
25.环比增长速度的连乘积等于相应期内的定基增长速度。
(√)
26.每增长百分之一的绝对值是增长量除以增长百分比之值。
(√)
27.相邻的两个环比发展速度相除,即得定基发展速度。
(×)
28.增长量、发展速度、增长速度是通过发展水平求得的,统称为动态比较指标。
(√)
29.环比发展速度等于相应时期内各定基发展速度的连乘积。
(×)
30.按照我国习惯做法,数量指标综合指数一般是以基期质量指标作为同度量因素。
(√)
六、计算题
1.将下表画成直方图和折线图
2002年我国城乡人口情况
按城乡分
人口数(万人)
比重(%)
城镇
乡村
50212
78241
39.09
60.91
合计
128453
100.00
2.已知某社区50名退休老人的年龄如下:
81、56、76、67、79、62、72、61、77、62
60、73、65、58、70、60、59、69、58、68
80、59、62、59、83、68、63、70、69、59
64、75、66、74、65、87、58、81、68、63
56、58、77、57、72、65、65、61、73、79
①试编一频数分布数列(要求:
第一组下限取56,组距取4);②试求该社区退休老人年龄的算术平均数和中位数;③试求该社区退休老人年龄的标准差。
3.已知一未分组资料为2、3、5、8、9、12,试求:
算术平均数、中位数、众数。
4.某街道8户居民在某周的收入分布如下:
(单位:
元)
257,278,305,278,340,413,327,241。
求8户居民收入的算术平均数和中位数,并指出众数。
5.某工厂50名职工日工资数分配情况如下表,试求:
(1)算术平均;
(2)中位数;(3)众数。
工资数(元)
人数
60-62
3
63-65
10
66-68
20
69-71
13
72-74
4
合计
50
6.对100名吸烟者作调查,每日吸烟量统计如下表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会研究方法试题 第九章 社会研究的定量分析 社会 研究 方法 试题 第九 定量分析