统计考点汇总版.docx
- 文档编号:17283073
- 上传时间:2023-07-23
- 格式:DOCX
- 页数:19
- 大小:165.31KB
统计考点汇总版.docx
《统计考点汇总版.docx》由会员分享,可在线阅读,更多相关《统计考点汇总版.docx(19页珍藏版)》请在冰点文库上搜索。
统计考点汇总版
第二章
1、简述统计数据的两个来源,及其相互关系。
从统计数据的观测登记方式和统计数据本身的属性看,统计数据存在着两种不同的来源:
一是专门组织的统计调查;二是科学试验、生产实验和交易活动的观测数据。
从使用者的角度看,统计数据存在两种不同的来源。
一是直接的来源,使用者所应用是由自己亲自观测登记获得的统计数据,属于第一手的统计数据,称为初级数据;
二是间接的来源,使用者所应用是由他人观测登记获得的统计数据,属于第二手的统计数据,称为次级数据。
任何第二手统计数据都是来源于他人观测登记所获得的第一手统计数据。
归根到底,专门组织的统计调查,科学试验和生产实验的观测数据是统计数据的来源所在,是第一性的,决定着统计数据的质量。
2、简述普查、抽样调查的特点和联系。
普查:
为了特定目的而专门组织的一次性或周期性的全面调查,调查在某一标准时间上的社会经济现象的总量。
普查具有以下特点:
(1)普查是一种全面调查。
(2)普查是一种一次性或周期性的调查。
(3)普查是一种调查在某一标准时间上的社会经济现象总量的调查。
抽查:
根据随机原则和具体的抽样技术的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总体数量特征的非全面调查。
1)抽样调查是一种按照随机原则抽取样本的调查。
2)抽样调查是一种可以事先估计和控制抽样误差的调查。
3)抽样调查是一种非全面调查。
4)抽样调查是一种准确性高的调查。
5)抽样调查是一种具有广泛适用性的调查。
3、统计调查方案设计的主要内容。
1.调查任务和目的
2.调查对象、调查单位和填报单位
3.调查项目和调查指标
4.调查时间
5.调查方法
6.调查误差的控制方法
7.调查数据的汇总处理方法
8.调查表和调查问卷设计
9.制定调查工作的组织实施计划
4、问卷设计的主要内容。
a问卷结构问卷结构由问卷的开始,主体和结束三个部分组成。
b封闭性问题及备选答案
c问题排列
5、数据的登记性误差和代表性误差。
1.登记性误差。
登记性误差是指在调查过程中由于调查者和被调查者的人为原因形成的误差。
例如,调查者的人为原因主要有总体界定错误、调查单位缺失、计量和测量误差、记录失误、抄录错误、汇总差错;被调查者的人为原因主要有有意识地提供虚假数据、无意识地提供有误数据。
从理论上说登记性误差属于可以消除的误差。
2.代表性误差。
代表性误差是指利用样本数据推断总体参数时产生的误差。
分为随机性误差和系统性误差。
(1)随机性误差是由于随机性原因形成的代表性误差,它是服从于某一概率分布的随机变量。
随机性误差是不可以消除的误差,只要利用样本数据推断总体参数,就必然存在着随机性误差。
随机性误差的取值随着样本容量的增大而减小。
(2)系统性误差是由于非随机性原因形成的代表性误差。
主要原因有抽样框过于陈旧导致的抽样框偏误、非随机样本、无回答问题、辅助数据偏误等。
系统性误差属于代表性误差,也是在利用样本数据推断总体参数时产生的误差,但是系统性误差不会随着样本容量的增大而减小,不能通过增大样本容量来实现对系统性误差的控制。
6、什么是统计数据质量的三点标准?
时效性,准确性、一致性
第三章
1、什么是数据的审核,具体有什么内容和方式?
数据审核是指在进行数据整理之前对原始数据的审查和核对。
内容
统计数据的时效性,准确性、一致性三个方面的标准就是数据审核的基本内容。
(1)统计数据的时效性审核。
检查是否在规定的统计调查时间内完成数据搜集,采集的数据是否为规定的调查时点上,或规定的调查时段内的数量特征。
(2)统计数据的准确性审核。
从数据的完整性、真实性和精确性角度进行审核。
(3)统计数据的一致性审核。
检查统计数据在时间和空间上的连续性和可比性。
方式:
逻辑检查和技术检查
2、非数值型数据分组和数值型数据分组有那些差别?
非数值型数据的分组也称为分类。
定类数据和定序数据都是对事物质的属性的描述,两者都是一种分类性质的数据,只在分类划分的无序和有序上存在差别。
反映事物自然属性的非数值型数据的分组一般比较简单,只要进行适当的细分或合并,以及选择恰当的分组标志即可。
反映事物社会经济属性的非数值型数据的分组一般比较复杂,往往是人们对事物数量特征进行深入地统计分析之后形成的一种质的划分,这种质的划分体现了人们认识活动对与事物由量变到质变的把握,一般采用国家标准、行业标准或者企业标准等标准化的形式确定下来,并借助统计报表和统计调查方案等方式加以明确,以此来规范和指导后续的统计活动。
数值型数据分组可以分为单变量分组和组距分组。
单变量分组是指每个分组只用一个变量值表示的分组形式,又称为单项分组。
单变量分组一般在分组标志为离散变量,且变量的取值范围不是太大的情况下使用。
组距分组是指每个分组用一个数据取值区间表示的分组形式。
组距分组适用于按连续变量分组或变量的取值范围较大的离散变量的场合。
3、简述数值型数据分组的具体方式有那些?
4、怎样确定等距分组中组距、组数和各组上限、下限?
5、频数、频数分布的概念和意义。
频数(Frequence)是落在某一特定分组中的数据个数
频数分布(FrequenceDistribution)是由各组的频数组成的一个数组。
频数与频数分布总是在具体的分组设置前提下的对总体数据分布特征的描述
6、组中值的意义和计算方法。
组距分组中处在各组取值范围中点位置上的数值。
代表性的数值,用来代表该组数据取值的一般水平。
7、绝对数的概念、种类和计量单位。
绝对数是反映总体绝对规模和绝对水平的测度,是通过数据汇总直接得到的测度。
1.总值和频数。
2.时期数据和时点数据
3.截面数据和时间序列数据。
计量单位:
实物单位、货币单位及时间单位
8、统计表的构成和绘制要求。
构成
从形式上看,统计表由表头、行标题、列标题和数据4个主要部分内容组成。
此外,在需要时做某些说明时,可以在表的上下端加上附注。
9、直方图、折线图的概念和绘制方法。
第四章
1、应从哪几方面对数据分布特征进行度量,为什么?
数据分布特征的度量包括三个方面:
一是数据分布的集中趋势,反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;
二是数据分布的离散趋势,反映总体中各个单位的数值水平偏离中心数值的综合程度;
三是数据分布的偏态和峰度,反映各个总体单位的数值水平的分布形态是对称或偏倚,平坦或尖耸的具体数值。
2、度量数据分布集中趋势的测度主要有那些?
众数
频数最大的变量值,直观地反映了数据的集中趋势。
众数是度量定类数据集中趋势的测度
频数最大的数据的数值来反映集中趋势
当数值型数据中含有极小值和极大值时,使用众数来度量数据的集中趋势,前提是数据的频数分布存在明显的集中态势。
中位数
有序数据正中间位置上的变量值,中位数用其特殊的位置属性直接地体现了集中趋势的中心数值特征
均值
3、均值的特征、计算方法、数学性质,及其在度量数据分布特征中的地位
计算方法:
一组数值型数据之和除以该组数据总数的商,即同一组数据的总值与其频数的商。
计算均值的数据需要具备数值型数据的属性,均值是一个数值型的集中趋势测度。
通过计算均值的运算过程,首先将各个数据之间的数量差异抽象掉了,以一个抽象性的综合测度概括地反映事物的集中趋势。
其次将不同总体的总量规模抽象掉了,表现出来的只是一个一般性的代表水平,有利于不同规模的同类总体在不同空间和时间上的广泛比较。
1.简单均值
2.加权均值运用各组频数作为权数对各组数值水平进行加权计算出来的均值。
(1)单变量值分组加权均值
(2)采用组均值计算加权均值
(3)采用组中值计算加权均值
3.权数与加权结构
均值的数学性质:
(1)各个变量值与其均值的离差和为零,即
(2)各个变量值与其均值平均数的离差平方和为最小,即
当取均值作为集中趋势的测度时,各个数据的取值与集中趋势测度的离差平方和为最小值。
均值的这一数学性质是度量离散程度,进行误差分析和最小二乘估计等统计方法的基础。
4、调和平均数
简单调和平均数:
倒数的平均数的倒数
加权调和平均数:
5、几何平均数
是指各项数据的连乘积开其项数次方的算术根
4、均值、调和平均数和几何平均数的比较。
对于同一组数据,仅从数值比较的角度,有均值大于等于几何平均数,几何平均数大于等于调和平均数
5、如何利用均值、众数和中位数的数值特征分析数据分布的偏态?
●均值是唯一的数值型测度。
均值一般采用算术平均方法计算的集中趋势测度,对极端数值的反应比较敏感,在数据的分布出现偏倚时,均值受到的影响最大。
●众数和中位数都是位置型的集中趋势测度,其具体取值不受极端数值的影响。
其中众数是对应于最大频数的数值,中位数是居于有序数据中间位置上的数值。
因此,若数据的分布是对称的,有均值、众数和中位数三个集中趋势测度的取值相等。
当数据分布呈左偏态时,一般有均值的取值最小,其次是中位数,众数的取值最大。
在频数分布图上,众数始终对应于峰顶,均值和中位数偏在峰顶的左边,均值又在中位数左边;
当数据分布呈右偏态时,一般有均值的取值最大,其次是中位数,众数的取值最小。
在频数分布图上,众数还是处在对应于峰顶的位置,均值和中位数偏在峰顶的右边,并且均值偏在最右边。
6、度量数据分布离散趋势的测度主要有那些?
异众比率(VariationRatio)是非众数所在组的频数之和占总频数的比率
异众比率数值越大,越趋近于1,说明众数所在组的频数占总频数的比率越低,众数的代表性越弱,反映数据的频数分布不存在显著集中的态势,无法借助众数来反映数据的集中趋势;异众比率数值越小,越趋近于0,说明众数所在组的频数占总频数的比率越高,众数作为集中趋势测度的代表性越强。
四分位差
取值范围
取值范围的计算只使用了数值变量中的最大与最小两个数值,具有计算简洁,意义明确,易于理解的特点,但是没有充分利用数据的全部信息,是一个粗略的,简单的,尤其是容易受到极端数值影响的测度。
平均差
全部变量值与其均值的离差的绝对值的均值,也称为平均离差,用A.D.表示
方差和标准差
方差:
指全部变量值与其均值的离差的平方的均值。
标准差,方差的算数平方根
7、为什么要计算离散系数?
离散系数:
标准差与均值的比值。
计算离散系数的主要目的就是消除标准差的量纲和数值水平上的差异,使其成为一个抽象的,纯粹反映数据分布离散程度的测度,一个具有广泛的直接的可比性的离散程度测度。
从形式上看,离散系数是一个相对的比值,一个相对数。
8、标准化值的意义和用途?
以变量值与其均值的差除以同一数据的标准差的比值,也称为标准分数,
消除标准化值的量纲和绝对水平,剔除不同的数据分布离散程度在量纲和数值水平上的差异,使离散程度不同的数据之间具备了广泛的可比性。
使数据具有了普遍的可加性和直接的可比性。
9、偏态系数和峰度系数的意义?
数据分布偏倚的方向和程度
数据分布平峰或尖峰的程度,也称为峰态。
第五章
1、什么是指数?
从内涵角度,指数是反映研究对象某一数量特征在时间上,或空间上差异的方向和程度的测度。
从外延角度,指数可以从广义和狭义两个概念上去理解。
狭义的指数是指度量多个项目综合变动的方向和程度的测度,一般称为总指数。
广义的指数是指任意两个数值的对比,泛指反映数量差异的各类相对数,既包括狭义的指数,也包括只反映单项事物变动的个体指数。
2、相对数的分类,及其特点?
结构相对数、动态相对数、比较相对数、比例相对数、强度相对数、计划完成情况相对数
通过两个有关联的数据对比的方式来反映现象之间联系的测度。
以某个数据(相对数的基数)作为参照系来观察所研究现象的数量特征。
相对数的计量单位有无名数和复合量纲两种形式。
A计划完成相对数
、
B结构相对数
C比例相对数
D比较相对数
不同总体的同类数据之间的相互对比
F强度相对数
两个有密切联系的,性质不同总体的数据的对比,以反映事物发展的强度、密度、普遍程度或经济效益高低的测度
G动态相对数
两个有联系的数据在空间上的比较,动态相对数则是两个有联系的数据在时间上的比较
3、强度相对数与均值的区别?
强度相对数是两个有密切联系的,性质不同总体的数据的对比,以反映事物发展的强度、密度、普遍程度或经济效益高低的测度。
强度相对数主要用于分析不同现象之间的数量关系。
有些强度相对数也使用“平均”的字眼,但它不是同一总体的总值与其频数的商,而是两个不同总体的数据的比值,同均值存在本质的区别。
4、指数分为哪几类?
1.数量指数和质量指数
2.时间性指数和区域性指数
3.个体指数和总指数
4.简单指数和加权指数
5.综合指数和平均指数
5、拉氏指数公式和帕氏指数公式的特点?
拉氏:
将权数因素固定在基期
帕氏:
将权数因素固定在报告期
5、权数因素在指数中的作用?
将不同度量的指标转化为同度量的指标,可以将各种产品的价值量加总起来
6、综合指数与平均指数的联系和区别?
联系:
①综合指数与平均指数都是总指数,其经济内容是一致的;②平均指数在使用全面调查资料时,实质上就是综合指数的一种变形形式。
区别:
①计算方法不同。
综合指数“先综合,后对比”,平均指数“先对比,后平均”;②资料来源不同。
综合指数采用的是全面调查资料,平均指数则通常采用抽样调查资料。
③综合指数的分子与分母之差具有一定的经济内容,即说明由于指数化因素变动带来的价值总量指标的增减量,而平均指数的分子与分母之差却不具有价值总量指标增减的经济内容。
特别是采用固定权数的平均指数,只有相对数的意义。
因此,纵然平均指数有许多优点,也不能完全取代综合指数的应用。
7、指数体系分析的特点?
指数体系是指由若干个在经济意义上互相联系的指数所构成的整体。
一般将数量指数的权数固定在基期,即采用拉氏公式;将质量指数的权数固定在报告期,即采用帕氏公式。
8、我国商品零售价格指数和工业品出厂价格指数的编制方法?
零售价格指数
1.选择调查商店(农贸市场)。
2.选择代表规格品。
3.平均价格的计算
4.权数的计算。
5.价格指数的编制方法
在对商品进行科学分类基础上选择各类别商品的代表规格品;采用加权算术平均形式计算总指数;采用代表规格品的全社会综合平均价作为计算的依据。
我国工业品出厂价格指数的编制方法
1.选择代表产品。
2.权数的确定。
3.工业品出厂价格指数的计算。
10、如何应用居民消费价格指数分析经济问题?
居民消费价格指数是反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格变动趋势和程度的指数。
是观察和分析消费品的零售价格和服务价格变动,及其对城乡居民实际生活费支出的影响程度的重要测度。
1.反映居民生活消费品和服务项目价格变动趋势和程度。
2.测定通货膨胀程度。
说明一定时期内商品价格变动幅度的主要测度
3.度量货币购买能力。
一般采用货币购买能力指数来表示。
与居民消费价格指数呈反比关系。
4.计算实际工资水平。
居民的实际消费水平,不仅受到名义工资增减的影响,还要受到居民消费价格指数的制约。
可以利用居民消费价格指数将居民的名义工资转换为实际工资,来反映居民的实际消费水平。
5.剔除价格变动影响。
任何以货币单位为量纲的数据都不可避免的要受到价格水平波动的影响,当进行不同时间上的时间序列数据计算和分析时,需要使用居民消费价格指数,来剔除不同时间上货物和服务单位价格水平的差异。
利用居民消费价格指数来剔除价格变动影响的方式称为缩减或平减,通过居民消费价格指数缩减,剔除了价格变动影响之后的数据,称为缩减数据,或缩减指标。
第六章
1、什么是总体、样本、样本容量、估计量、估计值?
总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。
样本(Sample)是指从总体抽取的若干个体构成的集合。
样本容量(Samplesize)是指构成样本的全部个体的数量。
2、什么是点估计和区间估计?
在总体分布形式为已知,从该总体中抽取一个样本,对未知参数所作的一个数值点的估计,称为参数的点估计
区间是在点估计的基础上,给出在一定的置信程度下确定总体参数取值区间的方法和过程。
3、什么是总体分布、样本分布和抽样分布?
总体分布是指由客观存在的,构成总体的个体所形成的频数分布,及其相关参数数值。
样本分布是指由构成样本的个体所形成样本的频数分布,以及计算出来的相关统计量。
抽样分布(SamplingDistribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量的概率分布。
所以,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。
4、什么是大数定律和中心极限定理?
大数定律
在对客观事物及其现象进行观测和实验中,随着观测或实验的次数增多,事件发生的频率和均值逐渐地趋于某个常数。
中心极限定理
在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。
中心极限定理反映了随机变量近似地服从正态分布的特征。
中心极限定理是大样本推断的理论基础。
6、样本均值和样本方差有那些分布?
样本均值
.大样本场合下的样本均值抽样分布
在反复抽取容量相同的独立同分布样本条件下,所得到的样本均值的概率分布称为样本均值的抽样分布。
在样本容量充分大的情况下,即大样本场合,样本均值依据中心极限定理趋于正态分布。
小样本场合下的样本均值抽样分布
在小样不满足中心极限定理对于样本容量充分大的要求,样本均值不趋于正态本场合,分布,而是趋于t分布
样本方差
在反复抽取容量相同的独立同分布样本条件下,所得到的样本方差的概率分布称为样本方差的抽样分布。
在服从正态分布的同分布总体中,样本方差与总体方差的比值服从于自由度n-1为的卡方分布。
卡方分布仅在第一象限取值,所以分布的取值永远为正数。
卡方分布一般为右偏态的偏峰分布,偏倚形态取决于其自由度的数值,自由度的数值越小,偏倚的程度越大,并且随着自由度的数值增大,分布的形态逐渐趋于对称,正态分布是卡方分布的极限分布。
7、什么是点估计的矩估计法和最大似然法?
用样本的矩,估计总体的矩的参数估计方法。
矩是在数学期望基础上定义的数字特征,可以分为k阶原点矩和k阶中心矩两类。
8、什么是点估计量的一致性、无偏性和有效性?
一致性
当样本容量趋于无穷大时,估计量依概率收敛于总体参数。
即
一致估计量随着样本容量的增大,其数值越来越接近被估计的总体参数
无偏性
指估计量的数学期望等于未知的总体参数真值。
有效性
采用均方误差对估计量精确程度的测定,通常表现为两个估计量的均方误差之比。
9、解释置信区间和置信水平的联系。
置信区间反映的是区间估计的精确程度,置信水平反映的是区间估计的可靠程度,对于某一样本容量已定的具体样本而言,这两方面是互为消长的。
当通过缩小置信区间来提高对总体参数的估计精确程度时,就需要降低置信水平,降低对总体参数估计的可靠程度;若是要提高区间估计的可靠程度,势必会增大置信区间,降低对总体参数估计的精确程度。
所以,需要根据具体情况和实际需要适当地选择置信水平的数值,进而确定置信区间。
若既要提高区间估计的精确程度,又要提高区间估计的可靠程度,就需要采取增加样本容量,以及通过更有效的抽样和估计方法来实现。
第十章
1、什么是时间序列?
时间序列是指按照时间先后依次排列的观测值所构成的数列,因而也称为时间数列,或动态数列。
2、时间序列有哪几种类型?
按照时间序列中依次排列的观测值的属性不同,将时间序列分为绝对数时间序列、相对数时间序列和平均数时间序列三种。
其中绝对数时间序列又具体分为时期序列和时点序列两种。
时期序列是由时期绝对数数据所构成的时间序列,其中每个数值反映现象在一段时间内发展过程的总量。
时点序列是由时点绝对数数据所构成的时间序列,其中的每个数值反映现象在某一时点上所达到的水平。
3、计算序时平均数的公式有几种,应用条件是什么?
序时平均数,又是平均发展水平
按时间序列是时期还是时点序列,序列中各项数据的时期长度是否一致,有4种平均发展水平的计算公式
时期数列,时期长度一致&时点数列,时点数据的间隔长度
4、有哪两种计算平均发展速度的方法?
5、时间序列的因素有那些?
长期趋势(T)现象在较长时期内受某种根本性因素作用而形成的总的变动趋势 季节变动(S)现象在一年内随着季节的变化而发生的有规律的周期性变动 循环变动(C)现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动 不规则变动(I)是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型
6、移动平均法的思想和特点。
基本原理,通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示时间序列的长期趋势。
特点:
当时间数列的变动趋势为线性状态时,可采用移动平均法进行描述和分析。
该方法是通过扩大原时间数列的时间间隔,并按一定的间隔长度逐期移动,分别计算一系列移动平均数,由这些平均数形成的新的时间数列对原时间数列的波动起到一定的修匀作用,削弱了原数列中短期偶然因素的影响,从而呈现出现象发展的变动趋势。
7、时间序列趋势模型与回归模型有那些区别?
使用移动平均数值作为预测值是将一个平均数值,人为地前移之后,作为t+1时刻的预测数值,存在着一个固有滞后问题。
在许多场合需要采用模型拟合法对长期趋势进行预测和分析。
对于长期趋势的模型拟合是采用数学方程的形式,来模拟客观存在的事物及其现象的某一数量特征的基本的、稳定的、长期的增长规律性,因此又统称为趋势模型,或增长模型。
趋势模型与回归模型的共同点均可采用回归的方法来估计模型的参数,但是趋势模型并不揭示事物及其现象之间的因果联系,只是反映事物及其现象的某一数量特征依时间推移所呈现出来的某种变动的规律性。
因而趋势模型也被称为非因果关系的定量模型。
8、计算季节指数的特点和步骤
当时间序列含有显著长期趋势,又没有剔除长期趋势变动影响时,长期趋势就会参杂在季节变动之中,使计算出来的反映季节因素变动的季节指数中含有显著的系统性偏误。
所以实施季节分析之前,必须对时间序列进行分析,当时间序列存在显著的长期趋势时,就必须首先对该时间序列进行长期趋势的剔除,为正确地计算季节指数奠定基础。
在剔除了长期趋势之后的时间序列中,除了季节变动(S),还包括循环变动(C)、和不规则变动(I)。
(1)分别将每年各月(季)的数值加总,计算各年月(季)的总数。
(2)根据各年同月(季)的总数,计算各年月(季)的平均数。
(3)将各个月(季)的平均数加总,计算各年总的月(季)平均数。
(4)将若干年内同月(季)的平均数与总的月(季)平均数相比,即求得用百分数表示的各月(季)的季节比率,又称季节指数(S.I.)。
9、采用剩余法进行循环变动分析的特点和步骤。
通常采用基于乘法公式的剩余法来测定和度量循环变动。
所谓的剩余法是指从原时间序列中依次剔除长期趋势(T)和季节变动(S)因素之后,所剩余的部分为循环变动(C)和不规则变动(I),再通过移动平均的方法来剔除不规则变动(I),最后剩余的则为循环变动(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 考点 汇总