统计学讲义doc.docx
- 文档编号:3739467
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:83
- 大小:317.98KB
统计学讲义doc.docx
《统计学讲义doc.docx》由会员分享,可在线阅读,更多相关《统计学讲义doc.docx(83页珍藏版)》请在冰点文库上搜索。
统计学讲义doc
第二节统计学的理论基础和研究方法
第三节统计学的基本范畴
一、统计总体与总体单位
(一)概念
统计总体和总体单位,又可以简称为总体和个体,是反映统计认识对象的基本概念。
凡是客观存在的,在同一性质基础上结合起来的许多事物的整体,就是统计总体。
组成统计总体的个体称为总体单位。
例如,一个工业企业,有以职工为单位组成的职工总体,有以每台设备组成的设备总体,有以产品为单位组成的产品总体,有以销售行为为单位组成的销售总体等。
总体和个体是多种多样的,常见的主要有两种,即:
以某种客观存在的实体为单位组成的总体,如以个人、家庭、学校、设备、产品、商品等为单位组成的总体称作实体总体;以某种行为、事件为单位组成的总体,如买卖行为、工伤事故、犯罪事件、体育活动等为单位组成的总体称作行为总体。
一个统计总体中所包括的总体单位数可以是无限的,这样的总体称为无限总体;也可以是有限的,则称为无限总体。
在社会经济现象中统计总体大多是有限的。
在统计调查中,对无限总体不能进行全面调查,只能调查其中一小部分单位,据以推断总体。
对有限总体既可作全面调查,也可只调查其中的一小部分。
(二)特点
统计总体的形成必须具备一定的条件,作为统计研究具体对象的统计总体,其形成条件主要有三条:
第一,同质性。
组成统计总体的所有单位必须是在某些性质上是相同的,例如工业企业总体,必须是由进行工业生产经营的基层单位组成的。
如果是国有工业企业总体,便又多了一个所有制性质上的相同标志,它的范围便小于工业企业总体了。
或数量标志数值;第二,大量性。
统计总体是由许多总体单位构成的。
小型总体(抽样总体)的单位数要足够多;第三,差异性。
构成总体的各单位除了同质性一面还必须有差异性一面,否则便不需要进行统计调查研究了。
例如职工总体中的每个职工,在工种、性别、年龄、文化程度、工资等方面都有差异,这样才构成社会经济统计调查的内容。
二、标志与指标
(一)概念
标志是说明总体单位属性和特征的名称。
标志按其表现形式有数量标志与品质标志两种。
凡是表示总体单位数量特征的标志,称数量标志。
它能用数量来表示,如企业的职工人数、产量、产值;职工的年龄、工龄、工资等。
凡是表示总体单位质的特征的标志,称品质标志。
如职工的性别、企业的经济类型、工人的工种等。
标志的具体表现是在标志名称之后所表明的属性或数值,如某职工的性别是女,民族是汉族。
这里的“性别”和“民族”是品质标志名称。
而“女”和“汉族”是这类标志的属性的具体表现。
又如该工人的年龄是35岁,工资是96元,则“年龄”和“工资”是数量标志的名称,而“35岁”和“96元”则是它们的数值表现。
统计指标是说明总体特征的。
对统计指标的概念,有两种理解和使用方法。
一种情况是把说明总体数量特征的名称,如全国总人口、工资总额、谷物总产量等等叫做统计指标。
这是统计指标的设计形态。
我们在讨论统计理论和进行统计设计时所说的统计指标,就属于这一种。
另一种是把指标名称和具体时间地点的统计数值结合起来,如某年末全国总人口118517万人,北京市职工工资总额202.5亿元,河北省谷物总产量2136.4万吨等等,叫做统计指标。
这是统计指标的完成形态,在实际工作中对统计数据进行加工整理、分析研究时所说的统计指标是指后一种。
(二)关系
1.指标与标志的区别:
(1)指标是说明总体特征的,而标志则是说明总体单位特征的。
(2)标志有不能用数值表示的品质标志与能用数值表示的数量标志,而指标都是用数值表示的,没有不能用数值表示的统计指标。
2.指标与标志的联系:
(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的,如一个煤炭工业局(公司)的煤炭总产量,是从所属各煤炭工业企业的产量汇总出来的。
(2)指标与标志(数量标志)之间存在着变换关系。
由于研究的目的不同,原来的统计总体如果变成总体单位,则相对应的统计指标也就变成数量标志,反之亦然。
三、变异与变量
统计中的标志与指标的具体表现各不相同,如性别标志表现为男、女,年龄标志表现为不同的年岁,劳动生产率标志表现为不同的生产水平等,这种差别称作变异,变异是普遍存在的,这是统计的前提条件,有变异才有统计,没有变异就用不着统计。
可变的数量标志和所有的统计指标称为变量。
变量的具体表现称作变量值。
如年龄这个数量标志,其标志值可以是20,30,40,50等。
在这里把数量标志年龄称为变量,而把标志值20,30,40,50等称为变量值。
某地区职工工资总额为指标(变量),其指标值1200万元为变量值。
变量按其变量值是否连续分为连续性变量与离散性变量。
连续变量的数值都是连续不断的,相邻两值之间可取无限数值。
例如,煤层厚度,煤层生产能力,产值等都是连续变量,其数值要用测量或计算的方法取得。
离散变量的数值都是不连续的整数值,例如,职工人数、企业数、机器台数等,其数值的取得只能用计数的方法。
第五节统计指标与统计指标体系
一、统计指标
统计指标是社会经济统计活动和社会经济统计学中最重要的基本概念。
统计正是用统计指标来反映总体的实际情况,并用统计指标来研究认识总体的发展变化情况、总体内部以及它和外部的数量关系。
在社会经济统计中,统计指标占有中心地位,许多统计方法都是围绕统计指标而产生的。
(一)统计指标的概念和要素
统计指标的概念如前所述,它有两种理解和使用方法。
一种情况是指说明总体数量特征的名称;一种情况是指说明总体数量特征的名称和指标数值。
统计指标,就其完成形态而言,由以下要素构成:
第一,定性范围。
包括指标名称和指标涵义。
指标涵义要明确总体现象的质的规定性,包括时间标准和空间标准。
例如,我国人口普查的总人口,其指标涵义是:
指在规定的时点,具有中华人民共和国国籍的、在国内一定区域居住一年以上的人口总和。
指标涵义比较复杂,指标名称是它的表现形式。
第二,定量方法。
包括计量单位和计量方法,是指标涵义的量化规范。
例如,总人口的计量单位是一个人,全国总人口的计算方法是各地区人口加上现役军人的人口总数。
第三,指标数值。
根据定性规范和定量方法,经过实际调查和数据处理所取得的具体时间、具体空间的统计数值。
统计指标的设计形态只包括定性范围和定量方法两个要素,不包括指标数值。
(二)统计指标的特点和作用
第一,同质事物的可量性。
没有质的规定性不能成为统计指标,有了质的规定性而不能用数量来表示也不能成为统计指标。
有些抽象度较高的社会经济概念是难以量化的,不能直接用来作为统计指标的名称,必须将它分解或转化为可以量化的概念才能成为统计指标。
例如,我国大部分地区的人民生活正在发生又温饱上升到小康的阶段性变化,为了衡量是不是达到了小康水平,只有人均收入水平或人均消费水平是不够的,党中央和国务院已经提出“生活质量达到或超过中等收入国家水平”的要求。
“生活质量”是怎样衡量呢?
可以把它分解为:
平均预期寿命、平均受教育年限、婴儿死亡率、每人每日摄取热量等等可以量化的概念,然后用一定的方法加以综合计算。
这样,“生活质量”便成为一个统计指标了。
第二,量的综合性。
统计指标反映的是总体的量,它是许多个体现象的数量综合的结果。
一个职工的工资不能成为统计指标,一个企业或一个地区的工资总额或平均工资才成为统计指标。
一、总量指标的意义
(一)总量指标的概念
总量指标是指统计汇总后得到的具有计算单位的总和指标,反映被研究对象在一定时期或时点的规模、水平或性质相同总体规模的数量差异。
一般用绝对数表示,又称绝对数指标。
(三)作用1.从总体上认识社会经济现象的起点。
了解一个国家或地区的基本情况,从其基本状况和基本实力入手。
2.计算其它统计指标的基础。
统计综合指标中的相对指标,平均指标的计算都是以绝对数指标为基础计算的。
二、总量指标的种类
1.按指标反映的具体内容划分为总体单位总量指标和总体标志总量指标
总体单位总量指标:
是用来反映总体中单位数的多少,说明总体本身规模大小的总量指标。
如:
对某地区居民粮食消费情况进行研究,该地区的居民人口数便是总体单位总量指标。
总体标志总量指标:
是用来反映总体中标志值总和的总量指标。
如:
上例中粮食消费总量便是总体标志总量指标。
总体单位总量指标和总体标志总量指标的地位随统计研究的目的而变化。
如:
研究该地区粮食消费价格,粮食消费总量变为总体单位总量指标了。
2.按指标反映的时间状况划分为时期指标和时点指标
时期指标:
反映社会经济现象在一定时期内发展变化过程总量的指标,如:
商品销售额、总产值、基本建设投资额等。
时点指标:
反映社会经济现象在一定时点上状况的数量的指标,如:
人口数、房屋的居住面积,企业数等。
时期指标和时点指标的特点(区别):
a.性质相同的时期指标的数值可以相加,时点指标相加则无意义。
b.同类时期指标数值的大小与时期长短有直接关系,时点指标则没有这种关系。
c.时期指标数值是经常登记取得,时点指标不是。
区分时期指标和时点指标决定了统计处理与应用上的不同,在运用时期和时点指标时,注意同一指标若从不同的角度考虑则总量指标的性质也不同,如:
年末人口数和年初人口数是时点指标,但年末人口数一年初人口数=人口净增数则为时期指标。
3.按指标采用的计量单位划分为价值指标、实物指标和劳动量指标
价值指标、实物指标和劳动量指标前面已经讲过,这里就不讲了。
相对量指标
一、相对指标的意义
统计中,数字的作用在于进行比较和分析。
“比较为统计之母”是有道理的,孤立的数字,不进行任何比较分析,不能说明任何问题。
因此,对事物进行判断、鉴别和比较,就要借助于相对指标。
(一)相对指标的概念
相对指标:
两个有联系的指标数值之比,反映现象之间所固有的数量对比关系,表现形式一般为倍数或系数(以1作为对比基础),成数(以10作为对比基础),百分数(以100作为对比基础),千分数(以1000作为对比基础),复名数等。
相对指标的特点:
①将对比的基础抽象化。
②抽象化掩盖了绝对数的规模百分数或千分数(以100或1000作为对比基础)。
复名数。
这里还要对经济分析中经常用到的“百分点”的概念作一点说明。
一个百分点是指1%,百分点常用于两个百分数相减的场合。
如:
在股票交易市场上,确定某一时间的股票价格为基数,将两个不同时间股票价格与之相比,分别为150%和120%,那么后一时间上的股票价格比前一时间下降了30个百分点(120%-150%)。
(二)相对指标的作用
1.反映现象间数量对比关系。
2.反映现象发展变化程度、速度、强度、质量、效益等。
3.弥补总量指标的不足,便于比较。
二、相对指标的种类及其计算方法
1.结构相对指标
是将两个有从属关系的总量指标对比而得,说明总体内部组成情况,一般用%表示。
结构相对数=(总体内某一部分指标数值)/总体总量×100%
如:
反映工农业增加值的内部结构,农业内部各业构成,种植业内粮食作物,经济作物及其它作物的比例结构,消费结构中食品支出占全部生活费支出的比重,(恩格尔系数),国内生产总值中第一、二、三产业间的构成等。
如:
某地区工农业产值中工业、农业产值所占的比重:
工业产值占工农业产值比重=工业产值/工农业产值=304.43÷468.51=64.98%
农业产值占工农业产值比重=农业产值/工农业产值=164.08÷468.51=35.02%
结构相对指标的特点:
①各部分计算结果<1
②各部分比重之和=1
③分子分母不能互换
2.比例相对指标
比例相对指标是同一总体内不同组成部分的指标数值对比的结果,它可以表明总体内部的比例关系。
比例相对指标=总体中某部分指标数值/总体中另一部分指标数值
比例相对指标可以用百分数表示,也可以用一比几或几比几形式表示。
如上例中工业产值与农业产值的比例可表示为304.43:
164.08,也可以表示为1.86:
1,分析总体中若干部分的比例关系时可采用连比形式。
例如,某地社会劳动者人数为59432万人,其中第一产业为34769万人,第二产业为12921万人,第三产业为11742万人,三个产业劳动者人数比例为100∶37∶34。
利用比例相对指标可以分析国民经济中各种比例关系,调整不合理的比例,促使社会主义市场经济稳步协调发展。
特点:
①分子、分母可互换
②同一总体内
③各部分之间比例之和不等于100%
3.比较相对指标
比较相对指标是同一时间不同国家、不同地区、不同单位的某项指标对比的结果。
比较相对指标=某一空间的某项指标数值/另一空间的同项指标数值
比较相对指标一般用倍数表示,有时也可用系数表示。
例如:
甲乙两公司2002年商品销售额分别为5.4亿元和3.6亿元,则甲公司商品销售额为乙公司的1.5倍(=5.4/3.6)。
计算比较相对指标可以用总量指标,相对指标或平均指标。
运用比较相对指标对不同国家、不同地区、不同单位的同类指标对比,有助于揭露矛盾、找出差距、挖掘潜力,促进事物进一步发展。
相对指标的特点:
①对比的分子分母必须是同质现象
②分子、分母可互换
4.强度相对指标
强度相对指标是两个性质不同而有联系的总量指标对比的结果。
强度相对指标=某一总量指标数值/另一性质不同而有联系的总量指标数值
强度相对指标是以复名数表示的,有些强度相对指标是采用无名数。
强度相对指标的特殊使用是按平均每个人摊得到的份额表示。
由于强度相对指标的分子和分母可以互换,因此可以形成正指标和逆指标两种计算方法。
如:
反映卫生事业对居民服务保证程序的指标:
每千人口的医院床位数=医院床位数(张)/人口数(千人),这是正指标。
每千人口的医院床位数=人口数(千人)/医院床位数(张),这是逆指标。
强度相对指标应用十分广泛,它可以反映国民经济和社会发展的基本情况;反映生产条件及公共设施的配备情况;也可以反映经济效益的情况。
强度相对指标的特点:
①不同总体对比
②具有平均含义
③分子分母可互换
5.动态相对指标
动态相对指标也称作发展速度,它是某一指标不同时间上的数值对比的结果。
动态相对指标一般用百分数表示。
动态相对指标=报告期指标数值/基期指标数值
动态相对指标对于分析研究社会经济现象的发展变化过程具有重要意义,将在第七章予以详细讲述。
6.计划完成程度相对指标
计划完成程度相对指标是某一时期实际完成的指标数值与计划指标数量对比的结果。
一般用百分数表示。
计划完成程度相对指标=实际完成的指标数值/计划指标数值x100%
①计划完成相对指标的一般应用
例1.某企业计划规定产值达10万元,实际执行结果产值达11.5万元,则计划完成程度=实际完成数/计划规定数x100%=11.5/10x100%=115%
例2.某企业劳动生产率计划规定完成103%,实际却提高了5%。
则计划完成程度=实际完成数/计划规定数x100%=(1+5%)/103%=101.94%
②还可计算计划时期某一段累计完成数占全计划的百分比,即进行进度分析。
计划完成相对数=累计至报告期止完成数/全部计划数×100%
第二章统计资料搜集、整理与显示
本章重点内容:
本章主要讲授统计调查的内容和方法、统计调查的组织、统计资料的整理的方法及技术和统计表。
难点讲授调查方案的设计,统计资料的整理技术。
第一节统计调查的种类和内容
一、统计调查的意义
(一)统计调查的概念
统计调查就是根据调查的任务和要求,采取科学的调查方法,有目的、有计划地、有组织地及时搜集各项反映社会经济活动和科学试验成果的原始资料的过程。
二、统计调查的种类
1.按调查对象包括的范围划分为全面调查和非全面调查
①全面调查:
构成总体的所有单位的调查。
如:
普查。
②非全面调查:
构成总体的一部分单位的调查。
如典型调查、重点调查、抽样调查。
2.按统计调查的组织形式划分为统计报表和专门调查
①统计报表:
按照一定的表式和要求,自上而下的统一布置,自下而上的提供统计资料的一种定期的调查方式。
如:
农业统计报表制度,工业统计报表制度。
②专门调查:
为研究某些专门问题而由调查单位组织的多属一次性调查。
如:
普查,抽样调查,典型调查。
3.按调查登记的时间是否连续划分为经常性调查和一次性调查
①经常性调查:
随着现象的不断变化而连续不断地进行登记。
如:
产品产量,原材料消耗量等。
其数值变动很大。
②一次性调查:
间隔一定时间(一般为一年以上)对现象进行调查登记。
如:
人口数,固定资产总值,生产设备数等。
其数值变动不大。
4.按搜集资料的方式划分为直接观察法,采访法,报告法,问卷调查法
①直接观察法:
调查人员亲自到现场对调查对象进行观察计量取得资料。
一般资料准确,但人力多、时间长。
②采访法:
调查人员对被调查者提问,据被调查者的答复取得资料,又分为个别询问法和开调查会法。
资料准确全面,但需人多。
③报告法:
调查单位按隶属关系,逐级向国家报告经济社会活动成果的搜集资料的方法。
取得资料快,节省人力、物力。
④问卷调查法:
问卷调查法是为特定目的,以问卷形式提问,发给被调查者,由被调查者自愿自由回答的一种采集资料的方法。
二、专门调查
1.普查
普查是专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期内的社会经济现象总量。
它适于搜集某些不能够或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。
例如,我国第四次人口普查,第三产业普查,等等。
普查可以摸清一个国家的国情、国力,特别是可以了解与掌握人力、物力、资源状况及其利用状况,为国家制定长远规划与政策提供可靠的依据。
因此,普查具有资料包括的范围全面、详尽、系统的优点,但是普查的工作量大,耗资也多,一般不宜经常使用。
2.重点调查
重点调查是在调查对象中选择一部分重点单位进行调查的一种非全面调查。
重点单位是它们的标志总量在总体总量中占据绝大比量。
因此,当调查的任务只要求掌握事物的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。
例如,为了掌握全国钢铁产量,可以选出鞍钢、宝钢、武钢、包钢、首钢、攀钢、马钢等几个大型钢铁企业调查。
重点调查的组织形式有两种:
一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位调查。
3.典型调查
典型调查是一种非全面调查,它是根据调查的目的与要求,在对被调查对象进行全面了解的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。
典型调查具有灵活机动、通过少数典型即可取得深入、详实的统计资料的优点。
但是,这种调查由于受“有意识地选出若干有代表性”的限制,在很大程度上受人们主观认识的影响。
因此,必须同其他调查方法结合起来使用,才能避免出现片面性。
4.抽样调查
抽样调查是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。
抽样调查同其他调查比较,既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较准确的全面统计资料。
因此,这种调查方法在市场经济条件下,使用非常广泛。
详细内容,将在第四章抽样技术一章中介绍。
第三节统计资料的整理
三、统计分组
(一)统计分组的概念
统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个不同类型或性质的组成部分的一种统计方法。
(三)统计分组的方法
①按品质标志分组或按数量标志分组,或用两种标志结合分组。
按品质标志分组就是用反映事物的属性、性质的标志分组,它可以将总体单位划分为若干性质不同的组成部分。
这种分组在许多情况下概念明确,但有些情况下也会产生不容易划分的时候,每个总体单位应当划归哪一类的问题。
例如:
城镇居民和乡村居民按其居住地划分,就会产生不易划分的情况,为了使这些复杂的分类在全国统一执行,国家统计局及中央有关部门,统一制订有各种分类目录与规定标准。
按数量标志分组就是用事物数量的多少作为分组标志的分组。
数量标志可以是绝对数,也可以是相对数,这种分组,是按照具体数值界限划分的,一般不会产生困难,其关键在于如何划分它们的界限。
两种标志结合分组就是把品质标志和数量标志结合起来的分组。
②按主要标志与辅助标志分组。
对于有些现象进行分组时,使用一个分组标志不足以区分事物的不同性质与特点,不能全面地认识事物的变化规律。
因此,进行分组时,除了使用一个主要分组标志以外,还要用一个或几个辅助标志作为分组补充标志。
哪些标志作为主要标志,哪些标志作为辅助标志,这要根据研究任务来选择与确定。
四、次数分配
(一)次数分配的概念
在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各单位数在各组间的分配称为次数分配。
某年某地区人口的性别分布
性别
人数(万人)
比率(%)
男性
1198.0
51.34
女性
1108.6
48.06
合计
2306.6
100.00
分配在各组的单位数叫次数或频数。
各组次数与总次数的比率叫频率或比率。
各比率之和为100或1即Σ=1。
将各组组别与次数依次排列而形成的数列叫次数分配数列,简称分配数列。
(二)分配数列的编制
1.种类
①属性分配数列:
按品质标志分配而形成的数列叫属性分配数列,简称品质数列,如上例内蒙古自治区人口分布。
②变量分配数列
按数量标志分组而形成的数列叫变量分配数列,简称变量数列。
某班学生统计考试成绩表
考分
人数(人)
比率(%)
50—60
2
5.0
60—70
7
17.5
70—80
11
27.5
80—90
12
30.0
90—100
8
20.0
合计
40
100.0
1)单项式变量分组数列
是按每个变量值分别列组而形成的数列。
某发电厂拥有发电机组的分布
拥有发电机组(套)
发电厂数(个)
比率(%)
1
35
28.0
2
48
38.4
3
26
20.8
4
12
9.6
5
4
3.2
合计
125
100.0
2)组距式变量数列
把各变量值按照一定组距进行分组而形成的数列。
如:
上例某班学生统计考试成绩表。
在组距数列中,表示各组界限的变量值称为组限,50—60,60—70等。
其中较小的变量值称为下限,50,60等,较大的变量值为上限,60,70等,各组上限与下限之差即为组距,组距=上限-下限,60-50,70-60等,各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2,(50+60)/2=55,(60+70)/2=65,组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。
a.等距分组
各组的组距均相等。
特点:
由于各组组距相等,各组次数的分布不受组距大小的影响,它和消除了组距影响,与次数密度的分布是一致的,一般呈正态分布。
次数密度=次数/组距,其作用主要用于消除各组组距不相等而造成的现象分布的影响。
b.不等距分组
各组组距不相等。
特点:
不等距分组各组的次数多少受组距不同的影响,组距大次数可能多,组距小,则次数可能少,因此必须消除组距对其分布的影响即需计算次数密度。
在编制组距式变量数列时,常常会遇到这样的情况,如:
学生成绩的分布
60分以下
60—70
70—80等
又如:
学生人数的分布
30人以下
30—60
60人以上等
这种具有不确定组距的组称为“开口组”,包括上开口和下开口,其组中值如何计算?
下开口的组中值=上限-1/2邻组组距
上开口的组中值=下限+下限1/2邻组组距
2.变量数列的编制
程序:
①原始数据②序列化(编制由小到大简单数列)③求出组距等④分组归类合计(形成次数分布)⑤制成统计表(变量数列)
①整理原始数据使其序列化
现有某班40人统计学考试成绩如表所示:
89,88,76,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 讲义 doc