统计学原理复习要点优质PPT.ppt
- 文档编号:7750955
- 上传时间:2023-05-09
- 格式:PPT
- 页数:139
- 大小:3.73MB
统计学原理复习要点优质PPT.ppt
《统计学原理复习要点优质PPT.ppt》由会员分享,可在线阅读,更多相关《统计学原理复习要点优质PPT.ppt(139页珍藏版)》请在冰点文库上搜索。
,第三章数据整理和描述,一、统计分组的概念,统计数据分组就是根据统计研究的目的和要求以及现象总体的内在特点,按照某一个或几个标志将总体划分为若干性质不同的组成部分。
总体:
“分”个体:
“合”最终的结果是“组内同质,组间差异”,二、统计分组的作用,
(一)划分社会经济现象的类型
(二)揭示社会经济现象的内部结构,各区域GDP总量三次产业结构情况单位:
%,二、统计分组的作用,(三)分析社会经济现象之间的依存关系,某种农作物产量与耕作深度的关系,三、统计分组的类型,按分组标志的性质分为:
品质标志分组:
也称属性分组如企业按经济类型、行业分组;
人口按性别、民族分组等数量标志分组:
也称变量分组如工人按产品产量、劳动生产率分组;
商店按商品流转额、职工人数分组;
人口按年龄、身高分组等,三、统计分组的类型,按分组标志的多少分为:
简单分组:
按某一个标志分组对同一总体采用两个或两个以上的标志分别进行简单分组,这几个简单分组就形成了平行分组体系。
复合分组:
按两个或两个以上的标志层叠分组复合分组本身就是多个标志结合起来的分组,形成复合分组体系。
四、统计分组的方法,品质标志分组数量标志分组单项式分组适用于离散型变量且变量值较少、变量值变动范围不大的情况。
组距式分组适用于连续型变量或者离散型变量且变量值较多、变量变动范围较大的情况。
四、统计分组的方法,组距式分组涉及的有关概念
(1)组限:
表示各组界限的变量值,其中每组的起点数值称为下限,每组的终点数值称为上限。
组限是否可以重叠离散型变量:
相邻组的组限既可以重叠,也可以不重叠连续型变量:
相邻组的组限必须是重叠的,“上限不在内”原则,四、统计分组的方法,组距式分组涉及的有关概念
(2)组数和组距重叠分组:
组距=本组上限-本组下限不重叠分组:
组距=本组下限-前组下限,斯特杰斯经验公式,组数,组距,
(1)组距最好为5或10的倍数。
(2)最小组的下限略低于最小变量值,最大组的上限略高于最大变量值。
(3)离散型变量分组,相邻组的组限可以间断,也可以重叠;
连续型变量分组,相邻组的组限必须重叠。
(4)组限重叠时,临界点的总体单位按“上限不在内”的原则归组。
注意事项,五、分布数列的概念,用来反映统计总体中所有单位在各组间分布状态或分布特征的一个数列,被称为次数(或频数)分布数列,简称分布数列。
两个构成要素总体按某一标志所分的组(各组组名)分布在各组的单位数(各组次数),
(1)频数(次数)与频率(比重)频数:
分布在各组的单位数频率:
各组次数占总次数的比重
(2)品质数列与变量数列品质数列:
按品质标志分组形成的数列变量数列:
按数量标志分组形成的数列(3)等距数列与异距数列等距数列:
各组组距相等异距数列:
各组组距不相等,与分布数列相关的概念,开口组:
缺上限或缺下限的组闭口组:
上下限齐全的组(5)组中值及计算*闭口组组限重合时:
组中值=(上限下限)/2组限间断时:
组中值=(下限下组下限)/2开口组缺上限时:
组中值=下限邻组组距/2缺下限时:
组中值=上限-邻组组距/2,(4),与分布数列相关的概念,六、分布数列的分类,七、统计表的结构,河南省2007年规模以上工业增加值主要分类情况,第四章综合指标,总量指标是反映社会经济现象总规模、总水平和工作总量的统计指标。
也称绝对数指标简称绝对数。
一、总量指标的概念和作用(理解),总量指标的概念,总量指标的特点,最基本的综合指标;
统计整理阶段的直接成果;
数字形式为绝对数,数值与总体范围大小直接相关。
二、总量指标的种类(掌握),总体单位总量,
(1)按其反映内容不同,总体标志总量,总体内所有单位个数的总和,总体内各单位某一数量标志的标志值之和,一个总体中只有一个总体单位总量,但可以有多个标志总量,它们由总体单位的数量标志值汇总而来。
时期指标,时点指标,反映某种社会经济现象在一段时期内的活动过程中所取得或实现的累计总量。
反映社会经济现象在某一时点上所实现或达到的总量指标。
(2)按其反映时间状况不同,时期指标具有可加性,时点指标数值不具有可加性时期指标与时间长短有关,时点指标与其时间间隔长短无直接关系。
时期指标通过连续登记取得。
时点指标采用间断登记取得。
二、总量指标的种类(掌握),第二节相对指标一、相对指标概念和作用(理解)二、相对指标的表现形式(理解)三、六种常用的相对指标(掌握),又叫相对数,是由两个相互联系的指标数值对比得到的指标数值,反映现象总体的结构、比例、程度、发展速度等对比关系。
相对指标,用来反映总体现象的各种数量对比关系,以深入认识社会经济现象的不同数量特征;
使不能直接对比的现象找到共同的比较基础。
相对指标的作用:
一、相对指标的概念和作用(理解),用倍数、系数、成数、等表示,用双重计量单位表示的复名数,成数应当用整数的形式来表述3成、近7成、8.6成,二、相对指标的表现形式(理解),结构相对数,比例相对数,比较相对数,计划完成程度相对数,强度相对数,动态相对数,三、六种常用的相对指标(掌握),结构相对指标是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。
如下岗职工安置率.,结构相对指标,三、六种常用的相对指标(掌握),比例相对指标是同一总体中不同部分数量对比的相对指标,也可以叫比例相对数。
作用:
以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况。
比例相对指标,三、六种常用的相对指标(掌握),概念:
比较相对指标是不同单位的同类现象数量对比而确定的相对指标,也可以叫比较相对数。
同一类事物由于所处的空间条件不一样,发展状况也不同,要了解它们之间的差异程度,就需要将不同空间条件下的同类事物对比。
比较相对指标,三、六种常用的相对指标(掌握),概念:
强度相对指标是两个性质不同但有一定联系的总量指标之间的对比,也可以叫强度相对数。
表明某一现象在另一现象中发展的强度、密度和普遍程度。
强度相对指标,三、六种常用的相对指标(掌握),例:
某年某地区年平均人口数为100万人,在该年度内出生的人口数为8600人。
一般用、表示。
其特点是分子来源于分母,但分母并不是分子的总体,二者所反映现象数量的时间状况不同。
无名数的强度相对数,强度相对指标,三、六种常用的相对指标(掌握),例:
某地区某年末现有总人口为100万人,医院床位总数为24700张。
则该地区,用双重计量单位表示的复名数,反映的是一种依存性的比例关系或协调关系,用来反映经济效益、经济实力、现象的密集程度等。
有名数的强度相对数,强度相对指标,数值越大表明强度越大、密度越大、普遍程度越高。
数值越小表明强度越大、密度越大、普遍程度越高,三、六种常用的相对指标(掌握),动态相对指标又称发展速度,表示同类事物的报告期水平与基期水平对比发展变化的速度。
它是将不同时期的同类现象进行对比,计算的相对指标。
也可以叫动态相对数。
动态相对指标,三、六种常用的相对指标(掌握),概念:
现象在某一段时间内的实际完成数与计划数对比,借以观察计划完成程度,也称为计划完成百分比。
检查、监督计划执行情况。
计划完成程度相对指标,指标根据下达计划任务时期的长短和计划任务数值的表现形式不同,而有多种计算方法,实际应用时需注意区别。
三、六种常用的相对指标(掌握),A.计划任务数表现为绝对数时,例:
某工业企业全年工业产值为计划为4000万元,实际完成4200万元,则计划完成情况为:
计划完成程度相对指标短期计划,三、六种常用的相对指标(掌握),B.计划任务数表现为相对数时,计划完成程度相对指标短期计划,三、六种常用的相对指标(掌握),C.计划任务数表现为平均数时,计划完成程度相对指标短期计划,三、六种常用的相对指标(掌握),总结:
六种相对数指标的比较,不同时期比较,动态相对数,强度相对数,不同现象比较,不同总体比较,比较相对数,同一总体中,部分与部分比较,部分与总体比较,实际与计划比较,比例相对数,结构相对数,计划完成相对数,同一时期比较,同类现象比较,分子分母可以互换的有:
强度相对数、比较相对数、比例相对数,第三节平均指标,平均指标又称平均数,用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。
平均指标概述(理解),抽象性:
把总体各单位标志值的差异抽象化了代表性:
平均指标是个代表值,代表总体各单位标志值的一般水平同质性:
平均指标只能计算同类现象,特点,概念,算术平均数调和平均数几何平均数中位数众数,根据分布数列中各单位的标志值计算出来,根据分布数列中某些处于特殊位置的标志值计算出来,种类,基本形式,注意区分算术平均数与强度相对数,算术平均数,直接承担者,算术平均数,计算公式,简单式,加权式,未分组,已分组,单项式,组距式,
(1)单项式分组,
(2)组距式分组,【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:
再求算术平均数:
求各标志值的倒数:
,,再求倒数:
是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数。
常用于不掌握总体单位总量的情况。
调和平均数,调和平均数,计算公式,简单式,加权式,未分组,已分组,单项式,组距式,市场上某种蔬菜早市价格每斤0.25元,午市价格每斤0.2元,晚市每斤0.1元,如早中晚各买1元的菜,则平均每斤价格是多少:
购买总金额,购买总数量,A.简单调和平均数,调和平均数,B.加权调和平均数,适用于总体资料经过分组整理形成变量数列的情况,调和平均数,式中:
为第组的变量值(组中值);
为第组的标志总量。
某企业某日工人的日产量资料如下:
计算该企业该日全部工人的平均日产量。
调和平均数的应用,即该企业该日全部工人的平均日产量为12.1375件。
调和平均数的应用,是N项变量值连乘积的开N次方根,用于计算现象的平均比率或平均速度,各个比率或速度的连乘积等于总比率或总速度;
相乘的各个比率或速度不为零或负值。
应用的前提条件:
几何平均数,几何平均数,计算公式,简单式,加权式,未分组,已分组,注:
几何平均数多用于计算时间上或程序上相互衔接的一些比率的平均值,如平均发展水平、平均指数等。
指总体中出现次数最多的变量值,用表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。
众数,比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。
此时众数是合适的代表值。
众数的确定方法,未分组资料,组距式数列,从数列中找出最大的次数或频率,对应的标志值即为该数列的众数,下限公式,上限公式,众数的确定,单项式数列,出现次数最多的那个标志值即为众数,将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用表示,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。
中位数的作用:
如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。
中位数,中位数的确定方法,未分组,组距式,单项式,下限公式,上限公式,为奇数时,为偶数时,n为奇数时,n为偶数时,第四节变异指标,全距系数,平均差系数,标准差系数,变异指标的种类,异众比例,指所研究的数据中,最大值与最小值之差,又称极差。
【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则,
(一)全距,
(二)平均差,计算公式,简单式,加权式,未分组,已分组,是各个单位标志值与其算术平均数的离差绝对值的算术平均数,用A.D表示,(三)标准差和方差方差是总体各单位标志值与其平均数离差平方的算术平均数,用2表示。
方差的正平方根称为标准差或均方根差,用表示。
标准差的计算公式,简单式,加权式,未分组,已分组,平均差系数,标准差系数,用来比较不同水平的同类现象,或者是不同类现象总体平均数代表性的大小,可以消除不同水平和不同计量单位的影响。
变异系数指标,全距系数,例B某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为36件,标准差为9.6件;
乙组工人日产量资料如下,计算乙组平均每个工人的日产量,并比较甲、乙两生产小组哪个组的日产量更有代表性?
变异系数指标例题分析,变异系数指标例题分析,乙小组的平均日产量,乙小组的标准差,因为26.67%31.81%,所以甲小组工人的平均日产量更具有代表性。
第五章时间数列,时间数列(Timeseries):
指将某一指标的历史数据按时间顺序排列而形成的数列,又称动态数列。
时间数列的概念,时间数列,时间数列的要素之一:
现象所属时间,时间数列的要素之二:
现象在不同时间上对应的指标数值,根据时间数列中指标的表现形式分为,绝对数时间数列,相对数时间数列,平均数时间数列,时间数列的种类,课堂练习,1、下面哪几项是时期数列(BC)A、我国近几年的耕地总面积B、我国历年新增人口数C、我国历年图书出版量D、我国历年的黄金储备E、某地区国有企业历年资金利税率,第二节时间数列水平分析,一、发展水平,
(一)概念:
时间序列中各项具体的指标数值。
字母表示:
a0,a1,a2,an-1,an相关概念:
最初水平:
动态数列中的第一项指标数值最末水平:
动态数列中最后一项指标数值报告期水平:
要研究的那一时期的指标值基期水平:
作为对比的基础时期的指标值
(二)意义:
是计算其他水平指标和速度指标的基础。
(一)概念又称序时平均数或动态平均数,是将不同时期的发展水平加以平均得到的平均值。
(二)序时平均数与一般平均数的区别1.计算依据不同:
序时平均数依据动态数列,一般平均数依据变量数列。
2.说明问题不同:
序时平均数从动态上说明现象在不同时间上某一数值的一般水平,一般平均数从静态上说明总体某个数量标志的一般水平。
二、平均发展水平,平均发展水平,例根据表中资料计算企业上半年平均职工人数及平均固定资产额。
表某企业2005年上半年统计资料,序时平均数计算示例,分析属于时间间隔相等的间断时点数列,采用首末折半法计算。
上半年平均职工人数为:
例题答案,上半年平均固定资产额为:
例根据表计算2001年的平均职工人数。
表某企业2001年职工人数资料单位:
人分析属于时间间隔不等的间断时点数列,采用加权算术平均法计算。
序时平均数计算示例,分子分母都是时期指标,相对数时间数列的序时平均数,分子分母一个是时期指标,一个是时点指标,相对数时间数列的序时平均数,根据相对数时间序列计算(例题),例某企业2008年下半年各月劳动生产率资料如表,又已知12月末的工人数为910人,试计算下半年平均月劳动生产率。
根据相对数时间序列计算(例题),分子分母都是时点指标,相对数时间数列的序时平均数,发展水平之差。
=报告期水平-基期水平,逐期增长量:
累计增长量:
以前一期水平为基期水平,以某一固定期(一般为最初水平)水平为基期水平,三、增长量,增长量,n项逐期增长量之和,等于第n期的累积增长量,逐期增长量与累积增长量关系:
相邻两个累积增长量之差,等于相应时期的逐期增长量,增长量,四、平均增长量,逐期增长量的序时平均数。
注意:
逐期增长量个数,为发展水平项数减1,第三节时间数列速度分析,报告期水平与基期水平的比值(后期观测值与前期观测值的比值),说明现象的变动程度。
一、发展速度,发展速度,环比发展速度,定基发展速度,年距发展速度,以前一期水平为基期水平,以某一固定期(一般为最初水平)水平为基期水平,发展速度,环比发展速度与定基发展速度的关系:
发展速度,n项环比发展速度的连乘积等于第n期的定基发展速度,相邻两个时期的定基发展速度之商等于相应时期的环比发展速度,增长量与基期水平的比值。
也等于发展速度减1.,增长速度,环比增长速度,定基增长速度,年距增长速度,二、增长速度,增长速度,注意:
定基增长速度与环比增长速度之间没有直接的换算关系。
二者的换算必须以发展速度为中介,增长速度,定基增长速度=定基发展速度-1,环比发展速度=环比增长速度+1,定基发展速度=环比发展速度的连乘积,书137页,增长速度,各环比发展速度的平均数,用以表现现象在一个较长时期内平均发展变化的程度。
三、平均发展速度,平均发展速度,从最初水平出发,按平均发展速度逐期发展,经过n期以后,可以达到最末水平。
又称水平法,数理依据:
平均发展速度,几何平均法,定基发展速度=环比发展速度连乘积,三种计算方法可根据掌握资料选择使用。
平均发展速度,计算方法:
四、平均增长速度,平均增长速度=平均发展速度-1,增长1%绝对值,对时间数列进行分析,即要看速度,又要看水平,二者结合起来才能对现象的变化作出全面的认识。
1998年相对于1997年,美国的GDP增长速度为3.9,同期中国GDP增长速度为7.8,恰好为美国的2倍;
但根据同期汇率(1美元兑换8.3元人民币),1998年中国GDP总量约合9671亿美元,约相当于同期美国GDP总量84272亿美元的1/9。
1997年美国GDP总量为81109亿美元,中国的GDP总量折算为美元约为8972亿。
增长1%绝对值=逐期增长量环比增长百分点前期水平100,增长1%绝对值,第四节时间数列的影响因素分析,一、时间序列的构成要素,长期趋势季节变动循环变动不规则变动,注:
对于某一个时间序列而言,这四个要素可能同时存在,也可能单独存在。
二、长期趋势的测定与预测,时距扩大法移动平均法最小平方法,二、最小平方法,利用最小二乘法拟合线性趋势方程线性趋势方程的一般形式为:
采用最小二乘法计算参数a和b,其求解方程组为:
利用最小二乘法拟合线性趋势方程简捷运算法注意事项:
当时间序列为奇数项时,以中间一年为原点,t值分别用、-3、-2、-1、0、1、2、3、来表示各年序号,使;
当时间序列为偶数项时,以中间两项的中点为原点,t以半年为时间单位,原点以前各项的t值分别为、-5、-3、-1,原点以后各项的t值依次为1、3、5、,同样可使。
最小平方法配合的直线模型*,*解题思路1.建模:
建立时间序列各观测值和时间之间的直线模型。
2.求参数a和b:
令3.预测:
将预测期的t值带入模型中,预测长期趋势值。
可得到参数a和b的表达式:
第六章统计指数,数量指标综合指数计算公式,表示数量指标指数,表示数量指标,0、1表示基期和报告期,表示质量指标,0、1表示基期和报告期,综合指数的编制方法,表示质量指标指数,表示数量指标,0、1表示基期和报告期,表示质量指标,0、1表示基期和报告期,综合指数的编制方法,质量指标综合指数计算公式,加权算术平均数指数通常用于编制数量指标综合指数,权数为基期综合总量,加权算术平均数指数其实是综合指标指数公式的变形公式。
加权调和平均数指数通常用于编制质量指标综合指数,权数为报告期综合总量,加权调和平均数指数其实是综合指标指数公式的变形公式。
总变动,Q变动对总量带来的影响,P变动对总量带来的影响,总量指标变动的两因素分析,可变构成指数,结构影响指数,固定构成指数,平均指标变动的因素分析,第八章相关与回归分析,一、相关分析的概念(P226),相关分析是研究一个变量与另一个变量或另一组变量之间相互关系密切程度和相关方向的一种统计分析方法。
事物间存在普遍的联系与相互影响,如受教育水平与工作后的收入、预防疾病支出与疾病的发生率等,这种依存关系可以用数量关系表现出来。
有两种类型:
函数关系(确定性依存关系)相关关系(非确定性依存关系),函数关系(几个例子),某种商品的销售额y与销售量x之间的关系可表示为y=px(p为单价)圆的面积S与半径R之间的关系可表示为S=R2企业的原材料消耗额y与产量x1、单位产量消耗x2、原材料价格x3之间的关系可表示为y=x1x2x3,相关关系(几个例子),子女身高y与父母身高x之间的关系收入水平y与受教育程度x之间的关系粮食单位面积产量y与施肥量x之间的关系(降雨量、温度)商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系,单相关两个变量之间的相关复相关一个变量与多个变量之间的相关关系偏相关一个变量与多个变量相关,假定其他变量不变,仅考虑与其中一个变量之间的相关关系,涉及变量的多少,二、相关关系的种类(P227),相关系数的特点:
只能判断两个变量之间是否存在直线相关关系。
两个变量之间的相系系数只有一个。
取值范围在1和1之间。
正值为正相关,负值为负相关,为表示不相关。
其绝对值在.以下为微弱相关其绝对值在0.3和0.5之间为低度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 复习 要点