第一节抽样推断的一般问题.pptx
- 文档编号:14142228
- 上传时间:2023-06-21
- 格式:PPTX
- 页数:91
- 大小:683.57KB
第一节抽样推断的一般问题.pptx
《第一节抽样推断的一般问题.pptx》由会员分享,可在线阅读,更多相关《第一节抽样推断的一般问题.pptx(91页珍藏版)》请在冰点文库上搜索。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点第五章抽样估计教学目的:
通过对本章的学习,了解抽样估计的基本原理,掌握抽样估计的基本方法。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点教学设计:
对主要的知识点进行讲解,通过在线学习平台的“教学辅导”与“参考资料”栏目获取相关知识,从而对重要的知识点有进一步的认识,在此基础上通过练习来加深对相关问题的理解,同时通过网上实时与非实时的答疑解决疑难问题。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点统计学原理中央广播电视大学人才培养模式改革和开放教育试点重难点讲解:
抽样误差的概念及计算;抽样估计的方法统计学原理中央广播电视大学人才培养模式改革和开放教育试点第五章抽样估计第一节抽样推断的一般问题第二节抽样误差第三节抽样估计的方法第四节抽样组织设计统计学原理中央广播电视大学人才培养模式改革和开放教育试点统计调查方法全面调查非全面调查普查抽样调查重点调查典型调查相关知识回顾:
统计报表统计学原理中央广播电视大学人才培养模式改革和开放教育试点抽样调查:
按照随机原则,从总体中抽取一部分样本单位,根据对样本单位的调查结果来推断总体的数量特征。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点一、抽样推断的意义1、概念:
抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。
第一节抽样推断的一般问题样本总体推断统计学原理中央广播电视大学人才培养模式改革和开放教育试点2、特点
(1)由部分推算整体的一种方法;
(2)抽样推断建立在随机抽样的基础上;(3)抽样推断是运用概率估计的方法;(4)抽样推断的误差可以计算并加以控制。
样本(非唯一)总体(唯一)推断统计学原理中央广播电视大学人才培养模式改革和开放教育试点二、抽样推断的内容
(一)参数估计用样本的观察资料来估计所研究现象总体的水平、结构、规模等数量特征,这种推断方法称为参数估计。
(二)假设检验对总体的状况作出某种假设,然后根据样本所提供的信息来判断总体未知参数事先所作的假设是否成立的统计分析方法称为假设检验。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点三、抽样的几个基本概念1、总体也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,一般用N表示。
无限总体、有限总体2、样本又称子样,是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体,一般用n表示。
总体样本统计学原理中央广播电视大学人才培养模式改革和开放教育试点3、随机抽样按随机原则从总体中抽取样本单位。
4、非随机抽样根据市场调查者的主观分析判断来选取样本单位。
包括偶遇抽样、主观抽样、定额抽样。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点5、参数根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,称为全及指标,由总体各单位的标志值或标志特征所决定,全及指标的指标值是确定的,唯一的,称为参数。
2和总体方差体均值,常用的总体参数有总对于总体中的数量标志XFXFNXXFFXXNXX222统计学原理中央广播电视大学人才培养模式改革和开放教育试点对于总体中的品质标志:
由于不能用数量来表示,总体参数通常用成数P表示。
成数:
总体中具有某种性质的单位数在总体全部单位数中的比重,用P表示。
总体中不具有某种性质的单位数在总体中所占的比重,用Q表示。
有P+Q=1X:
表示总体变量,有N个单位,所以可以表示为nXXX,21道性质的单位数,可以知表示总体中不具有某种质的单位数,表示总体中具有某种性表示总体单位数,用01NNNNNN01PNN/1统计学原理中央广播电视大学人才培养模式改革和开放教育试点当某种标志,它的标志表现只有是非两种,可以用“1”表示标志表现为“是”的标志的标志表现,“0”表示标志表现为“非”的标志的标志表现,在此情况下:
PNNNNNXP10101PQQPPQPQQPNNQNPNNPNPP2212021202210PQNN1/0统计学原理中央广播电视大学人才培养模式改革和开放教育试点6、统计量根据样本各单位标志值或标志属性计算的综合指标称为统计量。
样本统计量是用来估计总体参数的。
反映样本的数量特征。
fxfnxx222()()xxxxffss-邋邋=nnpxp=2ppqss=统计学原理中央广播电视大学人才培养模式改革和开放教育试点参数总体统计量样本统计学原理中央广播电视大学人才培养模式改革和开放教育试点例题:
某批产品共500件,合格品480件,不合格品20件,要求计算成数合格品率、、PXP%96500480P%96PX196.0%4%96PQP统计学原理中央广播电视大学人才培养模式改革和开放教育试点7、样本容量指一个样本所包含的单位数。
8、样本个数又称样本可能数目,是指从一个总体中可能抽取的样本个数。
9、重复抽样从总体N个单位中随机抽取样本容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。
每次抽出一个单位把结果登记下来又放回,重新参加下一次的抽选。
共可抽取容量为n的样本个。
nN统计学原理中央广播电视大学人才培养模式改革和开放教育试点10、不重复抽样从总体N个单位中随机抽取容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。
但每次抽选出的单位就不再放回参加下一次抽选。
共可抽取容量为n的样本N(N-1)(N-2).(N-n+1)个。
结论:
总体单位数一致,在相同样本容量的情况下,重复抽样的样本个数大于不重复抽样的样本个数。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点第二节抽样误差一、抽样误差的概念概念:
指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。
系统偏误与登记性误差可以防止或避免,抽样误差不可避免,只能加以控制。
)()(抽样误差偶然性代表性误差系统偏误系统性代表性误差代表性误差登记性误差调查误差统计学原理中央广播电视大学人才培养模式改革和开放教育试点影响抽样误差大小的因素:
(1)总体各单位标志值的差异程度;
(2)样本单位数;(3)抽样方法;(4)抽样组织形式。
二、抽样平均误差(抽样指标的标准差)反映抽样误差一般水平的指标。
是所有可能出现的样本指标和总体指标的平均离差。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点1、抽样平均数的平均误差,也可称为抽样平均数的标准差(表明各样本均值与总体均值离差的一般水平)
(1)重复抽样情况下)(计算公式nnxx:
样本单位数总体标准差n:
统计学原理中央广播电视大学人才培养模式改革和开放教育试点例:
设有三个数8、10、12,这一总体的均值、标准差分别为:
用重复抽样的方法,从8、10、12三个数中抽两个数构成样本,求样本的平均值,用以代表三个数的一般水平,所有可能的样本以及样本的平均值列表如下:
10312108X1.6331.633332210)10)(12(122210)10)(10(102210)10)(8(8NN22xxxx统计学原理中央广播电视大学人才培养模式改革和开放教育试点样本个数样本变量样本均值平均数离差离差平方123456789888108121010101210812121281210891010119121011-2-1001201-1410014011合计90010990)(MxxE样本平均数的平均数统计学原理中央广播电视大学人才培养模式改革和开放教育试点抽样平均数的标准差:
现在按重复抽样误差公式计算抽样平均误差1.1551.155xx9122nxEx1.1551.1551.6331.63322nx统计学原理中央广播电视大学人才培养模式改革和开放教育试点几个基本关系:
a.样本平均数的平均数等于总体平均数;b.抽样平均误差实质上就是抽样平均数的标准差,也称为抽样标准误差;c.抽样平均数的标准差(抽样平均误差)比总体标准差小很多,仅为总体标准差的。
d.可以通过调整样本单位数n来控制抽样平均误差。
n1统计学原理中央广播电视大学人才培养模式改革和开放教育试点
(2)在不重复抽样的情况下样本个数样本变量样本均值平均数离差离差平方123456810812101210812812109101191011-101-101101101合计60012NnNnx)1(2Nnnx10660)(MxxE样本平均数的平均数统计学原理中央广播电视大学人才培养模式改革和开放教育试点按不重复抽样误差公式计算抽样平均误差816.64200xxnxEx816.0)1323(22633.112NnNnx统计学原理中央广播电视大学人才培养模式改革和开放教育试点)(差重复抽样的抽样平均误nNnNn12代替标准差经常是未知的,用样本在计算中,总体标准差ss12nxxs)(2nxxs统计学原理中央广播电视大学人才培养模式改革和开放教育试点某工厂有1500个工人,用简单随机重复抽样的方法抽取50个工人作为样本,调查其工资水平,资料如下:
月平均工资(元)524534540550560580600660工人数(人)469108643计算样本平均数和抽样平均误差。
560(元)560(元)5050336606606653453444524524fxfx32.45(元)32.45(元)50503344560)560)(524(524222)560660(2ffxx)4.59(4.59(505032.4532.45元nx统计学原理中央广播电视大学人才培养模式改革和开放教育试点2、抽样成数的平均误差(表明各样本成数与总体成数绝对离差的一般水平)
(1)在重复抽样下P:
总体成数n:
样本单位数nnP)P)P(1P(1PP)(2nx统计学原理中央广播电视大学人才培养模式改革和开放教育试点
(2)在不重复抽样下在实际计算中,用样本成数p代替总体成数P1)1)-(N(Nnnn)n)-P)(NP)(NP(1P(1PP)NNnn(1(1nnp)p)p(1p(1pp(nnp1统计学原理中央广播电视大学人才培养模式改革和开放教育试点从2000件产品中抽查200件,其中合格品190件,要求:
计算样本合格率及其抽样平均误差。
解:
在重复抽样下:
在不重复抽样下:
95.0200/190p0.01540.01542002000.050.050.950.95nnp)p)p(1p(1p0.01460.0146)NNnn(1(1nnp)p)p(1p(1pp统计学原理中央广播电视大学人才培养模式改革和开放教育试点某电子产品使用寿命在3000小时以下为不合格品。
现在用简单随机抽样方法从5000个产品中抽取100个对其使用寿命进行调查,结果如下表所示使用寿命(小时)产品数量(个)3000以下30004000400050005000以上2305018合计统计学原理中央广播电视大学人才培养模式改革和开放教育试点要求:
(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差;
(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点解:
根据资料可算出使用寿命(小时)组中值产品数量(个)xf3000以下30004000400050005000以上25003500450055002305018500010500022500099000合计统计学原理中央广播电视大学人才培养模式改革和开放教育试点)(4340100434000小时样本均值fxfx)(03.7311001843405500243402500222小时样本标准差ffxx%9810098p样本合格品率)(.小时样平均误差重复抽样下平均寿命抽17310003731nx统计学原理中央广播电视大学人才培养模式改革和开放教育试点)(37.725000100110003.731122小时抽样平均误差不重复抽样下平均寿命Nnnx014.01000196.010002.098.01nppp平均误差重复抽样下合格率抽样01386.098.01000196.05000100110002.098.011样平均误差不重复抽样下合格率抽Nnnppp统计学原理中央广播电视大学人才培养模式改革和开放教育试点三、抽样极限误差指变动的抽样指标与确定的总体指标之间离差的可能范围,统计上称为抽样极限误差。
设误差抽样平均数的抽样极限:
x差抽样成数的抽样极限误:
pXxxPpPpppPpxxxXx.,),()称为置信区间或(ppxxppxx统计学原理中央广播电视大学人才培养模式改革和开放教育试点四、抽样误差的概率度xtxxppt抽样误差的概率度。
就称为,得到数值除以或者用除以用ttppxx)(xxtppt统计学原理中央广播电视大学人才培养模式改革和开放教育试点对某市居民进行生活水平调查,现随机抽取100户,结果户月均收入为482元,标准差为50元,要求该市居民户月均收入在472492元的范围内,试求抽样极限误差和抽样概率度。
10482,xxxxxXx解:
根据2510510050xxxtn又统计学原理中央广播电视大学人才培养模式改革和开放教育试点第三节抽样估计的方法一、总体参数的点估计根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值,即直接以样本平均数、成数推断总体的平均数和成数。
的估计量表示总体成数的估计量,表示总体平均数设PPXXPpXx统计学原理中央广播电视大学人才培养模式改革和开放教育试点优良估计的标准:
1、无偏性:
以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身。
2、一致性:
以抽样指标估计总体指标要求当样本容量增大时,抽样指标也充分地靠近总体指标。
3、有效性:
以抽样指标值估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。
)1(,(npppnx统计学原理中央广播电视大学人才培养模式改革和开放教育试点二、抽样估计的精度估计精度1误差率三、抽样估计的置信度表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
xXxx误差率KPPPXxP21xx统计学原理中央广播电视大学人才培养模式改革和开放教育试点样本平均数700800900100011001200130014001500频数f121242121频率根据以上分布写出平均工资落在各种区间范围内的概率P:
)xx()ffff(1616111616221616111616221616441616221616111616221616112116216416212001000xP851611621641621611300900xP871621611621641621611621400800xP)100100(Xx)200200(Xx)300300(Xx统计学原理中央广播电视大学人才培养模式改革和开放教育试点已经证明,当样本单位数大于或等于30的条件下,抽样平均数的分布接近与正态分布。
84)100(XxP87)300(XxP85)200(XxP统计学原理中央广播电视大学人才培养模式改革和开放教育试点该分布的特点是:
(1)抽样平均数以总体平均数为中心,它大于或小于总体平均数的概率分布完全呈对称分布;抽样平均数的正误差和负误差的可能性完全相等。
(2)抽样平均数越接近总体平均数,其出现的概率越大;越远离总体平均数,其出现的概率越小。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点概率度与概率保证程度之间是函数关系,概率保证程度是概率度的函数,即:
%73.993%45.95227.68)-P(P()-P(P(%)P(P(XxXxXxF(t)F(t)P(P(xtXx)1,(ttx)2,(ttx)3,(ttx统计学原理中央广播电视大学人才培养模式改革和开放教育试点t与与F(t)之间的关系可以查正态分布概率表,附录三99.73%99.73%F(t)F(t),33tt95.45%95.45%F(t)F(t),22tt9595F(t)F(t)1.961.96tt68.27%68.27%F(t)F(t),11tt时时时时时时时,统计学原理中央广播电视大学人才培养模式改革和开放教育试点四、总体参数的区间估计对于总体的被估计值(总体参数)X,找出两个数值使被估计指标X落在区间内的概率为已知的。
(用一个具有一定可靠程度的区间范围来估计总体参数))221,1,xx(x(x)10(1置信上限置信下限;:
21xx为置信区间21,xx为置信水平为置信度,1)(21xx21xx和统计学原理中央广播电视大学人才培养模式改革和开放教育试点区间估计的两种方法:
1、根据已知的抽样误差范围(抽样极限误差)求概率保证程度(置信度)。
并给出相应的概率保证程度用时数。
估计该批灯泡的平均耐,试允许误差范围下表,要求耐用时间的个灯泡的耐用时间见个进行检验,这随机抽取检查中,万个灯泡,在进行质量某灯泡厂某月生产7.4047.404500500500500500500xx统计学原理中央广播电视大学人才培养模式改革和开放教育试点耐用时间组中值灯泡数耐用时间组中值灯泡数800850825359501000975103850900875127100010501025429009509251851050110010758
(1)样本平均数及抽样平均误差2.4682.468nnxx55.1955.19500500ff926.4926.450050088107510751271278758753535825825ffxfxfxx50019.5585.9261075354.926825222fxx统计学原理中央广播电视大学人才培养模式改革和开放教育试点以99.73的可靠程度推断这批灯泡的耐用时间在(919小时,933.8小时)的范围内。
(小时)(小时)(小时)(小时)
(2)
(2)933.8933.87.4047.404926.4926.49199197.4047.404926.4926.4上限下限xxxx332.4682.4687.4047.404ttxxxxtt(3)(3)%73.99)(tF统计学原理中央广播电视大学人才培养模式改革和开放教育试点若已知样本灯泡的合格率为95,要求合格率的误差范围不超过0.97,估计该批灯泡的合格率,并给出相应的概率保证程度。
0.00970.00975005000.04750.0475nnp)p)p(1p(1pp)抽样平均误差(1
(2)-=-=-=-=+=+=求求总总体体合合格格率率的的上上下下限限下下限限:
pp95%0.97%94.0395%0.97%94.03pp上上限限:
pp95%95%0.97%95.970.97%95.97pp统计学原理中央广播电视大学人才培养模式改革和开放教育试点2、给出置信度,求抽样极限误差的可能范围以68.27的概率保证程度估计该批灯泡的合格率在(94.03%,95.97%)范围内。
110.00970.00970.97%0.97%ttpppptt(3)(3)%27.68)(tF统计学原理中央广播电视大学人才培养模式改革和开放教育试点某城市某街道所管辖的10000户居民中,用单纯随机重复抽样方法抽取200户,对某种商品的平均需求量和需求倾向进行调查,调查结果表明,每户居民对该商品的月平均需求量为500克,标准差为100克,表示一年内不选择其他替代商品,继续消费该商品的居民户为90,试对总体平均数,总体成数进行区间估计。
统计学原理中央广播电视大学人才培养模式改革和开放教育试点
(1)当置信度85时1.441.44tt90%90%pp100100500500xx200200nn克)克)克)克)(224.101.744.1(1.7200100xxxtn为为克,这种估计的置信度克,这种估计的置信度平均需求量为平均需求量为户居民对该商品的月户户居民对该商品的月户即该街道即该街道852.5108.489100002.5108.489224.10500224.10500XXxXxxx统计学原理中央广播电视大学人才培养模式改革和开放教育试点该街道10000户居民表示继续消费该商品的居民户占8793,估计的置信度为0.02880.02880.020.021.441.44ppt.t.pp0.020.022002000.10.10.90.9nnp)pp)p(1(1pp0.930.93PP0.870.870.02880.02880.90.9PP0.02880.02880.90.9ppppPPpppp统计学原理中央广播电视大学人才培养模式改革和开放教育试点
(2)当置信度95时,该街道10000户居民对该商品需求量为486.1513.9克,置信度为1.961.96tt90%90%pp100100500500xx200200nn克)克)(9.131.796.1xxt9.5131.4869.135009.13500XXxXxxx统计学原理中央广播电视大学人才培养模式改革和开放教育试点总体参数的区间估计的三要素是:
估计值、抽样误差范围、概率保证程度。
该街道10000户居民表示继续消费该商品的居民户占86.193.9,置信度为9392.08608.00392.09.00392.09.00392.002.096.1PPpPptpppp统计学原理中央广播电视大学人才培养模式改革和开放教育试点例1:
某工厂生产一种新型灯泡5000只,随机抽取100只作耐用时间实验,测试结果平均寿命为4500小时,标准差为300小时,试在95.45概率保证下,估计该新式灯泡平均寿命区间。
456044406030230100300XxxXxxtxns即即解:
解:
xxxx22tt300300500500xx100100nn统计学原理中央广播电视大学人才培养模式改革和开放教育试点例2:
某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元,要求:
(1)以95的概率估计全乡平均每户年纯收入的区间;
(2)以同样概率估计全乡农户年纯收入总额的区间范围。
1239211608(39220096.1)(2001002000196.1,2000,12000,100,5000XxXxtntsxnNxxxxx元)元)元元)(解:
解:
统计学原理中央广播电视大学人才培养模
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一节 抽样 推断 一般 问题