统计推断估计与假设检验.ppt
- 文档编号:18865798
- 上传时间:2024-02-02
- 格式:PPT
- 页数:59
- 大小:267.50KB
统计推断估计与假设检验.ppt
《统计推断估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《统计推断估计与假设检验.ppt(59页珍藏版)》请在冰点文库上搜索。
路路只有一条路不能选择,那就是放弃的路;只有一条路不能拒绝,那就是成长的路。
有三位计量经济学家在森林中猎鹿,他们发现50米远处有一只很大的猎物正站在那里。
第一位计量经济学家举枪射击,击中了鹿身后两米远的一棵树。
第二位计量经济学家也几乎同时开枪,击中了鹿身前两米远的一棵树。
第三位计量经济学家高兴得跳起来,并喊道:
“平均的看,我们击中它了!
”显然无偏性有一些缺陷,但在其他条件不变的情况下,平均而言正确通常总比平均而言错误要好一些。
如果这两位计量经济学家击中了离鹿的心脏2厘米远的位置,而不是几米远的地方,那么他们将会边吃鹿肉边庆祝他们的成功。
无偏性之外,还要考虑,估计量方差的大小。
统计推断:
估计与假设检验统计推断:
估计与假设检验统计推断:
估计与假设检验统计推断:
估计与假设检验1、估计和假设检验:
统计推断的两个孪生分支2、参数估计3、点估计量的性质4、假设检验统计推断的含义统计推断的含义:
我们知道,总体是指我们所关注现象出现的可能结果的全体,样本是总体的一个子集。
统计推断研究的是总体与来自总体的样本之间的关系。
一般地说,统计推断是根据来自总体的样本对总体(概率密度函数)的种种统计特征作出判断。
11、估计和假设检验:
统计推断、估计和假设检验:
统计推断的两个孪生分支的两个孪生分支统计推断的主要步骤(举例说明):
首先,关注某一总体,如纽约股票交易市场的1758支(90年9月4日)股票,想要研究该总体某一方面的统计特征,比如说股票价格与收入比(P/E)的平均值。
在总体中抽取随机样本,如50支股票,求样本中每一支股票的P/E值,然后再计算平均P/E值,即,就称为总体平均P/E的估计量(也即E(X)的估计量,E(X)为总体的一个参数)。
从而完成统计推断的第一步:
参数估计。
XX其次,判断估计值的“优度”,主要因为估计值很可能不等于真实的参数值。
如果有两个或更多个随机样本,计算这些样本的均值,则得到的估计值很可能不相同。
我们把不同样本估计值的差异称为抽样误差,从而引入一些判定估计量优劣的常用标准。
再次,进行假设检验。
假设检验是统计推断的另一个重要方面。
在假设检验中,可以对某参数的假定值进行先验判断或预期。
如以往的经验或专家意见指出1758值股票总体的平均P/E值为12,若随机样本计算出的值为11,则根据假设检验的内容接受假设或者拒绝假设。
22、参数估计参数估计点估计:
假定随机变量X(P/E)服从某一未知均值和方差的正态分布。
并且有来自该正态总体的一个随机样本(50个P/E值),见下表。
如何根据这些样本数据计算总体的均值和方差呢?
先假设只关注总体均值x=E(X)。
根据表中数据,50个P/E的样本均值为11.4,显然我们可以选择11.4作为x的估计值,称这个单一数值为x的点估计值,称计算公式50150iiXX为x的点估计量。
67891011121314151618P/E频数225657543461均值=11.5样本方差=9.2755样本标准差=3.0456中位数=众位数=11总计:
50假设的样本(50值股票的P/E值)注意:
点估计是一个随机变量,因为其值随样本的不同而不同,那么,某一特殊的估计值的可信度有多大呢?
为了更好地估计总体特征,引入区间估计。
区间估计:
区间估计的主要思想源于估计量抽样分布(概率分布)的概念。
我们知道,如果随机变量XN(x,x),则,nNXx,)1,0()(NnXZx或若x未知,可用其估计量S来替代,则有:
nSXtx)(服从自由度为(n-1)的t分布。
在上里中,由50个样本观察值,故自由度为49。
查t分布表得到:
P(-2.0096t2.0096)=0.95即区间-2.0096,2.0096包括t的概率为95%。
将t变量公式带入,经整理得:
10.63x12.36,即为x的95%的置信区间。
自由度为49的t分布2.5%95%2.5%02.0096-2.009695.0)0096.2)(0096.2(nSXPX由计算式P(-2.0096t2.0096)=0.95可得出:
95.00096.20096.2nSXnSXPX整理得:
在统计学中,上述公式称为未知的总体均值x的一个95%的置信区间。
0.95称为置信系数。
表示随机区间包括真实x的概率为0.95。
区间下限区间上限需要特别强调一点:
上式给出的区间是随机的区间,它依赖于样本值的变化而变化,尽管总体均值x是未知的,但它是固定值,而非随机量。
由此,我们不能说x位于上述区间的概率为0.95,只能说该区间包括真实的x的概率为0.95。
与点估计相比区间估计提供了在某一置信度下,真实参数的取值范围。
归纳区间估计概念假定随机变量X服从某一概率分布,若要对其参数(如x)进行估计。
选取容量为n的随机样本,X1,X2,Xn,并根据样本计算两个估计量L和U:
P(LxU)=1-01即从L到U的随机区间包括真实x的概率为(1-)。
L称为区间下限,U称为区间上限。
该区间称为x的置信区间。
(1-)称为置信系数,称为显著水平,或犯第一类错误的概率。
33、点估计量的性质(评价标准)、点估计量的性质(评价标准)在P/E一例中,用样本均值作为x的点估计量,满足了以下性质:
线性无偏性有效性最优线性无偏估计量一致性3.13.1线性线性线性估计量:
若估计量是样本观察值的线性函数,则称该估计量是线性估计量。
上式看出,样本均值是样本观察值Xs的线性函数,即Xs仅以一次幂的形式出现。
niniXXXnnXX121)(13.23.2无偏性无偏性无偏估计量:
如果重复使用某种方法,得到的估计量的均值(如E())与真实参数值x一致,该估计量就是无偏估计量。
即XXXE)(如果二者不相等,则称该估计量是有偏的估计量。
例1:
若XiN(x,),假定从该正态总体中随机抽取容量为n的样本。
则样本均值是真实x的无偏估计量。
(参考样本均值的抽样分布或概率分布)。
例2:
若XiN(x,),假定从该正态总体中随机抽取容量为n的样本。
Xmed表示样本中位数,可以证明E(Xmed)=x,即样本中位数也是真实均值的无偏估计量。
X3.33.3有效性有效性有效估计量:
若仅考虑唯一一个参数的估计量,则方差最小的估计量是最好的或称为有效的估计量。
对比样本均值和样本中位数。
假定随机变量X的取值构成一随机样本,样本容量为n,并且每个XN(x,),令、Xmed分别表示样本均值和样本中位数。
已知:
N(x,/n)若样本容量足够大,可以证明,XmedN(x,(/2)(/n)XX即对大样本而言,样本均值和样本中位数均服从均值为x的正态分布,但样本中位数的方差是样本均值的方差的(/2)倍。
根据有效性的性质,用样本均值估计x比用样本中位数Xmed更准确,即样本均值提供了一个比样本中位数更为准确的总体均值的估计值。
X3.43.4最优线性无偏估计量最优线性无偏估计量最优线性无偏估计量(BLUE):
如果一个估计量是线性的和无偏的,并且在参数的所有线性无偏估计量中,这个估计量的方差最小,则称这个估计量是最优线性无偏估计量。
显然,该性质包括了线性、无偏性和有效性。
3.53.5一致性一致性假定XN(x,),从该正态总体中抽取一容量为n的随机样本。
现考虑x的两个估计量:
nXXi1*nXXi第一个估计量是常用的样本均值,则E()=x。
X可以证明,XnnXE1)(*显然第二个估计量X*是一个有偏估计量。
两个估计量的差别在于前者的分母是n而后者的分母是n+1。
但是,假定我们增大样本容量,则随着样本容量的增大,第二个估计量X*的均值也将近似等于真实的x,在统计学中,我们称这样的估计量(如X*)为一致估计量。
有时得不到无偏估计量,但却可以得到一个一致估计量。
xn=100n=80n=50n=25概率密度f(X*)随着样本容量的增大,总体均值估计量X*的变化示意图统计推断:
估计与假设检验统计推断:
估计与假设检验统计推断:
估计与假设检验统计推断:
估计与假设检验1、估计和假设检验:
统计推断的两个孪生分支2、参数估计3、点估计量的性质4、假设检验44、假设检验、假设检验在股票的P/E一例中,上一节我们根据50个P/E值组成的随机样本,建立了x的一个95%的置信区间。
即在该区间内包括x的概率为95%。
现在改变策略,不是建立一个置信区间,而是假设真实的x取某一特定值,如x=13。
然后去检验这个假设,检验结果是接受或拒绝该假设?
下面以此为例说明。
67891011121314151618P/E频数225657543461均值=11.5样本方差=9.2755样本标准差=3.0456中位数=众位数=11总计:
50假设的样本(50支股票的P/E值)用假设的语言,将x=13称为零假设(原假设),用符号H0表示。
即,H0:
x=13与零假设相对应的是备择假设,用符号H1表示,备择假设有以下几种形式:
H1:
x13称为单边备择假设(右侧);H1:
x13称为单边备择假设(左侧);H1:
x13称为双边备择假设。
为了检验零假设(和备择假设),根据样本数据及统计理论建立判定规则来判断样本信息是否支持零假设。
若支持,不拒绝零假设,反之拒绝零假设,接受备择假设。
建立判定规则有两种方法:
置信区间法、显著性检验法。
4.14.1置信区间法置信区间法在上述例子中,我们知道样本均值服从均值为x,方差为/n的正态分布,由于真实的方差未知,以样本方差代替。
在这种情况下,样本均值服从t分布,从而得到x的一个95%的置信区间:
10.63x12.36(近似值)置信区间提供了在某一置信度下(如95%)真实的x的取值范围。
因此,如果这个区间不包括零假设中的值,如x=13,则拒绝零假设,即我们以95%的置信度拒绝零假设。
反之,接受零假设。
接受区域:
上述不等式所描述的置信区间称为接受区域。
零假设的临界区域(或拒绝区域):
接受区域以外的称为零假设的临界区域或拒绝区域。
临界值:
接受区域的上界和下界称为临界值。
它们是接受或拒绝零假设的分界线。
归纳:
如果参数值在零假设下位于接受区域内,则不拒绝零假设,若落在接受区域以外(即落在拒绝区域内),则拒绝零假设。
10.6312.36P/E值P/E总体均值的95%的置信区间10.6312.36P/E值P/E总体均值的95%的置信区间132.5%95%2.5%4.2第一类错误和第二类错误H0:
x=13第一类错误:
亦称弃真错误。
在上述P/E例子中,我们以95%的置信度拒绝了零假设:
x=13,那么是否就意味着上表中所给出的样本就不是来自均值为13的正态总体呢?
或许事实的确如此。
但是由于不等式给出的置信区间的置信度是95%,而非100%,我们抽取的这一个特定的样本可能正好不包含真实值。
如果真是这样,则拒绝H0:
x=13,就可能犯错误,这种情况下,我们说犯了第一类错误(也称弃真错误),即原假设为真而我们拒绝了它。
10.6312.36P/E值P/E总体均值的95%的置信区间122.5%95%2.5%H0:
x=12第二类错误:
亦称取伪错误。
在上述例子中,假定零假设H0:
x=12,在这种情况下,根据上述置信区间,我们应该不拒绝零假设。
但是上表中的数据很可能不是来自均值为12的正态总体,此时我们会犯第二类错误,也即取伪错误。
在研究中,我们想尽可能减小这两种错误。
但是,对于任一给定的样本,我们不可能同时作到犯这两种错误的概率都很小。
其解决方法为:
先固定犯第一类错误的概率在一很低水平上,再考虑如何减小犯第二类错误的概率。
统计学家(NeymanPearson)提出的解决问题的方法是假定在实际中弃真错误比取伪错误更严重。
第一类错误与第二类错误第一类错误与第二类错误正确结论弃真错误拒绝H0取伪错误正确结论接受H0H1为真H0为真结论总体情况拒绝H0的结论要么是正确的,要么犯了第一类错误我们可以控制犯第一类错误的概率,得出具有很高置信度的结论“拒绝H0是正确的”;统计学家通过“不拒绝H0”的表述来避免犯第二类错误犯第一类错误的概率通常用符号表示,称为显著性水平;犯第二类错误的概率通常用符号表示。
则:
第一类错误=犯弃真错误的概率;第二类错误=犯取伪错误的概率。
不犯第二类错误的概率=(1-),称为检验的功效。
假设检验的标准做法是:
给定某一显著水平的,如=0.01(或0.05),然后使检验的功效最大,即使最小。
由于求解过程比较复杂,在实际中,仅仅给出值,而没有过多考虑值。
置信系数(1-)就是1减去“犯第一类错误的概率”,因此,95%的置信系数表示拒绝零假设犯第一类错误的概率至多为5%。
以下用实例来进一步阐明假设检验的置信区间法。
例:
坛子里的花生的重量服从正态分布,但均值和方差是未知的。
随机选取20个坛子,发现其样本均值和样本方差分别为6.5和4。
检验零假设:
真实均值为7.5;备则假设:
真实均值不是7.5。
给定显著水平1%。
若显著水平为5%,又会如何?
分析:
令X代表坛子中花生的重量,因此,XN(x,),两个参数x和均是未知的。
由于知道样本方差,故设计t变量,它服从自由度为19的t分布。
1920)(tSXtX查t分布表得:
当自由度为19时,P(-2.861t2.861)=0.99整理得出:
将已知条件代入,得:
5.22x7.78(近似值)由于该区间包括了零假设值7.5,因此,我们不拒绝不拒绝零假设:
真实的x=7.5。
99.0861.2861.2nSXnSXPX若置信水平为5%,也就意味着决定冒更大的风险犯第一类错误。
分析如下:
根据t分布表,当=5%,自由度为19时,t的临界值为-2.093和+2.093,即P(-2.093t2.093)=0.95按照上述步骤,求得:
5.56x7.44(近似值)由于该区间不包括7.5,因此,拒绝零假设:
真实的x=7.5。
后者和前者的不同之处在于后者的置信区间比前者略窄一些,反映了不同的显著水平下置信区间有所区别。
5.227.78b)x的95%的置信区间7.50.5%99%0.5%H0:
x=7.595%2.5%2.5%5.567.447.5a)x的99%的置信区间4.34.3显著性检验显著性检验显著性检验是一种两者择一的假设检验,但它却是完备的。
现通过P/E一例加以说明。
根据以下公式可知:
nSXtX)(服从自由度为(n-1)的t分布。
在具体应用中,、S、n已知,x未知。
X在零假设下设定x为一给定值,从而求出t值。
由于该式中的t值服从自由度为(n-1)的t分布,根据t分布很容易求出获此t值的概率。
如果与x的差别不大(绝对值形式),则根据上式,t值为0,在这种情况下,我们接受零假设。
随着t的绝对值的增大,逐渐趋于拒绝零假设。
在能拒绝零假设之前,最大的t的绝对值是多少呢?
它直接取决于置信水平(犯第一类错误的概率)和自由度。
显著性检验方法的关键之处是检验统计量(t统计量)以及在假定x为一给定值下该t统计量的概率分布。
XX在P/E例子中,=11.5,S=3.0456,n=50。
令H0:
x=13,H1:
x13,则有:
t=(11.5-13)/(3.0456/50)=-3.4826根据该t值能否拒绝零假设呢?
在没有设定置信水平之前,无法回答这个问题。
现假定置信水平为5%,即=5%。
由于备择假设是双边假设,因此,可以将犯第一类错误的风险均分在t分布的两侧两个拒绝区域(计算的t值位于任何一个拒绝区域,都能够拒绝零假设)。
X当自由度为49时,在5%的显著水平下,查表得临界的t值为-2.0096和2.0096(见下图),获此t值小于或等于-2.0096的概率为2.5%,获得此t值大于或等于2.0096的概率也为2.5%。
95%=2.5%=2.5%t=-3.5-2.00962.00960t检验的显著性:
双边检验显然,t值位于t分布的左侧拒绝区域。
因此,拒绝零假设。
在显著性检验时,经常遇到的两个术语:
检验(统计量)是显著的:
当能够拒绝零假设时,认为检验是显著的。
检验(统计量)是统计不显著的:
当不能拒绝零假设时,就说不是统计显著的。
单边检验单边检验当备择假设为单边假设时,则检验这个假设为单边假设。
如在P/E以利中,H0:
x=13,H1:
x0x=0x0x=0x0t检验小结最后一列给出了t临界值,第一个下标表示显著水平,d.t代表自由度。
4.44.4显著性检验和显著性检验和FF显著性检验显著性检验1.检验在分布部分提到,如果S表示来自方差为的正态总体,容量为n的随机样本的样本方差,那么,2)1(22)1(nSn即样本方差与总体方差的比值与(n-1)的乘积服从自由度为(n-1)的分布。
如果已知样本容量n及样本方差S,总体方差未知,则根据分布可对未知的总体方差建立一个(1-)的置信区间,其机制与t检验类似。
在零假设H0下,给定一个具体的值,则可利用上述公式直接计算出的值,并根据分布表进行显著性检验。
例:
假定随机样本来自正态总体,样本容量为31,样本方差为12。
检验零假设:
真实的方差为9;备择假设:
真实的方差不等于9。
给定显著性水平=5%。
分析:
H0:
=9;H1:
9把相应的数字代入上述公式中,得:
=30(12/9)=40根据分布表,在自由度为30时,值为40的概率为0.10(10%)。
由于这个概率值大于5%的显著水平,所以不能拒绝零假设:
真实方差为9。
2.F2.F检验检验在讲F分布时,我们讨论过,如果X、Y是来自两正态总体的随机样本,自由度分别为m和n,则变量:
)1()()1()(2_222nYYmXXSSFiiYX服从自由度为(m-1)和(n-1)的F分布。
假定两正态总体同方差(H0:
x=y),用上式的F检验检验该零假设。
例:
两个班做同样的计量经济学测试。
其中,一班级共有学生100名,二班级共有学生150名。
老师从一班级随机抽取25个学生,从二班级随机抽取31个学生,观察得到两个班级学生考试平均分数的样本方差分别为100和132。
假设学生考试平均分数这一随机变量服从正态分布,检验假设:
这两个班级的分数平均值同方差。
(=1%)分析:
这两个随机样本来自两个正态总体,并且相互独立,则首先利用公式计算F值。
F=132/100=1.32它服从自由度为30、24的F分布。
根据F分布表,自由度为30、24,在1%的显著水平下,临界的F值为2.58。
由于计算的F值为1.32,小于2.58,故不能拒绝零假设:
两总体同方差。
统计检验的步骤:
统计检验的步骤:
第一步:
表述零假设和备择假设。
如:
H0:
x=13,H1:
x13。
第二步:
选择检验统计量(如,)。
第三步:
确定检验统计量的概率分布。
(如N(x,/n))第四步:
选择显著水平。
第五步:
选择置信区间法或显著检验法。
XX
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 推断 估计 假设检验