第八讲异方差性.pptx
- 文档编号:18723732
- 上传时间:2023-10-19
- 格式:PPTX
- 页数:50
- 大小:683.74KB
第八讲异方差性.pptx
《第八讲异方差性.pptx》由会员分享,可在线阅读,更多相关《第八讲异方差性.pptx(50页珍藏版)》请在冰点文库上搜索。
第八讲异方差性(Heteroskedasticity),一、异方差性对于OLS估计的影响二、稳健性检验三、对是否存在异方差的检验四、加权最小二乘估计,第一节异方差性对OLS估计的影响,一、异方差性,回忆:
经典线性模型(CLM)的假定:
同方差性(homoscedasticity):
误差项的条件方差相同异方差性(heteroscedasticity):
误差项的条件方差不相同,同方差性:
X,Y,概率密度,X:
受教育年限Y:
工资,异方差性:
X,Y,概率密度,X:
受教育年限Y:
工资,异方差性:
X,Y,概率密度,X:
时间Y:
打字正确率,异方差在散点图中的反应,递增的异方差,同方差,递减的异方差,无规律的异方差,二、异方差的来源,1.截面数据,例如,前面估计工资水平与受教育程度之间的关系时,较大的误差项可能存在于受教育程度较高的群体中,而小误差则与较低的受教育程度有关。
2.省略变量,例如,在估计某种商品价格对该种商品需求量的影响时,省略了消费者的收入水平。
3.数据的分组处理,例如,在绝对收入消费理论中,将居民按照收入水平不同分为不同的组,不同组的观测值数目不相同。
二、异方差性对OLS估计的影响,1.回归系数的OLS估计量仍然是无偏的、一致的,并且不影响R2和调整的R2,对多元回归模型:
样本回归方程为:
写成矩阵形式时,待估参数可以表示为:
(见第3讲课件),因此有:
将多元回归模型:
写成矩阵形式时:
其中:
在存在异方差的条件下:
其中,为对角线上元素各不相同的对角矩阵。
2.OLS估计量不再是有效的和渐近有效的,由此可见,在存在异方差的条件下,会夸大或缩小真实的方差,使得的有效性得不到保障。
3.t统计量不服从t分布,F统计量也不服从F分布,从而无法进行假设检验和区间估计,也无法进行区间预测,t统计量:
当误差项同方差时,的标准误是一个确定的值,但当误差项异方差时,随xi的变化不断变化,不再确定,所以,的t统计量和置信区间都是变动的,预测值难以稳定。
因此,无法进行t检验或者F检验,也无法进行区间预测。
两种方法:
其一,异方差性不影响OLS估计量的无偏性和一致性,只影响OLS估计量的方差估计,因此,如果能找到一种方法(不同于OLS估计)正确地估计出OLS估计量的方差,那么同样可以进行假设检验。
这种方法称为稳健性检验其二,首先检验是否存在异方差,如果不存在,可以使用OLS估计;如果存在异方差,使用另外一种估计方法(即加权最小二乘估计,WLS),三、如何解决可能存在的异方差,第二节稳健性检验,一、稳健性t检验,异方差性不影响OLS估计量的无偏性和一致性,只是影响OLS估计量的方差估计,从而影响t检验和F检验。
因此,如果能找到一种方法正确地估计出OLS估计量的方差,那么同样可以进行t检验和F检验。
对于大样本数据,在假定MLR.1-4下,可以通过一定的方法得到OLS估计量的方差的正确估计量,并进而得到OLS估计量的标准误。
通过这种方法得到的标准误称为异方差-稳健性标准误(heteroskedasticity-robuststandarderror),或简称稳健性标准误(robuststandarderror)。
一旦得到了稳健性标准误,就可以在此基础上构造稳健性t统计量(robusttstatistics),进而进行稳健性t检验。
也就是说,在大样本条件下,可以通过某种方法得到OLS估计量的标准误,无论误差项是否同方差,这种方法都可以得到有效的估计量。
值得注意的是,这种方法并不能检测出是否存在异方差,更无法知道存在何种形式的异方差。
例:
工资方程(P264,例8.1),从结果来看,稳健标准误通常比常规标准误更大,但有时候也可能比常规标准误小;而且在稳健标准误的条件下,各变量的统计显著性并没有显著地变化。
当两种标准误差异较大时,统计推断的结论可能出现较大差异(例8.4,P270,HPRICE.RAW),OLS回归的结果:
稳健性检验的结果:
为何要考虑常规标准误差?
如果稳健标准误差无论异方差存在与否都是适用的,为什么我们还需要常规标准误差?
我们应当注意到,稳健标准误差的适用性依赖于大样本(Robuststandarderrorsarejustifiedonlywhenthesamplesizeislarge)。
如果是小样本同方差情形,那么常规的t统计量精确地服从t分布,在这种情况下使用稳健标准误差就可能导致推断错误。
在大样本情形下,特别是应用截面数据的时候,我们推荐报告稳健标准误差(或同时报告常规的标准误差)。
二、稳健性F检验,稳健F统计量也称为Wald统计量,例:
学习成绩的决定(P265,例8.2),例:
新生儿体重的决定(BWGHT.DAT),常规回归(无约束的回归):
由于“母亲的受教育程度”和“家庭收入的对数”的系数都不显著,有必要考察他们是否联合显著。
常规回归(约束的回归):
根据无约束条件的回归和带约束条件的回归结果,可以计算得到F统计量为F=1.31,相应的p值为0.2703,据此我们无法拒绝原假设,也就是说,“母亲的受教育程度”和“家庭收入的对数”两个变量的系数可能同时为零。
但如果误差项存在异方差,这样的检验便不合理。
稳健回归:
在稳健回归条件下,关于“母亲的受教育程度”和“家庭收入的对数”两个变量的系数可能同时为零的稳健性F统计量的值为1.39,相应的p值为0.2496,与常规回归条件下的F统计量相差不大,同样无法拒绝原假设。
因此,无论在什么情况下,都无法拒绝原假设。
三、稳健性LM检验,有的软件无法计算稳健的F统计量,我们可以采用另一种相对简单的方法对多重排除性约束进行联合显著性的稳健性检验。
稳健性LM检验的检验步骤:
在约束模型下进行OLS,保存残差将每一个排除变量对全部未排除变量进行回归(q个回归),并将每一组残差1,2,q保存将1向量对1,2,q进行无截矩回归。
LM定义为nSSR1,其中SSR1为最后一步回归的残差平方和,例8.3:
拘捕次数的决定(CRIME1.DAT)P178,narr86=0+1pcnv+2avgsen+3tottime+4ptime86+5qemp86+u,pcnv:
以前被拘捕后被定罪的次数;avgsen:
过去定罪后被判刑的平均时间长度;ptime86:
1986年以前此人年满18岁之后被送进监狱的总时间;qemp86:
此人在1986年合法就业的季度数。
H0:
2=3=0H1:
2和3至少有一个不为0,(i)对约束模型进行回归,得到残差:
常规的LM检验:
(ii)用对无约束模型的所有解释变量进行回归,得到Ru2,可知Ru2=0.0015,进而有:
LM=nRu2=27250.0015=4.09Df=2、显著性水平为5%的2分布临界值为5.99显然:
LM5.99,因此不能拒绝H0,第一步:
将被排除的2个变量对所有未排除变量回归,保存残差,用r1和r2表示,稳健的LM检验:
regavgsenpcnvptime86qemp86predictr1,resid,regtottimepcnvptime86qemp86predictr2,resid,第二步:
分别求出与r1和r2的乘积,分别用x1和x2表示genx1=ubar*r1genx2=ubar*r2,第三步:
用1对x1和x2做不包括截距项的回归:
geniota=1regiotax1x2,noconstant,从而可得到稳健的LM统计量为:
2725-2722.78631=2.21369查自由度为2的2分布5%的显著性水平下临界值为5.99.显然:
LM5.99。
因此不能拒绝零假设。
注意:
稳健回归和常规回归的LM检验结果一致。
第三节对是否存在异方差的检验,一、为什么要对是否存在异方差进行检验,不管模型是否满足同方差假定,估计稳健性标准误和进行稳健性检验是更为稳妥的方法,因此这一方法越来越普遍。
那么,为什么还要对是否存在异方差性进行检验?
对于小样本数据,稳健性t统计量并不十分接近t分布,应使用通常的t检验。
此时,应首先对是否存在异方差性进行检验。
如果不存在异方差性,就可以使用通常的t检验;如果存在异方差性,就应使用不同于OLS的估计方法。
只要存在异方差,OLS估计量就不是最优线性无偏估计量。
因此最好使用比OLS更好的估计方法,二、B-P检验(Breusch-Pagantest),例:
住房价格方程中的异方差性(P270,例8.4),住房价格采用水平形式:
第一步:
对上述模型回归,并保存残差,第二步:
计算残差平方,并将残差平方对所有自变量回归,第三步:
根据回归的Ru2,计算F统计量或者LM统计量,相应的p值为0.002,因此可以拒绝原假设,认为原模型中误差项存在异方差。
相应的p值约为0.0028,因此可以拒绝原假设,认为原模型中误差项存在异方差。
住房价格采用对数形式:
同样采取前面的方法和步骤,可得:
由此可见,采用对数形式之后,能够在很大程度上消除原模型中误差项存在异方差的现象,从而使得OLS估计的结果更好。
三、怀特检验(Whitetest),一般怀特检验,特殊怀特检验:
节省自由度的怀特检验,例:
住房价格方程中的怀特检验(P272,例8.5),一般怀特检验,第一步:
对上述模型回归,并保存残差,第二步:
计算残差平方,并将残差平方对所有自变量及其平方项和交互项回归,第三步:
根据回归的Ru2,计算F统计量或者LM统计量,相应的p值为0.4053,因此无法拒绝原假设,不能认为原模型中误差项存在异方差。
,因此无法拒绝原假设,不能认为原模型中误差项存在异方差。
特殊怀特检验,第一步:
对原模型回归,保存残差,并计算残差平方,第二步:
计算被解释变量的拟合值以及拟合值的平方,第三步:
将残差平方对拟合值和拟合值的平方项回归,第四步:
根据回归的Ru2,计算F统计量或者LM统计量,相应的p值为0.4053,因此无法拒绝原假设,不能认为原模型中误差项存在异方差。
,因此无法拒绝原假设,不能认为原模型中误差项存在异方差。
四、对异方差检验的小结,即便真实的情况并无异方差,异方差检验可能由于重要变量的遗漏而错误的拒绝零假设,错误地认为模型存在异方差。
检验的结果如果表明模型中存在异方差,可能的确存在异方差,也可能意味着模型设定错误,因此,如果可能的话,应当在异方差检验之前进行模型设定检验。
第四节加权最小二乘估计,如果发现存在异方差,可以采取两种方式解决:
对于大样本数据,可使用稳健性标准误和稳健性检验探究异方差的形式,通过适当的变换得到最优线性无偏估计量,将原模型转化为具有同方差的模型,这就是加权最小二乘估计。
在这些情况中,加权最小二乘法比OLS更为有效。
对应的t和F统计量具有t和F分布。
一、异方差形式已知,二、异方差形式未知,在一般情况下,我们并不知道异方差的具体形式,需要对异方差的函数形式做出估计,然后再进行加权最小二乘估计,这种方法属于可行的广义最小二乘估计(FeasibleGeneralizedLeastSquare,FGLS)或估计的广义最小二乘估计(EstimatedGeneralizedLeastSquare,EGLS)的一种。
可行的广义最小二乘估计(FGLS),例:
对香烟的需求(P281,例8.7),若知道异方差的形式,应直接用WLS而非FGLS,因为FGLS估计量是有偏的。
但FGLS估计量是一致的和渐近有效的,因此在大样本情况下,不论是否知道异方差的形式,都可以使用FGLS,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 方差