静态变截距面板数据模型分析.ppt
- 文档编号:18840264
- 上传时间:2024-01-09
- 格式:PPT
- 页数:33
- 大小:2.11MB
静态变截距面板数据模型分析.ppt
《静态变截距面板数据模型分析.ppt》由会员分享,可在线阅读,更多相关《静态变截距面板数据模型分析.ppt(33页珍藏版)》请在冰点文库上搜索。
静态变截距面板数据模型分析,主要内容,面板数据的优势和需要注意的问题面板数据模型分类和分析步骤静态变截距面板数据分析一维固定效应模型、二维固定效应模型、一维随机效应模型、二维随机效应模型、用固定效应模型还是随机效应模型,面板数据简介,与截面数据和时间序列数据相比,面板数据的优势:
缓解遗漏变量偏差,减少多重共线性。
1.可为研究者提供大量数据点,从而增加自由度并降低解释变量之间的共线性程度,因而可改进参数估计质量(一致性、准确性、有效性等)2.可让研究者分析无法仅用截面数据或时间序列数据分析的经济问题。
比如,分析生产成本问题,只利用截面数据,即选择同一截面上不同规模的企业数据作为样本观测值,可以分析成本与企业规模的关系,但是不能分析技术进步对成本的影响;只利用时间序列数据,即选择,面板数据简介,同一企业在不同时间上的数据作为样本观测值,可以分析成本与技术进步的关系,但是不能分析企业规模对成本的影响。
如果利用面板数据,则二者都可以进行分析。
3.能显著减少缺省变量(或不能观察到的变量)所带来的问题。
存在与解释变量相关的缺省变量,会引起用最小二乘法得到的解释变量的系数估计量有偏(见教材第5页),面板数据简介,wherexitandzitarek11andk21vectorsofexogenousvariables(外生变量);*,andare11,k11,andk21vectorsofconstantsrespectively;andtheerrortermuitisindependently,identicallydistributedoveriandt,withmeanzeroandvarianceu2.i表示截面个体。
t表示时间。
可以用最小二乘法估计吗?
可以。
因为系数对不同公司、不同年份都一样。
如果系数有下标则不可以。
面板数据简介,利用面板数据需要注意的问题:
1.异质性偏差(关注系数用不用加下标,不加下标认为相等)忽略个体效应或时间效应会导致参数异质性偏差,即本来不相等的参数(截距和斜率)被当作相等。
2.选择性偏差选择的样本不是随机样本。
调查样本要与研究对象相符。
面板数据模型分类,2种基本的面板数据模型截距随截面个体或时间变化,斜率不随截面个体和时间变化。
(a有下标,b没有下标)称为变截距模型,这是应用得最为广泛的面板数据模型。
如(2.2.2式)H1:
Regressionslopecoefficientsareidentical,andinterceptsarenot,Thatis,面板数据模型分类,截距和斜率随截面个体或时间变化,称为变系数模型。
a,b都有下标。
当b有下标时,a有没有下标都不重要。
注意,所有系数(截距和斜率)不能同时既随时间变化也随截面个体变化,因为这时观察值数比要估计的参数要少,没法估计出参数。
上述模型可以进一步细分为固定效应模型和随机效应模型,取决于截距和斜率被假设为固定还是随机。
通常不把b当成随机,一般只研究截距和误差项。
根据自变量是否包括滞后因变量,面板数据模型有静态和动态之分。
一般研究静态变截距模型,1.检验斜率和截距都不随截面个体和时间变化。
譬如原假设为17页H3.检验统计量为表达式2.2.14。
全模型就是有下标的模型,缩减模型就是没有下标i。
如果接受H3,则模型为2.2.4.,面板数据模型分析步骤,2.检验斜率不随截面个体和时间变化。
譬如原假设为17页H1.检验统计量为表达式2.2.15.如果接受原假设,则模型为2.2.2。
面板数据模型分析步骤,如果原假设不能被拒绝,就要进一步检验a是不是相等。
如果原假设被拒绝,则可以做也可以不做检验。
3.检验截距不随截面个体和时间变化。
譬如原假设为18页H4.given检验统计量为表达式2.2.16.如果接受原假设,则模型为2.2.4要注意的是,根据统计量F3,可能会得出拒绝H3的结论。
但根据统计量F1和F4,会得出不能拒绝原假设的结论。
第一个检验和二、三个检验可能得出相反的结论。
因为每个检验都有犯错的概率,不同于数学中的传递性。
面板数据模型分析步骤,在b都相等的前提下检验a的。
这时全模型中b没有下标,a有下标。
缩减模型都没有下标。
一、一维固定效应模型模型包括截面固定效应或时间固定效应,见30页表达式3.2.1或3.2.10。
Where,isa1Kvectorofconstantsandi*isa11scalarconstantrepresentingtheeffectsofthosevariablespeculiartotheithindividualinmoreorlessthesamefashionovertime.Theerrorterm,uit,representstheeffectsoftheomittedvariablesthatarepeculiartoboththeindividualunitsandtimeperiods.,静态变截距面板数据模型,一、一维固定效应模型Itshouldbenotedthatanalternativeandequivalentformulationof(3.2.1)istointroducea“meanintercept,”,sothat模型假定:
误差项与解释变量不相关;独立同分布;均值为0;同方差。
固定效应被当做参数估计。
表达式3.2.1也称为协方差分析模型,静态变截距面板数据模型,一、一维固定效应模型OLS回归分析、方差分析、协方差分析有何区别。
自变量:
ols回归不可以包括分类变量,方差分析可以包括。
协方差分析既可以包括数量变量,也可以包括分类变量。
构建截距效应或斜率效应的虚拟变量。
用OLS方法估计模型3.2.2,得到的参数估计量是最佳线性无偏估计量(BLUE),又称为最小平方虚拟变量估计量(LSDV),因为模型3.2.2中固定效应对应的变量为虚拟变量形式,但在斜率估计量的计算过程中并未用到虚拟变量。
斜率估计量又称为组内估计量。
注意差分方法,静态变截距面板数据模型,静态变截距面板数据模型,一、一维固定效应模型WhereandITdenotestheTTidentitymatrix.,一、一维固定效应模型另一种参数估计思路是:
先算出每个截面个体在时间维上的均值(针对包含截面固定效应的模型)或所有截面个体在每个时间的均值(针对包含时间固定效应的模型),然后用原始数据减去其截面均值或时间均值(demean),这样可以把固定效应项去掉,见模型3.2.7,对新得到的数据用OLS方法,得到的估计量称为协方差估计量。
减均值体现了缓解多重共线性。
考虑固定效应ai体现了减少遗漏变量偏差。
静态变截距面板数据模型,一、一维固定效应模型注意,斜率估计量当截面个体数或时间趋向于无穷时是一致估计量,但截距估计量(3.2.4)只有当时间趋向于无穷时才是一致估计量。
因为截面个体数增加不会增加已有截面个体截距项的信息,增加的只是新增截面个体截距项的信息。
where,静态变截距面板数据模型,二、二维固定效应模型模型见Panel过程1366页,既包括截面固定效应也包括时间固定效应。
模型假定:
误差项与解释变量不相关;独立同分布;均值为0;同方差。
固定效应被当做参数估计,静态变截距面板数据模型,二、二维固定效应模型也有两种估计思路,与一维固定效应模型类似与一维不同:
在demean的估计思路中,原始数据要同时减去截面均值和时间均值并加上所有观察值的均值,见1367页,这样可把截面固定效应和时间固定效应都去掉。
静态变截距面板数据模型,三、一维随机效应模型模型形式与一维固定效应模型相同,但截面个体效应或时间效应不再被当做参数估计,而是当做随机变量,是随机效应。
模型假定:
误差项与解释变量不相关,独立同分布,均值为0,同方差。
随机效应也是如此。
并且随机效应与误差项不相关,都无序列自相关。
随机效应本身独立。
截面效应或时间效应与解释变量不相关(固定与随机最大的不同)估计思路:
以包括截面随机效应的模型为例截面随机效应的存在,使同一截面个体在不同时间维度的残差之间存在相关性。
可采用协方差估计方法,思路与一维固定效应模型相同,也是要把随机效应去掉后用OLS回归。
得到的,静态变截距面板数据模型,三、一维随机效应模型参数估计量同一维固定效应模型。
这时斜率估计量虽然是无偏一致估计量,但有限样本里不再是BLUE,不满足误差有效性。
用广义最小平方法GLS可得到BLUE。
斜率估计量见(3.3.12),是组间估计量和组内估计量的加权平均。
静态变截距面板数据模型,组间估计量,组内估计量,三、一维随机效应模型whereTheestimatoriscalledthebetween-groupestimatorbecauseitignoresvariationwithinthegroup.,静态变截距面板数据模型,取决于误差方差、随机效应方差之间的表达式,三、一维随机效应模型通常误差项和随机效应的方差未知,因此斜率估计量(3.3.12)不能算出来。
这时需采用两阶段GLS方法来估计斜率。
第一阶段用某些方法把误差项和随机效应的方差估计出来,第二阶段再算斜率估计量。
SAS9.3提供了4种方法用来估计误差项和随机效应的方差,见1372页。
FullerandBattesesMethodWansbeekandKapteynsMethodWallaceandHussainsMethodNerlovesMethod,静态变截距面板数据模型,静态变截距面板数据模型,四、二维随机效应模型模型形式与二维固定效应模型相同,但截面个体效应或时间效应不再被当做参数估计,而是当做随机变量,是随机效应。
模型假定:
误差项与解释变量不相关,独立同分布,均值为0,同方差。
随机效应也是如此。
并且随机效应与误差项不相关,都无序列自相关,截面随机效应与时间随机效应不相关。
截面效应和时间效应与解释变量不相关。
见教材34页(3.3.1),静态变截距面板数据模型,四、二维随机效应模型WhereandBreusch和Pagan(1980)方法可检验是否有一维随机效应存在,称为BP检验。
Greene(2000)形成了检验二维随机效应的BP方法,称为BP2检验。
原假设是没有随机效应的存在。
随机效应模型与OLS方法作对比。
这两个检验只适用于平衡面板数据。
对于非平衡面板数据,这两个检验统计量无效。
非平衡:
每一个截面个体在一个时间维度上至少有两个观测值,但是有缺失值。
静态变截距面板数据模型,四、二维随机效应模型估计思路同一维随机效应模型,用两阶段GLS方法来估计。
第一阶段用某些方法把误差项、截面随机效应和时间随机效应的方差估计出来,第二阶段再估计斜率。
SAS9.3提供了4种估计方法,见1375页。
静态变截距面板数据模型,五、用固定效应模型还是随机效应模型当T很大时,截面效应被当做固定还是随机并不重要,因为斜率的LSDV估计量3.2.8与GLS估计量3.3.12变成相同的估计量。
当T有限,N很大时,必须区分随机效应还是固定效应。
静态变截距面板数据模型,五、用固定效应模型还是随机效应模型Mundlak(1978)认为没有必要区分固定效应模型和随机效应模型,见45页,因为他推导出斜率的GLS估计量等于协方差估计量。
但作者认为其不对。
固定效应模型与随机效应模型的主要区别是,随机效应模型假设截面效应和时间效应与解释变量不相关,而固定效应模型不考虑其是否相关。
静态变截距面板数据模型,五、用固定效应模型还是随机效应模型固定效应模型由于要估计固定效应会损失自由度,所以会有估计质量损失。
当T有限时,截面固定效应的估计量不是一致估计量,静态变截距面板数据模型,五、用固定效应模型还是随机效应模型用固定效应模型还是随机效应模型?
当截面效应和时间效应与解释变量不相关,用随机效应模型,否则用固定效应模型。
可以用Hausman方法检验,见50页。
IfthealternativehypothesisH1holds,weusethefixed-effectsmodel.IfthenullhypothesisH0holds,weusetherandom-effectsmodel.如果原假设不能被拒绝,则使用随机效应模型。
被拒绝则采用固定效应模型。
静态变截距面板数据模型,五、用固定效应模型还是随机效应模型当收集的数据是总体数据,或仅对现有模型中的效应做推断,应该考虑固定效应模型。
当收集的数据是来自总体的一个样本,要根据模型中的效应对总体做推断,应考虑随机效应模型。
当认为模型中的效应来自不同总体,用固定效应模型更合适。
模型中有不随时间变化但随截面个体变化的自变量或不随截面个体变化但随时间变化的自变量,不适合采用固定效应模型,因为这些变量与截面效应或时间效应完全相关,无法估计出这些变量的系数。
比如性别,在时间序列上不变,这样会被demean掉。
静态变截距面板数据模型,六、存在异方差、序列相关、截面相关如何处理有HAC估计量、HCCME估计量,或用Parks方法等,静态变截距面板数据模型,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 静态 变截距 面板 数据模型 分析