第4章多重共线性.docx
- 文档编号:17614436
- 上传时间:2023-07-27
- 格式:DOCX
- 页数:10
- 大小:158.68KB
第4章多重共线性.docx
《第4章多重共线性.docx》由会员分享,可在线阅读,更多相关《第4章多重共线性.docx(10页珍藏版)》请在冰点文库上搜索。
第4章多重共线性
计量经济学课程教案
授课题目(教学章、节或主题):
第4章多重共线性
授课时间
安排
第8、9周共4课时
教学器材与工具
多媒体
授课类型
(请打√)
理论课√讨论课□实验课□习题课□双语课程□其他□
教学目的、要求(分掌握、熟悉、了解三个层次):
1、熟悉多重共线性的实质和产生的原因;
2、了解多重共线性产生的后果;
3、熟悉多重共线性的检测方法;
4、掌握多重共线性的处置方法。
教学重点及难点:
掌握多重共线性的检测方法、处置方法
教学基本内容
一、多重共线性的概念
二、实际经济问题中的多重共线性
三、多重共线性的后果
四、多重共线性的检验
五、克服多重共线性的方法
六、案例
*七、分部回归与多重共线性
教学过程设计:
一、引入
二、讲授
三、小结
教学方法及手段(请打√):
讲授√、讨论□、多媒体讲解√、模型、实物讲解□、挂图讲解□、音像讲解□等。
作业、讨论题、思考题:
1、多重共线性的实质是什么为什么会出现多重共线性
参考资料(含参考书、文献等):
《计量经济学》,(美)著,林少宫译;《计量经济学》,李子奈编著;《经济计量学精要》,(美)著,张寿等译。
课后小结:
本章我们讨论多重共线性问题。
在实际经济问题中的常常发生多重共线性问题,多重共线性的会给模型的估计带来严重后果;多重共线性的检验方法主要有方差扩大因子法、逐步回归检测法、特征值分析法等,克服多重共线性的方法主要有剔除变量法、模型变形法、逐步回归法等。
第四章 多重共线性
§什么是多重共线性
一、多重共线性的概念
对于模型
Yi=1+2X2i+3X3i++kXki+i
i=1,2,…,n
其基本假设之一是解释变量是互相独立的。
如果存在
c1X1i+c2X2i+…+ckXki=0i=1,2,…,n
其中:
ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。
在矩阵表示的线性回归模型
Y=X+
中,完全共线性指:
秩(X) 二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三个方面: (1)经济变量相关的共同趋势 时间序列样本: 经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据: 生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。 (2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。 例如,消费=f(当期收入,前期收入) 显然,两期收入间有较强的线性相关性。 (3)样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本: 简单线性模型,往往存在多重共线性。 截面数据样本: 问题不那么严重,但多重共线性仍然是存在的。 §多重共线性产生的后果 一、完全共线性下参数估计量不存在 的OLS估计量为: 如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。 二、近似共线性下OLS估计量非有效 近似共线性下,可以得到OLS参数估计量, 但参数估计量方差的表达式为 由于|X’X|0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。 多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(VarianceInflationFactor,VIF) 三、参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如X2=X1, 这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象: 例如1本来应该是正的,结果恰是负的。 四、变量的显著性检验失去意义 五、模型的预测功能失效 变大的方差容易使区间预测的“区间”变大,使预测失去意义。 §多重共线性的检验 多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法: 如判定系数检验法、逐步回归检验法等。 多重共线性检验的任务是: (1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之间存在共线性。 一、检验多重共线性是否存在 (1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。 (2)对多个解释变量的模型,采用综合统计检验法 若在OLS法下: R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。 二、判明存在多重共线性的范围 如果存在多重共线性,需进一步确定究竟由哪些变量引起。 (1)判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。 如果某一种回归: Xji=1X1i+2X2i+LXLi 的判定系数较大,说明Xj与其他X间存在共线性。 具体可进一步对上述回归方程作F检验。 构造如下F统计量 式中: Rj•2为第j个解释变量对其他解释变量的回归方程的决定系数, 若存在较强的共线性,则Rj•2较大且接近于1,这时(1-Rj•2)较小,从而Fj的值较大。 因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。 另一等价的检验是: 在模型中排除某一个解释变量Xj,估计模型; 如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。 (2)逐步回归法 以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。 §多重共线性的补救措施 如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。 一、第一类方法: 排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除出去。 以逐步回归法得到最广泛的应用。 注意: 这时,剩余解释变量参数的经济含义和数值都发生了变化。 二、第二类方法: 差分法 时间序列数据、线性模型: 将原模型变换为差分模型: Yi=1X1i+2X2i++kXki+i 可以有效地消除原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。 三、第三类方法: 减小参数估计量的方差 多重共线性的主要后果是参数估计量具有较大的方差,所以 采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。 例如: ①增加样本容量,可使参数估计量的方差减小。 *②岭回归法(RidgeRegression) 70年代发展的岭回归法,以引入偏误为代价减小参数估计量的方差,受到人们的重视。 具体方法是: 引入矩阵D,使参数估计量为 其中矩阵D一般选择为主对角阵,即 D=aI a为大于0的常数。 显然,与未含D的参数B的估计量相比,(*)式的估计量有较小的方差。 §案例——中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3);农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食生产函数: Y=0+1X1+2X2+3X3+4X4+4X5+ 一、用OLS法估计上述模型: R2接近于1; 给定=5%,得F临界值(5,12)= F=>, 故认上述粮食生产的总体线性关系显著成立。 但X4、X5的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。 二、检验简单相关系数 发现: X1与X4间存在高度相关性。 三、找出最简单的回归形式 可见,应选第1个式子为初始的回归模型。 四、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。 五、结论 回归方程以Y=f(X1,X2,X3)为最优: 思考题 1、多重共线性的实质是什么为什么会出现多重共线性 2、多重共线性对回归参数的估计有何影响 3、多重共线性的典型表现是什么判断多重共线性的方法有哪些 4、针对多重共线性的不同情形,能采取的补救措施有哪些 5、具有多重共线性的回归方程能否用来进行预测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重 线性