换一换

冰点文库 > 资源分类 > PDF文档下载

预览

经典线性回归模型.pdf

资源ID：3439520 资源大小：461.62KB 全文页数：17页
资源格式： PDF 下载积分：10金币

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要10金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

经典线性回归模型.pdf

1、2 经典经典线性回归模型线性回归模型2.1 概念与记号概念与记号1线性回归模型是用来描述一个特定变量y与其它一些变量与其它一些变量x1，xp p之间的关系之间的关系。2 称特定变量y为因变量因变量（dependentvariable）、）、被解释变量被解释变量（explainedvariable）、）、响应变量响应变量（responsevariable）、）、被预测变量被预测变量（predictedvariable）、）、回归子回归子（regressand）。3称与特定变量相关的其它一些变量x1，xp为自变量自变量（independentvariable）、）、解释变量解释变量（expl

2、anatoryvariable）、）、控制变量（控制变量（controlvariable）、）、预测变量预测变量（predictorvariable）、）、回归量回归量（regressor）、）、协变量（协变量（covariate）。）。4假定我们观测到上述这些变量的n组值：()ipiixxy,1L(i=1，n)。称称这这n组值为样本样本（sample）或或数据数据（data）。2.2 经典线性回归模型的假定经典线性回归模型的假定假定假定2.1（线性线性性性(linearity)）iippiixxy +=L110(i=1，n)。（2.1）称方程（2.1）为因变量y对自变量x1，xp的

3、线性回归方程线性回归方程（linearregressionequation），其中()p，kk,10L=是待估的未知未知参数参数（unknownparameters），()nii,1L=是满足一定限制条件的无法观测的无法观测的误差项误差项（unobservederror term）。称自变量的函数ippixx +L110为回归函数（regressionfunction）或简称为回归回归（regression）。称0 为回归的截距截距(ntercept)，称()pkk,1L=为自变量的回归系数回归系数（regressioncoefficients）。某个自变量的回归系数表示在其它条件保持不变的

4、情况下，这个自变量变化一个单位对因变量的影响程度，这个影响是在排除其它自变量的影响后，这个自变量对因变量的偏效应。下面引入线性回归方程的矩阵表示。记()Tp ,10L=（未知系数向量（unknowncoefficientvector）()Tipiixxx,1L=，()Tipiixxx,11L=，则iTiixy +=(i=1，n)。又记X=nppnxxxxM L L L M M111111，Y=nyyM1，=n M1，则 +=XY假定假定2.2（严格外生性（严格外生性(strictlyexogeneity)）()()npnpinixxxxExxE,|,|11111L L L L =0(i=1，

5、n)。严格外生性的含义严格外生性的含义误差项的无条件期望为零误差项的无条件期望为零()0=iE(i=1，n)。正交条件正交条件（orthogonalityconditions）()()()01=ijpijijxExExE M(i=1，nj=1，n)。不相关条件不相关条件（zerocorrelationconditions）()0,cov=jkix(对所有i，j，k)。由以上严格外生性的含义可知，如果在时间序列数据中存在的滞后效应滞后效应（laggedeffect）和反馈效应反馈效应（feetback effect），那么严格外生性条件就不成立。因而，在在严格外生性假定下推出的性质就不能用于

6、这类时间序列数据。滞后效应是指自变量历史值对因变量当前值的影响，反馈效应是指因变量当前值对自变量未来值的影响。假定假定2.3（无多重共线性（无多重共线性(nomulticollinearity)）n n(p+1)(p+1)矩阵X的秩为(p+1)(p+1)的概率为1。假定假定2.4（球面误差方差（球面误差方差(sphericalerrorvariance)）()nnIxxVar21,|=L 条件同方差条件同方差（conditionalhomoskedasticity）()0,|212 =nixxEL(i=1，n)。（误差方差（误差方差）误差项误差项不相关不相关(nocorrelationbe

7、tweenerror term)()0,|1=njixxEL (对所有ij)在经典线性回归模型的四个假定中，假定2.1和假定2.3是必不可少的，但假定2.2和假定2.4中的严格外生性、条件同方差和误差项不相关以后可以适当放宽。2.3 随机样本的经典线性回归模型随机样本的经典线性回归模型若样本()Tiixy,(i=1，n)为IID，那么假定2.2和假定2.4可简化为假定假定2.2:()0|=iixE(i=1，n)假定假定2.4：()0|22 =iixE(i=1，n)2.4 确定性自变量的经典线性回归模型确定性自变量的经典线性回归模型若更进一步假定自变量x1，xp为确定性的变量，那么假定2.

8、2和假定2.4可进一步简化为假定假定2.2：()0=iE(i=1，n)假定假定2.4：()nIVar2 =2.5 最小二乘估计量及其代数性质最小二乘估计量及其代数性质虽然我们无法直接观测到误差项，但对未知系数向量的一个假想值假想值（hypotheticalvalue），容易计算出ippiixxy 110 L 称这个量为第i次观测的残差残差（residual），并且称使残差残差平方和平方和（residual sumofsquares）()()=niippiixxyQ12110 L=()()XYXYT 达到最小的假想值：为未知系数向量的普通最小二乘估计量普通最小二乘估计量（ordinaryl

9、eastsquaresestimators），简记为OLS估计量估计量。下面介绍OLS估计量的一些代数性质。一阶条件一阶条件（firstorderconditions）()0=XbYXT（正规方程正规方程（normalequations）的的OLS估计量估计量：在假定2.3成立时()=niiiniTiiTTyxnxxnYXXXb111111估计量的抽样误差估计量的抽样误差（samplingerror）：()TTXXXb1 =第i次观测的拟合值拟合值（fitted value）：bxyTii=拟合值向量拟合值向量（vectoroffitted value）：()HYYXXXXXbYTT =1投

10、影矩阵投影矩阵（projectionmatrix）：()TTXXXXH （对称幂等，秩为p+1，HX=X）第i次观测的OLS残差残差（OLSresidual）：iiTiiiyybxye =()minargQb=残差向量残差向量（vectorofOLSresiduals）：e=YXb=YY=(IH)YMY M=零化子零化子（annihilator）：M=InH（对称幂等，秩为np1，MX=0）一阶条件一阶条件：0=eXT，即011=niiiexn（()0=iixE ）OLS估计的几何意义估计的几何意义：eYeXbY+=+=L(X)残差平方和残差平方和（residualssumofsquares）

11、RSS=MMYYeeTTT=，(其自由度为np1)2的的OLS估计量估计量RMSpnRSSs =12（残（残差差均方均方，residualmeansquare）回归（回归（方程方程）标准误）标准误（standarderroroftheregression(equation)）1 =pnRSSs(残差标准误残差标准误，residualstandarderror)平方和分解公式平方和分解公式当回归方程包含常数项时，可以证明称这个等式为平方和分解公式平方和分解公式。记YeYeeYYYYTTT+=()()=+=niiniiniieyyyy121212()YnIYyySSTTTnii =112（称为

12、总平方和总平方和，其自由度为n1）(其中，()T1,1L=表示每个元素均为1的n维向量)()RSSSSTyySSniireg =12（称为回归平方和，回归平方和，其自由度为p）则平方和分解公式又可写成：，(n1)=p+(np1)。平方和分解公式将总平方和分解为回归平方和与残差平方和两部分。总平方和表示样本中因变量的总变异，回归平方和表示总变异中能够解释的部分，因此又称为解释平方和解释平方和，回归平方和是由样本中自变量的变异产生的，回归平方和可表示回归的效应。残差平方和表示总变异中不能解释的部分，残差平方和是由不可观测的误差的波动产生的。决定系数决定系数（coefficientofdet

13、ermination,Rsquare）SSTRSSR =12，当回归方程包含常数项时，由平方和分解公式有102 R。当回归方程不包含常数项时，平方和分解公式不再成立，且有可能会出现，即RSSSST ，从而使R2变成负数。因此决定系数只能用于包含常数项的回归。由平方和分解公式可知，因变量的变异由解释变量的变异和误差的变异两部分组成。决定系数R2度量了由解释变量变异（回归函数）决定决定的因变量变异的比例。或者说决定系数R2度量了解释变量（回归函数）能够解释的因变量变异的比例。复相关系数复相关系数(multiplecorrelationcoefficient，multipleR)()()()()

14、=niiniiniiiyyyyyyyyYYcorrSSTRSSR12121),(1()=bloodcor(blood)X1 X2 YX11.0000000 0.70028310.9064018X2 0.70028311.0000000 0.3827729Y0.9064018 0.38277291.0000000plot(blood)lm.sollm.sol$coefficients(Intercept)X1X262.96335912.13655810.4002162lm.sol$residuals123 4 5 6 70.5741329 0.4639664 3.7166848 0.690828

15、1 0.8312185 4.0403788 2.77680858 9 10 11 12 130.8355416 2.6527288 0.5047730 3.7569456 1.0183102 4.3274082lm.sol$fitted.values123 4 5 678119.4259 140.5360 127.7167 125.3092 117.8312 129.0404 120.2232 125.8355另外，还可通过一些函数获取更多线性拟合模型的信息。这些函数有summary()计算线性拟合模型的基本统计量，返回的是一个列表。anova()计算单个或多个线性拟合模型的方差分析表。coe

16、f()提取系数向量的估计值。resid()提取残差向量。fitted()提取拟合值向量。vcov()提取的OLS估计量条件方差阵的估计。deviance()计算残差平方和。formula()提取模型公式。summary()函数的主要用法为summary(object,correlation=FALSE)其返回的列表中的常用统计量有residuals线性拟合模型的残差向量。coefficients关于系数向量估计的(p+1)4矩阵。sigma误差标准差的估计值（回归标准误，残差标准误）。r.squared决定系数。adj.r.squared 修正决定系数。fstatistic回归方程显著性检验的

17、F统计量、分子自由度和分母自由度。cov.unscaled 未乘s2的的OLS估计量的条件方差阵的估计，即()1 XXT。correlation如果correlation=TRUE，的OLS估计量的条件相关系数阵的估计。(out=summary(lm.sol)Call:lm(formula=YX1+X2,data=blood)Residuals:Min 1QMedian 3Q Max4.04041.01830.46400.6908 4.3274Coefficients:EstimateStd.ErrortvaluePr(|t|)(Intercept)62.9633616.999763.7040

18、.004083*X12.13656 0.1753412.1852.53e07*X2 0.40022 0.083214.8100.000713*Signif.codes:0*0.001*0.01*0.05.0.11Residualstandarderror:2.854on10degreesoffreedomMultipleRsquared:0.946,Adjusted Rsquared:0.935Fstatistic:87.84on2and10DF,pvalue:4.531e07 out$sigma 1 2.853596 out$r.squared 1 0.9461441 out$adj.r.s

19、quared 1 0.935373 out$fstatistic value numdf dendf 87.84038 2.00000 10.00000910111213134.6527 122.4952 128.2431 156.0183 142.6726lm.sol$df.residual110anova()函数的主要用法为 anova(object,.)如果只指定一个对象，则返回那个线性拟合模型的方差分析表。如果指定多个对象，那么返回多个线性拟合模型比较的方差分析表，特别适用于嵌套嵌套模型模型的 F 检验（Wald 检验，似然比检验），一般将简单的模型排在前面，复杂的模型排在后面。ano

20、va(lm.sol)AnalysisofVarianceTableResponse:YDfSum SqMeanSqFvaluePr(F)X1 11242.211242.21152.5492.227e07*X2 1188.36188.3623.1320.0007133*Residuals1081.438.14Signif.codes:0*0.001*0.01*0.05.0.11anova(lm(YI(X1+X2),data=blood),lm.sol)AnalysisofVarianceTableModel1:YI(X1+X2)Model2:YX1+X2Res.Df RSSDfSumofSq F

21、Pr(F)1 111505.9521081.4311424.52174.941.164e07*Signif.codes:0*0.001*0.01*0.05.0.11coef(lm.sol)(Intercept)X1 X262.96335912.13655810.4002162resid(lm.sol)1 2 3 4 5 6 70.5741329 0.4639664 3.7166848 0.6908281 0.83121854.0403788 2.77680858 9 10 11 12 130.8355416 2.6527288 0.5047730 3.7569456 1.0183102 4.3

22、274082fitted(lm.sol)12345678119.4259 140.5360 127.7167 125.3092 117.8312 129.0404 120.2232 125.835591011 12 13134.6527 122.4952 128.2431 156.0183 142.6726vcov(lm.sol)out$correlation NULL out$cov.unscaled(Intercept)X1 X2(Intercept)35.4895683-0.362265125-0.1372261097 X1-0.9896500 1.0000000 0.7002831 X

23、2-0.7899354 0.7002831 1.0000000 out1=summary(lm.sol,correlation=TRUE)out1$correlation(Intercept)X1 X2(Intercept)1.0000000-0.9896500-0.7899354 X1-0.9896500 1.0000000 0.7002831 X2-0.7899354 0.7002831 1.0000000在R的附加程序包CAR（CompaniontoAppliedRegression）中的lhts()函数可用于检验线性约束rRH=:0。此函数的一般用法为 linear.hypothes

24、is(model,hypothesis.matrix,rhs=NULL,)lht(model,hypothesis.matrix,rhs=NULL,)model：指定线性拟合模型对象。hypothesis.matrix：数值型的矩阵或向量，每一行表示模型系数的一个线性组合，同rhs一起构成了模型系数的线性约束。也可以是一个字符型向量，每个元素指定系数的一个线性组合或线性约束。Rhs：指定线性约束左边常数的向量，缺省表示左边常数全等于0。R的函数predict()用于预测，其一般用法为library(car)lht(lm.sol,c(X1+3*X2=1)lht(lm.sol,c(X1+3*X2

25、),1)lht(lm.sol,c(0,1,3),1)LinearhypothesistestHypothesis:X1+3X2=1Model1:YX1+X2Model2:restrictedmodelRes.Df RSSDfSumofSqFPr(F)1 1081.432 11369.581288.1535.3860.0001415*Signif.codes:0*0.001*0.01*0.05.0.11(Intercept)X1X2(Intercept)288.9918612.94992804 1.117433397X12.9499280.030744960.010217576X21.11743

26、30.010217580.006924278deviance(lm.sol)181.43009formula(lm.sol)YX1+X2predict(object,newdata,interval=c(none,confidence,prediction),level=0.95)object：指定线性拟合模型对象。newdata：指新观测值所在的数据框。interval：指定预测的形式，缺省为none，表示只给出预测值；confidence 表示给出预测值和回归函数的估计值；prediction表示给出预测值和预测区间。new=data.frame(X1=80,X2=40)lm.pred=

27、predict(lm.sol,new,interval=prediction,level=0.95)lm.predfitlwrupr1123.9699117.2889130.6509(lm.pred=predict(lm.sol,new,level=0.95)1123.9699(lm.pred=predict(lm.sol,new,interval=confidence,level=0.95)fitlwrupr1123.9699121.9183126.0215(lm.pred=predict(lm.sol,new,interval=prediction,level=0.70)fitlwrupr1123.9699120.6924127.2474

注意事项

本文（经典线性回归模型.pdf）为本站会员主动上传，冰点文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知冰点文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。