书签分享收藏举报版权申诉 / 79

立即下载加入VIP,免费下载

当前位置：首页 > 医药卫生 > 中医中药 > 计量经济学课件PPT一元回归一元回归2.ppt

计量经济学课件PPT一元回归一元回归2.ppt

文档编号：18728701
上传时间：2023-10-21
格式：PPT
页数：79
大小：421.50KB

《计量经济学课件PPT一元回归一元回归2.ppt》由会员分享，可在线阅读，更多相关《计量经济学课件PPT一元回归一元回归2.ppt（79页珍藏版）》请在冰点文库上搜索。

计量经济学课件PPT一元回归一元回归2.ppt

北京林业大学经济管理学院统计系,1,第四章一元线性回归模型,1.一元线性回归模型的一般形式2.一元线性回归模型的参数估计3.一元线性回归模型的检验4.预测应用,北京林业大学经济管理学院统计系,2,一元线性回归模型的一般形式,要求估计：

（1）模型结构参数0和1

（2）模型分布参数2返回,一元线性回归模型的参数估计,一、普通最小二乘法OLS二、最大似然法ML（以后集中讨论）三、参数估计量的性质四、一元线性回归模型参数估计的实例返回,北京林业大学经济管理学院统计系,4,一、普通最小二乘法OLS,OLS方法的由来实际观察值-对应拟合值=误差=纵向距离最小二乘误差平方（二乘）和（综合）最小数学原理正规方程估计参数的公式（结构参数与分布参数）估计参数的公式的离均差形式数据结构的矩阵表示,北京林业大学经济管理学院统计系,5,OLS（OrdinaryLeastSquare）方法的由来,1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式下图是根据1078个家庭的调查所作的散点图（略图）,北京林业大学经济管理学院统计系,6,北京林业大学经济管理学院统计系,7,从图上虽可看出，个子高的父亲确有生出个子高的儿子的倾向，同样地，个子低的父亲确有生出个子低的儿子的倾向。

得到的具体规律如下：

如此以来，高的伸进了天，低的缩入了地。

他百思不得其解，同时又发现某人种的平均身高是相当稳定的。

最后得到结论：

儿子们的身高回复于全体男子的平均身高，即“回归”见1889年F.Gallton的论文普用回归定律。

后人将此种方法普遍用于寻找变量之间的规律,北京林业大学经济管理学院统计系,8,最小二乘法的思路,1为了精确地描述Y与X之间的关系，必须使用这两个变量的每一对观察值（n组观察值），才不至于以点概面（作到全面）。

2Y与X之间是否是直线关系（用协方差或相关系数判断）？

若是，可用一条直线描述它们之间的关系。

3在Y与X的散点图上画出直线的方法很多。

任务？

找出一条能够最好地描述Y与X（代表所有点）之间的直线。

4什么是最好？

找出判断“最好”的原则。

最好指的是找一条直线使得所有这些点到该直线的纵向距离的和（平方和）最小实际与理论抽象最接近。

北京林业大学经济管理学院统计系,9,三种距离,北京林业大学经济管理学院统计系,10,纵向距离是度量实际值与拟合值是否相符的有效手段,点到直线的距离点到直线的垂直线的长度。

横向距离点沿（平行）X轴方向到直线的距离。

纵向距离点沿（平行）Y轴方向到直线的距离。

也就是实际观察点的Y坐标减去根据直线方程计算出来的Y的拟合值。

实际值-拟合值=残差（误差、剩余）。

北京林业大学经济管理学院统计系,11,最小二乘法的数学原理,纵向距离是Y的实际值与拟合值之差，差异大拟合不好，差异小拟合好，所以又称为拟合误差或残差。

将所有纵向距离平方后相加，即得误差平方和，“最好”直线就是使误差平方和最小的直线。

于是可以运用求极值的原理，将求最好拟合直线问题转换为求误差平方和最小。

北京林业大学经济管理学院统计系,12,数学推证过程,北京林业大学经济管理学院统计系,13,关于所得直线方程的结论,结论之一：

由（5）式，得即拟合直线过y和x的平均数点。

结论之二：

由

（2）式，得残差与自变量x的乘积和等于0，即两者不相关。

北京林业大学经济管理学院统计系,14,拟合直线的性质,1估计残差和为零2Y的真实值和拟合值有共同的均值3估计残差与自变量不相关4估计残差与拟合值不相关,北京林业大学经济管理学院统计系,15,1估计残差和为零（ResidualsSumtozero）,由

（1）式直接得此结论无须再证明。

并推出残差的平均数也等于零。

北京林业大学经济管理学院统计系,16,2Y的真实值和拟合值有共同的均值（Theactualandfittedvaluesofyihavethesamemean）,北京林业大学经济管理学院统计系,17,3估计残差与自变量不相关（Residualsareunrelatedwithindependentvariable）,北京林业大学经济管理学院统计系,18,4估计残差与拟合值不相关（Residualsareunrelatedwithfittedvalueofyi）,北京林业大学经济管理学院统计系,19,关于回归直线性质的总结,北京林业大学经济管理学院统计系,20,数学推证,北京林业大学经济管理学院统计系,21,正规方程,北京林业大学经济管理学院统计系,22,估计参数的公式的离均差形式,北京林业大学经济管理学院统计系,23,正规方程的矩阵表示,北京林业大学经济管理学院统计系,24,随机误差项方差的估计,北京林业大学经济管理学院统计系,25,一元回归模型的数据结构,返回,北京林业大学经济管理学院统计系,26,三、参数估计量的性质,1、线性（Linear）2、无偏性（Unbiased）3、有效性（最小方差）（Best）3、高斯-马尔可夫定理（Gauss_Markov）（BLUE）,参数估计量的性质实际上指的是用某种方法（OLS）导出的参数估计量是否具有优良性。

衡量优良性的标准：

线性、无偏性、有效性、一致性、均方误最小等,北京林业大学经济管理学院统计系,27,1、线性,线性指的是参数估计量是被解释变量的线性函数。

回归系数的估计量=正规方程的解从解的解析式（或矩阵形式），不难看出回归系数的估计量是被解释变量的线性组合。

B=（XX）-1XY,北京林业大学经济管理学院统计系,28,2、无偏性,无偏性指的是参数估计量的均值（数学期望）等于被估计的真值（模型中的参数）,北京林业大学经济管理学院统计系,29,北京林业大学经济管理学院统计系,30,北京林业大学经济管理学院统计系,31,3、有效性（最小方差）,OLS参数估计量的有效性指的是：

在一切线性、无偏估计量中，OLS参数估计量的方差最小。

1、导出参数估计量的方差（解析式）2、导出参数估计量的方差（矩阵表示）3、高斯-马尔可夫定理,北京林业大学经济管理学院统计系,32,北京林业大学经济管理学院统计系,33,3、高斯-马尔可夫定理,关于高斯-马尔可夫定理的证明，参见其他文献。

计量经济学园地有正反两种证明。

根据高斯-马尔可夫定理，形如上页公式中表示的参数估计量的方差，在一切线性、无偏估计量中方差最小，所以OLS估计量是有效估计量。

OLS估计量和是BLUE（BestLinearUnbiasedEstimator）的。

北京林业大学经济管理学院统计系,34,4、随机误差项估计量的无偏性问题,请同学们复习数理统计的相关内容。

返回,北京林业大学经济管理学院统计系,35,四、一元线性回归模型参数估计的实例,我国用于文教科学卫生事业费用的支出（ED），主要由财政收入（FI）决定，二者之间具有线性关系。

平均百分误差在10%以内，表明是一个拟合得比较好的模型,北京林业大学经济管理学院统计系,36,北京林业大学经济管理学院统计系,37,我国财政文教科学卫生事业费支出模型,EstimationCommand:

=LSEDFICEstimationEquation:

=ED=C

（1）*FI+C

（2）SubstitutedCoefficients:

=ED=0.22341905*FI+30.052368返回,北京林业大学经济管理学院统计系,38,一元线性回归模型的检验,假设检验参数的显著性检验1.t检验2.置信区间的检验3.F检验拟合优度的检验,北京林业大学经济管理学院统计系,39,假设检验,北京林业大学经济管理学院统计系,40,假设检验的原理,1、提出二择一的假设:

H0（往往与目的相反）与HA（往往是欲得到的结论）2、给定显著水平（小概率）3、在H0成立下，收集数据，构造检验统计量（如t、F），且已知统计量的分布，能计算出取各种值的概率4、查表得小概率发生的临界值（如t、F）5、将样本值和H0代入检验统计量进行计算6、将计算结果与临界值比较，若大于临界值，小概率事件发生，根据小概率原理，在一次试验中小概率事件是不会发生的。

现在，居然发生了。

错在哪里？

7、原来是假设H0错了，因为一切都是在H0成立下推证的，于是拒绝H0。

否则，不拒绝H0（注意没有使用“接受”）,北京林业大学经济管理学院统计系,41,大海里捞针反证法,H0：

一棵针掉进了大海里（海底只有一棵针）HA：

海底不只一棵针显著水平=0.01（小概率事件发生的概率）进行抽样（试验）到海底捞针通常用大海里捞针比喻不可能发生的事现在，一次潜水（抽样试验）就捞上一棵针，这掉下的一棵针居然被我们捞上来，不可能发生的事件发生了，于是拒绝H0，认为大海里不只一个针。

“只有一棵针”，在一次抽样试验中是捞不上来的。

北京林业大学经济管理学院统计系,42,两类错误之一弃真,1、H0：

海底只有一棵针。

但一次试验捞了上来。

因为小概率事件发生，必须拒绝（H0）。

然而此时此地海底真的只有一棵针，结论说不只一棵针，错了！

犯“弃真”错误了。

只有拒绝H0时才会犯弃真错误2、此时犯了弃真的错误，但是犯弃真错误的可能性，事先已经控制只有显著水平（小概率）那么大3、所以拒绝不仅是坚决的，而且犯弃真错误的概率（冒险率风险是事先控制的）也很小=。

所得结论的可靠性=1-4、所以，人们提出的H0通常是无效的（null）,北京林业大学经济管理学院统计系,43,犯两类错误之二纳伪,H0：

某某（参加高考的考生）=大学生（准予参考就是提出这个假设，即假设他是优秀青年）进行抽样试验参加高考检验统计量考试总分（包括加分）众所周知，大学生乃同龄人中的佼佼者，而该某某平时素质和学业平平，距高等学府之路遥遥，被录取（总分超过报考学校的录取线）的概率很小。

同时，在H0成立下，优秀毕业生考分低于录取线（失常）的概率很小。

在此次抽样中他的总分喜煞人，由于小概率事件（优秀者失常）没有发生，于是不能拒绝H0某某“顺利”进入了重庆某学院，显然属于纳伪。

北京林业大学经济管理学院统计系,44,不拒绝H0是无可奈何,仅当不拒绝H0才会犯纳伪错误某某进入高校，招生工作犯了纳伪错误而且，进行检验时，没有事先控制纳伪的概率无法度量犯纳伪的可能性。

也就不能给出不拒绝H0结论（录取进大学）的可靠性（1-）。

就一次试验而言，不拒绝H0是无可奈何的千万不可，以接受H0作为我们研究的结论（如有些市场调查的教科书）。

欲证明H0成立必须继续抽样、继续检验，并采用功效函数。

所以某某进校后不断地被抽样、被检验,北京林业大学经济管理学院统计系,45,纳伪的概率,-,H0,实际总体,/2,/2,北京林业大学经济管理学院统计系,46,假设检验的种类,1、参数检验已知分布形式（正态），检验分布的参数，例如检验均值、方差、回归系数等等2、非参数检验检验随机变量的分布形式，例如是否服从正态分布本课程主要讨论参数检验,北京林业大学经济管理学院统计系,47,各种常用分布之间的联系,北京林业大学经济管理学院统计系,48,抽样分布之间的联系,返回,北京林业大学经济管理学院统计系,49,显著性检验t检验（检验系数）方法,北京林业大学经济管理学院统计系,50,t检验方法的直接计算,返回,北京林业大学经济管理学院统计系,51,显著性检验置信区间方法,北京林业大学经济管理学院统计系,52,估计参数的置信区间,北京林业大学经济管理学院统计系,53,回归系数1和2的置信区间,北京林业大学经济管理学院统计系,54,回归系数1和2的置信区间,2的显著水平为的置信区间为：

同样，1显著水平为的置信区间为：

北京林业大学经济管理学院统计系,55,2的置信区间,返回,北京林业大学经济管理学院统计系,56,2检验的显著性（2检验）,返回,北京林业大学经济管理学院统计系,57,假设检验中的两类错误,第一类错误：

拒绝真实；第二类错误：

接受错误。

两类错误之间存在一种替代关系（Trade-off）。

北京林业大学经济管理学院统计系,58,F检验,零假设H0：

b=0备择HA：

b0H0：

b=0RSS中的X不起作用，RSS变动无异于随机变动=分子方差与分母方差是一回事=F=1如果F显著地大于1，甚至FF=小概率事件发生了，根据小概率原理，小概率事件在一次试验中是不可能发生的，于是H0不成立。

就不能认为X没有作用。

则直线是有意义的。

可靠性=1-,北京林业大学经济管理学院统计系,59,F检验（总显著水平）,算出F的估计值，与F分布表在选定显著水平上读出的F临界值相比较；或查找F统计量的估计值的P值。

一元模型中b=0的t检验中的t统计量的平方和F检验德F统计量等价。

返回,北京林业大学经济管理学院统计系,60,拟合优度的检验,由最小二乘法所得直线究竟能够对这些点之间的关系加以反映吗？

对这些点之间的关系或趋势反映到了何种程度？

于是必须经过某种检验或者找出一个指标，在一定可靠程度下，根据指标值的大小，对拟合的优度进行评价。

分四个问题进行讨论：

平方和分解、方差分析、拟合优度、拟合优度与简单相关系数的关系。

北京林业大学经济管理学院统计系,61,拟合优度检验,拟合优度检验是指样本回归线与样本观测值之间拟合程度的检验。

度量拟合程度的指标是判定系数R2。

北京林业大学经济管理学院统计系,62,一、平方和与自由度的分解,1、总平方和、回归平方和、残差平方和的定义2、平方和的分解3、自由度的分解,北京林业大学经济管理学院统计系,63,1、总平方和、回归平方和、残差平方和的定义,TSS度量Y自身的差异程度，ESS度量因变量Y的拟合值自身的差异程度，RSS度量实际值与拟合值之间的差异程度。

北京林业大学经济管理学院统计系,64,2、平方和的分解,北京林业大学经济管理学院统计系,65,平方和分解的意义,TSS=RSS+ESS被解释变量Y总的变动（差异）=解释变量X引起的变动（差异）+除X以外的因素引起的变动（差异）如果X引起的变动在Y的总变动中占很大比例，那么X很好地解释了Y；否则，X不能很好地解释Y。

北京林业大学经济管理学院统计系,66,3、自由度的分解,总自由度dfT=n-1回归自由度dfR=1（自变量的个数，k元为k）残差自由度dfE=n-2自由度分解dfT=dfR+dfE,北京林业大学经济管理学院统计系,67,平方和分解图,北京林业大学经济管理学院统计系,68,为什么回归平方和是由X引起的变动,北京林业大学经济管理学院统计系,69,二、方差分析,模型：

y=a+bx+u=LS估计：

y=a+bxH0:

b=0HA:

b0,北京林业大学经济管理学院统计系,70,拟合优度R2公式,性质：

r2与相关系数r不同在回归分析中，r2是一个比r更有意义的度量，因为前者告诉我们在因变量的变异中由解释变量解释的部分占怎样一个比例，因而对一个变量的变异在多大程度上决定另一个变量的变异，提供了一个总的度量。

称为判定系数、决定系数，这里称为拟合优度。

北京林业大学经济管理学院统计系,71,拟合优度等于实际值与拟合值之间简单相关系数的平方,北京林业大学经济管理学院统计系,72,拟合优度（或称判定系数、决定系数）,目的：

企图构造一个不含单位，可以相互进行比较，而且能直观判断拟合优劣。

拟合优度的定义：

意义：

拟合优度越大，自变量对因变量的解释程度越高，自变量引起的变动占总变动的百分比高。

观察点在回归直线附近越密集。

取值范围：

0-1,北京林业大学经济管理学院统计系,73,拟合优度与F统计量之间的联系,F显著=拟合优度必然显著,北京林业大学经济管理学院统计系,74,复习与提高,y=a+bx+uxn+1yn+1xnynx2y2x1y1,根据已知样本采用LS得一拟合直线,拟合直线性质:

残差和=0残差与自变量无关拟合值与残差值无关两个平均数均值相等,R20,TSSRSSESSR2,R21,用直线反映总体,Good?

no,Yes,返回,北京林业大学经济管理学院统计系,75,预测,样本回归函数的一个用途是“预测”或“预报”对应于给定X的未来的Y值。

包括两种预测：

1、均值预测（meanprediction）2、个值预测（individualprediction）,北京林业大学经济管理学院统计系,76,均值预测（Meanprediction）,北京林业大学经济管理学院统计系,77,个值预测（individualprediction）,北京林业大学经济管理学院统计系,78,比较,北京林业大学经济管理学院统计系,79,均值预测与各值预测之比较,返回,