计量经济学要义.docx
- 文档编号:16829164
- 上传时间:2023-07-17
- 格式:DOCX
- 页数:25
- 大小:286.77KB
计量经济学要义.docx
《计量经济学要义.docx》由会员分享,可在线阅读,更多相关《计量经济学要义.docx(25页珍藏版)》请在冰点文库上搜索。
计量经济学要义
计量经济学要义
第一章计量经济学基础
第一节计量经济学概述
1、一般性定义
计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究的主体(出发点、归宿、核心):
经济现象及数量变化规律
研究的工具(手段):
模型 数学和统计方法
注1:
必须明确,方法手段要服从研究对象的本质特征(与数学不同),方法是为经济问题服务的。
注2:
计量经济研究的三个方面(三者缺一不可):
理论:
即说明所研究对象经济行为的经济理论——计量经济研究的基础
数据:
对所研究对象经济行为观测所得到的信息——计量经济研究的原料或依据
方法:
模型的方法与估计、检验、分析的方法——计量经济研究的工具与手段
2、计量经济学的学科类型
理论计量经济学:
研究经济计量的理论和方法。
应用计量经济学:
应用计量经济方法研究某些领域的具体经济问题。
3、计量经济与经济理论的关系:
经济理论重在定性分析,并不对经济关系提供数量上的具体度量,计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容。
4、计量经济与经济统计的关系
经济现象不能作实验,只能被动地观测客观经济现象变动的既成事实,只能依赖于经济统计数据。
经济统计侧重于对社会经济现象的描述性计量,其提供的数据是计量经济学据以估计参数、验证经济理论的基本依据,
5、计量经济学与数理统计的关系
数理统计学是计量经济学的方法论基础,但是数理统计是在标准假定条件下抽象地研究一般的随机变量的统计规律性;计量经济学是从经济模型出发,研究模型参数的估计和推断,参数有特定的经济意义,标准假定条件经常不能满足,需要建立一些专门的经济计量方法。
6、计量经济学的特点:
计量经济学的一个重要特点是:
它自身并没有固定的经济理论,而是根据其它经济理论,应用计量经济方法将这些理论数量化。
计量经济学的另一个重要特点是:
计量经济学是经济理论、数理经济、经济统计与数理统计的混合物。
经济理论所作的陈述或假说大多数是定性性质的,计量经济学对大多数经济理论赋予经验内容。
经济统计学的问题主要是收集、加工并通过图或表的形式以展现经济数据,他们不考虑怎样用所收集的数据来检验经济理论。
虽然数理统计学提供了这一行业中使用的许多工具,但由于大多数经济数据的独特性,计量经济学家常常需要有特殊的方法。
第二节计量经济学方法论
1、用计量经济学来分析问题的一般方法;
(1)理论或假说的陈述;
(2)理论的数学模型的设定;(3)理论的计量模型的设定;(4)获取数据;(5)计量经济模型的参数估计;(6)模型检验(假设检验);(7)模型的应用:
预报或预测、利用模型进行控制或制定政策。
2、应用举例(消费函数):
(1)理论或假说的陈述:
凯恩斯认为:
随着收入的增加,消费也会增加,但是消费的增加不及收入增加的多。
即边际消费倾向递减。
(2)理论的数学模型设定:
y=a+bx,其中y为消费支出,x为收入,a、b为模型的参数,分别代表截距和斜率系数。
斜率系数b就是消费边际倾向MPC的度量。
其中左边的y称为应变量,方程右边的x称为自变量或解释变量。
该方程表明消费和收入之间存在准确的一一对应关系。
(3)计量模型的设定:
考虑到经济变量间的非准确关系,则消费函数的计量模型可以设定为:
y=a+bx+μ其中μ被称为干扰项,或误差项,是一个随机变量,它有良好定义的概率性质。
μ是从模型中省略下来的而又集体影响着y的全部变量的替代物(就是除了收入外,其它可能影响消费的所有因素)。
(4)数据的获得
各种统计年鉴,企业报表和相关职能部门公布的统计数据(该例中我们可以通过中国统计年鉴获取相关数据)。
(5)参数估计(利用各种统计或计量软件来进行如:
SASEviews)
比如,我们可得如下消费函数方程:
ý=-231.8+0.7196x,其中a=-231.8b=0.7196
它表明实际收入每增加一元,平均消费增加0.72元。
(6)模型检验(假设检验)
A、对理论或假说的检验:
弗里德曼认为凡是不能通过经验数据检验(实证检验)的理论或假设,都不能作为科学探索的一部分。
0<0.7196<1。
B、对模型的检验:
统计推断检验:
模型的拟合优度检验、变量的显著性检验。
计量经济学检验:
平稳性、多重共线性、自相关、异方差等方面的检验。
(7)预报或预测
(8)利用模型进行控制或制定政策
3、计量经济学模型的应用
(1)结构分析
经济学中的结构分析是对经济现象中变量之间相互关系的研究。
结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。
计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。
(2)经济预测
计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。
计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。
对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。
模型理论方法的发展以适应预测的需要。
(3)政策评价
政策评价的重要性。
经济政策的不可试验性。
计量经济学模型具有“经济政策实验室”的功能。
(4)理论检验与发展
实践是检验真理的唯一标准任何经济学理论,只有当它成功地解释了过去,才能为人们所接受。
计量经济学模型提供了一种检验经济理论的好方法。
对理论假设的检验可以发现和发展理论。
第三节变量数据参数与模型
1、计量经济模型中的变量
(1)从变量的因果关系分:
自变量(解释变量)、因变量(被解释变量)
(2)从变量的性质分:
内生变量(模型求解的结果)、外生变量(政策性变量)
注:
任何一个系统(或模型)中都存在许多变量,其中自变量和因变量统称为内生变量,是指在经济机制内部由纯粹的经济因素所决定的变量,是由模型决定的,不为政策所左右,是“一种理论内所要解释的变量”,而作为给定条件存在的变量则称为外生变量,只起解释变量作用,不受自变量影响,而受外部条件支配的变量。
在路径图中,只有指向其他变量的箭头,没有箭头指向它的变量均为外生变量。
例:
P=a+bQ,表示价格与数量的关系,则P和Q是模型要决定的变量,所以是内生变量,a和b是参数,都是外生变量,此外,譬如相关商品的价格,人们的收入等其他于模型有关的变量,也都是外生变量。
2、计量经济学中应用的数据
(1)时间序列数据:
在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度(同一本主体在不同时点,容易出现序列相关性),是样本数据中的常见类型之一,例如季度数据、月度数据等。
时间序列数据可分为平稳过程、趋势平稳过程以及差分平稳过程等等很多种类。
(2)截面数据:
截面数据(cross-sectiondata)是一批发生在同一时间截面上的调查数据,也称静态数据,即不同主体在同一时间点或同一时间段的数据,是样本数据中的常见类型之一,例如工业普查数据,人口普查数据,家庭收入调查数据。
在数学,计量经济学中应用广泛。
(3)面板数据:
面板数据(PanelData)是截面数据与时间序列数据综合起来的一种数据类型,具有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把paneldata译作“面板数据”。
(4)虚拟变量数据(虚设变量、名义变量或哑变量):
用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。
一些定性的事实,不能直接用一般的数据去计量,引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。
一般地,在虚拟变量的设置中:
基础类型、肯定类型取值为1;比较类型,否定类型取值为0。
3、参数及其估计准则
参数估计(parameterestimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法,是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分,其特点如下:
(1)无偏性:
估计值在待估参数的真值附近摆动,对待估参数的真值无偏倚,即样本估计量(平均数、变异数、方差等)的数学期望等于母体真值,即:
表示的方式为:
E(θˆ)=θ。
(2)最小方差性(最优无偏估计):
估计误差方差最小
(3)一致性:
样本函数参数依概率收敛于母体函数参数。
4、计量模型的基本函数形式
(1)线性模型
(2)非线性模型(可变为线性形式的非线性模型)
双对数模型
半对数模型
倒数变换模型
第二章回归模型概述
第一节回归分析的性质
1、变量间的关系
经济变量之间的关系,大体可分为两类:
(1)确定性关系或函数关系:
研究的是确定现象非随机变量间的关系,正方形的面积是边长的平方。
(2)统计依赖或相关关系:
研究的是非确定现象随机变量间的关系,以一定的统计规律呈现出来的关系,如农作物产量与降雨量、光照强度、施肥量等因素的依赖性。
2、统计依赖或相关关系:
注:
①不线性相关并不意味着不相关;
②回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。
Kendall和Stuart认为一个统计关系式不管多么强,也不管多么有启发性,却永远不能确立因果方面的联系,对因果关系方面的理念必须来自统计学之外,最终来自这种或那种理论。
从逻辑上说,统计关系式本身不可能意味着任何因果关系。
要谈因果关系,必须诉诸先验或理论上的思考。
③相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。
回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):
前者是随机变量,后者不是。
第二节回归分析的基本思想
1、利用样本来推断总体
(1)总回归函数(PRF):
根据解释变量的已知或给定值,考察被解释变量的总体均值时,在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线,或更一般地称为总体回归曲线。
(2)样本回归函数(SRF):
如果把解释变量Y的样本条件均值表示为解释变量X的某种函数,这个函数成为样本回归函数。
样本回归函数的函数形式应与设定的总体回归函数形式一致。
(3)样本回归函数对总回归函数的进行拟合:
(1)最小二乘法(OLS)
(2)最小二乘法的基本假定
(3)最小二乘估计的精度或标准误
(4)最小二乘估计量的性质
(5)拟合优度的度量
(6)区间估计或假设检验
(4)利用回归方程进行分析、评价及预测。
2、回归分析的基本概念
1、回归分析(regressionanalysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论,其用意:
在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。
前一个变量被称为被解释变量或因变量对变量测量尺度
注:
分类尺度(名义尺度)、顺序尺度(序数尺度)、间隔尺度(区间尺度)、比率尺度(比率尺度)
3、总体回归函数
由于变量间关系的随机性,回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。
例2.1:
一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。
即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。
为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。
分析:
(1)由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;
(2)但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditionaldistribution)是已知的,比如,P(Y=561|X=800)=1/4。
因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditionalmean)或条件期望(conditionalexpectation):
E(Y|X=Xi)。
该例中:
E(Y|X=800)=561。
描出散点图发现:
随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。
这条直线称为总体回归线。
在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线,或更一般地称为总体回归曲线。
相应的函数:
称为(双变量)总体回归函数。
回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。
其函数形式:
可以是线性或非线性的。
例2.1中,将居民消费支出看成是其可支配收入的线性函数时:
为一线性函数。
其中,0,1是未知参数,称为回归系数(regressioncoefficients)。
4、随机扰动项
总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。
但对某一个别的家庭,其消费支出可能与该平均水平有偏差。
记:
称i为观察值Yi围绕它的期望值E(Y|Xi)的距离,是一个不可观测的随机变量,又称为随机干扰项或随机误差项。
例2.1中,个别家庭的消费支出为:
(*)即,给定收入水平Xi,个别家庭的支出可表示为两部分之和:
(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。
(2)其他随机或非确定性(nonsystematic)部分ui。
(*)式称为总体回归函数PRF的随机设定形式。
表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。
由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。
随机误差项是指从模型中省略下来的而又集体地影响着Y的全部变量的替代物。
随机误差项主要包括下列因素的影响:
1)在解释变量中被忽略的因素的影响;
2)变量观测值的观测误差的影响;
3)其它随机因素的影响。
产生并设计随机误差项的主要原因:
1)理论的含糊性;
2)数据的欠缺(糟糕的替代变量)
3)核心变量与周边变量;
4)节省原则;
5)人类行为的内在随机性;
6)错误的函数形式;
5、样本回归函数(SRF)
问题:
能从一次抽样中获得总体的近似的信息吗?
如果可以,如何从抽样中获得总体的近似信息?
例2.2:
在例2.1的总体中有如下一个样本,
总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。
问:
能否从该样本估计总体回归函数PRF?
回答:
能
该样本的散点图(scatterdiagram):
样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。
该线称为样本回归线。
记样本回归线的函数形式为:
称为样本回归函数。
注:
这里将样本回归线看成总体回归线的近似替代
同样地,样本回归函数也有如下的随机形式:
式中,ei成为样本残差项,代表了其他影响因素Yi的随机因素的集合,可以看成是随机扰动项ui的估计量,由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型。
回归分析的主要目的:
根据样本回归函数SRF,估计总体回归函数PRF。
即,根据
估计
注:
这里PRF可能永远无法知道。
第三节对一元线性回归分析的几点说明
1、对变量之间关系为线性
2、对参数为线性
3、本身为非线性,但通过变形可以变为线性关系
经典回归分析主要考虑对参数是线性的形式,对变量之间的关系不作线性要求。
第四节一元回归模型的参数估计
1、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi,Yi)(i=1,2,…n)要求样本回归函数尽可能好地拟合这组值。
要求样本函数仅可能好的拟合这组数值,我们可以考虑使观测值Yi与样本回归值之差(残差ei)尽可能的小,使之尽可能的接近PRF,即:
由于参数的估计结果是通过最小二乘法得到的,故称为普通最小二乘估计量。
2、LS估计量的数值性质
OLS数值性质是指运用最小二乘法而得以成立的那些性质,而不管这些数据是怎样产生的。
1、OLS估计量纯粹是用可观测的量(即样本)来表达的,因此这些量是容易计算的。
2、这些量是点估计量。
3、一旦从样本数据得到OLS估计值,便容易画出样本回归线,这样得到的回归线有如下性质:
(1)它通过Y和X的样本均值。
即
(2)估计的Y均值等于实测的Y均值。
即
(3)残差ei的均值为零。
即∑ei=0。
3、线性回归模型的基本假设
为什么要做出假定:
1、虽然通过OLS,我们可以获得
的估计值,但我们的目的不仅仅是为了得到它们的值。
2、更为重要的是对0,1与真实的0,1之间的替代性进行推断。
3、对Yi与E(Y|X=Xi)之间的差距到底有多大进行推断。
4、在模型
中,ei是一随机变量,如果我们不知道xi、ei是怎样产生的,就无法对Yi做出任何推断,也无法对0,1做出任何推断。
5、在一系列假定下,OLS具有良好的统计性质,能够满足我们对b0,1作出推断的要求。
线性回归模型的基本假设
假设1、线性回归模型,回归模型对参数而言是线性的;
假设2、解释变量X是确定性变量,不是随机变量;
假设3、随机误差项m具有零均值、同方差和不序列相关性:
E(i)=0i=1,2,…,n
Var(i)=s2i=1,2,…,n
Cov(i,j)=0i≠ji,j=1,2,…,n
假设4、随机误差项m与解释变量X之间不相关:
Cov(Xi,i)=0i=1,2,…,n
假设5、m服从零均值、同方差、零协方差的正态分布
i~N(0,2)i=1,2,…,n
假设6、观测次数n必须大于待估的参数个数;
假设7、X值要有变异性;
假设8、正确的设定了回归模型;也被称为模型没有设定偏误(specificationerror);
假设9、在多元回归模型中没有完全的多重共线性。
注意:
1、如果假设2、3满足,则假设4也满足;
2、如果假设5满足,则假设3也满足。
以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型。
另外,在进行模型回归时,还有一个暗含的假设:
假设10:
随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。
即
假设5旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生所谓的伪回归问题。
4、假定条件下的最小二乘估计量的统计性质
当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。
(1)线性性,即估计值是因变量的线性函数;
(2)无偏性,即它的均值或期望值等于总体的真实值;
(3)有效性,即它在所有线性无偏估计量中具有最小方差。
(4)渐近无偏性,即样本容量趋于无穷大时,它的均值序列趋于总体真值;
(5)一致性,即样本容量趋于无穷大时,它依概率收敛于总体的真值;
(6)渐近有效性,即样本容量趋于无穷大时,它在所有的一致估计量中具有最小的渐近方差。
拥有这类性质的估计量称为最佳线性无偏估计量(bestlinerunbiasedestimator,BLUE)。
当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质:
在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。
第五节一元线性回归模型的统计检验
1、拟合优度检验
拟合优度检验:
对样本回归直线与样本观测值之间拟合程度的检验。
度量拟合优度的指标:
判定系数(可决系数)r2(二元回归)或R2(多元回归)
问题:
采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?
我们可以得到:
TSS=ESS+RSS
Y的观测值围绕其均值的总离差(totalvaria可分解为两部分:
一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。
在给定样本中,TSS不变,
如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此,拟合优度较优。
2、可决系数R2统计量
称R2为(样本)可决系数/判定系数,可决系数的取值范围:
[0,1]。
R2越接近1,说明实际观测点离样本线越近,拟合优度越高。
3、回归系数的区间估计
如果存在这样一个区间,称之为置信区间;1-称为置信系数(置信度),称为显著性水平;置信区间的端点称为置信限或临界值。
从定义我们可以看出,区间估计量是一个构造出来的区间,要使得它把参数的真值包括在区间的界限内有一个特定的概率:
1-α。
在给定α=0.05或5%的情况下,置信(随机),区间包含真实β的概率为0.95或95%。
它表示使用我们所描述的方法构造出来的众多区间中包含β真值的概率为0.95或95%。
4、假设检验:
回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。
在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。
这就需要进行变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的假设检验。
计量经计学中,主要是针对变量的参数真值是否为零来进行显著性检验的。
1、假设检验
所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。
当我们拒绝原假设(虚拟假设)时,我们说发现统计上是显著的。
当我们不拒绝原假设时,我们说发现不是统计上显著的。
假设检验采用的逻辑推理方法是反证法。
先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。
判断结果合理与否,是基于“小概率事件不易发生”这一原理的
2、变量的显著性检验
检验步骤:
(1)对总体参数提出假设
H0:
1=0,H1:
10
(2)以原假设H0构造t统计量,并由样本计算其值
(3)给定显著性水平,查t分布表,得临界值t/2(n-2)
(4)比较,判断
若|t|>t/2(n-2),则拒绝H0,接受H1;
若|t|t/2(n-2),则拒绝H1,接受H0;
3、变量的置信区间检验
要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。
这种方法就是参数检验的置信区间估计。
在置信区间检验程序中,我们试图建立一个以某种概率包含有真实,但未知的β的一个范围区间;而在显著性检验步骤中,我们假设β为某值,然后看所计算的值,是否位于该假设值周围某个合理的范围内。
由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。
要缩小置信区间,需
(1)增大样本容量n,因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;
(2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。
第六节双变量线性回归模型的延伸
1过原点的回归
过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 要义