书签分享收藏举报版权申诉 / 71

立即下载加入VIP,免费下载

当前位置：首页 > 外语学习 > 其它语言学习 > 第四讲二值选择模型高级计量经济学及Stata应用课件.pptx

第四讲二值选择模型高级计量经济学及Stata应用课件.pptx

文档编号：10153431
上传时间：2023-05-23
格式：PPTX
页数：71
大小：1.07MB

《第四讲二值选择模型高级计量经济学及Stata应用课件.pptx》由会员分享，可在线阅读，更多相关《第四讲二值选择模型高级计量经济学及Stata应用课件.pptx（71页珍藏版）》请在冰点文库上搜索。

第四讲二值选择模型高级计量经济学及Stata应用课件.pptx

高级计量经济学及Stata应用第四讲二值选择模型,陈强山东大学经济学院,2019-05-31,陈强计量及Stata应用（c）2014,2,微观计量的主要内容,二值选择模型多值选择模型排序模型计数模型受限被解释变量,注：

二值与多值选择模型统称“离散选择模型”（discretechoicemodel）或“定性反应模型”（qualitativeresponsemodel）。

2019-05-31,陈强计量及Stata应用（c）2014,3,二值选择模型,二值选择模型（binarychoicemodel）例：

考研或不考研；就业或待业；买房或不买房；买保险或不买保险；贷款申请被批准或拒绝；出国或不出国；回国或不回国；战争或和平；生或死。

Hamletschoice:

Tobeornottobe?

2019-05-31,陈强计量及Stata应用（c）2014,4,二值选择模型的设定,假设个体只有两种选择，比如y=1（考研）或y=0（不考研）。

是否考研，取决于研究生毕业后的预期收入、个人兴趣、本科毕业后直接就业的收入前景等。

假设这些解释变量都包括在向量x中。

线性概率模型,最简单的模型为“线性概率模型”（LinearProbabilityModel，简记LPM）：

缺点：

线性概率模型的预测值可能大于1或小于0。

2019-05-31,陈强计量及Stata应用（c）2014,5,线性概率模型的缺点,2019-05-31,陈强计量及Stata应用（c）2014,6,两点分布,在给定x的情况下，考虑y的两点分布概率：

选择连接函数为某随机变量的累积分布函数（cdf），可保证y的预测值介于0,1,2019-05-31,陈强计量及Stata应用（c）2014,7,y的预测值,可将y的预测值理解为事件“y=1”的发生概率：

2019-05-31,陈强计量及Stata应用（c）2014,8,Probit,如果连接函数布函数，则,为标准正态的累积分,此模型称为“Probit”。

2019-05-31,陈强计量及Stata应用（c）2014,9,Logit,如果连接函数为“逻辑分布”（logisticdistribution）的累积分布函数，则,此模型称为“Logit”。

2019-05-31,陈强计量及Stata应用（c）2014,10,Probitvs.Logit,逻辑分布的密度函数关于原点对称，期望为0，方差为（大于标准正态的方差）。

与标准正态相比，逻辑分布具有厚尾（fattails），更接近于自由度为7的t分布。

逻辑分布的cdf有解析表达式（而标准正态分布没有），故计算Logit通常比Probit更方便。

Logit模型的系数估计值更易从经济上解释。

2019-05-31,陈强计量及Stata应用（c）2014,11,最大似然估计,对于非线性模型，可使用最大似然法（MLE）进行估计。

以Logit模型为例。

第i个观测数据的概率密度为,2019-05-31,陈强计量及Stata应用（c）2014,12,最大似然估计（续）,将第i个观测值的密度函数紧凑地写为：

取对数加总可得整个样本的对数似然函数数值求解此非线性最大化问题。

2019-05-31,陈强计量及Stata应用（c）2014,13,数值计算（牛顿法）,2019-05-31,陈强计量及Stata应用（c）2014,14,边际效应,非线性模型的系数估计值一般不是边际效应。

以Probit模型为例：

Probit与Logit的系数估计值也不直接可比。

2019-05-31,陈强计量及Stata应用（c）2014,15,非线性模型的边际效应概念,平均边际效应（averagemarginaleffect）：

分别计算每个样本观测值上的边际效应，然后进行简单算术平均。

样本均值处的边际效应（marginaleffectatmean），即在处的边际效应。

在某代表值处的边际效应（marginaleffectatarepresentativevalue），即在处的边际效应,2019-05-31,陈强计量及Stata应用（c）2014,16,几率比,对于Logit模型，记“y=1”的概率为p，则几率比（oddsratio）或相对风险（relativerisk）为：

在检验药物疗效的随机实验中，“y=1”表示“生”，“y=0”表示“死”。

如几率比为2，则存活概率是死亡概率的两倍。

2019-05-31,陈强计量及Stata应用（c）2014,17,对数几率比,将上页方程两边取对数，可得“对数几率比”（logoddsratio）：

表示解释变量增加一个微小量引起“对数几率比”（log-oddsratio）的边际变化。

或把视为半弹性，即增加一单位引起几率比的变化百分比。

比如，意味着增加一单位引起几率比增加12%。

2019-05-31,陈强计量及Stata应用（c）2014,18,另一解释方法（不连续变化）,假设增加一单位，变为+1，记p的新值为p*，则新几率比与原先几率比的比率为,故表示解释变量几率比的变化倍数。

增加一单位引起,2019-05-31,陈强计量及Stata应用（c）2014,19,几率比（again）,比如，则，故当增加一单位时，新几率比是原先几率比的1.13倍，或增加13%。

Stata称为几率比（oddsratio）。

如果解释变量至少须变化一个单位（比如性别、婚否、年龄、子女个数），则应使用,2019-05-31,陈强计量及Stata应用（c）2014,20,非线性模型的拟合优度,对于非线性模型，平方和分解公式不成立，无法定义通常的拟合优度R2。

但可定义“准R2”（pseudoR2）：

LnL1为原模型的对数似然函数最大值，LnL0为以常数项为唯一解释变量的对数似然函数最大值。

2019-05-31,陈强计量及Stata应用（c）2014,21,准R2示意图,2019-05-31,陈强计量及Stata应用（c）2014,22,2019-05-31,陈强计量及Stata应用（c）2014,23,正确预测的百分比,判断拟合优度的另一方法是计算“正确预测的百分比”（percentcorrectlypredicted）如果发生概率的预测值0.5，则认为其预测y=1；反之，则认为其预测y=0。

将预测值与实际值（样本数据）进行比较，就能计算正确预测的百分比。

准最大似然估计,对于Probit与Logit模型，如果分布函数设定不正确，则为“准最大似然估计”（QuasiMLE，简记QMLE）。

由于二值选择模型的分布必然为两点分布，故只要条件期望函数正确，MLE就是一致的。

2019-05-31,陈强计量及Stata应用（c）2014,24,普通标准误vs.稳健标准误,由于两点分布的特殊性，在iid的情况下，只要成立，稳健标准误就等于普通标准误。

如果模型设定正确，就没有必要使用稳健标准误（但使用稳健标准误也没有错）。

如果模型设定不正确（即），则Probit与Logit模型并不能得到对系数的一致估计，使用稳健标准误也就没有太大意义（只是更精确地估计了错误参数的标准误）。

2019-05-31,陈强计量及Stata应用（c）2014,25,2019-05-31,陈强计量及Stata应用（c）2014,26,二值模型的Stata命令,probityx1x2x3,r（probit模型）logityx1x2x3,or（logit模型）选择项“r”表示使用稳健标准误，选择项“or”表示显示几率比（oddsratio），而不显示系数。

2019-05-31,陈强计量及Stata应用（c）2014,27,预测,完成估计后，可用以下命令进行预测，并计算准确预测的百分比：

predictyhat（计算发生概率的预测值，并记为“yhat”）estatclas（计算预测准确的百分比，clas表示classification）,2019-05-31,陈强计量及Stata应用（c）2014,28,计算边际效应,margins,dydx（*）（计算所有解释变量的平均边际效应）margins,dydx（*）atmeans（计算所有解释变量在样本均值处的边际效应）margins,dydx（*）at（x1=0）（计算所有解释变量在“x1=0”处的边际效应）其中，“*”代表所有解释变量。

2019-05-31,陈强计量及Stata应用（c）2014,29,计算边际效应（续）,margins,dydx（x1）（计算解释变量x1的平均边际效应）margins,eyex（*）（计算平均弹性，两个“e”均指elasticity）margins,eydx（*）（计算平均半弹性，x变化1单位引起y变化百分之几）margins,dyex（*）（计算平均半弹性，x变化1%引起y变化几个单位）,实例：

美国妇女就业与否,数据集womenwk.dta包括以下变量：

work（是否就业），age（年龄），married（婚否），children（子女数），education（教育年限）。

考虑以下二值选择模型：

2019-05-31,陈强计量及Stata应用（c）2014,30,线性概率模型,usewomenwk.dta,clearregworkagemarriedchildreneducation,r,2019-05-31,陈强计量及Stata应用（c）2014,31,Logit（普通标准误）,logitworkagemarriedchildreneducation,nolog,2019-05-31,陈强计量及Stata应用（c）2014,32,Logit（稳健标准误）,logitworkagemarriedchildreneducation,rnolog,稳健标准误与普通标准误很接近。

2019-05-31,陈强计量及Stata应用（c）2014,33,2019-05-31,陈强计量及Stata应用（c）2014,34,汇报几率比,各解释变量（age,married,children,education）的最小变化量至少为一单位。

为便于解释回归结果，让Stata汇报几率比，而非系数。

logitworkagemarriedchildreneducation,ornolog,经济解释,给定其他变量，已婚妇女参加工作的几率比是未婚妇女的2.10倍（即高出110%）；年龄每增加一岁，参加工作的几率比就增加6%；以此类推。

2019-05-31,陈强计量及Stata应用（c）2014,35,计算平均边际效应,margins,dydx（*）,Logit模型的平均边际效应与OLS回归系数相似。

2019-05-31,陈强计量及Stata应用（c）2014,36,计算样本均值处的边际效应,margins,dydx（*）atmeans,2019-05-31,陈强计量及Stata应用（c）2014,37,变量age在“age=30”处的边际效应,margins,dydx（age）at（age=30）,2019-05-31,陈强计量及Stata应用（c）2014,38,准确预测的比率,estatclas,2019-05-31,陈强计量及Stata应用（c）2014,39,聚类稳健的标准误,为了演示目的，假设年龄相同的个体存在组内相关logitworkagemarriedchildreneducation,nologvce（clusterage）,2019-05-31,陈强计量及Stata应用（c）2014,40,Probit,probitworkagemarriedchildreneducation,nolog,Probit模型的准R2（0.1889）与Logit很接近（0.1882）。

2019-05-31,陈强计量及Stata应用（c）2014,41,Probit模型的准确预测比例,estatclas（准确预测比例与Logit完全一样）,2019-05-31,陈强计量及Stata应用（c）2014,42,Probit模型的边际效应,margins,dydx（*）,与Logit模型的边际效应很相似。

2019-05-31,陈强计量及Stata应用（c）2014,43,二值选择模型的微观基础,对于二值选择行为，可通过“潜变量”（latentvariable）来概括该行为的净收益。

净收益大于0，则选择做；否则，不做。

假设净收益为：

个体的选择规则为：

2019-05-31,陈强计量及Stata应用（c）2014,44,潜变量法,“y=1”的发生概率为假设扰动项的密度函数关于原点对称，则如果服从正态分布，则为Probit；如果服从逻辑分布，则为Logit。

2019-05-31,陈强计量及Stata应用（c）2014,45,方差的标准化,对于任意常数k0，,记，则模型的拟合与别”（identify）,，故对完全一样，故无法同时“识。

对于Probit模型，令扰动项方差为1；对于Logit模型，令扰动项方差为（逻辑分布的方差）。

2019-05-31,陈强计量及Stata应用（c）2014,46,2019-05-31,陈强计量及Stata应用（c）2014,47,随机效用法,二值选择的另一可能微观基础为“随机效用最大化”模型（RandomUtilityMaximization）。

假设选择a，可得效用Ua；选择b，可得效用Ub。

如果UaUb，则选a，记y=1；反之，选b，记y=0。

由于存在决定效用的未知因素以及未来的不确定性，效用方程包含扰动项，故名“随机效用”。

随机效用法（续）,假定,，则,重新定义系数及扰动项，则回到潜变量法的表达式。

随机效用法便于推广到多值选择模型。

2019-05-31,陈强计量及Stata应用（c）2014,48,2019-05-31,陈强计量及Stata应用（c）2014,49,稀有事件偏差,若“y=1”的发生频率很小，称为“稀有事件”（rareevents）。

比如，战争、政变、革命、流行病、金融危机、百年一遇的灾害等。

虽然MLE是一致的，但在有限样本下（样本容量小于200），Probit或Logit估计依然有偏差。

如果存在稀有事件，此偏差将被放大；称为“稀有事件偏差”（rareeventsbias）。

2019-05-31,陈强计量及Stata应用（c）2014,50,方法一：

偏差修正法,使用Logit模型，但对稀有事件造成的小样本偏差进行估计，然后对Logit模型的估计系数进行修正，得到“偏差修正估计”（bias-correctedestimates），估计量的标准误也得到改善。

在http:

/gking.harvard.edu/relogit下载Stata命令“relogit,norobust”来实现；“re”表示“rareevents”；选择项“nor”表示不使用稳健标准误（默认使用稳健标准误）。

安装方法参见下载文件中的“readme”文档。

方法二、补对数-对数模型,使用非对称的“极值分布”（extremevaluedistribution），得到“补对数-对数模型”（complementarylog-logmodel）：

由于极值分布左偏（left-skewed），故在补对数-对数模型中，事件发生概率p趋于1的速度快于趋于0的速度；此性质正好对应于稀有事件的情形。

2019-05-31,陈强计量及Stata应用（c）2014,51,Probit,Logit,Complementarylog-log的累积分布函数比较,2019-05-31,陈强计量及Stata应用（c）2014,52,2019-05-31,陈强计量及Stata应用（c）2014,53,补对数-对数模型的Stata命令,补对数-对数模型的Stata命令为cloglogyx1x2x3,r其中，选择项“r”表示稳健标准误。

2019-05-31,陈强计量及Stata应用（c）2014,54,例：

游牧民族的征服,陈强（2014）研究了中原王朝被游牧民族征服的决定因素。

以每十年作为观测单位，从公元前221年秦朝建立至1911年清朝灭亡，共有213个观测值；中原王朝被征服（conquered）仅发生7次。

主要解释变量：

中原王朝早于游牧政权建立的年数（diff），中原王朝的绝对年龄（age），中原是否在长城的有效保护之下（wall），中国北方在十年中发生旱灾的年数比例的一阶滞后（drought1）。

普通的Logit,usenomadic_conquest.dta,clearlogitconquereddiffagewalldrought1,rnolog,2019-05-31,陈强计量及Stata应用（c）2014,55,Bias-correctedLogit,relogitconquereddiffagewalldrought1,偏差修正后，Logit模型的估计系数有些变化，标准误有所下降，而变量的显著性基本没变。

2019-05-31,陈强计量及Stata应用（c）2014,56,Complementarylog-log,cloglogconquereddiffagewalldrought1,rnolog,2019-05-31,陈强计量及Stata应用（c）2014,57,含内生变量的Probit,是否买保险取决于收入，但收入或为内生变量，因为存在遗漏变量同时影响收入与买保险决定。

由于扰动项与解释变量相关，Probit或Logit不一致。

考虑以下模型：

y1为可观测的虚拟变量，,为不可观测的潜变量,，y2是唯一的内生解释变量。

1（）为示性函数。

2019-05-31,陈强计量及Stata应用（c）2014,58,IVProbit的模型设定,假设扰动项服从二维正态分布：

u的方差标准化为1。

假设（u,v）独立于x与z，故x为外生解释变量，而z可作为y2的工具变量。

y2的内生性完全来自于u与v的相关性；如果二者,的相关系数,，则y2为外生变量。

2019-05-31,陈强计量及Stata应用（c）2014,59,2019-05-31,陈强计量及Stata应用（c）2014,60,MLE估计,给定x与z，（y1,y2）的条件概率分布完全确定，可写出似然函数，进行最有效率的MLE估计，称为“工具变量Probit”（IVProbit）但MLE在数值计算时，可能不易收敛，特别在多个内生解释变量的情形下。

两步法,思想：

y2的内生性由于遗漏了变量v所造成，只要把v作为控制变量加入方程即可得到一致估计。

第一步：

用OLS估计方程，得到其残差。

第二步：

将,作为控制变量加入方程，进行Probit估计。

2019-05-31,陈强计量及Stata应用（c）2014,61,MLEvs.两步法,系数不直接可比：

为将第二步的扰动项的方差标准化为1，MLE的系数是两步法系数的倍。

MLE更有效率，但两步法计算方便。

内生性检验：

（MLE）（两步法）,2019-05-31,陈强计量及Stata应用（c）2014,62,2019-05-31,陈强计量及Stata应用（c）2014,63,IVProbit的Stata命令,ivprobity1x1x2（y2=z1z2）,rivprobity1x1x2（y2=z1z2）,firsttwostepy1为被解释变量，y2为内生解释变量，x1x2为外生解释变量，z1z2为工具变量；选择项“r”表示稳健标准误；“twostep”表示使用两步法，默认为MLE；“first”表示显示第一步回归的结果。

2019-05-31,陈强计量及Stata应用（c）2014,64,例：

是否购买私人医疗保险（ins）,以数据集mus14data.dta为例，包括2002年3,206名美国老年人。

解释变量包括：

linc（家庭收入的对数），hstatusg（自我评估的健康状况虚拟变量），adl（日常生活中受限活动数目，numberoflimitationsonactivitiesofdailyliving），chronic（慢性病数目），age（年龄），age2（年龄平方），female（是否女性），educyear（教育年限），married（是否结婚），hisp（是否拉丁裔），white（是否白人）。

普通的Probit,usemus14data.dta,clearprobitinslincfemaleageage2educyearmarriedhispwhitechronicadlhstatusg,rnolog,2019-05-31,陈强计量及Stata应用（c）2014,65,2019-05-31,陈强计量及Stata应用（c）2014,66,内生性与工具变量,linc的系数为0.35，且在1%水平上显著，即家庭收入越高，越可能购买私人健康保险。

怀疑linc为内生变量，因为可能存在同时影响ins与linc的遗漏变量。

使用变量retire（本人是否退休）作为工具变量。

是否退休与收入linc相关，满足相关性；假设是否退休不直接影响购买保险的决策，满足外生性。

IVProbit（MLE）,ivprobitinsfemaleageage2educyearmarriedhispwhitechronicadlhstatusg（linc=retire）,rnolog结果见下页：

对外生性原假设“”进行沃尔德检验，p值为0.0367，可在5%水平上认为linc为内生变量u与v的相关系数高达0.64，这表明，遗漏变量在增加家庭收入的同时，也会提高购买保险的倾向。

使用ivprobit时，linc的估计系数为-0.62，改变了符号，且在10%水平上显著。

如使用Probit，忽略linc的内生性，将高估家庭收入对于保险购买倾向的正作用。

2019-05-31,陈强计量及Stata应用（c）2014,67,2019-05-31,陈强计量及Stata应用（c）2014,68,2019-05-31,陈强计量及Stata应用（c）2014,69,IVProbit（两步法）,ivprobitinsfemaleageage2educyearmarriedhispwhitechronicadlhstatusg（linc=retire）,firsttwostep结果见下页：

在第一步回归中，工具变量retire对于内生变量linc具有较强的解释力。

两步法的估计系数与MLE类似，但绝对值比后者约大25%检验linc外生性原假设，p值为0.0366，可在5%水平上认为linc为内生变量。

2019-05-31,陈强计量及Stata应用（c）2014,70,2019-05-31,陈强计量及Stata应用（c）2014,71,