《计量经济学11.ppt》由会员分享,可在线阅读,更多相关《计量经济学11.ppt(35页珍藏版)》请在第壹文秘上搜索。
1、第三部分第三部分 实践中的实践中的回归分析回归分析Chp 11 标准与检验标准与检验11-2主要内容主要内容n优良模型的性质优良模型的性质n设定误差的类型设定误差的类型n遗漏相关变量遗漏相关变量n包括不相关变量包括不相关变量n不正确的函数形式不正确的函数形式n度量误差度量误差n设定误差的诊断设定误差的诊断n小结小结11-3一、优良模型的性质一、优良模型的性质n简约性(简约性(Parsimony)n可识别性(可识别性(Identifiability)n拟合优度(拟合优度(Goodness of fit)n理论一致性(理论一致性(Theoretical consistency)n预测能力(预测能力
2、(Predictive power)11-4二、设定误差的类型二、设定误差的类型n导致模型失效的设定误差主要包括如下几导致模型失效的设定误差主要包括如下几种类型:种类型:遗漏相关变量遗漏相关变量包括不必要的变量包括不必要的变量采用了错误的函数形式采用了错误的函数形式度量误差度量误差11-5三、遗漏相关变量三、遗漏相关变量 “过低拟合过低拟合”模型模型n考虑如下模型:考虑如下模型:Yi=B1+B2X2i+B3X3i+ui其中,其中,Y为婴儿死亡率,为婴儿死亡率,X2为人均为人均GNP,X3为女性识为女性识字率字率n若在建模时遗漏了变量若在建模时遗漏了变量X3,则有:,则有:Yi=A1+A2X2i
3、+vi12233iiiiYBB XB Xu 11-6n遗漏变量遗漏变量X3将导致的后果:将导致的后果:如果遗漏变量如果遗漏变量X3与模型中的变量与模型中的变量X2相关,则相关,则a1和和a2是有偏的,即:其均值或期望值与真实值是有偏的,即:其均值或期望值与真实值不一致,用符号表示如下:不一致,用符号表示如下:E(a1)B1,E(a2)B2n可以证明:可以证明:E(a2)=B2+B3b32E(a1)=B1+B3(E(X3)-b32E(X2)11-7a1和和a2也是不一致的,即无论样本容量有多大,也是不一致的,即无论样本容量有多大,偏差也不会消失偏差也不会消失如果如果X2与与X3不相关,则不相关,
4、则b32为零。为零。根据错误模型得到的误差方差是真实误差方差根据错误模型得到的误差方差是真实误差方差的有偏估计量;的有偏估计量;a2的方差是真实估计量的方差是真实估计量b2方差的有偏估计量。方差的有偏估计量。通常的置信区间和假设检验过程不再可靠。通常的置信区间和假设检验过程不再可靠。11-8n例例11-1:婴儿死亡率的决定因素:婴儿死亡率的决定因素正确:正确:CM=f(PGNP,FLR,u)错误:错误:CM=f(PGNP,u)n启示启示:在建立模型时,要对研究现象:在建立模型时,要对研究现象所蕴含的经济理论做深入了解,从而所蕴含的经济理论做深入了解,从而把相关变量都纳入模型。把相关变量都纳入模
5、型。11-9四、包括不相关变量四、包括不相关变量“过度拟合过度拟合”模型模型n模型包括不必要变量将导致的后果模型包括不必要变量将导致的后果不不相关变量偏差相关变量偏差假定下列包含双变量的模型为正确:假定下列包含双变量的模型为正确:Yi=B1+B2X2i+ui但建模时包括了不必要的变量但建模时包括了不必要的变量X3,即:,即:Yi=A1+A2X2i+A3X3i+vi该模型的估计后果:该模型的估计后果:11-10n“不正确不正确”模型的模型的OLS估计量是无偏的,即估计量是无偏的,即E(a1)=B1,E(a2)=B2,E(a3)=0n方差方差 2的估计量是正确的的估计量是正确的n建立在建立在t检验
6、和检验和F检验基础上的标准的置信检验基础上的标准的置信区间和假设检验仍然是有效的。区间和假设检验仍然是有效的。n错误的回归方程中估计的错误的回归方程中估计的a是无效的是无效的其其方差比从真实模型中估计的方差比从真实模型中估计的b的方差大。的方差大。11-11五、不正确的函数形式五、不正确的函数形式nYt=B1+B2X2t+B3X3t+ut(1)B2度量了度量了Y对对X2的变化率的变化率nlnYt=A1+A2lnX2t+A3lnX3t+vt(2)A2度量了度量了Y对对X2的弹性,的弹性,n实践中,经济理论没有明确应变量与解释实践中,经济理论没有明确应变量与解释变量之间的函数形式,假定对数形式是正
7、变量之间的函数形式,假定对数形式是正确的,但人们很可能用(确的,但人们很可能用(1)式来拟合数据,)式来拟合数据,导致模型设定误差。导致模型设定误差。11-12n例:例:11-3 美国进口货物的支出(美国进口货物的支出(P251)n=-751.47+0.576X-19.01Timen t=-5.63*8.68*-5.43*nR2=0.96,Ad_R2=0.96,F=233.3nln=-22.01+3.66lnX-0.0458Timen t=-4.17*5.10*-2.32*nR2=0.96,Ad_R2=0.96,F=233.311-13n例:例:11-3 美国进口货物的支出(美国进口货物的支出
8、(P251)分别用上述两种模型对数据进行拟合,其中:分别用上述两种模型对数据进行拟合,其中:n模型一的所有回归系数都显著,模型一的所有回归系数都显著,X的回归系数表明的回归系数表明在其他条件不变的情况下,个人可支配收入每增加在其他条件不变的情况下,个人可支配收入每增加1美元,平均进口支出将增加美元,平均进口支出将增加57美分,美分,n模型二的回归系数亦显著,其中,进口支出对模型二的回归系数亦显著,其中,进口支出对PDI的弹性约为的弹性约为3.66,而时间的回归系数表明,在其他,而时间的回归系数表明,在其他变量保持不变的条件下,进口支出年均以变量保持不变的条件下,进口支出年均以4.58%的的速率
9、降低,速率降低,。,。两个模型难以进行直接的比较两个模型难以进行直接的比较11-14六、度量误差六、度量误差n一般地,我们隐含地假定应变量和解释变量不存一般地,我们隐含地假定应变量和解释变量不存在度量误差,即在度量误差,即数据是准确的数据是准确的,而不是臆断的、,而不是臆断的、外推的、内插的或围绕某个系统样式。实践中,外推的、内插的或围绕某个系统样式。实践中,这种假定往往难以满足。这种假定往往难以满足。n应变量中的度量误差应变量中的度量误差导致的后果:导致的后果:OLS估计量是无偏的;估计量是无偏的;OLS估计量的方差也是无偏的;估计量的方差也是无偏的;估计量的估计方差比没有度量误差时的大估计
10、量的估计方差比没有度量误差时的大n应变量中的误差加入到了误差项应变量中的误差加入到了误差项ui中。中。11-15n解释变量中的度量误差解释变量中的度量误差导致的后果:导致的后果:OLS估计量是有偏的;估计量是有偏的;OLS估计量也是不一致的估计量也是不一致的n解决办法:解决办法:使用工具变量或替代变量使用工具变量或替代变量n实践中的建议:实践中的建议:确保变量确保变量X的数据尽可能准确,避免记录、舍的数据尽可能准确,避免记录、舍入和遗漏误差。入和遗漏误差。11-16七、诊断设定误差:检验七、诊断设定误差:检验n1.诊断非相关变量的存在诊断非相关变量的存在t检验检验在建模时,为了避免遗漏变量偏差
11、,会纳入一在建模时,为了避免遗漏变量偏差,会纳入一些控制变量。如果统计检验表明它们不显著(些控制变量。如果统计检验表明它们不显著(t检验),则可将它们从模型中删除。检验),则可将它们从模型中删除。n例:考虑模型例:考虑模型Yt=B1+B2X2t+B3X3t+B4X4t+ut11-17n例例11-4:85个国家的生命预期个国家的生命预期先验地预期先验地预期收入收入和和生命预期生命预期、获得保健获得保健和和生命生命预期预期之间正相关。之间正相关。n模型模型1验证这一预期;验证这一预期;n模型模型2增加了收入平方变量增加了收入平方变量目的在于验证生命预期对收入是以递增的速率变化还是以目的在于验证生命
12、预期对收入是以递增的速率变化还是以递减的速率变化;递减的速率变化;n模型模型3增加了获得保健平方变量增加了获得保健平方变量目的在于验证生命周期对获得保健是以递增的速率变化还目的在于验证生命周期对获得保健是以递增的速率变化还是以递减的速率变化。是以递减的速率变化。11-18表表11-2 生命预期模型生命预期模型解释变量解释变量Model 1Model 2Model 3Intercept收入收入获得获得收入平方收入平方获得平方获得平方R2F39.438(20.2)0.0054(4.44)0.2833(9.96)-0.774140.5340.508(20.8)0.0016(3.48)0.2499(8
13、.08)0(-2.41)-0.789101.0943.166(10.02)0.0014(2.68)0.149(1.001)0(-1.96)0.0008(0.69)0.79075.4511-19n逐步回归:最开始逐步回归:最开始Y与与X2相关,因为相关,因为b2在统计是在统计是显著,接着将模型加入变量显著,接着将模型加入变量X3。如果。如果b3统计显著,统计显著,则把这个变量保留在模型中这样的过程。则把这个变量保留在模型中这样的过程。n建模中不能重复使用建模中不能重复使用t检验和检验和F检验,但从某种程检验,但从某种程度上说,某些实验过程(如数据挖掘)有助于决度上说,某些实验过程(如数据挖掘)有
14、助于决定应变量和解释变量之间的函数形式。尤其当模定应变量和解释变量之间的函数形式。尤其当模型中包含若干解释变量,而我们又无法通过作图型中包含若干解释变量,而我们又无法通过作图直观观察这些变量与应变量关系的时候。直观观察这些变量与应变量关系的时候。11-20n2.对遗漏变量和不正确函数形式的检验对遗漏变量和不正确函数形式的检验n对于菲利普斯曲线:预期工资变化率与失对于菲利普斯曲线:预期工资变化率与失业率负相关,但它们可能的关系有:业率负相关,但它们可能的关系有:Yt=B1+B2Xt+ut(B20)lnYt=B1+B2lnXt+ut(B20)11-21n模型的选择:实践中通常按如下步骤进行模型的选
15、择:实践中通常按如下步骤进行判断:判断:首先根据理论或调查及先前的实践经验,建立首先根据理论或调查及先前的实践经验,建立一个自认为抓住了问题本质的模型;一个自认为抓住了问题本质的模型;然后对这个模型进行实证检验;然后对这个模型进行实证检验;得到回归结果后,根据前面讨论的得到回归结果后,根据前面讨论的“好好”的模的模型衡量标准型衡量标准进行事后分析。此时才知道所选择进行事后分析。此时才知道所选择模型是否恰当。模型是否恰当。11-22n判定模型是否恰当主要根据以下一些参数:判定模型是否恰当主要根据以下一些参数:R2和校正后的和校正后的R2估计的估计的t值值与先验预期相比,估计系数的符号与先验预期相
16、比,估计系数的符号n如果结果并不令人满意,由要考虑模型是如果结果并不令人满意,由要考虑模型是否恰当,并寻求补救措施,可能是遗漏某否恰当,并寻求补救措施,可能是遗漏某个重要变量;使用错误的函数形式等。个重要变量;使用错误的函数形式等。主主要可采用以下一些方法:要可采用以下一些方法:11-23n残差检验残差检验残差图可显示模型中的设定误差,如遗漏了某残差图可显示模型中的设定误差,如遗漏了某个重要的变量,或使用了不正确的函数形式。个重要的变量,或使用了不正确的函数形式。例:例:正确模型为正确模型为(11-13):Yt=B1+B2Xt+B3timet+ut错误模型为(遗漏错误模型为(遗漏X):):Yt=B1+B3timet+vt则:则:vt=B2Xt+utnV不仅反映出真实的随机项不仅反映出真实的随机项u,还反映变量,还反映变量X11-24n对图对图11-2的说明的说明S1:“错误错误”模型的残差;模型的残差;S2:“正确正确”模型的残差。模型的残差。n但从图中我们还可以看出,即使在进口支出函数中但从图中我们还可以看出,即使在进口支出函数中增加了趋势变量,残差也不完全是随机分布的,从增加了趋势