《第8章异方差性.ppt》由会员分享,可在线阅读,更多相关《第8章异方差性.ppt(50页珍藏版)》请在第壹文秘上搜索。
1、计量经济学导论第四版伍德里奇一、异方差-基本概念 定义:不可观测因素的方差随总体的不同部分(由不同解释变量值所决定)而变化,即:2iiiVaru x=()异方差对OLS影响:通常的t、F检验以及置信区间不确当OLS不是BLUE,也不再是渐进有效的不导致估计系数出现偏误或产生不一致拟合优度指标的解释也不受影响二、OLS估计后的异方差-稳健推断 适用情况:异方差形式未知1.出现异方差时的标准误和t统计量j1n22iii=12xjn22ijii=1ijijj2jjjVarVarx-xuSSTVar r uVar=rxiSSRSSR-(),对任何形式的异方差(包括同方差),()的一个确当估计为:(),
2、在一般多元回归模型中,()的一个确当估计为:(),表示将 对其他自变量做回归所得到的第 个残差,则是这个回归的残差平方和。该式子的平方根叫 的异方差 稳健标准误。相应的有异方差 稳t-t=健 统计量:估计值 假设值,因此计算标准误是关键。标准误例8.1P253用stata求异方差-稳健的t统计量:WAGE gen single=(married)gen male=(female)gen marrmale=male*married gen marrfem=female*married gen singfem=single*female reg lwage marrmale marrfem sin
3、gfem educ exper expersq tenure tenursq,robust异方差-稳健t估计OLS估计:reg lwage marrmale marrfem singfem educ exper expersq tenure tenursq异方差-稳健的t统计量推断的适用性:异方差-稳健t检验统计量只有在样本容量越来越大时才能使用。小样本时可能不服从t分布异方差异方差-稳健的稳健的F统计量统计量例例8.2 P255 GPA3.DTA例8.2 P255 GPA3.DTA 1.异方差-稳健回归得R-square=0.4006(注意是春季学期,所以有条件项)2.联合显著性检验约束方程
4、回归求R-squared=0.3983普通OLS回归普通OLS回归的约束方程回归 计算F统计量:异方差-稳健的LM检验例例8.3 P256 CRIME1.DTA例8.3 P256 CRIME1.DTATurning point for avgsendi _bavgsen/(2*_bavgsensq)-17.276862 1.ROBUST回归回归受约束方程robust回归并预测残差rur受约束变量avgsen对其他没有排除的自变量回归,保留残差r1注意回归不包含原来的注意回归不包含原来的y受约束变量avgsensq对其他没有排除的自变量回归,保留残差r2对观测值求rrur无截距语句与无截距语句与
5、robust不能同时使用不能同时使用?求F统计量的p值用1对每个rrur回归,得到LM统计量=n-SSR1,SSR1就是该步骤的残差平方和异方差异方差-稳健的稳健的LM=4.00,查表,在自由度为,查表,在自由度为2的的 分布中,分布中,10%,X=4.61;5%,X=5.99;1%,X=9.21,不能拒绝,不能拒绝H0.22.2.同理求普通同理求普通LMLMreg narr86 pcnv ptime86 qemp86 inc86 black hispanreg narr86 pcnv ptime86 qemp86 inc86 black hispanpredict urrpredict ur
6、r,residresidreg avgsen pcnv ptime86 qemp86 inc86 black hispanreg avgsen pcnv ptime86 qemp86 inc86 black hispanpredict ur11predict ur11,residresidreg avgsensq pcnv ptime86 qemp86 inc86 black hispanreg avgsensq pcnv ptime86 qemp86 inc86 black hispanpredict ur22predict ur22,residresidgen urr11=urrgen u
7、rr11=urr*ur11ur11gen urr22=urrgen urr22=urr*ur22ur22gen io=1gen io=1reg io urr11 urr22reg io urr11 urr22?predict ubar1,residquite reg avgsen pcnv ptime86 qemp86 inc86 black hispanpredict r1,rquite reg avgsensq pcnv ptime86 qemp86 inc86 black hispanpredict r2,rquite gen ur1=ubar1*r1quite gen ur2=ubar
8、1*r2gen iota=1reg iota ur1 ur2,noconstantscalar hetlm=e(N)-e(rss)scalar pval=chi2tail(2,hetlm)display _n Robust LM statistic:%6.3f hetlm/*/_n Under H0,distrib Chi2(2),p-value:%5.3f pvalRobust LM statistic:3.997Under H0,distrib Chi2(2),p-value:0.136predict ubar2,residreg ubar2 pcnv avgsen avgsensq pt
9、ime86 qemp86 inc86 black hispan scalar lm1=e(N)*e(r2)display _n LM statistic:%6.3f lm1/*通常的LM=3.54异方差稳健LM=4.00仍然不能拒绝H0问题:语句的意思,有没有直接计算LM的命令(robust LM statistic已有,则前面的计算?)三、异方差的检验 原理:22222011012222u=+x.1:.0/(1)/(1)1kkkuuuuxvHRkFRnkLMn RR()为方程()的拟合优度方法1:异方差的BPagan检验STATA准备:准备:BPagan检验不是标准语句,需要下载,操作如下:
10、检验不是标准语句,需要下载,操作如下:输入命令:输入命令:.findit bpagan.search bpagan,all得到词条:bpagan from http:/fmwww.bc.edu/RePEc/bocode/b 点击后按install 然后help bpagan,可以看到:BPAGAN:module to perform Breusch-Pagan test for heteroskedasticity/方法2:异方差的怀特检验 原理:步骤:2201212u=+y+y+H0=0误差项:异方差的BPagan检验和white检验例8.4,8.5 P259 HPRICE1.DTA1.普通
11、回归普通回归2.异方差检验?whitetst,fitted option fitted not allowed P值都不显著,存在异方差3.因变量采用对数形式回归及检验:消除异方差问题:两个检验出现矛盾的结论?问题:两个检验出现矛盾的结论?注意:进行异方差检验时应该首先检验模型的误设问题,否则异方差检验可能都是显著的四、加权最小二乘WLS估计 若已知异方差的形式,采用若已知异方差的形式,采用WLS比比OLS更有效,且能得到更有效,且能得到确当的确当的t、F统计量。统计量。情况情况1:除一个常数倍数外异方差是已知的:除一个常数倍数外异方差是已知的:01 1k2iiiii2iii*ixy=+x.+
12、x1Varu x=hxhxhxhxu/hx0Varu x=h1hGLStFku令 表示()中所有解释变量,并假定:()(),其中,()是解释变量的某种函数,并决定着异方差,()0由于 是 的函数,所以以 为条件的期望值为,并且(),所以可以将方程()两边同时除以经过变换以后得到的估计量 即为广义最小二乘估计量,此时得到的标准误、统计量是确当WLSGLSWLSOLS的。但拟合优度对原估计无意义。上述方法即为,纠正异方差的估计量为估计量。其思想是对误差方差越大的观察值赋予越小的权数,则对每个值权数相等。在现代软件包中不需手动变形,但要输入加权函数。WLS原理原理WLS应用:例8.6 P265 40
13、1KSUBS.DTA(与答案例子不同)1.OLS回归,得到第一列结果。(注意,只用单身个人数据回归,得到第一列结果。(注意,只用单身个人数据 if fsize=1)2.WLS回归,得第二列结果WLS语句:aw=1/inc 3.gen agenew=(age-25)2 注意数据集中对注意数据集中对age的的解释有误。解释有误。控制新变量的控制新变量的OLS回归,得第三列结果回归,得第三列结果(?系数及(?系数及t与书上略有差异)与书上略有差异)4.控制新变量的控制新变量的WLS回归,得第四列结果回归,得第四列结果(?系数及(?系数及t与书上略有差异)与书上略有差异)问题:什么时候权数是除以问题:
14、什么时候权数是除以h,什么时候是除以根号,什么时候是除以根号h?取决于是否先对变量进行变换。不变换,则无根号取决于是否先对变量进行变换。不变换,则无根号WLS权数的选择 多数情况中,对权数的选择有一定随机性 当研究问题没有个人层次数据而只有样本小组的均值数据时,如果个体方程同方差,则可以用小组人数(如企业规模,城市人口数)作为权数,以保证较大的子样本得到较高权数 但由于总体样本平均误差的形式不确定,在利用人均数据估计模型时研究倾向于简单使用OLS并计算稳健的标准误和统计量 另一种方法是以组规模进行加权,但在WLS估计中报告异方差-稳健统计量。情况情况2.异方差形式未知,需估计异方差函数:可行异
15、方差形式未知,需估计异方差函数:可行GLS原理:原理:如果异方差形式未知,则模型化函数h,并利用数据来估计这个模型中的未知参数,在GLS变换中用每个hi的估计值取代hi得到原方程的可行的可行的GLS(FGLS)估计量)估计量。因为使用同样的数据进行估计,所以FGLS不是无偏的,但是一致的,且比OLS渐进有效。0112011iiii011hx=exp+x+x+,gh=exp g1/hWLSy=+x.kkkkkkex()(.+x)log(u)=.+x该方程的拟合值记为()以为权数用估计 模型化函数模型化函数h的一种特殊方法:的一种特殊方法:线性模型不能保证预测值都为正,但进行线性模型不能保证预测值
16、都为正,但进行WLS变换要求估计的变换要求估计的方差必须为正方差必须为正估计估计hi的另一个方法的另一个方法22loguyy将步骤三中的回归换为:()对,的回归。FGLS应用:例8.7 P270 SMOKE.DTA1.普通普通OLS回归回归价格、收入都不显著价格、收入都不显著1.收入对吸烟量的影响 display _blincome*10/100 0.088026822.年龄与吸烟量的二次关系转折点 display _bage/2/_bagesq -42.7081163.怀特检验whitetst Whites general test statistic:52.17226 Chi-sq(25)P-value=.00114.whitetst,fitted Whites special test statistic:26.57258 Chi-sq(2)P-value=1.7e-06 5.Bpagan检验 bpagan cigs lincome lcigpric educ age agesq restaurn Breusch-Pagan LM statistic:1021.143 Chi-s