《第3章 双变量模型假设检验名师编辑PPT课件.ppt》由会员分享,可在线阅读,更多相关《第3章 双变量模型假设检验名师编辑PPT课件.ppt(61页珍藏版)》请在第壹文秘上搜索。
1、1Review of simple regression model:estimationlPopulation regression model:E(Y|X)=b0+b1 XYi=b0+b1 Xi+uilSample regression model:l“Linear”regressionLinear with parameters01YXbb+01YXebb+2Estimation of simple regression model:OLS ii122ii01011nThe OLS estimates areX-XY-Y=X-X=Y-XCharacteristic of OLS esti
2、mate:1XY is always on the sample regression line Y+X;2 e=e0;30;40.iiiiiiix yxe XeYbbbbb,3第第3 3章双变量模型:假设检验章双变量模型:假设检验Simple regression model:Inferencey=b0+b1 x+u4目录l3.1经典线性回归模型基本假设l3.2OLS估计量的方差与标准差l3.3OLS估计量的性质l3.4OLS估计量的分布l3.5假设检验l3.6判定系数:R2l3.7回归分析结果的报告l3.8正态性检验l3.9例子:简单工资决定模型l3.10预测53.1经典线性回归模型的基本
3、假设l解释变量(X)与随机误差项(u)不相关。即cov(X,u)=0,如果X是非随机的,上述假定自动成立。l随机误差项的均值为0,即E(u)=0平均来说,随机项的影响可以相互抵消,其实该假设只是为了便于处理。l随机误差项同方差(homoscedasticity),即Var(ui)=s2,所以Var(Y|X)=var(b0+b1X+u|X)=s2Var(Y)=var(b0+b1X+u)=s26同方差性(Homoscedasticity).x1x2E(y|x)=b0+b1xyf(y|x)7异方差(Heteroscedasticity).x x1x2yf(y|x)x3.E(y|x)=b0+b1x83
4、.1经典线性回归模型的基本假设l随机误差项无自相关(no autocorrelation),又称序列相关,即Cov(ui,uj)=0 for all ij,等价于E(ui,uj)=0l随机误差项服从正态分布,即u N(0,s2)l上述几条假设称为经典线性模型基本假设(CLRM)93.2 OLS估计量的方差与标准差lOLS估计量11111222111010112211112211nnnniiiiiiiiiiinnniiiiiiniiiiiiiiiniiiniiiinniiiiiXXYYXX YXX YXX YXXXXXXXXXuXXXXXXX uXXXXXX uXXXXXXbbbbbbb+111
5、nniiiiucub+103.2 OLS估计量的方差与标准差 221111222211111212220022varvarvarvarvar=,nniiiiiinnniiiiiiniiiiiiXX uXXuXXXXXXsdXXXXsdnXXnXXsbbsbbbsbs+In the same way,113.2 OLS估计量的方差与标准差ls2的估计量l回归标准差(standard error of the regression)2212niiens212niiens123.2 OLS估计量的方差与标准差 212111212220022varvarvar=,niniiiiiXXseXXXXsen
6、XXnXXsbsbbbsbs133.3OLS估计量的性质lGauss-Markov Theorem如果满足经典计量经济学模型基本假设,则在所有无偏估计量中,OLS估计量具有最小方差性;即OLS估计量是最优线性无偏估计量(BLUE)。l线性:模型参数估计量是样本观察值的线性函数。11221111niinniiiiinniiiiiiXX YXXYcYXXXXb143.3OLS估计量的性质l无偏性l最小方差性:OLS估计量是所有无偏估计量中方差最小的估计量。111211111112211010110110,.1niiiniinniiiiiinniiiiiiXX uXXXX uXXE uEEXXXXu
7、EE YXEXXnEXE unbbbbbbbbbbbbbbb+153.4OLS估计量的分布1、0b和和1b的概率分布的概率分布 首先,首先,由于解释变量iX是确定性变量,随机误差项iu是随机性变量,因此被解释变量iY是随机变量,且其分布(特征)与iu相同。其次其次,0b和1b分别是iY的线性组合,因此0b、1b的概率分布取决于 Y。在u是正态分布的假设下,Y 是正态分布,因此0b和1b也服从正态分布,其分布特征(密度函数)由其均值和方差唯一决定。163.4OLS估计量的分布l经典模型假设ui N(0,s2)XN(a,s12),YN(b,s22),相互独立X+YN(a+b,s12+s22)因此,
8、OLS估计量也服从正态分布11022211111niinniiiiinnniiiiiiiiXX YXXXXYuXXXXXXbb+173.4OLS估计量的分布1ibib11002221122222002,where,.and,iiiNXXXNnXXbbbbsbb sssbb ss18例3.1在收入收入-消费支出例子消费支出例子中,参数估计及其标准差的计算如下收入X(元)支出Y(元)XX YY)(YYXX2)(XX 2XY2)(YY 1800700-900-410369000810000640000652232121000650-700-460322000490000 10000007541074
9、031200900-500-210105000250000 1440000855198441400950-300-1604800090000 196000095753516001100-100-10100010000 25600001059167461800115010040400010000 32400001161119720001200300902700090000 400000012633935822001400500290145000250000 484000013651257924001550700440308000490000 576000014666995102600150090
10、0390351000810000 676000015684649平均17001110求和16800003300000 322000001110033727195091.033000001680000)()(21XXYYXXb5.24417005091.0111010XYbb0357.0001278.03300000)210(33727)2()(22221iiixnexSsb1382.64705.4113330000010)210(3220000033727)2()(2222220 iiiiixnnXexnXSsb居民家庭收入与消费支出的回归方程为:iiXY5091.05.244+(64.138
11、2)(0.0357)203.5假设检验l在模型估计中,我们往往关注某些变量是否对被解释变量有关系,如果关系不大,我们估计出的参数应该比较小,接近于零。因此,在假设检验中,我们往往关注这样的原假设,H0:b1=0比如居民消费函数Y b0+b1X+u213.5假设检验 111222112111111222101221,where,0,1H:=0,Z,0iiiNXXZNsdXXXXuubbbsbb ssbbbbbbbssbb我们知道 的分布为所以,因此,对于原假设的检验,在给定显著性水平,我们可以求得相应的分位数或临界值如果我们计算的则拒绝 为 的原假设。223.5假设检验 222211111112
12、22101221,2T2H:=0,T,0niiiient nseXXXXttsssbbbbbbbssbb如果我们知道随机误差项的方差,则很容易利用正态分布来进行假设检验,但是,我们不知道我们利用它的估计值来代替,其中,。则,因此,对于原假设的检验,在给定显著性水平,我们可以求得相应的分位数或临界值如果我们计算的则拒绝 为 的原假设。233.5假设检验 111112122112212212122P1,t,0iiiiTt nseXXTtttXXtXXtXXbbbbbbsbbsbbsbs+同样的,我们可以在给定置信水平1-下,求取 的置信区间,则从 分布表中求到临界值。则有,所以,的置信区间容易求得
13、给定显著性水平,如果上述置信区间不包括,10b则说明,在 的显著性水平下,显著不为。243.5假设检验:例子居民家庭收入与消费支出的回归方程为:iiXY5091.05.244+(64.1382)(0.0357)0110.05/210000(1)H000.5091 0T14.243t=2.3060.03575%0H:=0 0244.50T=3.8132.306,064.1382bbbbbb双边检验:所以,拒绝原假设,认为 在的显著性水平下不为同样的,对于假设 则也显著不为。253.5假设检验:例子01110.051(2)H:=0 H:00.5091-0T=14.243t10-2=1.860.03
14、575%0bbb右侧检验所以,我们拒绝原假设,接受备选假设,认为,在的水平下显著大于 的。263.5假设检验:例子l事实上,我们可以进行其他形式的假设检验,不只是考虑为0的假设。比如:01111H:0.5H:0.50.5091-0.5T=0.2551.860.03575%0.5bbb所以,我们不能拒绝原假设,认为在的显著性水平下,不大于。273.5假设检验:例子1221212,95%0.42680.5914iitXXtXXbbsbsb+1同样的,我们可以在给定置信水平1-下,的置信区间为对于本例,在的置信水平下,的置信区间为,283.5假设检验:例子l如果我们现在要检验斜率的标准差是否为0.0
15、3,我们将使用卡方分布。012222221 0.05/20.05/221H:0.03H:0.03-1-110-1 0.0357=2.7004=12.7449 t/2(139)=1.96,拒绝原假设,说明在5%的水平下,高中成绩的高低显著影响大学成绩。置信区间为(0.30,0.66)59An Example:Determinants of College GPA(wooldridge,p128)l高考成绩对大学成绩的影响colGPA=2.40+0.027ACT (0.2642)(0.0109)9.10 2.49 0.000 0.014 n=141 fd=141-2=139 R2=0.0427l高
16、考成绩每提高2分,大学成绩会增加0.027分。l为0假设t值为2.491.96,尽管大学入学成绩对大学成绩的影响很小,但仍然有影响,因为它在5%的水平下显著不为0。l置信区间为(0.0056,0.0485)60An Example:Determinants of College GPA(wooldridge,p128)l逃课与大学成绩colGPA=3.15 0.0895 skipped (0.0428)(0.0280)73.71 -3.20 0.0000.002 n=141 fd=141-2=139 R2=0.0685l每周逃课次数每增加1次,大学平均成绩将下降0.0895分。l我们考察一下,逃课是不是会显著的降低大学成绩呢?即H0:b1 0 H1:b1 0lT0.0895/0.02823.20 1.96,所以我们拒绝原假设,接受备选假设,即逃课显著的降低大学的平均成绩。尽管逃课对大学成绩的影响似乎不是很大,但影响是仍然是很显著的。l其95%的置信区间为0.1449,0.034261summarylGoodness of fit:R2lTest of normal distributi