《第6章双变量回归.ppt》由会员分享,可在线阅读,更多相关《第6章双变量回归.ppt(38页珍藏版)》请在第壹文秘上搜索。
1、2023-11-7计量经济学讲义1第6章:双变量线性回归2023-11-7计量经济学讲义2本章主要内容 双变量线性回归模型:回归的含义 总体回归函数 随机误差项的性质和设定 参数估计-普通最小二乘法 参数最小二乘估计量的统计性质(小结)2023-11-7计量经济学讲义3复习:计量经济学“四大过程”模型设计:模型设计:理论假说理论假说理论模型理论模型计量模型计量模型模型估计:模型估计:数据数据估计方法估计方法模型检验:模型检验:经济经济统计统计计量计量模型应用:模型应用:预测预测制定政策制定政策2023-11-7计量经济学讲义4复习:计量模型“四个要素”Y=1+2X+u3、方程式4、随机扰动项2
2、、参数1、变量2023-11-7计量经济学讲义5(2)、回归与相关 相关分析就是用来测度变量之间的线性关联程度的一种分析方法。回归分析并不对变量之间的关系感兴趣,主要是通过自变量的设定值来估计或预测因变量的平均值,同时对经济理论建立的假设进行检验。2023-11-7计量经济学讲义62023-11-7计量经济学讲义7回归的几个基本概念回归分析回归分析(regression analysis)是研究一个变量关于另一个(些)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论变量的具体依赖关系的计算方法和理论。其用意其用意:在于通过后者的已知或设定值,去估计和(或)预在于通过后者的已知或
3、设定值,去估计和(或)预测前者的(总体)均值测前者的(总体)均值。这里:前一个变量被称为被解释变量被解释变量(Explained Variable)或因变量因变量(Dependent Variable),),后一个(些)变量被称为解解释变量释变量(Explanatory Variable)或自变量自变量(Independent Variable)。)。2023-11-7计量经济学讲义82、总体回归函数 总体回归函数(PRF:Population Regression Function)E(Y|Xi)=f(Xi)例如 Yi=b0+b1Xi+u 回归直线上的点可表示为:E(YXi)=b0+b1Xi
4、 2023-11-7计量经济学讲义9总体回归曲线2023-11-7计量经济学讲义10总体回归函数释义 E(YXi)意为:在给定X值的条件下Y值分布的均值,即回归。这就是Y的条件期望(conditional expectation)或条件均值(conditional expected value)。意味着Y依赖于X,一般称之为Y对X的函数。一般称为Y对X的回归。换句话说,总体回归直线经过Y的条件期望值。2023-11-7计量经济学讲义11回归系数 b0,b1为参数parameters,也称回归系数(regression coefficients)b1为截距(intercept);b0为斜率(sl
5、ope)ui是随机误差项(stochastic,random error term)或随机干扰项。其值不能先验地知道。通常用概率分布来描述。2023-11-7计量经济学讲义12条件分布 条件分布:以X取定值为条件的Y的条件分布 注:给定收入X,支出Y并不确定,而是取不同的值。问:给定收入X,支出Y取什么值?例:给定X=80,Y取5个不同的值:55、60、65、70、752023-11-7计量经济学讲义13条件概率 条件概率:给定X的Y的概率,记为P(Y|X)。已知给定X=80,Y取5个不同的值:55、60、65、70、75。问:Y取每个值的概率有多大?古典概率模型:取每个值的概率相等。因此有:
6、P(Y=55|X=80)=1/5;P(Y=60|X=80)=1/5;P(Y=65|X=80)=1/5;P(Y=70|X=80)=1/5;P(Y=75|X=80)=1/5;2023-11-7计量经济学讲义14条件期望 问:给定X,Y可以取不同的值,那么,这些值平均起来是多少?条件期望(conditional Expectation):给定X的Y的期望值,记为E(Y|Xi)。例如,E(Y|X=80)=551/5601/5651/5701/5751/565 注:条件均值条件期望,称条件期望是为了表示它是总体的平均值。习惯上,看到“期望”一般指的是总体的平均值;看到“均值”一般指的是样本的平均值。应该
7、注意区分二者的含义。2023-11-7计量经济学讲义15总体回归曲线 思考:给定一个X,就对应一个(唯一的)E(Y|X)。因此,(X,E(Y|X))可以表示成平面上的一个点。总体回归曲线(Popular Regression Curve):Y的条件均值的轨迹。即Y对X的回归。总体回归曲线的几何意义:当解释变量给定值时因变量的条件期望值的轨迹。2023-11-7计量经济学讲义16条件均值条件均值 80 140 220 XE(Y|Xi)Y149101652023-11-7计量经济学讲义17总体回归函数(PRF)因为每个Xi对应唯一的一个E(Y|Xi),所以E(Y|Xi)是Xi的函数。将此函数称为:
8、总体回归函数(PRF:Population Regression Function)E(Y|Xi)=f(Xi)(1)当PRF的函数形式为线性函数,则有,E(Y|Xi)=1+2Xi (2)其中1和2为未知而固定的参数,称为回归系数。1和2也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。2023-11-7计量经济学讲义186.4随机误差项的性质及其来源 1、变量的省略。由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量有一定影响的自变量。2、统计误差。数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代
9、表性误差。3、模型的设定误差。如在模型构造时,非线性关系用线性模型描述了;复wwaz杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。4、随机误差。被解释变量还受一些不可控制的众多的、细小的偶然因素的影响 2023-11-7计量经济学讲义194、总体与样本 总体是我们研究的目的,但是不能知道总体的全部数据 用总体中的一部分(样本)来推断总体的性质。总体样本样本样本2023-11-7计量经济学讲义204、样本回归函数(SRF)n 两个随机样本,对应给定的每个Xi只有一个Y值,问:能从样本数据中估计出PRF吗?样本数据一 样本数据二XY149265344 1029XY151247346
10、 10302023-11-7计量经济学讲义21样本回归线与总体回归线n 比较两条样本回归线SRF1和SRF2(假定PRF是直线),问哪条样本线代表“真实”的总体回归线?SRF1PRFSRF2YX2023-11-7计量经济学讲义222023-11-7计量经济学讲义232023-11-7计量经济学讲义24样本回归函数 估计量(Estimator):一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计值。)X|E(Y)X|E(Y(:SRF2211i21i21的估计量。是的估计量;是的估计量;是其中相对于iiiiYXXY2023
11、-11-7计量经济学讲义25比较PRF和SRFiiiiiiiiiiiiiiiiiiiuXYuXYresidualuuXuYYXYuXuYX2121212121i21i :PRFSRF)(:SRF )X|E(Y)X|E(Y :PRF来估计根据回归分析的主要目的是是残差项其中2023-11-7计量经济学讲义26样本回归线的几何意义 Xi X i uiYE(Y|Xi)E(Y|Xi)iYi :SRF21iiXY)X|E(Y :PRF21iiX2023-11-7计量经济学讲义27样本回归线的几何意义呢?“逼近”真实的系数尽可能能使得问:怎样构造的一个近似估计是iiSRFPRFSRF2023-11-7计量
12、经济学讲义28“线性”的含义“线性”可作为两种解释:对变量的线性和对参数的线性。本课“线性”回归一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。模型对参数为线性?模型对变量为线性?是不是是LRM LRM 不是NLRM NLRM LRM=线性回归模型;NLRM=非线性回归模型2023-11-7计量经济学讲义29线性回归的特殊含义:2023-11-7计量经济学讲义306.6:“线性”特殊含义:一解释变量的线性一解释变量的线性:是被解释变量是被解释变量y与解释变量与解释变量x之间为线性关之间为线性关系,即解释变量系,即解释变量x仅以一次方的形式出现在模型之中。用数学仅以一次方的形式出现
13、在模型之中。用数学语言表示为:语言表示为:1yx220yx二是被解释变量x与参数 之间为线性关系,即参数仅以一次方的形式出现在模型之中。用数学语言表示为:01y2200y1yx2210y在经济计量学中,我们更关心被解释变量y与参数 之间的线性关系。因为只要被解释变量y与参数 之间2023-11-7计量经济学讲义31为线性关系,即使被解释变量y与解释变量x之间不为线性关系,我们也可以通过变量替换方便地将其化为线性。例如,模型就属于被解释变量y与解释变量x之间不为线性关系的情形,如果我们令 ,此时非线性模型 就变成线性模型 了。011iiiyux011iiiyux1xx01iiiyxu三、一元线性
14、回归模型中随机项的假定在给定样本观测值(样本值),1,2,3,n后,为了估计(2.1.5)式的参数 和 ,必须对随机项做出某些合理的假定。这些假定通常称为古典假设。(,)iix y01 2023-11-7计量经济学讲义32“线性”的含义 Y=1+2X+u 是线性的!lnY=1+2lnX+u 也是线性的!Y=1ln(2X+u)不是线性的!2023-11-7计量经济学讲义332023-11-7计量经济学讲义34方程组(*)称为正规方程组正规方程组(normal equations)。(2.2.3)(2.2.4)2023-11-7计量经济学讲义35记22221)(iiiiXnXXXxiiiiiiii
15、YXnYXYYXXyx1)(上述参数估计量可以写成:XYxyxiii1021称为OLS估计量的离差形式离差形式(deviation form)。)。由于参数的估计结果是通过最小二乘法得到的,故称为普通普通最小二乘估计量最小二乘估计量(ordinary least squares estimators 2023-11-7计量经济学讲义36由最小二乘法确定的一元线性回归方程 有以下性质:iy01bbix1、它是由所选取的样本唯一决定的。即对于一个给定的样本,只能估计出一个 ,但对于不同的样本,估计出的 可能不相等,即它们是服从某种分布的随机变量。01bb和01bb和2、残差的均值为零,即10niieen3、残差 的大小无关,进而与 的大小无关,即 iie x与iy(,)(,)0iiiiCOV e xCOV e y4、由 知,。说明回归直线 通过样本的平均点()。01by bx 01y b bx iy01bb ix,x y2023-11-7计量经济学讲义372023-11-7计量经济学讲义38