《面板数据分析.ppt》由会员分享,可在线阅读,更多相关《面板数据分析.ppt(30页珍藏版)》请在第壹文秘上搜索。
1、面板数据分析 Panel Data1.面板数据模型简介 面板数据(panel data)也称作时间序列与截面混合数据(pooled time series and cross section data)。面板数据是截面上个体在不同时点的重复观测数据。 N=30,T=50的面板数据示意图的面板数据示意图 面板数据分两种特征面板数据分两种特征:(:(1 1)个体数少,时间长。()个体数少,时间长。(2 2)个)个体数多,时间短。面板数据用双下标变量表示。体数多,时间短。面板数据用双下标变量表示。 y yi ti t, , i i = 1, 2, , = 1, 2, , N N; ; t t = 1
2、, 2, , = 1, 2, , T Ti i 对应面板数据中不同个体。对应面板数据中不同个体。N N表示面板数据中含有表示面板数据中含有N N个个个个体。体。t t 对应面板数据中不同时点。对应面板数据中不同时点。T T表示时间序列的最大长表示时间序列的最大长度。度。利用面板数据建立模型的好处利用面板数据建立模型的好处是:(是:(1 1)由于观测值的增多,)由于观测值的增多,可以增加估计量的抽样精度。(可以增加估计量的抽样精度。(2 2)对于固定效应回归模型)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(能得到参数的一致估计量,甚至有效估计量。(3 3)面板数)面板数据建模比
3、单截面数据建模可以获得更多的动态信息。据建模比单截面数据建模可以获得更多的动态信息。yi t, i = 1, 2, , N; t = 1, 2, , T 若固定t不变,yi ., ( i = 1, 2, , N)是横截面上的N个随机变量; 若固定i不变,y. t, (t = 1, 2, , T)是纵剖面上的一个时间序列(个体)。 面板数据是不同个体和不同时期被观察的数据(Longitudinal or Panel Data)1 122iiiiyxx1 122ttttyxx1 122itititityxx横截面数据横截面数据时间序列数据时间序列数据面板数据面板数据2面板数据模型分类用面板数据建立
4、的模型通常有用面板数据建立的模型通常有3 3种,即种,即混合模型、固定效应模型和随混合模型、固定效应模型和随机效应模型。机效应模型。2.1 2.1 混合模型(混合模型(Pooled modelPooled model)。)。如果一个面板数据模型定义为,如果一个面板数据模型定义为, y yitit = = + + X Xit it + + itit, , i i = 1, 2, , = 1, 2, , N N; ; t t = 1, 2, , = 1, 2, , T T其中其中y yitit为被回归变量(标量),为被回归变量(标量), 表示截距项,表示截距项,X Xitit为为k k 1 1阶回
5、归变阶回归变量列向量(包括量列向量(包括k k个回归量),个回归量), 为为k k 1 1阶回归系数列向量,阶回归系数列向量, itit为误为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数无论对任何个体和截面,回归系数 和和 都相同。都相同。如果模型是正确设定的,解释变量与误差项不相关,即如果模型是正确设定的,解释变量与误差项不相关,即Cov(Cov(X Xitit, , itit) ) = 0= 0。那么无论是。那么无论是N N,还是,还是T T,模型参数的混合最小二乘估计量,模型参数的
6、混合最小二乘估计量(Pooled OLSPooled OLS)都是一致估计量。)都是一致估计量。 2.2 2.2 固定效应模型(固定效应模型(fixed effects modelfixed effects model)。)。 固定效应模型分为固定效应模型分为3 3种类型,即种类型,即个体固定效应模型、时点固定个体固定效应模型、时点固定效应模型效应模型和和个体时点双固定效应模型。个体时点双固定效应模型。下面分别介绍。下面分别介绍。 2.2.12.2.1个体固定效应模型个体固定效应模型(entity fixed effects modelentity fixed effects model) 如
7、果一个面板数据模型定义为,如果一个面板数据模型定义为, y yitit = = i i + + X Xit it + + itit, , i i = 1, 2, , = 1, 2, , N N; ; t t = 1, = 1, 2, , 2, , T T 其中其中 i i是随机变量,表示对于是随机变量,表示对于i i个个体有个个体有i i个不同的截距项,个不同的截距项,且且其变化与其变化与X Xitit有关系有关系;X Xitit为为k k 1 1阶回归变量列向量(包括阶回归变量列向量(包括k k个回归量),个回归量), 为为k k 1 1阶回归系数列向量,对于不同个体回归阶回归系数列向量,对
8、于不同个体回归系数相同,系数相同,y yitit为被回归变量(标量),为被回归变量(标量), itit为误差项(标量),为误差项(标量),则称此模型为个体固定效应模型。则称此模型为个体固定效应模型。3. 面板数据模型估计方法混合最小二乘(Pooled OLS)估计 (适用于混合模型)平均数(between)OLS估计 (适用于混合模型和个体随机效应模型)离差变换(within)OLS估计 (适用于个体固定效应回归模型)一阶差分(first difference)OLS估计 (适用于个体固定效应模型)可行GLS(feasible GLS)估计 (适用于随机效应模型) 示例 采用STATA自带的范例数据grunfeld.dta 包含六个变量 company和year分别表示样本公司的代码和观察的年份,相当于截面变量和时间变量 invest表示公司的投资额;mvalue表示公司的市场价值;kstock表示公司的资本存量 目的是看公司的投资额和资本存量如何影响公司的市场价值过程 第一步,声明截面变量和时间变量 第二步,进行样本的描述性统计 第三步,面板数据模型回归分析 第四步,模型的筛选和检验 固定效应显著性的检验 固定效应还是随机效应