R语言分析面板数据:简单案例

28,411 阅读

1.面板数据定义 面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。或者说他是一个m*n的数据矩阵,记载的是n个时间节点上,m个对象的某一数据指标。(from 百度百科)

2.R语言中进行面板数据分析的包:plm

3.一个关于工资水平的案例 data set:美国595名个体从1976年到1982年的数据,共有4165个观测值(4165/595=7;相当于每个个体有7条记录)这七个观测值按顺序对应于1976到1982年的观测。数据来源:plm包里的Wages数据。 数据一览:

code:

install.packages("plm")
library(plm)
data("Wages",package="plm")
rd=plm(lwage~married+exp+I(exp^2)+bluecol+union+sex+black+ed,data=Wages,model="random",index=595)
summary(rd)

结果一览:

上述回归没有添加工具变量,下面添加工具变量:sex,black,bluecol,south,smsa,ind

plm方法里添加工具变量的方法是使用"|","|"后的变量为工具变量

library(plm)
data("Wages",package="plm")
ht=plm(lwage~married+exp+I(exp^2)+bluecol+union+sex+black+ed | sex+black+bluecol+south+smsa+ind,data=Wages,index=595)
summary(ht)

结果一览:

T.V.exo:外生变量(工具变量) T.V.endo:内生变量 T.I.exo:不随时间变化的外生变量 T.I.endo:不随时间变化的内生变量

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码