双重差分操作⼿册(附平⾏趋势检验coefplot)
本⽂由计量经济学服务中⼼综合整理
转载请注明来源
⼀、简介
现代计量经济学和统计学的发展为我们的研究提供了可⾏的⼯具。倍差法来源于计量经济学的综列数据模型,是政策分析和⼯程评估中⼴为使⽤的⼀种计量经济⽅法。主要是应⽤于在混合截⾯数据集中,评价某⼀事件或政策的影响程度。该⽅法的基本思路是将调查样本分为两组,⼀组是政策或⼯程作⽤对象即“作⽤组”,⼀组是⾮政策或⼯程作⽤对象即“对照组”。根据作⽤组和对照组在政策或⼯程实施前后的相关信息,可以计算作⽤组在政策或⼯程实施前后某个指标(如收⼊)的变化量(收⼊增长量),同时计算对照组在政策或⼯程实施前后同⼀指标的变化量。然后计算上述两个变化量的差值(即所谓的“倍差值”)。这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。该法最早由Ashenfelter(1978)引⼊经济学,⽽国内最早的应⽤或为周黎安、陈烨(2005)。
rider
常⽤的倍差法主要包括双重倍差法和三重倍差法。双重差分法(Difference-in-difference,DID)有⼏种其
他的称谓:倍差法、差分再差分等。该⽅法的原理⾮常简单,它要求数据期⾄少有两期,所有的样本被分为两类:实验组和控制组,其中实验组在第⼀期是没有受到政策影响,此后政策开始实施,第⼆期就是政策实施后的结果,控制组由于⼀直没有受政策⼲预,因此其第⼀期和第⼆期都是没有政策⼲预的结果。双重差分⽅法的测算也⾮常简单,两次差分的效应就是政策效应。
双重差分法的假定,为了使⽤OLS⼀致地估计⽅程,需要作以下两个假定。
假定1:此模型设定正确。特别地,⽆论处理组还是控制组,其时间趋势项都是。此假定即“平⾏趋势假定”(parallel trend assumption)。 DID最为重要和关键的前提条件:共同趋势(Common Trends)
双重差分法并不要求实验组和控制组是完全⼀致的,两组之间可以存在⼀定的差异,但是双重差分⽅法要求这种差异不随着时间产⽣变化,也就是说,处理组和对照组在政策实施之前必须具有相同的发展趋势。
假定2:暂时性冲击与政策虚拟变量不相关。这是保证双向固定效应为⼀致估计量(consist estimator)的重要条件。在此,可以允许个体固定效应与政策虚拟变量相关(可通过双重差分或组内变换消去,或通过LSDV法控制)。
工程英语翻译
promotion girl
efileDID允许根据个体特征进⾏选择,只要此特征不随时间⽽变;这是DID的最⼤优点,即可以部分地缓解因“选择偏差”(lection bias)⽽导致的内⽣性(endogeneity)。
⼆、双重差分操作案例
Difference in differences (DID) Estimation step‐by‐step双重差分操作步骤
⾸先我们读⼊所需数据,⽣成政策前后以及控制组虚拟变量,并将它们相乘产⽣交互项。
⽅法⼀:
Getting sample data调⽤数据
u "dss.princeton.edu/training/Panel101.dta", clear
Create a dummy variable to indicate the time when the treatment started. Lets assume that treatment started in 1994. In this ca, years before 1994 will have a value of 0 and 1994+ a 1. If you already have this skip this step.设置虚拟变量,政策执⾏时间为1994年
gen time = (year>=1994) & !missing(year)
*Create a dummy variable to identify the group expod to the treatment. In this example lets assumed that countries
*Create a dummy variable to identify the group expod to the treatment. In this example lets assumed that countries with code 5,6, and 7 were treated (=1). Countries 1-4 were not treated (=0). If you already have this skip this step⽣成地区的虚拟变量
gen treated = (country>4) & !missing(country)
* Create an interaction between time and treated. We will call this interaction ‘did’ 产⽣交互项
gen did = time*treated
Estimating the DID estimator随后将这三个变量作为解释变量,y作为被解释变量进⾏回归:
reg y time treated did, r
结果为:
did的系数显著为负,表明政策实施对Y有显著的(10%显著性⽔平下)负效应
clearstorage
⽅法⼆:diff
The command diff is ur‐defined for Stata,To install type
ssc install diff下载外部命令⽅法欧洲廉价航空
diff y, t(treated) p(time)
三、双重差分平⾏趋势检验
平⾏趋势检验
bob dylan 诺贝尔文学奖
2012年四川高考分数线⾸先⽣成年份虚拟变量与实验组虚拟变量的交互项,此处选在政策前后各3年进⾏对⽐。
gen period = year - 1994
forvalues i = 3(-1)1{
gen pre_`i' = (period == -`i' & treated == 1)}scenery是什么意思
gen current = (period == 0 & treated == 1)
forvalues j = 1(1)3{
gen time_`j' = (period == `j' & treated == 1)
}
随后将这些交互项作为解释变量进⾏回归,并将结果储存在reg中以备后续检验。
grossxtreg y time treated pre_* current time_* i.year, fe
est sto reg
采⽤coefplot命令进⾏绘图,观察是否1994年前的回归系数均在0轴附近波动,在1994年后回归系数显著为负。
采⽤coefplot命令进⾏绘图,观察是否1994年前的回归系数均在0轴附近波动,在1994年后回归系数显著为负。coefplot reg, keep(pre_* current post_*) vertical recast(connect) yline(0) xline(3, lp(dash))
结果发现系数在政策前的确在0附近波动,⽽政策后⼀年系数显著为负,但很快⼜回到0附近。这说明实验组和控制组的确是可以进⾏⽐较的,⽽政策效果可能出现在颁布后⼀年,随后⼜很快消失。