温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
多时
双重
差分法
潜在
问题
解决
措施
王鹏超
2023 年第 2 期(总第 146 期)3 月 15 日出版学报 多时点双重差分法的潜在问题与解决措施 王鹏超,韩立彬(东北财经大学 经济与社会发展研究院,辽宁 大连 116025)摘要多时点双重差分法具有准自然试验特征,可以相对干净地识别因果效应,广泛应用于与政策评估相关的研究中,但必须重视其可能存在的估计偏差问题。本文总结了多时点双重差分法存在的问题和相应的解决措施。通过梳理最新文献发现,多时点双重差分法回归系数识别的是组别时间处理效应的加权平均,而非受处理个体的平均处理效应。在异质性处理效应下,多时点双重差分法估计系数有偏,严重时估计系数符号会与真实系数符号相反。目前文献上提出的解决措施可以归结为一个诊断方法和三类解决方法。其中,诊断方法为Goodman-Bacon的系数分解定理,三类解决方法分别是加总方法、两步回归法和堆叠型双重差分法。关键词双重差分法(DID);多时点双重差分法;异质性处理效应;组别时间处理效应 中图分类号:F064.1 文献标识码:A 文章编号:1008-4096(2023)02-0027-13一一、问题的提出问题的提出计量经济学可信性革命推动了实证经济学进展,因果推断成为实证经济学研究的显学。2021年,诺贝尔经济学奖授予Card、Angrist和Imbens三位学者,表彰Card对劳动经济学领域的实证贡献,以及Angrist和Imbens对因果推断方法的贡献。这充分肯定了因果推断方法在经济学中的应用与发展。双重差分法(Difference-In-Difference,DID)作为应用最广的因果推断方法之一,可以相对干净地识别因果效应,在政策评估中受到国内外学者青睐。本文统计了20052020年使用DID方法的中文期刊文章数量。DID已成为国内实证研究者进行学术研究的重要工具。根据政策实施时点的不同,DID 一般可分为单时点 DID(Staggered DID)和多时点 DID(Multiple DID)。然而学界对多时点DID识别的系数含义与正确性却较少讨论。单时点DID识别的 多时点DID有时又被称为渐进DID或交错型DID。收稿日期:2022-11-12基金项目:国家自然科学基金青年项目“土地资源配置对人力资本空间分布的影响研究:理论、机制与对策”(72003020)作者简介:王鹏超(1996),男,山西晋城人,博士研究生,主要从事区域和城市经济研究。E-mail:韩立彬(1988),男,山东临沂人,副教授,博士,主要从事区域和城市经济研究。E-mail: DOI 10.19653/ki.dbcjdxxb.2023.02.003引用格式 王鹏超,韩立彬.多时点双重差分法的潜在问题与解决措施 J.东北财经大学学报,2023(2):27-39.27Number 2(General Serial No.146)March,2023学报是受处理个体的平均处理效应(Average Treatment Effect on the Treated,ATT),多时点DID识别的是否也是受处理个体的平均处理效应?多时点DID估计系数是否有偏?现有文献并未过多讨论。American Economic Review2020年第9期,Chaisemartin和DHaultfoeuille1探讨了多时点DID存在的问题,Journal of Econometrics在2021年第2期发布了“处理效应”专题,其中3篇文章与多时点DID识别直接相关。表明学术界对这一方法存在问题的高度关注。最新研究发现,多时点DID估计系数识别的并不是受处理个体的平均处理效应,而是组别时间处理效应的加权平均。当存在异质性处理效应时,估计系数有偏1-5。Goodman-Bacon2认为,多时点DID估计系数可分解为多个单时点DID系数的加权平均,权重与每个单时点DID的样本份额和解释变量方差相关,且都为正值。然而,部分单时点DID把早接受处理组作为晚接受处理组的对照组,在异质性处理效应下,这部分系数可能为负,从而总体估计系数会存在较大偏差。Chaisemartin和DHaultfoeuille1、Borusyak和Jaravel3以及Borusyak等4认为,组别时间处理效应为正,但部分权重为负,导致最终估计结果有偏。虽然事件研究法可以将不同处理时点转化为处理时点一致的相对时点,但Sun和Abraham6证明,事件研究法设定中的每一相对时点系数不仅与该相对时点系数相关,还与回归方程中其他相对时点系数及被剔除在方程之外的相对时点系数相关。在异质性处理效应下,利用相对时点系数大小检验平行趋势假定是否满足也会存在问题。针对多时点DID存在的问题,学者们提出了不同的解决方法,本文将其归结为一个诊断方法和三类解决方法。其中,诊断方法为Goodman-Bacon2的系数分解定理,该方法用于诊断估计系数的偏差程度。第一类解决方法为Sun和Abraham6、Callaway和SantAnna7提出的加总方法,即分别估计每个时期每个组别平均处理效应,再将其加总得到所有受处理个体的平均处理效应;第二类解决方法为Gardner8和Borusyak和Jaravel等3提出的两步回归法;第三类解决方法为堆叠型DID(stacked DID)9,将每一政策时点前后一段时期内的处理组和干净的对照组形成一个数据集,之后把所有的数据集堆叠并进行回归。二二、DID方法的基本原理方法的基本原理为阐明DID的基本原理,考虑包含2个组别和2个时期的2 2 DID情形。组别包括一个处理组(treati=1)和一个对照组(treati=0),时期包括政策前(postt=0)和政策后(postt=1)。政策效果通过式(1)进行估计:Yit=0treati postt+1treati+2postt+it(1)其中,0为政策评估所关注系数,识别的是受处理个体的平均处理效应。这一系数可以用式(2)和式(3)加以分解说明:?0=E(Yit(1)|treati=1,postt=1)-E(Yit(0)|treati=1,postt=0)-E(Yit(0)|treati=0,postt=1)-E(Yit(0)|treati=0,postt=0)(2)=E(Yit(1)|treati=1,postt=1)-E(Yit(0)|treati=1,postt=1)+E(Yit(0)|treati=1,postt=1)-E(Yit(0)|treati=1,postt=0)-E(Yit(0)|treati=0,postt=1)-E(Yit(0)|treati=0,postt=0)(3)其中,Yit(1)和Yit(0)是潜在结果。式(2)是处理组事后与事前均值的差异减去对照组事后与事前均值的差异,式(3)在式(2)上各加减一项E(Yit(0)|treati=1,postt=1)。式(3)中第一项表示事后所有受处理个体处理效应的均值,第二项是处理组事后假若未经处理的结果均值减去处理组事前的结果均值,第三项同理第二项。若满足平行趋势假定(第二项与第三项相减为0),得到?0=E(Yit(1)-Yit(0)|treati=1,postt=1),?0识别的是受处理个体的平均处理效应。单个政策时点情形下,为灵活地估计回归系数,常用个体固定效应i和时间固定效应t代替282023 年第 2 期(总第 146 期)3 月 15 日出版学报式(1)中的treati和postt。在多个政策时点情形下,若将Dit表示为处理状态,处理组在政策后受到影响为1,否则为0,由于postt与个体i和时间t同时相关,多时点DID的回归方程如式(4)所示:Yit=0Dit+i+t+it(4)在多时点DID实际应用中,由于存在多个处理组,无法直接通过对比处理组和对照组结果均值的时间变化,以此检验是否满足平行趋势假定,因而事件研究法通常被当作替代方法。这一方法不仅可以检验事前是否满足平行趋势假定,还可以观察事后政策效果的动态变化。事件研究法的模型设定为式(5):Yi,t=l=-k-20lDli,t+l=0L1lDli,t+i+t+i,t(5)其中,(-k,L)是相对时点l的范围,Dli,t是每一相对时点l是否接受处理,接受处理为1,未接受处理为0。实证中常剔除-1期这一相对时点作为基准,每一相对时点系数都表示为相对-1期这一时点系数的大小。假若政策前每一相对时点系数0l都无法拒绝系数为零的假设,则满足平行趋势假定,政策后每一相对时点系数1l反映的是政策效果随时间的变化。式(4)和式(5)的识别策略被广泛用于渐进性试点和多期试点政策研究中。三三、多时点多时点DID存在的问题存在的问题最新研究指出在异质性处理效应下多时点DID估计结果有偏。Baker等10利用蒙特卡罗方法,分析了不同处理效应下多时点DID估计系数存在偏差的六种情况,并分别进行了模拟。图1和图2为模拟1模拟3的结果。由图1可知,模拟1和模拟2得到的估计系数围绕真实系数呈正态分布,表明在单时点DID情况下,无论处理效应是否随时间变化,估计系数都是无偏的。在存在多个处理时点,处理效应不随时间和处理组组别变化时,模拟3得到的估计系数依然无偏。图3和图4为模拟4模拟6的结果。由图3可知,在模拟4模拟6中,多时点DID估计系数与真实系数存在偏差,偏差不断增大,并且在模拟6中估计系数符号与真实系数符号相反。研究中每个模拟都生成19802015年1 000家企业平衡面板数据,企业在50个城市均匀分布。在单时点情形下,假定1/2城市在1997年接受处理,1/2的城市未接受处理;在多时点情形下,假定1/3的城市在1989年接受处理,1/3的城市在1998年接受处理,剩余城市在2007年接受处理。研究的六种模拟情况:模拟1,单时点DID,假定处理组的处理效应恒定;模拟2,单时点DID,假定处理组处理效应随时间变化;模拟3,多时点DID,假定每个处理组组内的处理效应恒定,处理组之间的处理效应相同;模拟4,多时点DID,假定每个处理组组内处理效应恒定,处理组之间的处理效应不同;模拟5,多时点DID,假定每个处理组组内处理效应随时间变化,处理组之间处理效应的时间趋势完全相同;模拟6,多时点DID,假定每个处理组组内处理效应随时间变化,处理组之间的处理效应时间趋势不同。图1模拟1模拟3处理组和控制组结果均值的时间路径模拟1模拟2模拟3-4 -2 0 2 4 6-5 0 5 10-2 0 2 4 6年 份年 份1980 1990 2000 20101980 1990 2000 20101980 1990 2000 2010处理组对照组处理组对照组198919982007年 份29Number 2(General Serial No.146)March,2023学报异质性处理效应既包括处理效应随不同处理组组别发生变化,也包括同一个处理组在时间维度发生变化。无论处理效应是否随时间变化,单时点DID都不存在估计系数有偏问题。然而,由于早接受处理组在回归中被作为晚接受处理组的对照组,导致多时点DID估计系数有偏,尤其在异质性处理效应下,偏差会更大。不仅如此,估计系数识别的也不是受处理个体的平均处理效应,而是组别时间处理效应的加权平均1-5。关于加权处理,Goodman-Bacon2对多时点DID系数的加权给出了直观解释。考虑个体为N时期为T的平衡面板数据,假设存在2个政策时点:k和l,假设存在3个组别:早接受处理组k、晚接受处理组l和未受处理组U。(0,k)时期为PRE(k),(k,l)时期为MID(k,l),(l,T)时期为POST(l)。在不考虑控制变量 参见Goodman-Bacon2附录中图1。图2模拟1模拟3经过500次模拟所得系数的分布情况 图3模拟4模拟6处理组和控制组结果均值的时间路径 图4模拟4模拟6经过500次模拟所得系数的分布情况模拟2模拟1模拟30 10 20 30系 数2.96 2.98 3 3.02 3.040 10 200 1 2 3 4系 数系 数1.975 2 2.025 2.6