开放合作研究团队第56期Seminar学习讨论会
2023年3月14日晚18:30-20:00,中山大学区域开放与合作研究院学习讨论会以线上的方式成功举行。本次学习讨论会由李世龙硕士生分享文献《Fuzzy Difference-in-difference》。参加学习讨论会人员包括毛艳华教授、荣健欣副研究员、博士后以及博士生和硕士生等,另有澳门科技大学、澳门城市大学博士生通过线上形式参与了本次学习讨论会。
Fuzzy Difference-in-difference
C de Chaisemartin, X D’HaultfŒuille
一、引言
经济学家经常试图评估某一事件的影响,如某一政策的通过或某一创新的到来。衡量这些变化的影响的一种方法是看一个完全不受事件影响的对照组的结果。但在某些情况下,很难找到这样一个纯粹的对照组,在这种情况下,通常会利用不同地理区域或其他单位的变化来衡量这些变化。双重差分(DID)是一种评估处理效果的方法。在其基础版本中,对照组在两个时期都未被处理,而处理组在第二个日期被完全处理。然而,在实际应用时,对照组也时常会被处理影响,这被称为 "fuzzy design"。在fuzzy design中,根据所满足的假设,可以使用三种类型的DID估计(Wald-DID、TC-DID和CIC-DID)。
二、估计与识别
Chaisemartin and D’HaultfŒuille (2018) 第一次阐释了 fuzzy DID 估计量的识别与适用情况。首先将模型框架扩展为一般情形,令随机变量 g∈𝐺表示个体(组别),二元随机变量 𝑇={0, 1}表示时期,随机变量 𝐷(𝑡)=𝑑表示处理程度(可以理解为前文中的暴露程度),随机变量 𝑌_𝑔𝑡表示结果。Fuzzy design可分为两种情形,第一种是对照组在初期有些元素受处理,但是对照组受处理的元素个数在两期内保持不变,即满足:
同时,为了保证元素都是从未处理向被处理转变,则处理应当是单向的:
(1)Wald-DID
在 Assumption1-3前提下,如果对照组和实验组还满足平行趋势假设,且元素的处理效果不随着时间变动,即满足:
此时的平均处理效应 (LATE)可以通过 Wald-DID估计得到:
(2)TC-DID
在实际分析中,对照组和实验组的平行趋势有时无法得到满足,抑或在不同时刻进行处理的效果有差异,此时使用 Wald-DID 并不能得到平均处理效应。为应对这种情况, Chaisemartin and D’HaultfŒuille (2018) 提出对时间进行修正的Wald-DID,简称 TC-DID,应用条件为:
和 Assumption 4相比,该假设仅要求 fuzzy design中非 fuzzy(初期未被处理或末期被处理)的元素满足平行趋势,而对其余部分不做要求。在满足Assumption 1-3, 4’的条件下,TC-DID估计量为:
(3)CIC-DID
对 Wald-DID 的另一个修正是 CIC-DID ,该估计假定元素底层存在不随时间变动的不可观测变量,该变量的变化影响元素的变化,但该共同变化 (Common change) 和对照组与实验组数据的大小没有关系:
而 CIC-DID 的缺陷在于限制数据的整体分布(之前的估计都只限制数据均值)
在满足 Assumption 1-3, 7-8时,CIC-DID估计量为:
三、使用条件总结
四、实证应用
Duflo (2001) 使用1995年印度尼西亚的统计数据研究了新建学校导致的教育回报问题(包括受教育年限增长和工资增长两方面),该文章发表于2001年9月的 AER。在 Duflo (2001) 的原始文章中,作者意识到了自己面临的是一个 fuzzy design的实验环境,因此在文章中使用了 Wald-DID 来估计新建学校对教育回报的影响。
但 Chaisemartin and D’HaultfŒuille (2018) 指出,在原文的 Table 3中,作者的实验组的受教育年限要显著高于控制组。这种教育年限的差别说明地区间的发展水平可能有差异,实验组的经济水平更高,导致对高技能人才的需求更大,进而导致无干预情况下实验组的平均工资水平要高于控制组。因此 Chaisemartin 等人认为,Duflo 对实验组和对照组的设定存在问题,导致原文的实证分析结果并不可靠,他们使用 Duflo 的数据,对该文章进行了重新研究。
(1)Same group as Duflo (2001)
虽然原文的组别划分存在问题,但为了使结果可以与原文对比, Chaisemartin and D’HaultfŒuille (2018) 首先仍然按照原文划分的实验组和对照组进行了估计:
第一个 Wald-DID 是原文原始结果,该结果并不能在 95% 置信度下和 0 显著区分。TC 和 CIC 是作者重新估计的结果,由于控制组元素再发生变动,因此只能得到区间估计值 。
(2)New control and treatment group
对原文样本进行重新分组,以在第0期和第1期间样本平均受教育年限是否变化为标准,重新划分出实验组(平均受教育年限上升、下降)和控制组(平均年限不变),并以此为基础重新进行估计:
Table 3 展示了重估后的结果,TC 和 CIC-DID 的结果比较接近,同时都显著大于 Wald-DID。根据既往研究,受教育年限导致的回报是逐年递减的,与之前提到的 Assumption 5 矛盾,因此 Wald-DID 结果有误,最终应该使用TC 和 CIC-DID 的结果,算出的回报相对而言要小得多。
五、讨论
文章分享结束后,研究院成员展开了有关讨论。荣健欣副研究员询问了最近这些年使用过Fuzzy DID方法的中文文献,并提议可以和使用相似方法的中文期刊进行结合,便于观众理解。李世龙硕士生说该方法在英文期刊上使用较多,中文期刊由于其滞后性应用相对较少。
结束分享之后,李子文博士生询问了以“FDI对大湾区市场一体化的影响研究”作为研究问题的可行性,荣健欣副研究员认为这个题目有深入的价值,但是不一定要局限于大湾区。因为大湾区的FDI主要是港资,港澳资本对市场一体化影响很大,在一定程度上解释变量和被解释变量是一个东西,以大湾区作为对象进行估计可能会有很大的偏误。
本次学术研讨会充分体现了研究院浓厚的学术氛围,大家在学术交流中相互学习、共同进步,提高自己的学术能力,至此,本次文献研讨会圆满结束。
拟稿:李世龙
编辑:陈多多
审核发布:毛艳华