推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!
关于下方文字内容,作者:孙沁竹,复旦大学经济学院,通信邮箱:qzsun_fdu@163.com
Cengiz, Doruk, et al. Seeing Beyond the Trees: Using Machine Learning to Estimate the Impact of Minimum Wages on Labor Market Outcomes. No. w28399. National Bureau of Economic Research, 2021.
Abstract: We assess the effect of the minimum wage on labor market outcomes such as employment, unemployment, and labor force participation for most workers affected by the policy. We apply modern machine learning tools to construct demographically-based treatment groups capturing around 75% of all minimum wage workers—a major improvement over the literature which has focused on fairly narrow subgroups where the policy has a large bite (e.g., teens). By exploiting 172 prominent minimum wages between 1979 and 2019 we find that there is a very clear increase in average wages of workers in these groups following a minimum wage increase, while there is little evidence of employment loss. Furthermore, we find no indication that minimum wage has a negative effect on the unemployment rate, on the labor force participation, or on the labor market transitions. Furthermore, we detect no employment or participation responses even for sub-groups that are likely to have a high extensive margin labor supply elasticity—such as teens, older workers, or single mothers. Overall, these findings provide little evidence for changing search effort in response to a minimum wage increase.
摘要:本文估计了最低工资调整对最低工资受众群体的就业率、失业率、劳动力参工率等劳动力市场表现的效应。本文使用了时髦的机器学习手段,基于个体特征预测出易受最低工资制度影响的处理组(捕捉了约75%挣最低工资的工人)。相较于以往文献常常只关注特定最低工资受众群体(如青少年),本文是很大的改进。通过考察1979至2019年间发生的172次显著的最低工资标准调整政策,本文发现:当最低工资提高后,挣最低工资工人的平均工资显著提升,但是我们几乎看不到就业率下降。此外,最低工资提高也没有负面影响失业率、劳动力参工率、劳动力市场间的转移等。再者,即使对边际劳动力供给弹性较高的子群体(如青少年、年龄较大的工人、单亲母亲等)而言,最低工资调整几乎也没造成影响。总的而言,这些发现说明最低工资提高并没有改变劳动者搜寻工作机会的努力程度。
1.Introduction
长期以来,“最低工资制度如何影响低端劳动力市场”这一问题始终是经济学界的热点话题。但该课题的难点之一在于:如何有效识别最低工资的受众。很多研究聚焦于特定行业或特定人口结构特征群体(如青少年、低教育背景的工人等)。然而,这类研究关注的样本不能代表最低工资的全体受众,也就无法充分说明最低工资制度的影响效应。相较以往文献,本文创新性地采用机器学习手段,根据个体特征预测出最低工资受众,其中预测效果最好的算法为梯度提升树。这一方法扩展了Card and Krueger (1995)使用线性概率模型预测最低工资受众的思路。预测出来之后,本文探究了最低工资调整对工人就业率、失业率、劳动力参工率的效应。结果表明:最低工资上涨提高了最低工资工人的工资水平,但对于别的变量、非最低工资工人而言均无显著效应。本文采用的方法有以下优点:首先,本文探究的劳动力样本范围更广,不仅限于特定行业、人群,因而能够更充分地反映最低工资制度的总体效应。其次,本文也可以检验最低工资制度对非最低工资受众人群的效应,如果得到符合预期的不显著结果,那么一定程度上可以验证预测算法的可靠性。最后,对于以往文献基于现实样本分布无法探究的劳动力市场表现,本文也可以进行检验(如失业工人、劳动力参工率等囿于样本选择而无法观测到)。
2. Participation, Unemployment and the Welfare Impacts of the Minimum Wage
相较以往文献,本文的一大进步在于:除了检验最低工资调整政策对工资、就业率等传统的劳动力市场指标外,本研究还可以检验最低工资调整对失业、劳动力参工率、劳动力边际参工率(Participation Margin)等变量的效应,而后者可以用以验证搜寻模型(Search Model)文献对最低工资政策的机制解释,这正是大量理论文献所关心的。除此之外,对劳动力市场参工率的政策影响分析也有助于理解最低工资调整的福利效应。这是由于劳动者进入退出劳动力市场的决策显示了他们的偏好,一方面可反映相对福利的增减,另一方面也可以探究他们对工资溢价、便利设施等的评价,反映最低工资对集约边际(Intensive Margin)的失业率与转移概率的影响。
3.Data
本文主要采用的数据来自Current Population Survey (CPS)。本文使用了时间跨度在1979-2019年间的Outgoing Rotation Group (CPS-ORG)与CPS-Basic数据集。前一个数据集不仅采集了受访者小时工资、每周收入、工作时长等信息,也涵盖了受访者的教育、性别、种族、婚姻、服兵役情况等齐全的人口特征信息。样本大小为全美60000户家庭。后一数据集则涵盖了文中所需的劳动力市场表现相关的各项指标。
4.Predicting to Be a Minimum Wage Worker
本文定义:小时工资不足法定最低工资1.25倍的工人为“最低工资工人”。本文首先根据人口特征,预测个体成为最低工资工人的概率。为此,作者把样本分为三类:训练集(training)、测试集(test)、其他(leave-out)。为了构建训练集和测试集,作者重点关注在后续12个季度中发生了最低工资调整、在过去的20个季度内未发生调整的时段。作者在这些时段的469174个样本里随机选取150000个样本进入训练集,其余进入测试集。本文采用了决策树(Decision Tree)、随机森林(Random Forest)、提升算法(Boosting)、logistic回归、弹性网络(Elastic Net)、线性概率模型(Linear Probability Model, LPM)等多种算法进行预测,对比这些预测模型在测试样本中的表现,筛选出表现最好的算法。4.1. Predicted Algorithms决策树是随机森林、梯度提升树(Gradient Tree Boosting)等算法的基础。决策树算法的思路为:依据不同特征尝试每一种分类方法,选取分类效果最好(即,使损失函数值降低最多)的特征进行分类;把分类后的子样本作为新的样本,在剩余的特征中重复上一步继续分类。分类完成后,就可以依据样本的特征进行预测。决策树算法的关键之一在于确定分类何时停止。如果分类过细,尽管能确保训练集的拟合程度很好,但对于测试集的拟合效果会很差,即出现过拟合问题。通常而言,我们需要交叉验证的方法确定决策树合适的复杂度。有时,为了降低预测误差,我们会冒着造成结果有偏的风险对决策树剪枝。以图1为例,该图是一棵经过剪枝的简单决策树,利用人口特征与教育背景来预测工人是否为最低工资工人。该决策树预测:年龄在19岁以下的工人为最低工资工人。
随机森林算法是以决策树为基学习器的集成学习方法。随机森林利用自助法随机抽取样本构建出不同的决策树,对预测结果做平均处理,在保证预测结果无偏性基础上,有效降低单个决策树面临的预测方差过大的问题。如果要进一步降低预测结果的方差,还可以限制决策树每一次分类时选择特征的范围。根据本文交叉验证的结果,最优的随机森林采用了2000棵决策树,每次分类只考察两个特征。相较随机森林,提升算法采用了另一种集成学习的思路。提升算法中的树串行生成。先前的树中做错的部分会在后续的树中得到更多关注,从而不断进行误差修正。举例而言,第一棵树将青少年分类为最低工资工人,非青少年则不是。那么第二棵树将重点关注第一棵树中分类错误的样本,即非青少年最低工资工人与青少年的非最低工资工人群体。如此重复完成所有树的构建,并进行加权结合。由本文交叉验证结果看,最优的提升树模型包括4000棵树,收缩率为0.005,树的深度为6,每个结点中最少的样本量为10。本文也使用了Zou and Hastie (2005)开发的弹性网络正则化算法。该算法的底层模型实质上就是Lasso方法和Ridge方法的结合,添加不同的正则化项对模型的复杂度进行惩罚,兼具了Lasso和Ridge的优点,可有效防止模型过拟合的问题,提高预测的精准性。不同于前述方法,弹性网络回归需要预设模型的函数形式。为降低模型误设的可能,有必要加入预测特征的高阶项等,在与惩罚模型复杂度的正则项之间达到平衡。4.1.5. Card and Krueger’s Linear Probability ModelCard and Krueger (1995)方法的本质是在不断试错,手动挑选人口特征及其高次项进入解释变量,找出预测程度最好又避免过拟合的模型。这可以看成是手动完成了上述弹性网络回归做的工作,只不过这里的正则项是基于主观判断,而非严格按照算法生成。4.2. Precision-Recall Curves and Predicted Probabilities本文在此引入机器学习文献中的精确率(Precision)与召回率(Recall)的概念。以本研究为例,精确率指的是:在你预测出的最低工资工人中,其中有多少预测对了;召回率指的是:你成功预测出的最低工资工人数目占总样本中最低工资工人数目之比。显然,我们希望精确率和召回率均越高越好。一般而言,给定相同的召回率时,精确率越高说明模型表现越好。图2(a)展示了各种算法下的精确率-召回率曲线图。可以看到,在相同召回率下,提升树的精确率总是最高,说明提升算法表现好于其他模型。图2(b)将提升算法的精确率标准化为1,可以明显看出其他算法与提升算法的差距。值得注意的是,随机森林与提升算法的预测效果几乎一致;Card and Krueger (1995)的预测效果与弹性网络效果差距甚小,与4.1.5节对LPM的分析保持了一致,且与最优模型的表现差距不大。
4.3. Who are the Minimum Wage Workers?在探究最低工资对劳动力市场表现的影响之前,本文首先根据最优的预测模型,考察哪一类群体最有可能成为最低工资受众。为此,表1比较了不同预测概率群体中符合各类主要特征的劳动力占比。可以发现,年龄是预测最低工资工人的关键指标。在最可能成为最低工资工人的分位上,有70%的人是青少年;而自80%分位往下直至10%分位,青少年占比几乎均为0。这意味着,年龄指标不仅可以用来预测个体是否进入最易成为最低工资工人分位,也有助于预测个体是否进入别的概率分位。除年龄外,教育程度也对预测概率起到重要作用。未完成高中教育(Less Than High School, LTHS)的个体大多数集中在较高分位上;而在较低分位上几乎没有未完成高中教育的样本。图4展示对比了不同特征对预测结果的相对影响力,也可以佐证上述判断。
5. Impact of the Minimum Wage on Labor Market Outcomes
5.1. Identification Strategy本文使用事件分析法,考察了美国在1979至2019年间的州层面最低工资调整政策,基准回归如下:
在基准回归中,作者主要考察最低工资调整政策对最低工资受众群体的效应。为此,本文首先定义:高预测概率群体为预测概率位于最高10%分位的人群;为捕捉更多最低工资工人样本,本文也定义了高召回率群体,即保证至少75%的最低工资工人都被预测出来的概率分位以上的样本。作为对比,本文定义了低预测概率群体。后文分别汇报了这三种群体的估计结果。表2展示了基准回归结果。可以看到,最低工资政策对于高预测概率、高召回率群体的实际工资变动有显著正向影响,但其他劳动力市场表现几乎不受影响。而对于低预测概率群体而言,各项劳动力市场表现指标均不受影响,符合直觉,这增强了对本研究算法有效性的信心。而对于不同预测模型,结论均保持了一致。基于概率预测方法的关键优势之一在于:我们可以探究在劳动力市场上观测不到的变量,如最低工资调整政策对于失业率、参工率等的影响。我们看到,对于高预测概率、高召回率群体而言,最低工资调整降低了失业率、提振了参工率,但估计效应不显著。这也意味着,工人的搜寻努力程度没有随着法定最低工资提高而下降。而从福利角度看,参工率不降反升说明,对处于进入劳动力市场边际上的个体而言,他们的福利并没有严重受损。
5.3. Non-linearity In the Extent of Exposure高预测概率与高召回率群体的覆盖范围不同,但在表2中,不同群体的估计结果几乎一致,这说明最低工资调整政策的影响可能不是非线性的。图5进行了验证。在a栏中,工资效应随着预测概率的降低单调下降。由于预测概率的下降意味着样本覆盖了更多非最低工资受众,因此这一点符合直觉。b、c、d栏反映了其他劳动力市场表现指标几乎不受预测概率影响,不存在非线性效应。总的而言,图5并没有发现政策的非线性影响。
5.4. Timing of the Impact图6、图7展示了最低工资对高预测概率与高召回率群体劳动力市场表现的动态影响。得到结论:最低工资调整政策显著正向影响最低工资工人实际的工资,但几乎不影响这类群体的其他劳动力市场指标,与上文结论保持了一致。此外,随着时间的推移,最低工资调整对工资的正向影响有所削减,意味着最低工资调整政策对工资的短期影响更大。在接下来的一小节中,作者采用平衡面板数据进行了重新估计,得到了类似结论,不再赘述。
在基准回归的基础上,作者通过控制不同程度的时间趋势项、更换最低工资调整政策定义、不加权处理、样本限制等方式进行检验,均得到一致结果,保证了结论的稳健性。表格不再汇报。5.6. Effects on Labor Market Transitions劳动力市场转移(labor market transitions)指的是劳动力在就业(Employment)-失业(Unemployment)-离开劳动力市场(Inactivity)三种状态间的身份转换。图4发现,无论对于高预测概率、高召回率或低预测概率的群体,最低工资调整政策均无显著影响。这意味着,最低工资上涨并没有提升失业期长度,也没有使劳动力市场变得僵化。
5.7. Effects by Demographic Subgroups接下来,作者在高召回率样本内,根据不同人口特征分组回归,得到结论仍与上文保持一致:除60-70岁老年劳动者的工资效应不显著外,其余群体的工资效应均显著为正;且其他劳动力市场表现指标均不显著。表格不再汇报。5.8. Additional Labor Market Outcomes本文还探究了最低工资调整对自营、兼职、加班等的影响,结果发现,最低工资上涨显著降低了兼职人群在高预测概率的劳动力中占比,但对于其余无显著影响。
6.Conclusion
本文探究了最低工资调整政策对诸多劳动力市场指标的影响。为了更精准的找出挣最低工资工人的样本,本文创新性地采用机器学习的方法,预测出劳动力成为最低工资工人的概率,这比以往文献根据行业、人口特征简单分类选取子样本的做法更加高效。从结果看,本文发现:最低工资上调政策显著提高美国最低工资工人的工资水平,但对于其他劳动力市场表现的变量均无显著影响(尽管作者在文中从符号正负角度也对这些在经济和统计意义上都不显著的结果进行了论述)。这意味着,最低工资的提高并未降低失业者找新工作的努力程度、从而对劳动力市场起到负向影响。而对于不同特征的人群而言,他们对最低工资调整的反应并未显示出异质性。
笔者评述:
阅毕本文,笔者斗胆在此阐述自己一些不成熟的想法,抛砖引玉。在内容方面,首先,本文在阐述机器学习算法思想时是否应更多着墨于数学表达式,而非纯文字表述。个人浅见,在文中对算法进行数学表述更有助于读者掌握算法的核心思想,也有助于读者了解机器学习算法与传统计量回归方法的异同。其次,从行文逻辑而言,本文前半部分使用不同算法进行预测,对照图表描述预测结果;后半部分开展事件分析,发现“最低工资制度并未影响除工资外的其他劳动力市场表现”这一现象。这一估计结果本身固然值得重视,但是如果进行相应理论拓展、而非仅停留在现象说明层面,是否更能体现本文价值?在引言中,作者详尽综述了劳动力市场搜寻努力(Search Effort)这支文献以及本文对此的重要贡献,却在正文中并未深究,着墨略少,或许有必要进一步丰富文章内容。在细节处理方面,本文出现了如图表编排与文字说明无法对应、正文中引用有误以致出现“??”的显示效果等问题,这都是值得改进的地方。当然,我们不应忽略本文的优点。本文对劳动力市场分析之全面,在数据与算法层面都做了充足的工作,清晰地向我们展示了机器学习算法在劳动经济学中的应用,这有助于我们对机器学习算法在经济学中的价值进行深思。个人愚见如上,仅供大家参考交流。
Card, David, and Alan B. Krueger. "Time-series minimum-wage studies: a meta-analysis." The American Economic Review 85.2 (1995): 238-243.
Zou, Hui, and Trevor Hastie. "Regularization and variable selection via the elastic net." Journal of the royal statistical society: series B (statistical methodology) 67.2 (2005): 301-320.
1.机器学习之KNN分类算法介绍: Stata和R同步实现(附数据和代码),2.机器学习对经济学研究的影响研究进展综述,3.陈硕: 回顾与展望经济学研究中的机器学习,4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 5.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险!6.Top前沿: 农业和应用经济学中的机器学习, 其与计量经济学的比较, 不读不懂你就out了!7.前沿: 机器学习在金融和能源经济领域的应用分类总结,8.机器学习方法出现在AER, JPE, QJE等顶刊上了!9.机器学习第一书, 数据挖掘, 推理和预测,10.从线性回归到机器学习, 一张图帮你文献综述,11.11种与机器学习相关的多元变量分析方法汇总,12.机器学习和大数据计量经济学, 你必须阅读一下这篇,13.机器学习与Econometrics的书籍推荐, 值得拥有的经典,14.机器学习在微观计量的应用最新趋势: 大数据和因果推断,15.R语言函数最全总结, 机器学习从这里出发,16.机器学习在微观计量的应用最新趋势: 回归模型,17.机器学习对计量经济学的影响, AEA年会独家报道,18.回归、分类与聚类:三大方向剖解机器学习算法的优缺点(附Python和R实现),19.关于机器学习的领悟与反思,20.机器学习,可异于数理统计,21.前沿: 比特币, 多少罪恶假汝之手? 机器学习测算加密货币资助的非法活动金额! 22.利用机器学习进行实证资产定价, 金融投资的前沿科学技术! 23.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣!24.机器学习已经用于微观数据调查和构建指标了, 比较前沿!25.几张有趣的图片, 各种类型的经济学, 机器学习, 科学论文像什么样子?关于DID相关文章0.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!1.DID运用经典文献,强制性许可:来自对敌贸易法的证据,2.连续DID经典文献, 土豆成就了旧世界的文明,3.截面数据DID讲述, 截面做双重差分政策评估的范式,4.RDD经典文献, RDD模型有效性稳健性检验,5.事件研究法用于DID的经典文献"环境规制"论文数据和程序,6.广义DID方法运用得非常经典的JHE文献,7.DID的经典文献"强制许可"论文数据和do程序,8.传销活动对经济发展影响, AER上截面数据分析经典文,9.多期DID的经典文献big bad banks数据和do文件,10.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?11.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章,12.第二篇因果推断经典,工作中断对工人随后生产效率的影响?,13.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文,14.AER上以DID, DDD为识别策略的劳动和健康经济学,15.一个使用截面数据的政策评估方法, 也可以发AER,16.多期DID模型的经典文献,big bad banks讲解",17.多期DID的经典文献big bad banks数据和do文件,18.非线性DID, 双重变换模型CIC, 分位数DID,19.模糊(Fuzzy)DID是什么?如何用数据实现呢?20.多期DID的big bad banks中文翻译版本及各细节讲解,21.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等,22.截面数据DID操作程序指南, 一步一步教你做,23.DID的研究动态和政策评估中应用的文献综述,24.连续DID经典文献, 土豆成就了旧世界的文明,25.DID双重差分方法, 一些容易出错的地方,26.连续DID, DDD和比例DID, 不可观测选择偏差,27.加权DID, IPW-DID实证程序百科全书式的宝典,28.DID和DDD, 一个简明介绍, 双重和三重差分模型,29.DID过程中总结的地图展示技巧,30.DID的平行趋势假定检验程序和coefplot的其他用法,31.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,32.实践中双重差分法DID暗含的假设,33.过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图,34.计量院士首次用DID方法分析, 中国封城对新冠病毒扩散的影响!,35.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,36.诺奖夫妇的中国学生, “DID小公主”的成名之作, 茶叶价格与中国失踪女性之谜!,37.前沿: 反向DID, 反向双重差分法DDR全解析, 辅以实证示例!38.英诺丁汉大学校长为你讲解逐年PSM匹配-DID方法的操作, 并配上自己写的一篇范文!39.逐年PSM匹配后再DID识别因果的实证范文, 这就是逐年PSM-DID的操作范式!40.用事件研究法进行因果识别如何做? 有什么好处? 与DID结合起来潜力无穷!41.Abadie半参数双重差分DID估计量, 使你的平行趋势假设更加可信!42.弹性DID, DID的终极大法, 关于DID各方法总结太赞了!43.二重差分法分析(DID),44.比DID更加灵活的DDID政策效应评估方,45.DID思路和操作,一篇相关实证文献,46.二重差分法深度分析(DID),三重差分兼论,47.面板数据的DID估计,透彻解读,48.PSM-DID, DID, RDD, Stata程序百科全书式的宝典,49.关于DID的所有解读, 资料, 程序, 数据, 文献和各种变形都在这里,50.分位数DID, PSMDID, 政策前协变量平衡性检验操作步骤和案例,51.PSM-DID, DID实证完整程序百科全书式的宝典,52.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,53.广义DID, DID最大法宝, 无所不能的政策评估工具,54.渐进DID专治各种渐进性政策的良药, 可试一试疗效,55.双重差分DID的种类细分, 不得不看的20篇文章,56.找不到IV, RD和DID该怎么办? 这有一种备选方法,57.在教育领域使用IV, RDD, DID, PSM多吗? 使用具体References,58.DID和IV操纵空间大吗? 一切皆为P-hacking,59.第一篇中文DID实证论文长啥样? 60.世界上第一篇DID实证论文长啥样?,61.关于双重差分法DID的32篇精选Articles专辑!62.空间双重差分法(spatial DID)最新实证papers合辑!63.空间DID双重差分方法的文献, spatial DID,64.多期三重差分法和双重差分法的操作指南,65.多期双重差分法,政策实施时间不同的处理方法,66.三重差分法运行和示例,67.如何设计双重差分法DID: 各种政策研究的最佳指南! 68.利用DID和事件研究法的Top5文章, 分析最低工资对低薪工作的影响!69.推出输出表格, 滚动回归, 事件研究, asdoc, asreg,asrol, estudy代码和解析!70.中国拖拉机vs牲畜: 事件研究法用于政策评估和因果识别, 与DID结合起来威力无穷!71.事件研究法逐步附上程序code和对应的解释, 这还不懂那就真的没办法了!72.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。