互助问答第462期:关于两期家庭混合截面数据处理问题问题
关于两期家庭混合截面数据处理问题问题
各位老师好,请教一个问题。问题背景:两期(两个季度)家庭混合截面数据,因变量Y是0-1哑变量(家庭层面);关注变量X为城市层面的连续变量,中介变量M为0-1哑变量(家庭层面)。要论证中介效应(作用机制),计划估计以下2个方程:
Y=aX+bControl_1+cM (1)
M= aX+bControl_2 (2)
Q1: 如果估计系数和理论假设相符合,这么做是否可以说明X通过M影响Y?看到连玉君公号一个帖子说,当Y或者M是分类变量,貌似不可以用这种方式来论证中介效应,但是那篇推文也有点模糊;另外,看到部分文献是通过异质性,加入X*M交叉项论证X通过M影响Y,您怎么看这种机制论证方式?
Q2: 基于两步估计,上述方程(1)和(2)的Control_1 和 Control_2是否需要完全保持一致?
Q3: 基于两步估计,上述方程(1)和(2)的地区固定效应应该控制到城市层面?省级层面?还是东中西层面也可以?或者东中西固定效应+城市层面的相关特征变量(比如城市发展水平,没有季度层面数据,年度是有的)
Q4: 基于两步估计,上述方程(1)和(2)的均计划加入vce(cluster),这个时候,cluster的层级是否应该与地区固定效应的层级完全保持一致?比如固定效应为省级,cluster到省级?
Q5: 当Y或者关注X都为0-1哑变量,均值最低为多少,分析才有效,有没有经验法则?5%?10%?
Q6:同样的问题背景,关注变量X变为家庭层面的变量,这个时候,地区固定效应在省级、城市还是社区?我理解的是,对于截面回归,控制得越细越好,看到目前文献中控制到省级、城市或者区县居多,实践过程中发现回归结果差异还比较大。
第一,正如连老师所说,二元变量做中介效应不太好。第二,中介效应模型,几个方程的控制变量应该相同。第三,地区固定效应,应该越小单元越好,比如城市数据,控制城市固定效应。第四,cluster与地区固定效应一致比较好。第五,0-1变量时,均值多少没有具体的要求,关键看你的样本总量,如果样本总量具够大,均值为0.1,我觉得也是可以的。第六,的确如你如说,地区固定越细可能越好,但太细就会将核心变量的信息包括了。建议,个体样本数据,控制到城市就可以了!