博导讲堂|实证论文写作的四个阶段
作者简介:
刘西川 华中农业大学经济管理学院教授、博士生导师,中国合作经济管理学会理事,国家自然科学基金项目通讯评议人,《经济研究》《管理世界》《金融研究》《财贸经济》《中国农村经济》等权威期刊匿名审稿人。主要研究方向为:农业金融、中小企业融资、中小银行治理与金融扶贫。主持国家自然科学基金青年项目、面上项目各1项,出版《实证论文写作八讲》等著作3部,在《经济研究》等刊物上发表论文多篇,荣获全国2010年优秀博士学位论文提名论文、2012年第五届中国农村发展研究论文奖、2020年第八届高等学校科学研究优秀成果奖(人文社会科学)二等奖等。
首先来看一下什么叫实证分析,是通过计量模型和数据,完成对解释变量和被解释变量之间因果关系的识别与推断,这个因果关系也可被称为待检验的假说。实证研究一共有四个阶段,第1阶段:检验准备。这个准备工作主要包括:描述性统计与诊断性检验。第2阶段:检验假说。这也就是通常所讲的基准回归部分。第3阶段:保护假说。这个保护针对的是有可能困扰第2阶段检验假说的问题,主要工作有:①处理一些复杂的计量问题,如内生性问题等。②稳健性检验。第4阶段:进一步讨论。针对估计结果,结合相关文献排除其他竞争性理论性解释。
01
检验准备
我们先来看一下检验的准备。检验的准备第一个是描述性统计。什么是描述性统计?描述性统计就是对样本做一些整理,计算变量的基本统计量(平均值、百分比等)、制作变量交互列表、做一些初步图解分析等。描述性统计有两个基本功能:①介绍样本数据的基本情况,提供实证分析的基本事实背景,为待检验的因果关系做前期铺垫。②利用分组、列联表、散点图、相关系数表等分析工具,初步考察待检验假说的“雏形”,即核心自变量与因变量之间的相关性。第二个是诊断性检验。诊断性检验主要是为了证明选择某计量模型来估计某个样本数据是合理的,至少从数据统计分布来看是合理的。任何计量方法都有其适用的前提条件,例如,我们平常使用的OLS模型就要求数据符合正态分布。如果前提条件不成立,则无法使用此计量方法,否则可能导致不一致的估计结果。在运用模型进行估计之前,应对计量方法的前提条件进行诊断性检验。比如,使用工具变量法估计后,应进行弱工具变量检验、过度识别检验、解释变量内生性检验等。
02
检验假说
检验假说是在诊断性检验给出检验结果并为计量模型提供选择依据之后,就进入了检验假说的正式阶段。在这个环节,主要是根据基准回归结果检验假说是否成立。关于假说是否通过检验的判断标准,在研究设计中已经给出了明确说明。假说是否能够通过,首先关注模型对数据的整体拟合度,这是模型估计整体表现的统计量,诸如R2、F检验统计量、Durbin-Watson检验统计量等。要关注并考察核心自变量的估计结果,①显著性是关注的焦点,包括统计显著性和经济显著性。②对主要回归系数(或由回归系数所导出的弹性、乘数等)估计值的大小和符号详加讨论。还应注意:对于核心变量回归系数不显著,正确做法是保持谨慎的态度并积极探讨其中的原因。绝不能对不显著的估计值做出过度的解释,尤其不能宣称不显著的估计值支持或不支持某些特定结论。我们应该知道,估计值不显著意味着所使用的数据不能提供足够的信息,若是没有足够的信息,那么就不能够、也不应该做出任何确切的结论。此外,对于核心自变量不显著,甚至符号与预期相反的情形具体可以从以下三个方面入手做进一步的检查:①检查采用的计量方法是否合理。②检查数据质量是否有问题。③检查经济理论方面是否有问题。
03
保护假说
保护假说中的“保护”是指将干扰假说使其难以通过计量检验而无法成立的潜在威胁解除。保护假说有两道防线:第一道防线是考虑并处理相关计量问题,第二道防线是稳健性检验。实证分析中常常因为数据、研究设计和估计方法等原因难以实现有效识别与推断,上述两道防线就是为打消识别与推断以及假说检验等方面的疑虑而设置的。第一道防线是将未考虑的相关计量问题重新纳入分析框架,并参照处理后的估计结果重新审视假说检验工作;第二道防线是通过变换情境来重新审视所检验的假说。
保护假说需注意两个问题:一是相关计量问题处理。处理相关计量问题,需要:①认真了解数据的生成过程;②探寻该计量问题产生的原因,这样才有可能研判所采用的改进方法是否奏效;③将自己处理该问题的思路和做法与同类研究进行比较,思考自己这样做是否有竞争力。相关计量问题的产生一般都是源于数据与估计方法以及二者之间的矛盾,从根本上讲,平常所遇到的计量问题都可以归结于遗漏变量问题。在非实验数据中,遗漏变量问题几乎不可避免,它主要包括以下两种情况:①存在遗漏变量,但与解释变量不相关,这时只需要说明为什么不相关,可以不做处理。②存在遗漏变量,且与解释变量相关,这时则必须进行处理,具体方法包括增加控制变量、寻找代理变量、使用工具变量、使用面板数据等。二是稳健性检验。稳健性检验是通过改变样本区间(或去掉极端值)、函数形式、计量方法、控制变量、变量定义、数据来源等,来考察主要估计结果的变化与稳定性。平常训练过程中,初学者经常跑数据、反复跑,一定程度的数据挖掘是不可避免的,但一定要注意数据挖掘可能带来的偏差,跑数据的正确态度。不能将数据挖掘视为唯一,不应排除识别隐患的其他可能;同时也需要将数据导入计量软件中,尝试不同的研究思路,在反复尝试和比较分析多种思路及相应数据回归结果的过程中反思理论。稳健性检验与敏感性检验存在区别,前者强调对作用机制的再检验,作用方向及其显著性是关注的重点;而后者强调核心变量对因变量作用大小的稳定性考量,估计系数大小及其变化是关注的重点。
04
讨论假说
大多数实证研究都希望揭示x对y的因果作用,而从回归分析的相关关系升华到因果关系是很大的飞跃,这也是识别与推断的真谛所在。回归分析一般只能证实变量之间的相关性,要对变量之间的因果关系做出判断,常常需要依赖于经济理论,讨论假说就是试图从假说、数据、估计结果、经验解释以及理论等方面综合审视所检验的假说。
讨论需要进一步解决两个问题:①计量估计出现无法统一、模棱两可,甚至自相矛盾的估计结果。②基于相关的估计结果,可能存在多种竞争性理论解释。相对而言,因数据导致的计量问题在保护假说这一部分已经得到解决,所以理论方面的分析是讨论假说的关键所在。