写作指南|定量研究的入门步骤

    本文为科研写作研究所编辑部原创

定量研究一般包括数据收集、数据处理、数据分析和形成报告四个阶段。

数据收集和数据处理

数据收集有很多方式,比如我们可以通过调查问卷的方式获得一手数据,也可以通过专门负责数据统计的网站(国家统计局、各省市统计局等等)获得二手的数据等等,当然根据研究目的的不同,我们也可以从第三方网站进行数据的收集。
收集到的数据,我们不能直接拿来进行分析,而是需要对数据进行初步的处理,也即“数据清洗”的过程。因为我们收集到的数据可能有一些遗漏、缺失,或者无效等等,所以在这一步我们要对数据进行初步的筛选,以保证分析过程“代码不会出现Error”、分析结果“符合预期”等等。
筛选的方法也有很多,如果数据量较小,我们可以直接在数据原表中进行操作,删除无效、不符合要求的数据等等(当然这一步,我们也需要在形成的报告中进行说明);如果数据量较大,我们可以利用统计软件来处理,于是这一步也可以变成数据分析的第一个步骤。

数据分析

数据分析是定量研究过程最重要的一步,也是影响我们报告输出的关键步骤。首先根据不同的数据类型,我们需要选择不同的研究方法和模型。按照特定的方法步骤构建好模型后,我们便可以代入之前处理好的数据,对数据进行描述性统计,分析数据的表层特征;然后进行相关性分析、回归分析、拟合分析,分析数据的内在特征等等。
这一步是比较难的步骤。原因在于,一个是我们可能不知道选择什么方法来进行分析,另一个则是我们不知道用什么工具来进行数据分析。
对于第一问题——研究方法的选择,需要严格按照我们所研究的问题来选择。最简便最有效的途径是,我们可以借鉴已有研究的研究方法,通过阅读相关的文献资料获得我们研究问题的研究方法。当然,有些研究会选择一些“创新”的方法,甚至有些会“独辟蹊径”,用其他研究问题的研究方法,或者结合几种其他研究问题的研究方法,来分析某一研究问题。这一方式不管是从理论上或者逻辑上都是允许的,但“是否是创新”?我们说,是存疑的。因为“研究方法的创新”,是对方法本身的创新,并非“换汤不换药”,换一个研究问题就成了“创新”。
选择了研究方法后,我们还需要考虑“研究工具”。研究工具,也就是我们选择的统计软件。统计软件有很多,我们这里先介绍两种比较常用的——SPSS和Stata软件。
▍SPSS是最被大家熟知的一种统计软件。第一、它操作简便。SPSS绝大多数操作是通过菜单、按钮、对话框完成的。它不需要计算机编程,不需要记忆大量的命令和参数。第二、它可以直接读取其他软件格式的数据文件,与一般的办公软件直接兼容。第三、SPSS最新版本采用分布式分析系统,适应互联网,支持动态收集、分析数据和HTML报告等等。
SPSS可实现的分析功能:基本统计分析(描述性统计图表、列联表分析等等)、参数检验、方差分析、相关分析、回归分析、聚类分析、因子分析等等。
▍Stata与SAS、SPSS被称为三大权威统计软件。与其他软件相比,Stata具有以下明显的优势:第一、它是一个开放的软件系统。Stata里面有很多高级的统计模块,这些均是编程人员用宏语言编写的程序文件(ADO文件),我们可以随时到Stata网站寻找并下载,并且可以根据需要对这些ADO文件自行修改、添加,十分便捷。这一特点也使得Stata软件始终处于统计分析方法发展的最前沿。第二、它同时具有统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,通过Stata软件制作的图形十分精美,可直接被WORD、Excel等办公软件使用或操作等等。
Stata可实现的分析功能:数据制图、基本统计分析、参数检验、回归分析、回归诊断(异方差检验、内生性检验)等等。
当然,目前也有很多其他比较流行的统计软件。比如,R语言。R语言除了能够实现基本的统计分析功能外,它的一个明显的特点是可以处理“大数据”,比如金融数据。如果用SPSS或Stata来处理金融数据,会出现操作时间长、卡顿等问题,但R语言可以在很短的时间实现。还有专门用于做结构方程模型的Amos软件、以及实现爬取第三方网站数据的Python软件等等。
每一种统计软件都有其优势和特点。如果我们研究的方法模型较为简单,则只需选择基础的统计软件即可;如果方法模型较为复杂,则需要选择对应专业的软件来分析。不管选择哪一个,我们需要考虑的最重要的一点是,要让统计软件服务于我们的研究问题和方法模型。
作者:岳鑫鑫(科研写作研究所编辑)
(0)

相关推荐