暑假里,我和同学参加了中国社会科学院举办的中国社会综合状况调查(简称CSS)的问卷访谈工作,主要跑江汉平原的几个乡镇。在这将近半个月的时间里,我们顶着烈日走街串巷,不知道流了多少汗,不知道被村里的狗追了多少次,忘不了起初乡亲们从刚见面时的冷漠到最后执意留我们吃饭的热情,忘不了做完当天调查后走在乡间小路的静谧,忘不了回到住处讨论问卷设置及所见所闻的激情。
在这半个月的时间里,我参与了最一线的调查研究。也有了一些感悟和体会,主要是对定量调查的。因为我们收集的就是最基础的数据,没有我们千辛万苦拿来的数据,定量研究就会是无源之水、无土之木,不可持续的。
当前,社会学定量方法的学术地位得到公认,用数据说话并以之以论证各种观点遂成为学界时尚。通过技术手段和统计工具使社会学向定量化、微观化和实用化发展,在社会控制、社会预测、社会工作、社会管理和社会问题中产生重要作用。20世纪30年代,西方社会学家始用定量方法研究社会和政治问题,后来定量研究逐渐演变为全球社会学研究中的新潮。至90年代,北京大学恢复社会学系并开设社会统计学课程,定量方法进入中国。然而,国内近年对于同一社会调查项目,常有不同学者或部门拿出差异颇大的统计数据及分析结果,其释义大相径庭。究竟是什么原因造成了这个现象呢?是其内在的操作规范出现了问题,还是定量方法的一些结构性缺陷造成了这些问题呢?
我想从此次的调研出发,从定量研究的调查对象分布范围、抽样步骤和精度、调查实施、调查监督、调查结果核查等五个环节,来探讨当今定量研究中存在的一些问题及CSS调查是如何尽可能的有效解决这些问题的,以便给我这段难忘的岁月做一个总结。
一、对象分布范围
抽样就是从对象总体中抽取部分个体的选择过程,但社会学家是用代表总体的抽样框来实施抽样步骤的,因此,抽样框是否完整地包含了总体中所有个体,决定着抽样误差的大小。用统计学术语来描述,就是抽样框较大的优于抽样框较小的。当然,既然是用统计学的观点来衡量,通常要求这种差别是几何级或对数级的,而算术级差别意义不大。无论如何,足够的样本量是必要的,“有限观察”难免犯下“过度概化”的错误(李沛良,2002)。社会学定量研究遵循实证原则,必须从现实的对象总体中进行抽样,绝不能用假设或推断的“总体”来抽样,抽样框务必反映客观实在的对象总体。故在人口流动增大、社会和经济情况变化加快的今天,社会学定量研究课题不能不重视抽样框问题。抽样框数据越是新近、越是完备,其对抽样有效性的支持就越大。甚至可以说,建立抽样框是定量研究的第一个外显性步骤。如果研究内容复杂、层次深入,该步骤可能需长达数月甚至更久的时间。可惜现在许多人不太重视这个问题,不少定量课题都没有自己的抽样框,实际上有些人从一开始就没能将课题研究的对象总体界定清楚。还有一种“日趋普遍”的错误做法,“研究者往往从某个抽样框中选取样本,而后对一个近似于但并不等同于该抽样框的总体做出结论”(风笑天,2005)。当然,也有人明知这一统计学道理,但在快出“成果”的心理驱动下,故意省略了建立抽样框的必要步骤。从而导致了调查结果缺乏代表性且误差颇大。而CSS调查的对象分布于经过严格抽样选取的全国31个省的10268个家庭,因此分布范围来看,是比较有代表性的。
二、抽样步骤和抽样精度
“ 抽样很重要,因为我们只能讨论总体特征。我们不能讲个体,所以要抽样”(谢宇,2006)。社会学定量研究的第一个必要环节,就是抽样。各种抽样方法中,尤以随机的概率抽样最重要,它是让调查所得能够成为一套概率数据的必要条件。非概率抽样尽管适合于某些研究目的,但是其样本却不能够保证代表了总体,而概率抽样虽然无法完美地代表总体,但较其他抽样方法更具代表性,因为它能避免我们讨论过的偏见。“更重要的是,概率理论使我们能够估计样本的精确度及代表性”(风笑天,2005)。对象范围愈大,规范的概率抽样愈重要。令人遗憾的是:这些年来,国内很多的地方社科研究人员对于众多的对象单位,未做科学抽样环节就去搞“定量研究”,拿回的数据资料并不能反映社会总体,其“成果”却屡送单位、上级部门、媒体直至报刊和出版社。此类“成果”尽管汗牛充栋,终无益于国计民生,不具真正的定量研究实证价值。
抽样是从总体中抽出能够反映总体特征的样本的过程,其目的是凭籍样本参数以逼近总体参数。抽样精度愈高,样本参数与总体参数之间的差异愈小,抽样的有效性愈大。抽样精度取决于两个因素:A.样本数量。选取样本数量越大,抽样精度越高。总体中所有个体都成了样本便是普查。社会学家受制于时间和经济成本的约束,只能进行抽样调查。抽样的精度直接关系到后面数据分析的精度,粗糙的抽样则满足不了深入分层分析的需要。B.抽样方法。所用抽样方法愈能反映总体的内部差异特征,抽样精度愈高。但欲获得好的设计效应,单靠数学手段还不行,此时“先导研究”的技术价值就显现出来了。事先研究对象总体的各种情况更为重要。已知对象总体内部异质性强时可采用整群抽样,已知对象总体外部异质性强时宜采用分层抽样。总之,抽样方法是同等样本规模条件下追求较好设计效应的技术手段。CSS调查采用了地图地址抽样法,地图地址抽样法能够较好的反映总体状况,从而精确度较高。
三、调查实施过程
调查活动旨在从样本对象那里获取实在数据信息及其他资料。因此调查实施获取资料的环节就成为了调查成败的关键。从我自身的调查经验来看,定量研究有几个结构性的缺陷,不得不引起研究人员的重视。问卷的设计者大都为高校教师或者专业人员,虽然在问题设计上会考虑到受众的多样性及接受理解能力的差别。但在实际实施过程中,由于话语体系不同从而导致对问题的理解偏差还是普遍存在的。从CSS调查的实际经验来看,由于调查区域多为农村,农村受访者的受教育水平较低,加上整天早出晚归,忙于生计,因此对社会上的一些公共事务缺乏了解。当访员对其进行访问的时候,访员不得不将问卷问题的话语体系转化为受访者能够接受并理解的话语体系,在这一转化过程中,存在着一种双重偶然性,从而会导致问卷效果不佳。从访员角度看,访员有可能由于对问卷的不熟悉影响问卷效果。而这种不熟悉包括对问卷结构的不熟悉和具体问题的不熟悉,从而导致效率拖沓,严重影响效果。对问卷结构的不熟悉主要体现在:对于问卷ABC等各部分及各部分内部的不熟悉,从而在问题的跳转方面出现一些停滞。对问卷具体问题的不熟悉主要就是访员本身对问题的理解就存在偏差,从而导致最后问题的回答偏离了设计者原本预想的方向。从被访者的角度看,对于突然找到自己进行访问的访员,他们是不可能不心存警惕的。再加之问卷的内容中有问及被访者的个人收入、家庭收入、存款不动产信息等极具私密性的问题。因此针对这些问题的回答,其可信度是不会太高的。另一方面,由于对访员的警惕,在涉及一些如敏感的公共问题(如关于当地政府的问题)的时候,被访者的回答往往含糊其辞,遮遮掩掩,这对问卷效果的精确性也提出了很大的挑战。
四、调查监督
调查活动旨在从样本对象那里获取实在数据信息及其他资料。拿回来的数据信息和其他资料是否真实,决定了后面数据分析结果能否支撑整个研究做出正确结论。
作为课题研究的重要一环,按理讲研究者应该亲自去现实中拿回第一手数据资料,但社会学定量研究通常样本量较大、调查点较多且分散,光靠几个课题组成员难以完成调查,于是就需请别人来做调查员。这有两种方式:一是招募符合条件的人,录用后应进行规范培训;二是委托最接近各调查点的同行做调查,这样可节省培训费和交通费。后一种方式受限于同行的时间精力和分布地点等因素,故多采用前一种方式。而请别人给你做课题调查,就不仅需要培训并支付一定报酬,更需对他们的调查活动进行有效“督导”,将他们接触样本对象、交谈记录等活动状况置于严密监督之下。而CSS调查就是采取的前一种方式,将湖北地区的调查任务分配到我们身上,然后对我们进行规范培训,然后进行调查。
有切身经历的人都知道,社会学抽样调查是个苦差事,先得颇费周折地找到样本对象,然后要说服他花点时间接受调查,调查中还要受访者尽量回忆以前可能忽视了的事件细节、时间地点、准确数字等,再逐项记录下来。事实上,做了第一份问卷以后,你会想法子加快下一份问卷的访谈进度而倦怠于细问受访者精确答案。“督导”就是由督导员实施现场监督、引导和帮助调查员解决实际困难,以保证调查过程的真实性。但学界注重调查过程真实性的传统经常遇到来自行政权力的挑战。有一些地区数字政绩成风,我就曾听人说目睹统计调查队成员带调查问卷回家连夜自填的情况。国内各地的科研机构长期效仿行政化管理,许多专家学者时任各级科研机构或行政单位领导职务,他们承担课题时很难亲自下去拿第一手数据,而是喜欢通过召开调查座谈会拿回调查地点政府部门提供的数据,即便搞抽样调查也不能对第一线调查员的行为实施严密监督。在普遍急功近利的心态促动下,严密监督就要打个折扣,而缺乏严密监督就更不能保证调查过程的真实性了。这一执行环节的短处,将直接导致“不确切的观察”和“选择性观察”这两种“研究中的错误”(陈向明,2001),对课题研究结果的可信度具有根本的破坏力。
而CSS调查在这一方面做得非常好,实现非常严格的调查监督。它给每个调查小组都配备了一名随行督导和巡视督导,以便监督访员工作。首先,因为采用地图地址抽样法,所抽的每一户,必须亲自到户,针对该户成员进行访问,而且不是随机抽取成员进行访问,而是将访员能够接触到的家庭成员进行编号,再进行KISH表抽取成员进行问卷的回答。如果该成员不在家,则选择预约时间再次进行造访。如果该户全部人都不在的话,访员要至少对其进行三次造访,每次间隔不小于两小时,直到确定没人居住或者暂时接触不到的情况下,才可以向北京总部申请新的地址。督导对这一过程有着非常严格的监督,如果发现有访员对这过程的作弊情况,问卷直接作废。另外,CSS对每一份问卷实行严格的问卷审查制度。在访问期间,随行督导对每一份问卷进行审查,保证问卷质量。等到一个地区的全部问卷全部做完之后,再进行一次总的“一审”,然后进行不同小组的交叉互审,即“二审”。每次审查都需要审查人的签名,从而可以确认责任落实方。通过这些做法,能够从最大程度上保证结果的可信度。因此CSS的调查较之其他的调查,还是非常值得信赖的。
五、调查核实
前面的一些论述基本都是针对研究者的抽样误差和一线调查员的操作误差的。现在所说核查调查结果,则是针对受访者的错答误差的。从整个程序角度看,即便抽样和调查操作两大环节符合规范要求,也不能彻底排除受访者提供错误信息。一方面,现今某些地方的领导干部存有一个误区,认为社会调查所获资料若与政府公布的数据不同则将影响社会稳定,他们常采取种种阻挠、限制社会学规范调查的行为,包括对受访者施加压力。另一方面,一些经济落后地区的被访者滋生了用“哭穷”、“示差”去谋求更多援助的心态。这两种情况都会破坏调查数据的真实性。故通过核查,弄清花费大量时间精力拿到的资料数据是否符合客观实际情况并据实更正,与科学抽样、监督调查同等重要。无须讳言,由于多年来急功近利的思想严重侵蚀学界,政学商一体化体制致使学术管理低效甚至失效,社会学课题立项审查草率且科研经费普遍不足,很多社会学课题都忽视了调查监督和事后核查这两个重要环节。而CSS调查过程中如果发现问卷数据前后矛盾的时候,会要求访员进行电话复核或再次前往实地复核,从而尽量避免上述情况的出现。对于这一点,我们作为访员是深有体会的。
六、总 结
上述五个方面仅构成粗略的比较。若把五大环节细化,所获较小环节上更多的判断点当可构成更精细的社会学定量研究方法的优劣判断比较。所谓学术规范,无非是众多最佳效应判断的总和。所谓遵循学术规范,就是严格按照最佳效应所需的技术要求去做。充分吸收实证主义社会学的这些精华并发挥其应有作用,才是符合辩证唯物主义、历史唯物主义的科学态度。而由上述五个方面所产生的问题,又使人不禁发问:为什么许多劣质的定量研究得以形成发表?为什么国内媒体和学刊对那些劣质的定量研究缺乏揭露批评?为什么有人一再刻意提供劣质的定量研究“成果”不受遏制反受奖赏?不应掩饰,这里既有研究人员定量知识落后的原因,也有社科领域科研体制不健全的原因,且后者居主要地位,这均对我国学术评价和成果验证的规范化事业造成了严重危害。欲根本改观此等学术研究局面,不可不展开两方面努力:其一,学界自身应积极促进定量研究方法的普及和学术创新,坚持学术道德,活跃学术批评;其二,国家管理机构应启动更为深入、更为细致的科研管理体制和学术评价机制改革,以向全社会负责、向历史负责。大家要看到,社会学基础理论和应用技术的进步不会止步,对真实数据及其正确分析结果的追求与全社会的和谐发展本是内在一致的。
(写于2013.9.2)
参考文献:
李沛良,2002,《社会研究的统计应用》,北京:社会科学文献出版社。
风笑天,2005,《现代社会调查方法》,武汉:华中科技大学出版社。
谢宇,2006,《社会学方法和定量研究》,北京:社会科学文献出版社。
陈向明,2001,《质的研究方法与社会科学研究》,北京:教育科学出版社。