能力的测量
能力作为一种心理特性,不同于物理现象的特性,它看不见,摸不着,不能直接进行度量。但是,一个人的能力又能通过它成功地解决各种问题的活动表现出来。因此,分析个人怎样解决问题,取得了什么结果,就可以判断他能力的大小。例如,一个学生正确而迅速地完成了学校的各项作业,说明他有较强的学习能力;一个作家创作了具有重大社会影响的作品,说明他有较强的创作能力; 一个管理干部善于处理工作中遇到的各种问题,使本单位的工作面貌发生了巨大的变化,说明他有较强的管理工作能力。
能力与人的行为活动的这种内在联系,为间接地测量人的能力提供了客观可能性。
测量能力的工具是按标准化的程序所编制的各种能力测验。根据测验的方式可分为个人测验和团体测验; 根据测验的内容可分为文字测验和非文字测验;根据能力的分类可分为一般能力测验、特殊能力测验和创造力测验。实施这些测验的目的就是要把能力用数量化的方法精确地表示出来。
一、一般能力测量
一般能力测验即智力测验。 这是目前世界各国普遍流行的一类测验。智力是人的能力结构的重要组成部分。测量人的智力,了解人的智力水平,对做好教育、医疗工作,合理选拔人才具有重要的意义。
(一)智力测验的由来
用一定的手段和工具来测定人的智力,是古已有之的。在我国古代,刘勰用左手画方右手画圆的方法来考察人的注意分配;扬雄用言语和书法的速度来判断人的智慧,都具有智力测验的性质。19 世纪末,英国生物学家高尔顿 设计了高尔顿音笛和高尔顿棒,分别测定人的听觉和视觉辨别力,试图通过感觉辨别力来估计人们智力的高低。
系统采用测验方法来测量人的智力,是在本世纪初由法国心理学家比奈和医生西蒙提出来的。比奈早年就从事测验的研究,曾花费三年时间测验了自己的两个女儿,并于1903年出版了《智力的实验研究》一书。1904年,比奈受法国教育部的委托,参加筹建研究呆傻儿童的委员会,并承担任务,研究一套测定呆傻儿童的方法,以便把他们从一般儿童中区分出来。1905 年,比余在西蒙的帮助下,编制了一个包括30个项目的正式测验,每个项目的难度逐渐上升。根据儿童通过项目的多少来评定他们智力的高低。这就是最早出现的一个量表:比奈一西蒙智力量表。
1908年,比奈和西蒙对已编制好的量表进行了第一次修定。测验项目由30个增加到58个;测验的年龄由3岁到15岁,每个年龄组的测验项目为4~5个。1916年,美国斯坦福大学教授特曼将比奈一西蒙量表介绍到美国,并修订成为斯坦福一比奈量表。1937 年和1960年,斯坦福一比奈量表又经过两次修订,成为目前世界上广泛流传的标准测验之一。
(二)斯坦福一比奈智力量表
斯坦福一比奈智力量表是一种年龄量表。它以年龄作为测量智力的标尺,规定某个年龄应该达到的其一智力水平。
用斯坦福一比奈量表来测量人的智力,首先要计算出人的智力年龄,简称智龄(MA), 即受测者通过测验项目所属的年龄。如果一个孩子只能通过斯坦福一比奈(1960) 量表5岁组的全部项目,而不能通过6岁组的项目,那么这个孩子的智龄为5岁;如果他不仅通过了5岁组的全部项目,而且通过了6岁组的四个项目、7岁组的三个项目、8岁组的两个项目,而9岁组的项目一个也没有通过。这个孩子的智龄就是6岁6个月。很明显,一个孩子的智龄越大,他的智力发展水平就越好。
智龄是对智力的绝对水平的度量,它说明了一个儿童的智力实际达到了那种年龄水平。早期的智力测验(如比奈1905、1908 年的测验)就是用它来表示儿童智力的发展水平的。但是,智龄的大小并不能确切地说明一个孩子的智力发展是否超过了另一个孩子。智龄相同的两个孩子,由于实际年龄不同,他们的智力是不一样的。为了将一个孩子的智力水平与其他同龄核子进行比较,还必须考虑智龄与实际年龄的关系,并对个体的相对智力做出估计。特曼采用智商的概念,来表示智力的高低。智商的概念是由德国心理学家施特恩(Stern, 1914) 首先提出米的。
智商也叫智力商数,常用IQ表示。智商是根据一种智力测验的作业成绩所计算出的分数,它代表丁个体的智力年龄(MA)与实际年龄的关系。
按照这个公式,如果一个5岁的儿童的智龄与他的实际年龄相同,那么这个孩子的智商就是100,说明他的智商达到了正常5岁儿童的一般水平,如果一个6岁儿童的智龄为6.6,那么他的智商就是130了。智商100代表智力的一般水平。如智商超过100,说明儿童的智商水平高;低于100,则说明儿童的智商水平低。
用智龄和实际年龄的比率来代表智商,叫比率智商(ratio IQ)。比率智商有一个明显的缺点。人的实际年龄逐年在增加,而他的智力发展到一定阶段却可能稳定在一个水平上。这样,采用比例智商来表示人的智力水平,智商将逐渐下降。这是和智力发展的实际情况不相符的。
(三)韦克斯勒智力量表
斯坦福一比奈量表是对个体智力状况的综合测量,只能给人一个相当笼统的概念。
但是智力并不是一种单一的能力,它包含着各种结构成分。在同一人身上,智力的各个成分可能有不同的发展水平。
为了更真实地反映出一个人的智力状况。韦克斯勒编制了若干套智力量表,韦氏成人智力量表,适用于16岁以上的成人;韦氏儿童智力量表, 适用于6~16岁儿童;韦氏学前儿童智力量表, 适用于4~6.5岁儿童。这些量表测量了范围较广泛的能力。
韦氏量表包含了言语和操作两个分量表,叮以分别度量个体的言语能力和操作能力。言语分量表包含的项目有:词汇、常识、理解、回忆、发现相似性和数学推理等;操作分量表包含的项目有:完成图片、排列图片、事物组合、拼凑、译码等。
韦氏这一改进有明显的好处。应用韦氏址表,不仅可以度量出智商的股水平 (综合智力),而且可以度量出智商的不同侧面:言语智商和操作智商。言语智商和操作智商虽然有很高的正相关(+0.77-++0.81),但用这两种量表测得的却是不同的能力。
韦克斯勒还革新了智商的计算方法,把比率智商改成离差智商(deviation IQ)。提出离差智商的根据是:人的智力的测验分数是按常态分布的,大多数人的智力处于平均水平,IQ= 100;离平均数越远,获得该分数的人数就越少;人的智商从最低到最高,变化范围很大。智商分布的标准差为15。这样,一个人的智力就可以用他的测验分数与同一年龄的测验分数相比来表示。
由于离差智商是对个体的智商在其同龄人中的相对位置的度量,因而不受个体年龄增长的影响。例如,一个孩子在测验中的得分高于平均数3个标准差,那么,不论他的年龄有多大,他的智商总是148。
同样,一个智力平常的儿童,他的智商总是100。
离差智商克服了比率智商的弊病,但也存在问题。它容易造成对智力的绝对水平的误解。例如,一个人的离差智商在70岁时和在30岁时可能都是100,而智力的绝对水平并不相同,70岁时的智力应比30岁时的智力低一些。
(四)智力测验的标准化问题
智力测验是衡量人的智力和智力发展水平的工具。正如尺子、天平的精密度直接影响到测量结果的精密度一样。智力测验的好坏也关系到能否真实、准确的度量出人的智力。
标准化智力测验要求常模、信度、效度、施测与记分要求,这是评定测验的质量优劣的主要技术指标。
1.标准化与常模
一个好的测验,在编制时要经过标准化的过程。所谓标准化是指测验编制时要经历4个标准式的步骤:
其一,按照测验的性质选择具有代表性的测验题目。如果要测量数学能力,就要选择出足够能代表数学能力的题目,并要适合某个年龄水平,如一个题目4岁组儿童通过了10%,5岁组儿童通过了60%,6岁组儿童通过了90%,那么它可以作为5岁组的一个测验项目。选择项目还要注意公平合理,避免因文化上的差别而偏向某些被试。例如,让被试给钢琴和小提琴下定义,由于被试的家庭经济条件和父母职业的差异,有些人熟悉这些乐器,而另一些人不熟悉。因此,选择这种题目必将产生不公平的结果。对初选后的题目进行测试,要注意题目通过的水平。如果一个题目测试的结果,不同年龄组的儿童以相同的百分数通过了,这种题目就不宜选为最后的测验题目。
其二,选取具有代表性的被试,确定标准化样本。应用抽样的方法,从某一全体中选出少数被试为样本。样本要保持男女的恰当比例,城乡居民、不同地区人口的比例,注意人的社会阶层、经济地位等。人数的多少(样本的大小)也和测验的标准化有关。一般来说,取样的数量越多,标准化的程序也会精确些。比奈一西蒙(1980) 量表,只用了300个儿童;斯坦福一比奈(1937) 量表用了3000个儿童,但取样对象都是美国出生的白种人,这都会影响到量表的标准化。
其三,施测程序标准化。要使测验准确有效,就要使测验的施测和评分都有统一的标准。施测时的标准化是对施测环境的控制,如使测验场所的桌椅设备、采光环境保持一致;统一规定测验施行的时间;事前做好一切必要的准备,使测验不因偶然发生的事情受到影响或中断;在施测任何被试时,必须在同一时限与同样情境下,按照同样规则去从事测验作业。测验的记分也力求客观、正确,测验的评分标准必须有明确规定,要尽量减少阅卷者对测验成绩的影响。无论采用何种记分方法,都要遵循四点要求:客观、正确、经济和实用。
其四,统计结果,建立常模。样本施测后,对结果加以统计处理,得出一个具有代表性的分数分布,即常模。常模包括最高分与最低分,样本的平均数,各种分数上的人数。常模(norm)是使用测验者解释测验结果的依据。个体的测验分数必须与常模比较,以判别某一个体所得分数的高低,这时分数才能显示出它所代表的意义。例如,一个学生在一次高中英语考试中得了75分,我们一时无法判断其分数的高低,但我们将其分数与全年级学生的成绩相比较时,这位学生分数在300多名学生中排在第50位,我们就能知道其分数高低了。
2.信度
信度(relability)指测验的可靠程度,它以反复测验时能否提供相同的结果来说明。如果同一个人在初测时的得分很高,而在复测时得分很低,说明测验的信度差。如果初测与复测的结果一致,说明测验4有较好的信度。信度用信度系数表示。智力测验的信度系数一般为+0.90。信度太低的测验是不能使用的。
3.效度
效度(validity) 指测验能测量到所需要测的东西,即测验的有效性。表示测验效度的一种方法,是将测量的结果与随后的行为进行对照。如果一种测验能预测后来的行为,这种测验的效度就高;否则,他的效度就低。效度通常用效度系数来表示。智力测验的效度系数多在0.3到0.6之间。如斯坦福一比奈量表测得的智商与学生随后在学校中的成绩之间,其相关可达+0.6。 测验的效度也可以与一个效度较好的著名测验相比较来说明。当新的智力测验的得分比斯坦福一比奈测验的得分相关很高时,也可以说新测验有较好的效度。
二、特殊能力测验和创造力测验
(一)特殊能力测验
智力测验提供了对人的一般能力的了解,这种了解还远远不能满足社会对选拔和使用各种人才的迫切需要。在现代化的生产和生活的要求下,人的社会分工越来越精细,形成了不同的实践领域所需要的特殊能力,如机械操作能力、音乐能力、艺术能力等。使用不同的方法和手段来度量这些能力,就叫特殊能力测验。例如,通过测定一个人对音调、音响、和谐、节律的感受和分辨,可以了解他的音乐能力;通过测定视觉阅读速度和手指灵活性,可以了解一个人的打字能力;通过测定人对仪表的认读、空间定向、对仪器的理解、对物体运动速度的判断和手指的灵活性等,可以判断一个人的飞行驾驶能力;通过测定一个人在调度、安排、意外处理、判断决策方面的表现,可以了解他的管理能力等。可见,测定特殊能力同样要对某种能力的结构成分做出正确的分析,然后、采取适当的手段来进行度量。
例如,西肖尔编制的音乐能力测验,就是依据对音乐能力的分析编制的。西肖尔对音乐能力的分析如下。
西肖尔根据以上的分析,列举了5方面的测验项目,分别测量辨别不同音强、音高的能力,测量时间、和谐、记忆、节律方面的能力。
特殊能力测验具有较强的针对性,因而对职业定向指导、安置和选拔从业人员、发现和培养具有特殊能力的儿童,有重要意义。但这种测验发展较晚,因而测验的标准化问题尚未得到较满意的解决。
(二)创造力测验
在进行一般能力即智力的测量时,人们相继发现,在智商较高的人群中,智力和创造力之间几乎没有关系。这提出,创造力不等于一般智力,因而编制创造力测验也就成为必要的了。
创造力测验不同于一般智力的测验。智力测验的内容一般为常识性的,并有固定答案的问题,因而测量的结果主要反映个人的记忆、理解和一般的推理能力。而刨造力测验的内容,不强调对现成知识的记忆与理解,而强调思维的流畅性、变通性与超乎寻常的独特性。
以华莱奇和科甘的一项研究为例,他们用一系列的测验测量(儿童思维的流畅性:①尽量说出几种常见东西的用途,如鞋子、软木塞等;②尽量说出一对物体相似的地方,如火车与拖拉机、马铃薯与葫萝卜等;③尽量列举一个抽象范畴所具有的各种实例,如圆形的东西有水珠、皮球、盖碗等;④在看到某个抽象的图形或线条画时,尽量说出你所想到的意义。
研究者记录了儿童所做出的反应数量和具有创造性的反应数量。通过这两方面的度量,就可以了解儿童思维的流畅性与独创性。
巴朗(Barron,1958) 曾设计了一系列的测验,研究那些富于创造性的科学家和艺术家。这些测验包括:解释墨迹图;用彩色方块拼图;在一个微型舞台上创造一种舞台设计;完成一些未画完的图画;说明自己对图片和图案的艺术爱好;根据随机抽取的名词、形容词和动词,尽量编出词汇众多的故事。从这些测验发现,富于创造力的人都喜欢复杂的、不对称的、生动的图画。在选择自己喜爱的图片和进行拼图时,都是这样。
在墨迹测验和符号意义测验中,他们都喜欢做出不寻常的反应。下面是图画完成测验的结果。其中左侧是一般人的反应,而右侧是有创造性的人的反应。从图上看到,有创造性的人所完成的图画比较复杂,而且是非对称的。这和一般人的反应有明显的差别。
除上述测验外,还有多种创造力测验。下面列举的是各种创造力测验中所用项目的一些例子。
1.不寻常用途(Guilford, 1954)
对下列物品,把你所想到的用途尽量地说出来:
A.牙签
B.砖
C.曲别针
2.后果推测(Guilford, 1954)
如果国家和地方的法律都突然被废止,请你想像一切可能发生的事情。
3.故事结尾(Getzels & Jackson, 1962)
淘气的狗
一条淘气的狗过去常常悄悄地跟在行人的脚后,然后突然咬他们。狗的主人只好将一个铃铛条在它的颈上,这样无论它走到哪儿,都会发出响声。这条狗想真是太好了,于是很骄傲地响着铃铛声走遍了全城。但是,一条老狗说....
4.非直接联想(Mednick,1962)
让被试给出第四个词并使之与下列每组三个词有联系:
A.老鼠一蓝色一农舍小屋
B.轮子一电一高
C.外面狗一猫
D.惊奇一线一生日
5.词的联想(Getzels & Jackson, 1962)
要求被试对下列的每一个词写出尽可能多的意思:
A.母鸡
B.布袋.
C.投掷
D.公平的
许多研究表明,智商与创造力分数之间的相关是低的,但存在正相关。也有研究认为,智商与创造力之间的相关高低是由创造力测验的性质决定的,某种创造力可能要求较高的智力,面另一些创造力又可能与智力相关不高。尽管在智力和创造力的相关上还有不同的看法,但比较一致的看法是高智商并不能保证高度的创造力,而低智商的人肯定只能得到创造力的低分数。
人的创造力在现代生活中有重要意义。因此,创造力测验也就引起了人们的普遍重视。但是这类测验与特殊能力测验一样,研究的历史还不长,测验的标准化程度还不够。某些测验虽然取得了一些有价值的研究资料,但是离开实际应用一预测和控制人的创造行为,则还有很远的距离。