考试测量评估与锚题等值等概念的引进

考试测量评估与锚题等值等概念的引进

渐新堂

考试是老百姓耳熟能详的说法,已经有很多很多年的使用历史了。

教育测量则是西学东渐,尤其是在教育的需求进一步提升之后从其他学科其他领域引进的新名词,一旦说上教育测量,使用的工具仪器就变得客观起来,科学的味道立马浓厚了不少。

教育质量评估则是本世纪特别是课程改革以来的说法,在考试与教育测量基础上,引入和加进了人们更加全面客观观察的成分,似乎更科学更具有发展性,更容易体现出对学生成长鼓励。

考试体现的主动与被动,其权威不可撼动。教育测量则是体现客观性,没有其他因素的介入。评估则是以人为本,体现的是着眼长远鼓励发展。三者分别代表了农业文明对既往的判断,工业文明对当下的认定,网络文明对未来成长的关注。

以上概念代表着不同阶段不同时期的认知,分别引领者探索与进化。

然而,在我国的教育现实中,三个概念的使用,都不同程度地交织在一起,特别是大规模的考试中其观念在不同性质考试中,还需要我们进一步梳理清晰。

首先是基础教育中的考试,因为多少时代多少年代以来基于教育资源的严重匮乏,教育成为了极少数精英的奢侈的独享事情,考试则常常是好中选好优中选优,无论如何要把天才选出来,要把最优秀最厉害的那一个那一名尖子选出来。考试自然就成了高线考试。看一看最高水平在哪里,是哪一位。长此以往,为了那极少数的第一名,千千万万的学生跟着去厮杀拼搏,力求成为那第一名,完全忘记了学习任务完没有完成,达到还是没有达到国家要求的标准,基础教育逐渐演变成竞赛教育,绝大多数学生成为了第一名之外的青春年少期间的陪读者。

其次,如果采用一些发达国家教育测量中的低线考试的观念,即检查一下通过半年一年的教育学习的付出,看一看还有谁需要特别关爱,需要在某一时段某一内容上进行帮助,使其跟随大家一起进入下一阶段的学习。但是,这样的观念是行不通的,在我国极其看重立竿见影要有政绩的地方,大家都进步都好了,我的一己私利,即我的政绩如何与别人拉开距离。这就导致了我们国家基础教育的考试为什么失控,以致于干脆一纸命令下来,一律不准考试,一律不准组织统一考试。睁着眼睛说瞎话,人人优秀,个个超群,大家卓越。长期实行的因噎废食的结果是小学毕业不会加减乘除,初中毕业还有不少的人不会九九表,而对这一些,所有的教育行政长官以及学校校长教师,都没有丝毫的对孩子对民族对国家的负疚感。

从考试到教育测量再到教育评估,这些发达国家的教育同行们在实践中积累的智慧的确有效地影响和提升着我们的教育观念。

但是,并非引进的一切都是适合我国的国情的。譬如题库和锚题以及等值等三个概念,就远远不如教育测量与教育评估适合我国国情。

国家考试中心早在1995年高考改革方案中有就建立题库的项目,并向全国公开征集各个学科的试题入库,早在1980年代中后期,重庆市科委立项,也为重庆市教科所(当时全国规模最大的教科所)建立基础教育考试所需要的题库特拨转款数十万。但是,几年十年二十年过去了,仍然难以见到成效与结果。

与此同时。教育测量中的最专门最新颖的技术与概念——锚题、等值等,也不断输入教育界人士的大脑,在这十多年里,随着国家教育部在全国指派的30个教育质量综合评价试验区的面世,不拉上锚题,不使用等值这些概念,就必定显得落伍,似乎就没有了试验区的说话的分量。

在锚题和等值等概念上投入的经费,应该有数千万甚至上亿的数额,为何几年下来仍然不见效果呢,问题出在哪里?

我以为,不应该盲目硬搬西方的做法。

锚题以及等值是欧美国家教育测量常常使用的概念。以美国为例,他们是多地多州实行教育立法的国家,联邦政府不具有教育立法权利(若干年前没有教育部),各个州没有外交军事权但是有教育立法权,州与州之间学制考试都可以有很大的不同,而大学的招生却又不能够局限于某一个州,于是,客观上就存在着如何比较不同考试不同地方不同的州的考试成绩,如何认定学生进入大学的资格,如何看待不同考试的价值以及等值的问题。这是实践中产生的需求。随着高等教育的大众化普及化的到来,还涉及到不同年份的成绩如何比照的问题,如何认定其价值的问题,为了相对录取的公平,教育测量中的锚题以及等值问题便逐渐地急迫地摆在了面前。

我们国家是大一统的国家,高考全国统一命题,中考全省或全地区全市统一命题。且不管该届考生水平如何,招生计划早就制定好了的。绝对不会因为这一届考生好就多招收几十万,下一届考生差就少招收几十万。这样一来,水涨船高,水落船低,大家在同一试题同一分数线上论高低,没有条件没有可能在不同的试题背景中去进行比较,然后择优录取。

题库的建立同样遭遇到了我国的国情。因为我们的现代学校教育起步晚,教学内容课程标准至今还不成熟不稳定。40年来我国基础教育中的数理化等课程内容,就由40年前的试用本甲种本乙种本实验本再到重点中学本高级中学本再到现在的课标本,其内容被删减调整了十多次,教学内容的稳定性差变化快,对课程内容的共识少,缺乏人力财力对基础教育内容进行深入的研究与梳理。到今天为止,无论是2011年版的义务教育课程标准还是2017年版的高中课程标准,都很难取得共识,自然也很难确定下来甚至固定下来,在一段时间内相对稳定下来。

大范围内实行的大一统的考试,招生录取的计划指令,以及学科内容的瞬息多变,使得我国教育测量中的题库建立,锚题与等值技术研究,自然就水土不和,难以在实践中得到认可与推行。

说起来还真有点像大学实行学分制,已经喊了三四十年,仍然难以推行。这些洋名词,也像学分制一样,喊喊而已。要当真,可能还需要在50年甚至更多时间之后,说不定一直都没有必要去适应它。

长按或扫描此码方便继续关注

(0)

相关推荐