王殿军:评价的指挥棒不变,很难真正实际意义上改变教育现状
清华大学附属中学校长、清华大学教育研究院基础教育研究所所长、教授、特级校长 王殿军
尊敬的各位教育同仁,本次论坛的主题是“如何全面提升基础教育质量,激发学校办学活力”。今天我想利用20分钟左右的时间,与大家分享关于“基础教育评价体系构建的思考与探索”的话题。其中既有理性思考,也有实践探索经验,还有一些对未来的期待或者展望。
对于中国的基础教育,每个人都有自己的观点。我个人的观点就是,以世界眼光看中国基础教育,可以说是发展神速。因为建国这么短短时间内,能够将一国的教育办成这个样子,真的可以说是奇迹了。我国的九年义务教育早就实现了,现在还有一些声音呼吁将义务教育年限进一步扩大。当然,要不要扩大,还需要专家和教育行政部门进行慎重的研究和决策。总体来讲,无论扩大与不扩大,其实我们都具备这样的实力,也就是高中教育的普及,其实我们好多地方已经基本实现了,这是非常了不起的。
我们要发展教育,不能只看到成绩,还要看到问题。问题是什么?我们人才培养的质量和水平还有待提高,尤其是顶尖的人才,具有国际竞争力的人才,培养得不够多、不够快、不够高、不够好,平均水平在增高,但是没有特别顶尖的,能够具有国际竞争力的、能在多个学科和领域处于世界引领水平的、能成为领军人物的这种学科领域人才还不多。要改变这种局面,只有一个做法,就是要改革现在制约人才培养的这些关键问题,不能够坐等。
我们的基础教育特别重视知识,这是必要的,但我们不能只重视知识。我们一定要注重提高学生的思维品质,注重培养学生的创新能力和创新意识。
究竟是什么原因导致我们的教育教学都围着知识转?讲知识、背知识、重复知识、考知识,仿佛只要掌握了知识,我们就能够驾驭一切,但是计算机和人工智能出现后,我们发现所学到的知识远远赶不上互联网上的知识,所具备的知识反应也跟不上AI,但人的想像力和创造力是其机器所不能取代的,但遗憾的是,这也是我们的教育所忽略的地方。
我们教育的内容高度统一,保证了底线,但是高度的统一也限制了某些有天赋的孩子的发展空间,这是我个人的观点。我们的教学方式依然是教授式的,讨论启发流于浅显和形式化,“是不是?”“对不对?”这种简单的回答和应对比较多,真正深入的探究式、研究式、启发式的教学互动活动较少。我们很多内容,还是考记得牢不牢、背得熟不熟、练得是不是到位。我们的学习、考试,都是用这样的标准来衡量,这就导致学生记了一大堆知识,但是没有创新的想法,动手实践能力也比较差。
如何才能激发学生的兴趣?这与我们的教学过程有关。没有这种项目式的学习、探究式的学习,真正激发孩子用高阶思维能力去思考问题、研究问题的学习,就难以调动孩子深层的学习兴趣。
现实的状况,不是校长不会这么做,也不是老师不会这么做,是因为我们整个评价系统没有引导我们去这么做。应该培养什么样的人,校长和老师都心中有数,但是因为升学压力等各种各样的原因,导致我们不得不屈从于当前的选拔和评价方式。
如果评价的指挥棒不变,很难真正实际意义上改变我们的教育现状。评价太单一,这是我深深体会到的一件事情。单一到什么程度?就是一些考试分数起了几乎是全部的决定性作用。如果没法打破“唯分数”论,应试教育依然会大行其道,我们的人才培养质量和办学水平至多能够在校长可以左右的范围内有所改善、有所提高,但是全局很难改变。
我们都知道,基础教育的三个环节:培养、评价、选拔,循环往复。现在为了避免应试教育,幼儿园升小学是就近入学,摇号;小学升初中,摇号;初中升高中,好像没摇号,得考试。因为升高中要考试,所以初中的教育就得适当地考虑考试,多大程度取决于校长的观念、学校的做法。到高中升大学的时候更是如此。高考选拔具有高利害性,所有高中的校长和老师,包括家长、孩子,全力以赴,为赢得高考而拼搏。因为分数是决定他们命运的唯一东西,分数决定了他们能读什么大学、上什么专业,可能还决定了未来一生的起点,这是一个无法避而不谈的问题。
我相信,从总书记到国家高层都看到了问题的症结所在,那就是评价问题。评价就是基础教育发展的“指挥棒”,评价改革就是教育改革的“牛鼻子”,这个问题解决不了,就不能从根本上解决问题。因此,《深化新时代教育评价改革总体方案》提出了“五大改革”:改革教育工作评价、改革学校评价、改革教师评价、改革学生评价、改革用人评价;提出“四大改进”:改进结果评价,强化过程评价,探索增值评价,健全综合评价;提出“一个目标”:着力破除“五唯”,建立科学的、符合时代要求的教育评价制度和机制。如果没有这样的评价指挥棒指挥,我们的教育依然在原地打转,因为不知道方向在哪里。
当前推动评价改革,急需拿出具体的、可操作的办法,并付诸行动。相信教育专家和教育主管部门正在研究和制定具体举措。在具体方案出台之前,基层的教育工作者不能无动于衷,应该用自己的实践探索,积累经验,贡献智慧,提供建议。今天我就跟大家分享一下我的想法和清华附中的探索。
学生综合素质评价系统
学生综合素质评价非常难做,在中国尤其如此。学生综合素质评价是新时代基础教育改革的需要,学生综合素质评价有具有紧迫性、复杂性、长期性、实践性、引领性的特点。
清华附中建立的评价体系,主要从三个维度开展评价,或者说是“三位一体”的评价。第一是学业评价,学业评价其实就是考试成绩,这就是现在大多数学校采用的主要评价方式;第二是综合素质评价,综合素质评价是针对一个人全面的发展状况的评价,是以一个学生在几年当中所有的行为表现所积累的客观大数据为基础给出的评价;第三是能力评价。就是要测一下经过若干年的教育之后,学生的高阶能力,包括认知能力、思维水平、创造力等等,这是有国际通用的标准的,我们就是要把全世界通用的一些测能力发展状况的东西拿来,测测我们的学生。
“学业+综合素质+能力”的评价,最终的结果决定了你优秀不优秀,决定你能不能上什么大学,是什么类型的人才。打破“唯分数”论,不是说不要分数,但在中国国情下,分数不能成为唯一的决定性因素。
在创立学生综合素质评价系统的过程当中,我研究了国外专家关于评价的一些理论。因为在评价方面,尤其是科学评价方面,中国处于落后地位。在考试评价方面,中国是世界先进水平,没有比我们考生更多的国家,我们每一年的高考人数远远超过许多国家的总人口。但是综合评价方面,我们尚处于起步探索阶段,所以我们要学习,要把国外的经验内化,这是很复杂的,我们要知道别人怎么评,然后结合我们的国情,研究我们该怎么评。
2009年,清华附中梳理了学生在校期间的教育行为,通过聚类分析和相关性分析,总结学生在校期间的高影响力活动。结合20世纪50年代以来的优秀教育理论,采取自下而上的方式对学生各个方面进行观察、记录、分析,建立了包含9个模块46个维度的行为记录内容,构建了学生综合素质生成性评价模型,并利用大数据分析技术,开发学生综合素质生成性评价系统。全面记录学生校内外的成长轨迹,从中挖掘学生未来发展潜能和倾向,为每一个学生的个性、自主、健康和全面发展创造条件。
2012年起,清华附中研发了学生综合素质生成性评价系统的实验版,在清华大学计算机系、软件学院的帮助下完成了系统模型的构建。首次实现了云计算、大数据与综合素质评价相结合,利用信息技术深度挖掘教育数据价值,充分发挥“评价过程”的影响力。之后不断对系统进行完善升级,现已更新至3.0版本。综评系统的评价有三个特点:
一是评价全面、客观。记录覆盖学生全面发展的全部素质维度。重要客观数据由官方导入,记录公示及时,质疑流程完善,不实记录记入个人报告单,保证客观真实。二是具有即时性、过程性。学生 “即完成、即提交”,记录展现中学所有阶段记录,坚持以学生行为作为评价依据,着眼于学生的成长规律和学习生活轨迹,帮助其了解自我、发展自我。三是评价直观、具体。系统依据积分生成详实、直观的各类图表,并可导出综评报告单。引导学生关注自身发展,发掘自身潜能与特长,同时关注同伴发展,实现同伴学习与朋辈激励。
众多美国中学已经不满足现有的大学招生方式,正在寻求改变。由近百所美国顶尖私立中学组成的联盟 Mastery Transcript Consortium(MTC)创设了新型评价方式A New Model。不含分数,不评级,而是持续追踪记录、评估学生的8项能力。10 年之内,这种动态的电子档案就将终结 SAT、ACT 等 “美国高考” ,成为全美大学录取新生的评价体系。
美国与我们的评价方式的区别,思路是一样的,但是看了他们评的内容,我很受震撼,他们不评知识和学科,开始评能力和素养了。我后来研究是否能借鉴他们的做法,我发现借鉴不了,因为评价这8个方面的裁判是老师,老师给学生评。在中国怎么可能呢?老师给学生评就能决定谁上清华北大,老师不敢干,家长也不相信,所以在中国行不通,这事只能让机器来干。但是人家确实就是由老师来评价,每一节课、每一个活动里,所有的老师对一个人给出评价结果。
由美国83所高校共同创建的全新大学申请系统:联盟申请系统(The Coalition for Access,Affordability and Success)。超过500所高校宣布加入该系统,包括哈佛、普林斯顿、耶鲁、加州理工、杜克大学等等。有3所大学只接受通过CAAS的申请:佛罗里达大学、马里兰大学帕克分校和华盛顿大学西雅图分校。打破学术背景独当一面的状况,招收更多具有创造力、领导力和思辨能力的学生,对申请学生课外活动的考量比以往更加严格。
我们是2009年开始做的,他们大概2015年开始做,2017年开始使用。简单来讲就是能够尽可能的自动化地、全过程地把学生的发展、各方面的表现,包括活动、体育、身体素质、学业学习、课堂表现等等都记录下来,对孩子成长有利的活动里,做得如何,表现如何,都能记下来形成大数据。这其中,如何保证动态,适应客观条件,保证过程评价,如何保证模型的科学性,还有很多事要做。这些问题都研究解决了,还要研究怎样保证诚信,怎样保证个性化,减轻负担,这些问题同样需要解决。
目前这个评价系统在12个省得到了推广,有些省是全省推广,有些省是在部分地区使用。北京市是全市推广应用,学校总数已经超过5000多所。应该说,这个系统目前是国内高中初中使用最多的一个系统,这个系统的使用对于学生发展的促进作用非常大,不仅仅是中考、高考的人才选拔,对于教师提高教书育人水平、激发学校活力、引导学生全面成长,发挥出的作用和价值超出我原来的设想。
教师专业发展综合评价系统
教师专业化发展是我国的一项重要教育政策,打造高素质专业化的教师队伍是我国教育发展的需要。我们依据国家对中学教师专业发展提出的新理念和新要求,综合运用信息技术、完善评估体系、注重实际教育教学业绩、依照教师专业发展标准并结合清华附中自身特点和教师发展的需要,研究开发了教师专业发展综合系统。
中学教师应具有五大核心能力,教育理念、教学能力、教育能力、专业功底、发展动力。
教师的专业发展记录平台,包括四大模块:个人成长记录、专业发展引领、特色成长助力、评价与规划。平台的意义主要是,满足个性化需求,尊重人才成长的客观规律,满足不同阶段教师发展的个性化、多元化需求;为教师减负,与市级、区级、校级的各项工作做好对接,不给教师增加额外负担和压力;体现系统实用性,突出信息系统的动态、量化、使用便捷等特点。
系统应用成效体现在三个方面:第一,能够为每一位教师生成年度工作记录,了解自身数据情况,明确与他人差距和自身的优劣势,提高自我认知;帮助人力资源部门、校领导了解教师群体数据情况,制定教师发展培养计划,根据数据开展相应的教师培训活动等。第二,能够快速高效地开展全体教师评价、绩效考核评价,自动算分,快速导出,工作效率大幅度提升。第三,能够评价成绩,可以在同类教师中进行横向比较,也可以纵向了解同一教师阶段发展情况。
我认为评价改革很重要,评价改革很关键,评价改革很困难。面对这些重要而关键的问题,我们不能坐等。我们应该行动起来,在自己力所能及的范围里,研究、思考、实践、探索。我们已经完成了“学生综合素质评价系统”、“教师专业发展评价系统”,推广使用后看到了非常好的实效。我们正在研发“学校综合评价系统”、“区域教育质量评价系统”,我也希望这两个系统早日完成,对一些学校提供帮助,当然更希望大家支持,期待大家参与,让我们通过评价改革推动基础教育的发展。
作者王殿军系清华大学附属中学校长、清华大学教育研究院基础教育研究所所长、教授、特级校长。本文是作者2021年10月23日于北京圣陶教育发展与创新研究院和中国教育技术协会中学教育信息化专委会联合主办、北京大学附属中学和北京市海淀区万泉小学承办的“第八届全国中小学校长论坛”的中学组上所做的主题演讲。文中内容是根据会议现场录音整理,经本人审核后授权刊发。