| 作者:张警鹏 郑启跃 转贴自:北京修远教育科学研究院
[摘 要] 对考试的评价是一种比较特殊的教育评价。考试事实作为特殊的价值事实,决定了考试评价的事实判断与价值判断之间存在有一定的复杂性和特殊性。考试质量分析是考试评价的核心内容,它主要体现于对考试试题的评价和对考生水平的评价。考试评价应该建立在完备的考试数据统计分析的基础上,以考试政策及相关规范为评价标准,借助于评价者的学科教学经验以及对考生情况的掌握,而对考试试题和考生水平进行分析评价。 [关键词] 考试评价 价值事实 考试数据统计分析 试题评价 考试水平评价 对考试的评价,是当前考试研究需要关注的新课题。特别是在以“3+X”为标志的新一轮高考改革、“总体上要更加注重考生能力和素质的考查,命题立意要从以知识立意为主转向更加注重能力立意”[1]的背景下,考的是否合适?考的影响如何?考试如何改善?该改善什么?都是值得研究的。 高考内容改革也存在一个探索过程。原教育部考试中心副主任马金科曾说:“①高考内容改革的核心问题是进一步突出能力与素质的考查, 那么何谓能力, 何谓素质? 这是涉及高考改革的重大理论问题;②怎样将一般意义上的能力、素质概念与教育学、测量学相衔接, 把能力、素质的理论概念与相对具体的教育测量(考试) 项目的目标、任务结合起来,从而对高考改革起理论指导作用;③具有创新精神和创造能力的人才是知识经济时代的需要, 高考应在处理好知识、能力、素质三者关系的同时又能恰当地考查考生的创造能力, 并且恰当把握在命题环节贯彻执行的程度;④今后高考内容的改革将重点放在考什么上。”[2]通过对考试的评价以促进对考试的研究,这是有待开拓、值得开拓、也应该开拓的领域。 在教育实践中,对高考试卷分析和评价,探讨不少。但往往局限在经验层面,一般都缺乏数据支撑和理论指导。北京教育考试院自2001年开始就聘请知名评价专家、中央教育科学研究所臧铁军研究员主持,组织一批学科专家共同研究高考试题评价课题。本文结合参与该课题评价研究实践,谈谈对考试评价的一点思考。 一、对考试评价的意义理解 1、对考试的评价,是一种特殊的教育评价 对考试的评价,它归属于教育评价的范畴,但它是一种比较特殊的教育评价。说它特殊,是因为,考试原本就是教育评价的手段或形式之一,而对“考试”的评价,就是对一种“评价”的评价。 教育考试,作为一种教育评价活动,是一定教育组织中的考试主体根据考试目的的需要,选择运用有关资源,对考试客体某方面或诸方面的素质水平进行测度、甄别和评价的一种社会活动。特别是大规模考试,它既有评定学生学业成绩的功能,又有检验教育效果的功能,还有强化教学目标、导引教学改革方向、诊断教学问题、维护教育水准的功能,同时也不可避免地具有不同程度的甄别和选拔功能。所以,考试本身就是一种特定的“按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程”。 对考试的评价,是以特定的考试作为评价对象,评价其是否实现了考试主体实施该考试的目的,以及该考试是否合乎考试规律。对考试评价的目的是判断考试各个环节是否都符合考试目的性和规律性的要求。但一般都更加关注考试本质内容方面,即主要针对考试试卷,对试题的质量、属性、测试功能作出价值判断,以及对考生水平进行分析评价。 考试评价是一个教育价值判断,是以考试主体的教育价值取向为根本依据,评价活动要以教育目的和有关政策为价值标准来展开。教育政策由政府决策,是政府在教育领域的政治措施。各级教育行政部门代表政府实施教育领域的行政管辖权,制定考试的相关政策和有关制度以规范考试行为。考试政策,又是在教育考试这个特殊的社会领域实施的公共政策,其政策作用是调节教育考试领域的社会关系。从某种意义上说,教育考试政策是国家行政代表社会和公众进行的一种社会一致性选择或集体一致性选择。考试政策一旦确定,这些考试政策就对相关群体具有约束力。考试活动就应该通过追求执行考试政策规范来体现考试自身的现实功能。考试评价也就必须坚持对考试执行教育考试政策规范的情况进行评价,以判断考试活动及其考试结果是否实现了既定的考试目标,是否满足了考试主体的需要。 2、考试评价中的价值判断和事实判断 教育评价虽然是价值判断活动,但其价值判断必须建立在对教育事实判断的基础上,考试评价也是如此。只有准确地对考试事实进行分析判断,才能正确地对考试作出价值判断。 而教育事实、考试事实并非是自然事实,它的事实本身就包涵了价值取向。比如卷面60分,这看起来是个客观事实,但这“60分”是在既定命题思想指导下所设置试题检测的结果,命题立意的改变,就会引起检测结果的变化。命题立意取决于教育价值取向,考试的价值取向也就影响到考试事实。所以,考试事实是具有价值性的特殊事实——“价值事实”。在对考试进行评价中,评价者所面临的考试事实,就是考试主、客体之间价值关系运动所形成的一种客观的、不依赖于评价者而存在的价值事实。它既是考试客体对考试主体的价值实现和价值现实,又是受考试客体自身客观条件所制约的客观事实表现。价值事实之所以有别于自然事实,就在于它是一种主体性事实,这一本质特征决定了价值事实隐含有价值因素。认为考试事实与价值相分离,无视考试事实作为主体性的价值事实,恐怕是站不住脚的。以为“考试质量分析”是“缺乏价值判断”的,将考试评价与考试质量分析对立起来的看法,有待商榷。[3] 3、考试评价的特殊性 考试事实与考试价值存在互相依存、相辅相成的关系,决定了考试评价的事实判断与价值判断的复杂性和特殊性。一方面,考试价值需要通过考试活动、考试内容、考试方法等过程因素的操作“外化”表现为考试事实,这一过程实际上就是考试价值向考试事实转化的过程;另一方面,考试事实又需要“内化”,即通过考试评价,从具体的考试事实存在中提升出对考试价值承诺与行为规范的判断,这一过程则又是考试事实向考试价值转化的过程。不管是考试活动中的主考行为活动,比如发布的考试大纲和编排的考试试卷及试题,还是考试客体的应考行为及结果,比如考试成绩,既可以看成是一种考试事实的存在,同时也是一种考试价值的存在。教育评价就是在这种特殊的考试关系中的一种反省和纽带。 因为考试是一个交互性的活动,所以,在考试评价中,既要注意考试的主观价值判断,即从考试功能满足考试主体需要的角度,判断考试试题和考生水平是否符合考试主体的主观价值认同;又要注意考试的客观价值判断,即从考生、教师以及社会对考试的反映所产生的实际效果的角度,分析考试系统对外部环境所产生的功效、作用等,去判断考试试题和考生水平对考试主体所产生的真正实际效果。考试中要牵涉多方面具体人的利益,他们各自都是自身的利益主体或者价值主体。站在不同的角度,对同一考试可能存在不同的看法。但是,对考试评价的主流意见只能是以该考试的目的和规范作为评价标准而得出。 二、考试质量分析是考试评价的主要内容 1、考试质量分析离不开价值判断 通常被称之为“考试质量分析”的活动是以考试分析指标为手段对考试的检测结果进行质量分析的工作。这种事实判断看起来是以考试的客观事实为基础,运用定量分析指标,如考试的成绩分数、平均分、信度、效度、难度、区分度等数量关系以判断考试作为测量工具的检测质量如何。即便如此,考试质量分析也离不开价值判断。例如:即使一份试卷有适合的难度和很好的区分度,但它是很好地测量了考生对知识的识记呢,还是很好的测量了考生运用所掌握的知识解决问题的能力呢?实际测量的与预设测量的目标吻合吗?考试的内容与考试大纲的要求一致吗?考试实然的目标合理吗?考试的目标符合教育目的或者教育改革方向吗?……这些都涉及到考试价值和教育价值的取向问题。可见,考试质量分析也属于考试评价的内容范围。 考试质量分析只是一个比较笼统的称谓。考试的质量,主要表现在考试试题的质量和考生水平的质量,这两方面共同构成了考试本体质量的最重要内容。考试评价也主要是对考试试题和考生水平质量作出分析及评价。考试质量分析涉及的内容也就是考试评价所关注的主要内容。 2、考试试题评价 对试题的评价是对考试的测试工具进行评价。其评价具体对象是将卷面所有试题作为总体,以分析和判断其测试功能是否按考试性质及其命题原则给予了合适的表达。该评价以考试大纲、考试说明和教学大纲为尺度,在考试统计数据定量分析的基础上,结合评价者定性的教学经验,通过比较、分析和归纳而对测试工具作出价值判断。 考试试题评价内容一般要涉及到:依据考试标准判断试卷是否遵循了即定的原则,对试题执行命题依据的情况作出分析和基本判断;试题总体的测试功能表达状况如何,试题总体的特点是什么,做了哪些新的尝试,对教育教学改革有什么作用;试题结构是否合理,试题的难度和区分度控制得怎样,对学科能力的考核表现如何,是否反映了中学的教学实际和基本要求,是否具有较好的鉴定功能;以及试题的典型分析及存在的 问题,并在此基础上提出对今后命题的建议。 3、考生水平评价 对考生水平的评价,是在使用了既定的测试工具后,对测试结果所反映的考生掌握学科知识及其具备的学科能力水平状况的分析和判断,并由此对所折射出的日常教学质量作出推断。其评价对象是将全体考生作为总体,以分析和评价其学科能力的表达及展现状况。该评价也是以考试大纲、考试说明、教学大纲和课程标准对考生的要求为尺度,借助考试结果定量分析的统计数据为基础,结合评价者定性的教学经验及对学生学习状况的了解,通过比较、分析和归纳而对考生的学科能力水平及教学效果作出价值判断。 考生水平的评价内容一般要涉及到:依据考试标准判断考生水平是否达到了即定的要求,对考生水平的真实性作出分析和基本判断,考生总体水平是否符合大纲的要求状况;考生水平的差异状况如何,考生总体水平的特点是什么,考生水平的结构性的特征分析;考生水平的典型表现及存在的问题分析和判断;针对考生水平所折射出教学问题提出教学建议。 三、考试评价的方法问题 1、考试评价必须突破仅凭经验进行评价的层面 在教学实践中,对考试试题的评价分析甚多,一般也就局限于学科教学领域、运用教育学的方法进行分析及评价。少有老师能够充分运用考试成绩的详细数据作统计分析,以期通过数量关系而发掘关于试题和考生水平的定量基础和数据信息价值。由此,考试后评价信息反馈对教学指导的作用受到经验的局限。 对于高考,由于省市集中阅卷,大家都关心卷面总分,少有省市做全样本的详细数据采集。对高考试题的分析评价的意见虽多,多以教学经验作定性描述,定量的依据不充分。而且,仅凭有限的几个总体指标植,难以有效运用统计分析的方法来深入描述试题及考生水平,也难以有效分析高中教学状况和准确发现教学问题。以致不能够充分利用高考数据信息资源以促进高考“有助于中学开展素质教育”作用的发挥。 2、考试评价的定量基础及定量分析与定性分析的有机结合 在经典测验理论(CTT )视野下,测验的信度、效度、难度和区分度是主要的分析指标。在全样本数据统计的基础上,经过适当的处理,可以形成内容丰富多样的考试数据统计分析报告。这些数据分析图表不仅仅只是几个测量指标的孤立数值,它们表现了测量信息的内在数量关系。分析、发现、挖掘这些测量数据的数量关系,就能够分析出蕴含其中的大量教育信息。考试评价就应该在一定的价值取向作用下,通过测量的数量关系去分析和判断考生个性心理特征的质的差异关系,据此以对考试本身作出价值判断。而对质的差异分析,一方面,需要定量分析与定性分析结合;另一方面,必须依据教育目标作为评价标准,才能够作出合理的价值判断。 北京教育考试院对高考、高中会考、中考等大规模考试的评价研究,就是以教育测量学与统计学理论为指导,在全样本原始数据的科学统计分析基础上,组织教育评价专家和学科专家共同挖掘统计图表资料所蕴藏的教育信息,依据教学大纲、考试大纲、考试性质及命题立意要求,结合北京市基础教育教学实际以及评价者自身的教学经验,对考试试题和考生水平进行价值判断性的研究并作出结论。这种建立在大规模考试数据统计分析基础上的考试评价研究,拓宽了考试研究的新领域。 参考文献 [1]臧铁军.学生与考试的关系研究[J].教育科学,1997,3.18-21. [2]臧铁军,刘晓瑜.考试的哲学问题的思考[J].教育研究,1998,7.58-63. [3]马金科.高考能力考查的研究与实践[J].高等教育研究,2000,3.32-35. [4]张警鹏.高考试题对考生认知心理特征差异的测量[J].湖北招生考试(理论版),2004,10.52—55. [5] 张警鹏.学科能力建模之高考实证分析[J].湖北招生考试(理论版),2005,6.69—74. [6]漆书青.现代测量理论在考试中的应用[M].武汉:华中师范大学出版社,2003. [1]中国考试杂志编辑部.与时俱进深化高校招生考试制度改革——教育部高校学生司司长林蕙青在2003年高考改革培训班上的讲话摘要[J].中国考试,2003,1.2-5. [2]马金科.高考能力考查的研究与实践[J].高等教育研究.,2000,3.32-35. [3]张远增.考试评价:考试研究的新领域[J].考试研究,2005,1.5--11
|