教育诊断 学生学业评价中的l闭题研究 丁 洁 (江南大学人文学院,江苏无锡214122) 摘要:学生学业评价在实际教育教学中发挥着重要作用,从教育统计与测量的视角对学生进行学业评价. 应该处理好三个方面的问题:正确选择标准化测验和教师自编测验,合理采用原始分数和标准分数的记分 方式,适"3采用百分制和等级制的评分方式。对学生的学业评价不用过分拘泥于评价的方式,否则就失去 -了意义,沦落为“为评价而评价”。 关键词:学业评价;测验方式;记分方式;评分方式 中图分类号:G632.42 文献标识码:A 文章编号:1671—0568(2012)04—0143—03 学生学业评价是对学生个体学习进展和行为变化 验,这两种测验在日常的学业评价中运用得比较广泛, 的评价。测验是常用的测量工具,在测量的基础上。 两者各有优缺点,如何正确选择是教师必须关注的问 教师可以对学生个体发展和学习效果作出价值判断, 题。 衡量学生个体发展是否达到预定教学目标程度的过程。 标准化测验是指按照严格而规范的标准编制成的 对学生的学业进行评价是教师的教和学生的学之间 一种测验,该测验在测验目的、试题编制、考务管理、 “交流”和“对话”的过程。一方面,教师可以通过这 评分记分等方面都做到了标准化。特别是在测验编制的 种方式及时了解不同层次学生的学习情况,从而调整 整个过程中,它采用了系统、科学的程序编制而成,题 自己的教,为学生提供有效的学习指导,并积极创造 目编制、试题抽样、难度和区分度的控制以及信度和效 适合学生的教学;另一方面,学生也可以及时看到自 度的监测都具有统一的标准。El前一些大规模考试,如 身的不足,从而调整自己的学习方法,在教师指导下 全国大学英语四六级考试采用的就是标准化测验的形 更好地汲取知识,发展能力,进而保证教与学之间的 式。标准化测验由于其编制和施测等都具有统一的标 相互协调,相互促进,使学生的学习处于最优状态。 准,因此该测验的质量有保证,施测误差相对较小,具 从这点我们不难看出对学生进行学业评价的意义重大, 有权威性、科学性和良好的预测功能。但是由于标准化 值得教师们认真对待。 测验编制所需的时问较长,花费的人力和财力较多,因 但是在实际教育教学的过程中笔者也发现,对学 此此种测验不可能普及于每一次的学生测验。 生进行学业评价并不是一件容易的事,由于它牵涉到 与标准化测验相对应的就是非标准化测验,其编制 的内容比较广泛,所以至今还没有一个公认的比较完 相对比较宽泛,没有严格的要求,教师自编测验就是指 整的学生学业评价体系。由于学业评价问题的复杂性, 在平时教学中教师自编的一种非标准化测验,它是学生 因此,本文只是从教育统计与测量的视角对学生学业 和教师之问进行信息反馈的重要途径。教师为了考察学 评价过程中的三个问题做一些探讨,以期对改进学生 生的学习掌握情况,根据教学需要自行设计与编制的测 学业评价能起到一定的积极作用。 验,教师通过自编测验可以了解学生学习的进度,调整 一、选择测验:标准化测验和教师自编测验 教学方向、教学内容的重要依据,目前学校的单元测验 要对学生进行评价,首先要考虑测量工具问题。 和月考等大多采用教师自编测验。由于教师自编测验的 虽然现在对学生的学业评价可以采用El试、笔试、技 编制过程简单,一般与教师的教学实际紧密结合.评价 能测试等多种手段,但是就目前而言,在学校应用最 标准依据教学大纲或课程标准,因此,该测验能大体反 广、操作起来最简便的还是笔试,对于笔试这种评价 映出学生的学习情况,教师容易理解测验的结果.对于 方式,选择合适的测验就显得尤为重要。以笔试为手 考察学生的实际学习情况很有价值,其在学生学业评价 段的测验主要有两种方式:标准化测验和教师自编测 中发挥着不可低估的作用。但是教师自编测验也并非十 彩谭最拍屯 J 143 2012.02 总第248期I 霉择 屯 BW≤ }{l{; 臻 {Ik;5i, 麓i孵 全十美。在实际运用中还存在着缺陷。由于教师自编 测验的质量更多地取决于教师的经验,因而常常出现 测验效度、信度不高,难度不当等问题。测验的施测过 程并未加以控制,学生的成绩易受外界干扰、疲劳等 因素的影响,使教师自编测验的科学性受到一定程度 的影响。 原始分数对自己的学业水平一}j J 然,敦帅也【lJ‘以迎 过原始分数了解到教学目标的达成程度。但足由_r原 始分数只是一个顺序变量,我们无法通过原始分数得 到有关学生学业在班级中所处的位置的信息,也无法 将同一科目的不同测验或者不同科日的测验分数进行 比较。 两种测验各有其优缺点,教师在对学生进行学业 评价时.要正确处理好这两种测验的关系,在不同场 标准分数又称z分数,它是一种相对分数,足由 原始分数用过线性转换而导出的分数。标准分数的求 法是用原始分数减去平均分的差再除以标准差,但是 合和需要的情况下选择恰当的测验形式,主要是将测 验的选择与所需测验的功能结合起来。在进行鉴别测 验的时候,比如升学考试、带有选拔性质的考试适合 采用标准化测验,这样可以使学生学业评价的分数呈 正态分布,方便划定分数线和选拔优秀人才,同时由 于其编制和考核评分的标准化可以保证考试的相对公 平性,另外,由于标准化测验具有较高的信度和效度, 可以保证测验具有良好的预测功能,从而有效地鉴别 出优秀人才。但是在日常教学过程中,诸如课后练习、 单元测试等主要针对近阶段教学内容的测验则适宜采 用教师自编测验,这样教师就可以及时掌握学生学习 的实际情况,改进自己的教学.选择适合学生学习的 方法。教师不光可以根据不同学生学业评价的功能选 择相应的测验形式,在实际操作中也可以将两种测验 的优势进行互补。在自编测验的过程中,教师要注意 测验编制过程的严谨和科学.在施测和评价过程中也 要力求客观,排除主观因素的干扰。在编制标准化测 验时.则应该考虑到教师在课堂上的教学,以使所编 试题更加符合教学实际。 二、记分方式:原始分数和标准分数 使用测验对学生施测之后,如何记录分数是接下 来要处理的问题。在对学生进行学业评价时,要正确 地认识和处理分数,这是关系到学生学业评价能否真 正发挥作用的关键。目前采用较多的记分方式主要有 两种:记录原始分数和记录标准分数,其中,原始分数 在学校使用得比较普遍,教师多用这种方式对学生学 业进行评价:而标准分数随着近年对于学生学业评价 问题的重视也开始渐渐进入了人们的视野,有关标准 分数的讨论和研究也日益增加。 原始分数是指通过教育测量所直接得到的分数, 它是一种绝对分数,常用于目标参照测验,教师在学 生测验试卷上给出的分数一般就属于原始分数。原始 分数之所以应用广泛是由于其具备了一些优点:原始 分数使用简单,教师可以很便利地根据学生实际的答 题情况给出;另外,原始分数便于理解,学生可以根据 也并不是所有的原始分数都可以转化为标准分数,其 转化的前提条件是原始分数的分布要接近正态分布, 至少也应该是单峰对称分布。标准分是以平均数作参 照点,以标准差为单位的等距变量,具有可比性和町加 性.不同课程的标准分可以直接比较,而比较时无需考 虑试卷的难易程度及考分的离散程度 计算各门课程 的总成绩,用具有等距变量性质的标准分相加,比用顺 序变量性质的原始分相加更为科学合理。此外,由于标 准分数的性质,学生之间的差距可以很明确地表现出 来,学生学业在总体中所处的具体位置也可以通过标 准分数反映出来。标准分数虽然更加科学,但是并未普 及,是由于其在运用中有一些不足之处:标准分数的涵 义较难理解,计算方式也相对复杂,在实践操作中教师 一般不愿意使用:标准分数不能反映教学目标的达成 程度.从标准分数中能得到学生学业在总体中所处的 位置,但是对于学中 身对于测验的掌握程度并不能 做出很好的判断:…l 采用标准分数需要满足一 条 件,因此其在运朋范 i I-会受到一定的。 对于采用何种记分方式,笔者认为两种记分方式是 缺一不可的。如果原始分数可以转化为标准分数,那就 建议采用原始分和标准分两种分数并用的方式,同时 获得两种记分方式的优点;在原始分数无法转化时就 只能单一地采用原始分数记分了。在不忽视原始分数 巨大作用的基础上,应积极地推行标准分数的记分方 式。 三、评价方式:百分制和等级制 在学业测验结束以后,教师一般都会给学牛一个反 馈,在历来的学业评价中,教师多采用分数制的评价方 式。以一般的单元测验来说,试卷一般是百分制,以 60分为及格线.取得的分数越高,表示学业成绩越理 想,反之,如果测验分数低于60分,那表明学业水平 没有达到规定要求。但是近年来随着素质教育的推行, 部分学校开始尝试采用等级制的评分方式,用优秀、良 好、及格、待及格的等级代替以往的分数形式 采用不 同的评价方式对学生的学业进行评价会收到不同的效 果。 采用百分制的评价方式是指给学生的学业测验一 个具体的分数,这种评价方式由来已久,历来的学业 评价都十分看重学生的分数,以至于在师生间流传着 这样一句俗语:分分分,学生的命根,导致学生为取得 一个理想的分数拼尽全力,为了取得一个理想的名次 而对分数趋之若鹜。因此,采用分数制的评价方式有 利有弊。分数制评价方式之所以能够沿用至今是由于 其应用简单.教师根据学生对测验的完成情况可以明 确地给出分数;同时,这种分数易于学生理解,学生根 据所得具体分数一眼就能了解自己的学业掌握水平: 此外,由于教师给每个学生的学业成绩都打出了一个 明确的分数.学生就可以通过与其他同学比较,确切 了解自己在班级中所处的位置、与理想状态的差距, 从而激发其努力学习,为以后改进学习提供了一个可 参考的依据。但是分数制的评价方式也带来了一系列 的问题:曲于学生对于分数的不成熟理解,教师对于 分数的错误导向,导致在实际操作中师生们陷入了 “分数怪圈”,一味地追逐高分,而忽视了能力的培养。 另外。由于教师给每个学生都打出了一个分数,学生 之间的差距用具体的数字明确地标识了出来,这就给 学生特别是那些没有取得理想分数的学生带来了巨大 的压力。 采用等级制的评价方式是指给学生的学业水平一 个模糊的等级,用1~5、A ̄E或者优秀、良好、及格、 待及格等方式来标记,对处于某一学业水平范围内的 学生采用统一的一个等级进行评价。采用等级制来评 价学生符合素质教育的要求,具有积极意义,且在一 定程度上淡化了学生问的分数竞争,为学生提供了一 个相对宽松的环境,学生不必再为追逐高分而陷入激 烈的竞争之中。此外。学生还可以在保证取得一个理 想等级的基础上充分发挥自己的特长和兴趣爱好。促 进各方面能力的发展。用等级代替分数,考虑到了学 生的情感。尤其对于那些测验成绩不理想的同学,采 用等级制可以避免学生因为成绩不理想而难堪。但是 等级制的评价方式还存在着一些缺陷。由于在等级制 评价方式中给学生打出的等级属于顺序变量,因此其 具有了顺序变量的一些缺点:各等级之间是不等距的, 究竟各等级之间的差距是多少不能给出一个确切的描 述;等级无法进行四则运算,对学生进行总体评价时 不及分数制下采用总分的方式简单、易理解。除此之 外,由于只给每个学生打出一个模糊的等级.学生只 竺 能大体了解自己的学业水平,难以进行横向和纵向的 比较。从横向来看,可能两个同学获得相同的等级,但 是其真实的学业水平却存在着差异,只是等级制的评 价方式将这种差距模糊化了,这样不利于激发学生的 学习动机;从纵向来看,一个学生两次测验都取得了同 样的等级。但实质上在第二次测验时他做了充分的准 备,取得了比较理想的成绩,实际在班级中的排名也上 升了。但是由于等级制的评价方式,导致其还是处在某 一等级范围内,所以最后得到的等级并未改变。反之, 如果学生不努力学习,但如果第二次测验成绩退步不 明显的话,他最后获得的等级仍然能维持原来的水平, 这样的评价方式不利于学生对自己的学业进行准确地 评估和把握,容易影响学生的学习积极性,抑或导致学 生产生惰性。 在充分认识了分数制与等级制的优缺点之后,我们 就可以有针对性地选择合适的评价方式来对学生的学 业水平进行评价,在平时的测验中。两种评价方式都可 以采用;当然也可以将两种方式结合起来,对学生的学 业进行定性、定量两个角度的评价,这样可以使学生对 自己的学业有一个更加全面的了解。在总结性或选拔 性评价中则适宜选择分数制的评价方式.这样做的目 的是为了使评价更加精确,方便对学生进行鉴别和选 拔。除了以上两种评价方式之外,笔者认为。在对学生 进行学业评价时如果能够加入评语.增加描述性的内 容,将会取得更好的效果。在评语中,我们可以指出学 生学习中还存在的不足。帮助其及时纠正;可以对学生 日后的学习提出建议,促进其自我提升:可以对学生取 得的成绩进行表扬,激发其学习动力。总之,无论采用 何种评价方式,我们的目的都是为了促进学生更好地 发展,不用过分拘泥于评价的方式,否则这样的评价就 失去了意义,沦落为“为评价而评价”。 参考文献: 【1】刘远我.重视教师自编测验在学业评价中的作用[J].江西 教育科研,1993,(5). 【2】王树洲.学生学业成绩记分方法谈[J].中国科教创新导刊, 2007:456.