姚继海、张悦欣:考试成绩正态分布的误用与评价改进对策

北京

    原文刊载于《中国考试》2023年第7期第76—83页。

北京

作 者

北京

姚计海,北京师范大学教育学部副教授。

北京

    张玥欣,北京师范大学教育学部。

    摘 要:当前一些高校规定,要求学生课程考试成绩必须符合正态分布。正态分布是一种连续随机变量的概率分布,其统计分布呈现为中间多、两头少的特点。根据考试目的,可以将考试分为合格水平考试和甄别选拔考试两种类型。对于高等教育领域人才培养而言,课程考试通常属于合格水平考试,学生为特定群体且人数不多,其成绩一般不呈现正态分布。因此,要求课程考试成绩必须符合正态分布的规定并不科学合理,对于教师的教与学生的学还可能带来负面影响。基于此,推动高校课程考试改革要弱化其甄别选拔功能、强化合格达标功能,还应综合运用多种考试评价方式,重视形成性评价。

    关键词:大学课程;考试成绩;正态分布;合格水平考试;考试评价改革

      2017年国务院印发的《国家教育事业发展“十三五”规划》明确指出,要充分发挥教育评价对科学育人的导向作用[1]。2019年教育部印发的《关于深化本科教育教学改革 全面提高人才培养质量的意见》进一步强调,高等教育要加快形成更高水平的人才培养体系,其中重要一环就是要完善考核评价机制[2]。可见,教育评价作为课程教学的指挥棒,对于检验学校教育教学效果及推动教育改革进程都具有不可替代的重要作用。

      课堂教学评价具有指向作用,教学评价制度始终是教育改革中的核心环节[3]。考试作为教学评价的一种方式,不但给学生学习带来直接影响,从宏观层面看对于国家的政治、经济、文化等方面也会产生一定的政策效应[4]。考试的指挥棒作用是客观存在的现实,必然存在着考试对于学校教与学的指引[5]。在高等教育领域,大学各专业课程的考试评价制度对于检验教学效果、质量和水平具有基础性作用,对教师的教学活动和学生的学习行为具有重要的监督和激励作用,通过评价的信息反馈对于改进教学能够发挥很好的调节作用。

      然而,长期以来,我国高校在本科生和研究生课程考试的管理与评价中,仍存在一些不甚合理的管理规定,如要求授课教师给学生的考试成绩要呈现出统计学意义上的正态分布特征。目前,此类规定在我国高校教学管理中并不罕见,不少高校把学生成绩呈正态分布作为对授课教师的基本要求,甚至有些高校把成绩是否正态分布作为评判课程考试质量的标准[6]。按照此类管理规定,如果授课教师给学生的考试成绩整体偏高或偏低,不呈现正态分布特征,那么教师的课程考试成绩评定就可能被视为不科学,教师的课程教学效果或质量会被认为有问题甚至不合格。不过,近年来考试成绩的正态分布假设受到越来越多的质疑,基于正态分布的考试成绩报告常出现实际成绩与预想成绩相差较大的情况,其原因之一可能是学生的考试成绩并不真正符合正态分布特点,而如果强行按照正态分布进行分析处理,就会产生较大误差,甚至会得出错误结果[7]。那么,这种课程考试成绩评价方式与教学管理规定是否科学合理呢?会带来哪些影响?这些问题很值得深入研究。

    1 正态分布的概念与应用

      当前,一部分高校学生在选课过程中存在非理性选择,倾向于选择那些课堂点名少、考试容易得分高的课程,导致“水课”(即低质量授课)的不断出现[8]。针对此种情况,从教学管理者角度来看,提出课程考试成绩呈正态分布或类似正态分布的管理规定可能有助于减少此类现象,以期达到均衡评价教学质量、督促教师负责任地对待课程教学的效果。然而,这也反映出学校管理者对正态分布的误解,认为唯有此种分布才是科学的,甚至以是否遵循正态分布来评判考试及教师教学工作质量[9]。

      正态分布,也称常态分布,是一种以平均数为中心、中间频数众多、两侧逐渐减少、左右基本对称的频数或频率分布[10]。通常,正态分布曲线是用于描绘整体数据或基于整体进行随机取样所得数据的频数分布特征的钟形曲线图[11]。这一曲线图呈现为一种中间多、两头少的统计分布特征:越靠近平均数,分布的数据频数越多,离平均数越远,分布的数据频数越少。数据分布除了有钟形对称的正态分布外,还有一些其他类型。相对于正态分布而言,偏态分布是一种不对称的、偏斜的次数分布,具有正、负两种形态:正偏态分布的高峰偏左,负偏态分布的高峰则偏右[12]。如图1所示,横轴表示变量按照一定趋势的取值(x),纵轴表示频数(f),中间实线部分为正态分布,虚线部分为正、负偏态分布。

北京

      从整体看来,人们的许多身心特征都符合正态分布,如整个社会群体的智力或能力水平就呈现为正态分布特点,即中等智力水平的人数较多,由中间向两端趋于智力低常和超常的数量逐渐减少[13]。考试成绩受学生的智力或能力等心理特征的影响较大,因此对于整个学生群体而言,其成绩一般近似地呈现出正态分布特征。比如,全国统一高考或研究生入学考试,学生的能力水平分布比较广泛,基本呈现出正态分布特点。而且,这类考试的重要目的在于甄别选拔人才,考试组织者和命题者也希望群体分数呈现正态分布,以便更好地区分和选拔人才。

      正态分布本质上属于一种连续随机变量的概率分布。这种概率分布往往基于全部可能的结果或各种可能结果发生的概率而形成的规律。对于某一所高等院校而言,其本科生或研究生的小群体并不一定能代表全社会整体学生或同龄群体。因此,学生的课程考试成绩并不一定服从正态分布规律。换言之,单纯以成绩是否遵循正态分布来评价学生的学业水平以及教师的教学效果是不合适的[9]。在实践中,有些学校明确规定考试成绩要呈现正态分布,也有些学校虽然没有明确要求正态分布,但依据正态分布特征规定了考试成绩百分制各分数段的人数比例,并将优秀率、良好率及合格率等限定在一定比例范围内。例如,有的学校规定考试成绩90分以上人数或优秀率不能超过20%,这意味着参加课程学习的学生即使都非常优秀,也只能有少部分同学被评价为“优秀”。还有的学校对考试成绩60分以下的人数或不及格率加以明确规定,如要求60分以下不及格的学生人数比例不得低于5%,这就意味着即使参与课程学习的所有学生都非常努力,也会有5%的学生被划入“不及格”行列。可见,这种大学课程考试成绩的评价机制或多或少体现出对学生的甄别区分作用。然而,大学常规专业课程学习与人才培养的根本目的并不是为了甄别选拔部分或个别学生,而在于培养每一位学生都达到专业课程学习所要求的合格水平,引导每一位学生都具备合格的专业素质。

    2 高等教育中的合格水平考试和甄别选拔考试

      课程考试往往具有其目的性,比如,有的考试是为了绝对地评判学生的课程学习状况或效果,有的考试是为了相对地筛选出学习水平更高或更低的学生。一般而言,根据考试的目的,课程考试可以分为两种类型,即合格水平考试和甄别选拔考试。在高等教育的课程教学评价中,同样存在着这两种类型的考试。

      合格水平考试的目的在于检查学生是否达到预定的教学目标或学习标准,当学生都达到预定标准时就可以全部通过[14]。对大学各专业领域常规设置的课程教学而言,其平时测验、期中、期末考试等大多属于这类合格水平考试。而甄别选拔考试的目的在于对学生学习水平的高低进行区分,以选出相对更为优秀或更符合某种特定要求的学生,一般会提前设置通过率[14]。一些涉及学生范围较广、规模较大的竞赛性考试和择优录取的考试属于甄别选拔考试,而且这类考试的设计者希望学生的考试分数呈现正态分布特征,以便于更好地进行选拔。因此,甄别选拔考试对试题难度是否适当、监考程序是否规范以及考前是否有练习效应等都有着严格控制,以便准确选拔出所需的人才或特定群体。

      高等教育的本质是培养专业化的、具有知识和理性的社会行动者,如专业人员、管理人员以及社会公民[15]。我国大学教育的根本目的在于培养国家和社会发展所需要的合格人才。学生通过高考或研究生入学考试的选拔之后,面临的主要问题是在相关专业领域内怎样成为具有合格专业水平的专业人才,大学常规的课程学习及考试则成为评价其学业发展或专业学习活动是否达到相应合格标准的重要环节。从本质上说,大学课程考试评价是对学生专业领域的发展和学习效果作出价值判断的过程,它是以教学目标为依据来衡量个体发展是否达到预定教育目标和程度的过程[16]。虽然大学课程考试有时也会被赋予一些选拔性质,如本科生的课程考试成绩用于硕士研究生入学考试的推免资格选拔(即推荐优秀应届本科毕业生免试攻读硕士学位研究生的资格选拔)或硕士生的课程考试成绩用于博士研究生入学考试的选拔,但总体而言,大学课程考试的根本目的在于评价学生的课程学习是否达标合格,而不在于力求突出学生的学业差异以进行甄别选拔。因此,合格水平考试对高校专业课程学习及人才培养而言更具有现实性和普遍性。

3 正态分布在大学课程考试评价中的误用

      通过前面对考试类型的分析可知,通常而言大学常规课程考试属于合格水平考试而非甄别选拔考试,正态分布对大学常规课程考试评价并不具有适用性。从正态分布所需满足的条件来看,其样本属于连续随机变量的概率分布,应符合随机抽样原则,即需要有充足的、随机选取的样本量[17]。而大学课程中的学生已经历了多次筛选,同一院校、同一年级甚至同一专业的本科生或研究生已是高考或研究生入学考试选拔之后形成的特定学生群体。这一特定群体内成员的个人能力、心智等特征较为相似,具有一定的同质性,而且相对于整个社会的同龄群体而言,大学生群体在其专业领域有着相对较好的发展状态和潜能,因此这样特定的学生群体并不一定代表全社会整体学生或同龄人群体,并不符合随机抽样标准。此外,大学课程考试中的学生人数普遍较少,样本量上也不符合统计学要求。因此,大学在课程教学与管理过程中,要求授课教师把这类课程考试分数呈现为正态分布,显然缺乏基本的科学依据,也违背了实事求是原则。

      事实上,对大学常规课程教学而言,授课教师的教学目标主要在于引导学生学会相关课程知识,达到课程专业领域应有的特定合格水平或标准。对于此类合格性课程考试,授课教师或相关人员根据课程教学目标编制考试题目,旨在检测学生的学业水平是否达到教学目标的要求。在这种情况下,学生群体考试成绩越高,就意味着学生的学习效果越好、学业水平越高,也间接地反映出教师的教学效果越好。相反,如果学生群体考试成绩越低,则说明其对课程内容掌握程度越低、学业水平越低,也可能反映出教师的教学效果不佳。也就是说,当学生素质普遍较高,而且教师的教学具有实质成效时,成绩的分布更有可能呈现出一种集中偏高的负偏态分布[18]。因此,在大学的常规课程教学评价与管理过程中,因学生的课程考试成绩整体偏高或偏低、没有呈现出正态分布特征,就认为授课教师的课程教学存在问题或不合格,此种评价与管理方式缺乏基本的合理性,对于教师的教和学生的学都可能造成误导。

      概括而言,大学常规课程教学的效果应以学生是否掌握课程内容为基本评价标准,课程考试也应以学生应该掌握的相关课程内容为基准。学生的考试成绩在一定程度上反映学生的学习成效和水平,这也为教师检测课程教学的现状及明确改进策略提供参照和依据。大学的课程教学评价与管理规定要求授课教师给出的学生考试成绩呈正态分布,那么势必对教师的教学过程产生错误评价及不良影响,难以反映教师的教学质量,也掩盖了学生学习的真实效果,甚至干扰教师的教学目标和学生学习目标的实现,降低教师的工作动力和学生的学习积极性,对于教师和学生都会带来负面影响。

      从教师方面来看,所谓正态分布要求不能真实反映常规课程的授课教师的教学成效,更无助于公平合理地评价教师的课程教学质量,反而可能使教师课程教学偏离引导学生达到合格水平的基本教学目标,进而影响教师教学的主动性、积极性。已有研究通过数据分析与验证表明,不应对课程考试分数有正态分布的预期,它不利于教学过程的有效实施,也不利于提高教师的教学动机[6]。事实上,在大学常规课程考试中,如果学生考试分数呈正态分布,非但不能说明教师的课程教学是成功的、有质量的,反而意味着教师的课程教学可能存在严重的不足或疏漏。正如布鲁姆在探讨何为有效教学时曾指出,“教育是一种有目的的活动,我们力图使学生学会我们必须教授的事物……我们甚至可以断言:成绩的分布接近正态分布时,说明我们的教育努力是不成功的”[19],因为这种考试成绩所呈现的正态分布意味着必然有一部分学生的课程学习没有达到应有的合格水平。当然,影响学生考试成绩的因素非常多,大学的教学评价与管理不能单纯以学生考试成绩来评价教师的教学成效,而应对教师的课程教学建立起综合全面的评价体系。但无论怎样,强制要求常规课程的考试成绩符合正态分布特征的管理规定并不科学合理,不利于教师发现自身的课程教学问题,也不利于激励教师的课程教学工作动力。

    4 大学课程考试评价的改进对策

      不可否认,正态分布规律在考试评价和人才选拔上具有积极意义。在选拔性考试中合理运用正态分布,能够为各级各类人才选拔提供有说服力的参考依据。目前在大学常规课程教学与考试评价中,正态分布应用存在泛化甚至滥用、误用的情况。如前所述,在大学教学管理中,正态分布并不适用于评价常规课程考试。大学课程考试的功能主要在于考查学生在课程内容或相关专业领域的学习是否达到合格水平,而不是区分学生之间分数的高低。针对当前大学日常课程考试评价中存在的问题,本文提出如下3点改进对策。

4.1 弱化常规课程考试评价的甄别选拔功能

      对于大学常规课程而言,考试评价首先要避免不合理的教学管理规定,不能限定学生的优秀率或良好率,更不能要求学生的不及格率要达到某种比例,从而避免产生甄别选拔的消极作用,消除对课程评价带来的不良后果,使常规课程考试成为促进学生学业发展的有效途径。在课程考试设计和实施时,考核内容应鼓励学生创新思维和个性化表达,而不是记忆死的知识点;结果报告采用绩点制或等级分,而不是传统百分制,以减少分数攀比。此外,教师在通知课程考试成绩时,不应把全班或全体学生的考试成绩公布于众,可逐一单独通知本人,这样可以让每个学生都清晰地知晓自己的考试成绩及其在相应学生群体中的成绩排名或位置,但并不知道其他学生的分数。如此,既可以帮助每一位学生了解自己的学业发展状况,激发学生学习的内在动力,激励学生自我竞争并努力获得学业进步,也可以避免相互攀比和恶性竞争,最大程度上保护学生的学业隐私和自尊心。

4.2 强化常规课程考试评价的合格水平功能

    4.3 综合运用多种考试评价方式,注重形成性评价

      为适应创新性人才培养的要求,大学课程考试应注重形成性考核与终结性考核相结合[21],采取多种评价方式。当前,我国大多数高校的考试制度与新形势下培养学生创新精神和实践能力的目标不相适应,因此多样化的考试形式、创新的考试内容、成熟的考试管理制度建设和完善的学分制制度是高校考试制度改革的方向[22]。教学管理者有必要对学生考试评价进行再认识,形成科学的考试评价理念,制定完整的考试评价体系,实现从单一考试到多元评价的跃升[23]。从评价主体来看,课程评价应兼顾教师对学生的评价与学生的自我评价。教师是相关专业领域的课程大纲与教学目标的制定者,能够最为准确、客观地评价学生的学习水平,而学生自我评价则体现着学生自身发展的内在需要,能够激发学生学习的积极性、主动性和自主性,具有与教师评价同等重要的地位[24-25]。从评价方式来看,既要注重对教与学的终结性评价,也要注重全面反映学生的学业成长与进步的形成性评价。

      大学课程考试成绩评价的内容和指标有必要多样化,课程教学评价方式与途径有必要多元化,注重采用形成性评价。具体而言,应将量化评价方法与质性评价方法相结合,不仅用精确的指标来衡量学生的知识学习状况,也要用观察、记录等方式揭示和描述学生的特质,从而达到尊重学生个体差异的目的[26]。在高等教育的具体学习情境中,课程考试分数作为学生学业的一种量化评价方式,有必要与行为观察、情景测验、作业展示、课题研究活动等质性评价方式相结合,还要加强相关实践应用环节的评价,从而更好地促进学生的全面发展。

      当前,我国正在为实现建成社会主义现代化强国、教育强国的奋斗目标而努力,创新人才的培养则是实现第二个百年奋斗目标、实现中华民族伟大复兴的重大议题[27]。教育评价作为高校人才培养中的关键一环,应当做到以人为本,服务于学生的全面发展。对于大学教学及课程评价而言,在单一的课程考试基础上,有必要进一步丰富评价内容,创新评价形式。在课程教学评价过程中,为了促进学生学业进步,帮助学生学有所成,除了应注重发挥课程考试评价的作用之外,更应注重学生日常作业设计和专业综合素质评价,进而促进学生的全面发展、个性化发展,激发学生的创新精神和实践能力,努力培养各个专业领域的优秀专业人才。

    参考文献:

北京

    “《中国考试》杂志”

    学习强国号

北京

需要本期杂志可长按二维码识别购买

北京

北京

文章来源:推荐,若有侵权,请联系本站删除!

版权声明:本站内容由互联网用户投稿自发贡献或转载于互联网,文章观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至Li20230712@gmail.com举报,一经查实,本站将立刻删除。

合作:Li20230712@gmail.com