为了提高公立中小学教育的质量,近20年来,美国各州在学生的学业成绩评价方面进行了许多有益的改革尝试,并就建立保证教育质量并促进其不断提高的绩效制度进行了大胆的改革。就前者而言,主要涉及中小学教学的测验等微观领域,而后者则触及学校和学区乃至州的评估等宏观层面。正是通过这种双重并举的大范围改革,美国中小学教育质量呈现出逐年提高的势头。本文就上述两个方面近年来的改革进展情况作一介绍。
一、州级评价制度的全面推广
在美国基础教育改革的过程中,伴随着州级课程标准的制定,州级评价得到前所未有的重视。
第一,州级考试制度已经普遍建立,学业考核的重点是基础和核心课程。据统计,至1990-2000学年,全美 50个州中已有48个州建立起了州一级的考试制度,只有衣阿华和内布拉斯加(该州也于2001年春季举行了全州统一的写作测试)仍将考试的权限下放到学区。就48个州的考试科目来看,主要是针对中小学的基础和核心课程,具体情况为:数学(48个州)、阅读(48个州)、写作(31个州)、社会学科(29个州)、科学(34个州)。[1]1994年颁布的“改进美国学校法”(IASA)要求各州每隔3个学年就要对学生进行一次考试,分别是3-5年级、6-9年级、10-12年级。但是,实际上各州要求比这要高。从1999-2000学年的情况来看,主要可以分成下面 3种类型:第一种是在小学、初中和高中阶段每个科目只在一个年级考核;第二种是用同一种评定方法对小学2 或3年级至8年级以上的学生就同一科目逐年进行考核;第三种是用多种评定方法对小学2或3年级至8年级的学生就不同科目逐年进行考核。
只有少数州对每个年级的学生进行考试,但多数是针对不同的学科,或运用不同的测试手段。例如,肯塔基州绩效测试系统(CATS)对4年级和7年级的阅读、写作和科学进行测试,对5年级和8年级的数学和社会学科进行测试。不参加此考试的3、6和9年级的学生要参加阅读和数学学科的“基本技能综合测试”(CTBS)。至于高中阶段,这些课程的测试分布为:10年级的阅读;11年级的数学、科学和社会学科;12年级的写作。路易斯安娜州和马里兰州对3-9年级学生每个学年就同一课程考试,但评价的方法多样。
此外,许多州也鼓励作为管理学校的基层行政的学区来举办考试,作为州级考试的补充。
第二,测验的对象涵盖中小学的各个年级,测验的起始时间有低龄化的趋势。从测试的年级来看,多数州是在小学3年级以后才开始对学生进行测试。但近年来,包括阿拉巴马州在内的7个州开始对小学1、2年级学生,甚至是学前教育阶段的幼儿进行测试,目的是为了尽早诊断和发现学生的学习问题。例如,阿拉巴马州的阅读测评和佛蒙特州的发展性阅读测评均是用来测试1、2年级学生的阅读能力的。还有堪萨斯等5个州是通过地方来实施早期测试,测试方法也由学区来决定。如德克萨斯州就要求每个学区编制一套阅读测试工具为该州幼儿园阶段至小学2年级的学生进行测试。
第三,高中阶段的考试受到各州的普遍重视。1996-1997学年,有18个州要求高中毕业生参加州组织的考试,以取得毕业资格。近年来打算这么做的州开始增加。预计到2008年,将推广到28个州;2个州将要求学生在州级和学区级测试之间选择。此外,有7个州虽然不会将州级考试当作毕业要求,但将会把成绩记录在成绩册或毕业文凭中。例如,在康涅迪格州,10年级学生参加的学业成绩测试分数就被记录在成绩册中。成绩达到州成绩目标的高中生获得每一通过学科的合格证书。在阿肯色州,学生在每门课程结束时的考试分数也被记入成绩册和学习档案。还有少数州,如肯塔基和佛蒙特,对高中毕业生进行的考试不是针对学生,而是用来评价学校的绩效。就高中阶段测试的内容来看,多数州是针对学生的语言、数学、理科和社会学科知识和技能掌握情况。
第四,两种类型的测验相互补充。中小学常用的测试手段仍然是参照常模测验和标准参照测验两种。但各州在具体选择上不尽相同。在50个州中,只采用标准参照测验的有17个州,只采用参照常模测验的有2个州,二者相结合的有29个州,尚未建立州级评价制度的只有2个州。在二者同时并用的29个州中,有以下几种情况:( 1)互为补充。其中4个州将参照常模测验当作主要的测验手段,只是在某些年级和学科辅之以标准参照测验。例如,威斯康星州在3年级的测验中用标准参照测验作为参照常模测验的补充。有的州的做法正相反。例如,西弗吉尼亚州用标准参照测验对多数年级学生进行测验,但在11年级主要采用参照常模测验。(2)交叉使用。有10个州在不同年级分别采用不同的测验。(3)同时并用。属于这种情况的有8个州。如亚利桑那州2-11年级学生要参加名为SAT-9的参照常模测验,但3、5、8和10年级学生还要参加标准参照测验。(4)编制州一级的考试,这种考试包含了全国性的参照常模测验和州的标准参照测验。
就测验的类型而言,还存在一些问题:(1)各地在对待两种测验的态度上存在不同意见。强调运用参照常模测验的理由主要有3点:一是学生家长、社会公众以及政府部门均需要有一种测验方法来对本州学生和其它州学生的学业成绩进行比较。例如,全国教育进展评价组织(NAEP)就可以提供这样一种比较。但它只是定期在州一级进行,而且涵盖的学科数也有限。二是可能也是出于第一个方面的原因,一些州的议会要求进行参照常模测验,以了解本州的教育情况。三是对于人口少的州来说,设计全州统一的标准参照测验的成本太高。应该说这几点是目前争论较多的问题,关键是设计出一种兼顾两种测验优点的测验。(2)在试题的类型方面,联邦政府曾要求各州在关键性考试中采用多项选择客观测验,但这种测验本身不能全面反映学生的学习情况。(3)各州在推行严格的考试制度中存在较大的社会压力。社会公众虽然大多对标准化测验表示赞同,但很少有家长认同以一次测试来决定其子女的升留级或能否毕业。例如,密歇根州的家长成功地阻止中学毕业考试。马里兰州教育委员会出于对不及格率太高以及白人学生和少数群体学生成绩拉大的担心,也决定推迟实施严格的、在中学毕业考试证书上记载成绩的考试。
第五,成绩评定依旧以等级制为主,但在精确化程度上比以往有所提高。1994年颁布的“改进美国学校法 ”要求各州举行的考试的评分等级至少包含3个层次,即高级(Advanced)、熟练(Proficient)和部分熟练(Part ially Proficient),用以反映学生的不同成绩水平。所有已经举行州级考试的州都将于2000-2001学年设定学生成绩测试等级。至2001年1月,美国教育部已经批准了28个州设立的成绩水平等级。在多数州,测试成绩的等级是分成4-5等,也有个别州分成2等,有的州甚至分成8等。有的州是根据学生的年级和学科类型来分别设立测试等级。
具体做法主要有两种模式。一种是科罗拉多州的模式,将测试成绩定为4个水平,分别是高级、熟练、部分熟练和不及格。一种是明尼苏达州的模式,将3年级和5年级学生的知识和技能的掌握情况定为4级,分别是:几乎未掌握知识和技能、部分掌握知识和技能、良好的学业表现、优秀的学业表现;而对于8年级和10年级学生的阅读和数学测验,只设定了一个级别,答题正确率达75%以上即为合格。
至于教师评定测试成绩的用语,各州没有统一的做法。对于达到标准的多数是用“熟练”或“合格”来表示。由于在毕业证书中往往会有学生的成绩记录,对于成绩等级如何表示已经引起社会的关注。1997年,密歇根州甚至因证书中最低两等的教师评语引发了家长的抗议,于次年通过立法予以更改。
第六,传统的评价方式开始发生变化,在测试中越来越注重开放题和表现作业等非传统的测试方法。近年来,美国中小学学生的评定方式发生了许多变化。多重选择题和判断题等类型的客观性测验虽仍被广泛采用,但不再是惟一的方式,而且各州在设计这类题目时更加关注与学生实际生活的联系,注重学生解决问题得出结论的技能和过程,而不是仅仅像过去那样只是关注提供的答案。与此同时,一些新的所谓“非传统的”评定方法,如表现评定(Performance tasks)、简答(Short answer)、设计(Projects)、扩展书面反应(Extended wri tten response)、档案袋(Portfolio)、学生作业(Student work)、展示(Exhibitions)评定等,开始受到重视。因为这些评定方式更能够反映出学生在学校学习的全面而真实的情况。据统计,目前只有个别州单纯依赖传统的考试方法。
二、绩效制度的普遍建立
美国各州近年来也在积极地建立宏观的评估体系,以便形成确保教育质量得以维持和不断提高的有效机制。这就是所谓的“基于表现的绩效制度”(Performance-based Accountability)或“基于标准的绩效制度”(S tandard-based Accountability)的建立。
(一)绩效制度的类型
1.公众报告制(Public reporting)。这是最为常见的绩效制类型之一。所有各州都提供或要求下属学区向社会公布本州和本学区公立学校、学区和州的年度教育报告,其中包括各所学校学生的成绩情况,以便为社会公众了解。社会公众可以要求质量差的学校采取措施改进办学质量。家长可以以此作为子女选择学校的参考和依据。据统计,到2000年9月,所有的州均向社会提供了至少一份年度绩效报告,提供2份以上报告的有39个州。其中,有的州侧重于学区一级,有的州侧重于学校一级,许多州二者兼顾。[5]学校年度报告单的内容至少包括各个学校学生在州或学区测验中不同等级线上的成绩排名。如果是在以参照常模测验为考试依据的州,还要列出学校在全国的排名情况。此外,年度报告单的一个重要内容是学生在非认知领域的表现情况,以及其他影响教育的因素。前者包括就学率、辍学率和毕业率;后者指标包括学校纪律、安全情况、教学氛围、反映师资质量的教师学历水平和教龄、班级规模、师生比,以及经费投入等等。
2.州级绩效制(State-defined accountability systems)。采取这一模式的有33个州。主要做法是根据州一级的测验成绩来对学校和学区进行评估,这其中有3种情况:20个州依据标准参照测验的结果;6个州依据参照常模测验,尽管这些州同时进行两种测验,但在进行绩效评估时只根据参照常模测验的结果;余下的7个州中采取的是二者相结合的办法,分别根据两种测验的结果作为绩效评估的依据。如在肯塔基州和路易斯安娜州,参照常模测验占40%-50%的比重。
此外,上述33个州中有19个州已经或打算根据考试成绩以外的指标作为绩效评估指标,这些指标分别为:入学率(15个州)、辍学率(12个州)、毕业率(6个州)、校园安全(2个州)、休学率(2个州),等等。这些州在对学校和所在学区进行绩效评估时对待这些指标的做法不尽相同。有的州是作为评估指标体系的一个部分,在总评估指标里占一定的比例。有的州作为单独的指标,与测验成绩并列。还有的州则作为次要的指标看待。
3.地方绩效制(Locally-defined accounta-bility systems)。采取这一模式的州较少。主要做法是由学区来为学区内的学校订立绩效标准。
目前美国各州提高学生学业成绩水平的措施方面还存在不平衡性,这主要表现在3个方面,即期望学生达到的成绩水平、达到此成绩水平的学生人数比例,以及各个学校达到此目标所要花费的时间。就第一个方面而言,虽然各州都提出要使所有学生的成绩达到熟练水平,但在界定上存在较大的差异。第二,各州在要求一所学校学生的考试通过率方面的要求上也不尽相同。例如,7个州要求达到90-100%,8个州要求60%-85%,还有8个州要求50%。最后,在达标的时间表上,各州情况也有差别。6个州将用5到20年不等的时间使所有学生达标。佛蒙特:2008年;俄勒冈:2010年;肯塔基:2014年。有的州不明确规定具体时间,而是采取逐步提高的方式。
(二)评估的方法
那么,各州如何对学校进行评估呢?已经和即将将绩效评估付诸实施的33个州采用的方法主要有3种。第一种是以绝对指标(Absolute Target)来衡量学校的办学情况。采用这类做法的有14个州。例如,佛罗里达州将绝对评估指标分为6个等级,最高为A等,最低为F等,根据一所学校学生在阅读、数学、写作等考试中的通过率和成绩来分等。在1999-2000学年度,得克萨斯州不仅规定了成绩指标,而且还在辍学率等非认知领域作了硬性规定。第二种是以相对发展(Relative Growth)指标来衡量。例如,一所学校本学年度与上一学年度有关指标的对比,通常可能还包括与州目标的对比情况。采用这类做法的有马里兰等5个州。第三种方法是看一所学校是否缩小了成绩差距(Achievement Gap),即降低了最低分数段学生人数的百分比。但没有一个州单纯依赖这一方法。实际上,有8个州是将第一种和第二种方法相结合。有6个州是以第三种方法作为补充手段。
(三)评估的结果
评估的直接结果主要是为了达到两个目的:奖励先进,惩罚后进。但是,终极目的还是为了提高中小学办学的质量,这也正是建立绩效制度的出发点和归宿。由于美国采取的是高度的地方分权体制,甚至连州与学区的权限分配也因地区不同而有所差别,所以在具体的影响方面也因地区的不同而有所差异。
绩效评估的结果主要针对3个方面,即学校、学区和学生。但从实际上看,主要是针对学校。近年来美国各地纷纷建立起了校本绩效制(School-BasedAccountability),地方教育行政当局在给予学校更多的办学自主权的同时,更加强调学校要为学生的学习负责,因此突出了学校层面的评估,要求学校对办学绩效负责。目前有 16个州明确提出了学校(而非学区)对办学负责。例如,马里兰州有被称为“马里兰学校表现计划”(MSPP)的校本绩效制,它包含学生参与与学业成绩指标、学校年度表现报告、学校改进计划,以及奖惩措施等内容。
对于办学质量高的学校,各州采取了有效的激励机制,包括物质的和非物质的两方面。例如,根据佛罗里达州1999年颁布的立法,每所评估合格学校(包括达到A级,等级逐年提高或虽不合格但质量有明显提高的学校)将获得额外财政补助。新泽西州每年拨出1000万美元用于奖励先进学校。具体的做法是对90%以上学生成绩达标的学校予以奖励,其余的学校根据学生测验的及格率被分成5个档次,分别对学校予以奖励。非物质的激励措施包括由州推广办学经验等措施。
对于达不到标准的学校来说,采取的措施主要有以下几种:(1)改进。这包括举行公众听证会,让社会公众了解学校的办学情况,发动所在社区的支持;撰写或检查学校改进或行动方案,找出落点,提出改进策略和措施;予以各种技术层面的支持;州政府官员现场检查,提出改进计划,确定改进的时间表。(2)干预。如果学校在规定的期限内无法改进,州教育当局可对学校的办学加以干预,具体包括:1)列入州发布的警告名单。如阿拉巴马州的警告分为3个等级。阿肯色州将不合格学校且在4年时间内无法改进的分为4级。2)现场检查,加大技术支持力度。3)暂时终止或取消州认可合格地位。4)在学区或学校范围内进行教学人员和行政人员的调整或安排。5)允许学生转学。目前至少有6个州允许这样做。6)州对学校进行接管或重组。在科罗拉多州,如果差校在 2年内未能改善,将取消公立学校地位,经由协商后转为私立学校。如果最终还是无法改进,那么差校将关门倒闭。
相对于学校而言,绩效评估对学区的影响要小些。目前真正要求学区对于本区内学校和学生的业绩负责的只有俄亥俄等4个州,而且其中3个州即将改为校本绩效制。但有13个州采取了学区和学校双重负责的做法。
由于绩效制度主要针对宏观的体制层面,其内容很少涉及如何激励学生的学习积极性。这个问题正在被人们所认识。随着校本绩效制的建立和推广,许多人开始提出学校教学的关键在于发挥学生的学习主动性和积极性,这也是教师教学成功的关键所在。但绩效制缺乏鼓励学生(特别是中学生)学习的机制,长期以来学生学习好与坏是一个样的。针对这个问题,一些州开始根据测验成绩来决定学生是否留级,特别是针对像3、5、8年级这样处于关键转折阶段的学生。到2008年,全美国将会有28个州要求学生参加州组织的中学毕业考试。
部分以美国为例,在社会实践,创新,但我认为中国的教育体系的一部分,是良好的,就是要务实基础,但基础不能学太困难了,
??有时候真的觉得中国的教育太死板了,没有一点社会实践,每天在教室里坐,听无聊的课字给学生的压力较小,因为现在的学生不超过一天的自由,而不是扼杀在童年的学生,