统一标准综合评价—— 基础教育学业评价体系的改革取向_教育热点

奈思资讯

教育热点

统一标准综合评价—— 基础教育学业评价体系的改革取向

2019-03-17 11:35

近年来, 为了提升国民整体素质, 保持国际竞争的优势, 各国都在积极发展教育, 纷纷将改革的重点放在提高教育质量上, 在基础教育阶段强调保证所有受教育者达到国家课程的基本要求, 不断提高学生的学业水平。为此, 各国纷纷建立和改进学业评价体系, 监测教育质量, 引导中小学课程和教学改革。

1、统一学业标准, 提高教育质量

自20世纪60年代开始, 世界各国的教育改革均把教育的大众化、民主化, 即实现教育机会均等和普及义务教育作为改革的重点, 其结果是使越来越多的青少年有机会接受不同形式的各级教育, 受教育者数量得到了长足的发展。到20 世纪末, 日本、美国、英国、德国、法国等国的高中人学率都在90%以上；发达国家大学生人数在2 0~ 24 岁青年群体中的比例, 已从30年前的5%一10% , 提高到现在的20%一40% 。但是, 随着受教育面的扩大和受教育人数的急剧增长,特别是人们接受较高水平教育权利的扩大, 教育质量降低的事实严酷地摆在人们面前。因此提高教育质量已成为全球关心的话题, 并成为近年来世界各国教育改革的优先目标。

进人21世纪, 世界许多国家纷纷制定教育发展战略, 出台重大教育改革政策。在规划未来人才的素质方面, 都以提高学业标准, 确保扎实的学力为核心, 为全球竞争做好准备。

美国联邦教育部《2002年至2007 年战略规划》直接表达了“提高学生的成就。灌输坚定的品格和公民精神、改进教育研究的质量等比以往任何时候都显得更为紧迫”的国家利益取向。2001年,小布什总统签署的《不让一个孩子掉队》(NCLB )教育改革法案, 沿袭了前两位总统重视教育的做法, 并且规定美国公立中小学三至八年级学生到2004一2005学年都必须接受各州政府的阅读和数学两科统考,如果有学校连续两年教学成绩低劣, 那个学校的学生可以要求转学, 学校经费将相应减少;如果3年后教学质量还未改善, 那么这所学校就必须支付学生的补习费用; 如果连续6 年不能提高教学质量,就要对该校进行人员调整。

美国的基础教育改革从限定学生在校期间必修科目及最低学习标准人手, 推出国家核心课程,建立国家课程标准, 然后制定州级核心科目和课程标准, 强化州级统考, 在各州逐续建立起与课程标准挂钩的州级学业水平考试制度。美国《2007年2012年战略规划》要推动的核心任务之一是“提高所有学生数学和科学的熟练程度及提高当前急需外语的熟练程度。”美国政府对未来学生应具备的能力有了新的标准, 学业要求越来越高, 课程难度越来越大。

2005年8月, 美国教育政策中心(CEP)发布的研究报告称, 总体上“自从20年前美国发起通过提高学业标准来改革教育的运动以来, 美国公立中小学在很多方面都取得了进步。”美国新任总统奥巴马提出, 美国欲在21世纪保持其领导地位, 只有教育比别人强, 竞争力才能比别人强。

法国2004 年的教育改革报告《为了全体学生的成功》提出一个“必不可少的共同基础”的概念,即知识、能力和行为准则的整体, 由语言和数学两大支柱、英语和信息技术两大能力和民主社会中共同生活的教育构成。总统萨科奇明确提出法国教育的两大教育目标——优质与机会均等。

2005年2月,英国政府颁发的《l 4 岁至19 岁教育与技能白皮书》指出：确保14岁至19岁阶段教育打下更坚实的知识和技能基础；14至19岁阶段教育的关键是数学和英语的掌握和运用能力,将数学和英语作为14岁至19岁阶段教育的核心。2005年10月英国政府又颁布了《为了全体学生:更高的标准, 更好的学校》。

2005年10月, 日本中央教育审议会的终审报告《开创新时代的义务教育》明确指出, 培养“扎实的学力”是提高义务教育质量的着眼点。报告提出要重视学生“扎实的学力”，包括基础知识和技能、思考能力、创新能力等。2007年1月, 日本文部科学大臣表示, 新的中小学学习指导大纲将提前到2009年开始实施其中的部分内容。为纠正“宽松式教育”对学生学力水平下降的影响, 新的中小学学习指导大纲, 增加了中小学授课学时, 增添了教学内容和课程难度。小学授课时间增加5% , 初中增加4% , 其中数学增加18% ,理科增加23%。同时不同程度地增加了学习的难度和内容。

　　2、校外统一考试成为学业评价的重要方式

各国的基础教育学业评价, 大都制定统一评价标准, 采取统一考试方式来检验全国(地区)教育的达标情况。不论是全国统一考试还是地方性的统一测验, 大多不与升学直接发生关系, 而着眼于检验教育质量, 其考试只是形成性或终结性评价手段,以促进教育质量的提高为最终目的。

　　2.1 北美

20世纪60年代之前, 美国基础教育以反传统的理念, 提出充满浪漫色彩的“儿童中心论”的愉快教育, 强调学生的自由、兴趣、活动而放弃训练。努力和积累知识与技能, 放弃为将来参加工作做准备的必要的课业要求。过轻的学生负担与美国基础教育质量普遍下降有很大关系。美国长期以来没有国家课程, 也没有统一控制毕业要求的考试。主要为四年制本科大学服务的大学招生，人学考试也是由民间团体所属的考试机构分别举行。相当一部分社区学院和初级大学只凭高中毕业文凭即可人学, 而高中毕业文凭可不经统一考试在校内或学区即可获得。这种没有统一教育要求和衡量标准的、分权、状态,导致美国基础教育质量低下。

20世纪80年代, 在美国的初中毕业生中, 近一半人不能把100份中的9 份换算成百分数。权威的国际测试结果表明, 在自然科学和数学方面, 美国14岁学生掌握的知识不如其他发达国家的学生。

1983年美国《国家处在危机中, 教育改革势在必行》报告, 使美国教育开始回归基础。随后, 美国前总统老布什采纳了教育顾问委员会的建议, 为改变基础教育质量不高, 难以适应国际竞争的局面,在1989年9月召开的美国总统及各州州长“教育首脑会议”上, 确定了“国家的教育目标”, 谋求提高国家全体公民的知识水平。克林顿总统上台后提出振兴经济的关键是提高教育水平, 宣布美国政府将全力进行教育改革。予1994年3月宣布了《2000目标:美国教育》。克林顿的教育政策包括:在全美设立统一的教育标准, 建立全国统一的课程规范,在公立学校中引入竞争机制等。同时, 联邦政府还要求各州利用款项中的部分经费, 研究和开发中学学业评价的考试工具, 使各种与就业和升学有关的重要技能在考评系统中体现出来, 并将老布什政府在1990 年通过的六个全国性教育目标写进了法律。确立了包括数学、自然科学等五个主要学科的国家课程标准, 在四、八、十二年级引人全国性统一考试, 是以检验学生的学习水平。在这一政策影响下, 美国公立学校纷纷采取了改革措施:本着少而精的原则对高中课程进行改革；加强对教师培训并建立奖励制度；延长教学时间；允许学生选择学校等。肯塔基州还率先举行了四、八、十二年级学生的州级水平测试。

2001年, 《不让一个孩子掉队》法案规定, 每年对3一8 年级学生进行数学和英语考试, 并要求各州、学区、学校每年都要取得进步, 到2014 年, 全体学生都能达到国家规定的基本要求。NCLB法案实施五年来, 开局良好。根据美国教育政策中心发布的调查报告, 与20年前相比, 美国中小学课程难度增大了, 学生成绩提高了。州级统考在提高学生学习成绩, 建立教育质量责任制, 以及给家长更多选择方面起了重要的作用。美国联邦教育部2008年工作重点之一, 就是促成美国国会授权进一步推进N CLB 的实施。在美国高中增加两个年级的学生参加阅读和数学的州统一考试。这意味着3一11年级的学生每年都将参加一次州的统一考试。21世纪以来,美国约40个州为促进高中教育质量, 逐步统一州高中毕业标准,实行州级统一考试, 又称为州毕业会考。到2005年, 全美约一半(48 % )的高中要求学生必须通过州毕业会考后, 才能取得高中毕业文凭。

加拿大的基础教育具有与美国十分相似的特点, 由于没有统一的课程评价标准, 也没有全国统一的大学人学考试, 很难对全国的中小学教学质量作出评估。因此加拿大联邦教育部长会议决定, 采取“盖洛普教育调查”(The Gallup Poll of E dueation)方法进行研究。该方法是在各省13 岁到16 岁的学生中, 抽少量学生进行语文和数学考试, 在1993年和1994 年各进行一次, 以后再进行两年。由阿尔伯达和魁北克两省负责组织考试。这样到2000年, 就能够对全国中小学教育质量作出评估。

虽然没有在全国学生范围内进行统考, 但建议在全省或至少在学区范围内实施统一考试。有些省已经开始不同程度地实施全省范围的测试, 如马尼托巴省规定十二年级每年举行一次考试, 成绩占学生总成绩的30% 。部分省实行高中毕业统一考试。如艾伯塔省恢复毕业考试后,该省大学明显感到恢复毕业考试的人学新生, 在英语和社会科学成绩上有了明显提高。新斯科舍省的全省性标准化考试,不仅仅对毕业班实行, 必要时对某地区或某学校的一个年级实施。安大略省还制定了全省范围的学校学业成就指标项目, 该项目中规定对13一16 岁学生的阅读。写作。数学和科学水平进行考试。1994 一1995 年, 全省举行了九年级学生的阅读和写作学业成就评价,1996年成立了专门负责学生学业评价的机构。教育质量与责任办公室。负责组织每年基于本省中小学课程标准的学生学业成就评价。安大略省规定, 三。六。九年级三个关键学习阶段中的所有学生都必须参加数学和读写能力的统一考试。

通过十多年的对省统考的不断改进, 发展至今, 加拿大已逐渐形成了一个对学生。家长和教育者都有帮助的综合评价体系。

　　2.2 欧洲

以英国、法国为代表的欧洲证书考试制度, 使这些国家的基础教育长期为毕业与升学证书考试所左右, 这些考试主要为升学服务。特别是高中毕业证书考试一试而兼两用, 既是高中毕业水平证明, 又是大学人学资格凭证。但这些考试都不是由国家统一组织, 而是分散到地方或大学考试机构进行, 主要反映了大学招生的要求。随着教育改革的发展, 欧洲几个主要国家也都对这种独具特色的教育考试制度进行了不同程度的改革。加强对基础教育的国家监控, 利用考试评价教学质量, 提高国民的文化科学素质。

英国一反过去的教育权力分散和地方自主的传统, 在《1988 年教育改革法》中规定, 将对5一16岁处于义务教育阶段的中小学生, 划分成四个基本学段(key stage ), 每个学段(7岁、11 岁、14 岁、16 岁)结束时, 都举行国家课程测验。首先是第四学段( 16岁)考试。即为义务教育结束具有中学毕业和大学预科人学双重资格证明作用的GCSE 考试。1996年, 为保证义务教育阶段“全国统一课程”的学业质量, 决定对7 、11 、14 岁学生的学业水平进行测验和评价。所有学生都要参加的前三个学段末的考试,称为国家课程测验, 并由英国课程与资格局统一组织测验设计, 各地方考试机构只负责考试实施等工作。这一全国义务教育评价考试制度的出台, 与全国统一的课程计划密切配合, 充分体现了英国中等教育考试在评价教育质量。检查教学效果方面的独特作用。

近年来, 英国政府决定,又将16岁学生参加的中等教育普通证书(GCSE) 考试改为依据国家课程的证书考试, 如将考试成绩等级与教学目标等级相匹配。原GCSE 考试采用A、B、C、D、E、F、G七等级计分制。为了更好地体现考试为教学服务的特点,GC SE 考试启用与国家统一课程十级成绩等级相对应的十级分数量表。

英国政府有关报告指出:英国教育的首要目标是提高所有学生成就标准, 事实证明, 建立国家考试评价体系以来学生学业水平的提高是有目共睹的。国家课程和国家测试的统合, 成为英国加强国家对教育质量监控的主要手段。

从国际比较的角度看, 法国青年受教育的程度亦不令人满意。法国巧岁学生知识水平在发达国家中只列为中等, 并且有学习困难的学生比例高达20% 。面对这一局势, 提高法国未来就业人口受教育的程度, 普遍提高青年的教育水平已迫在眉睫。

2006年以来, 为了全面提高小学的教学质量,法国每一学年年初都针对小学二年级和五年级组织全国统考。目的是较准确地掌握哪些学生学习上存在困难,存在哪些困难。考试结果要上报区督学和学校校务委员会, 并通知成绩较差的学生家长。2007年, 法国教育部长称, 为实现三年内将困难学生的比例由现在的15%降低到5% ,近期正着手进行小学教学改革, 今后的统考不仅在学年初进行, 学年中后期也要举行一次。这样不仅在学年初诊断出学习困难的学生, 也可在年中后期检验学生学习水平是否达到二、五年级教学大纲要求的水平。并决定比照英国的做法, 将二年级、五年级全国统考成绩上网公布。增加学校教学质量透明度, 家长择校可参考这些数据, 促进学校之间教师之间竞争, 从而提高教学质量。

1995年, 奥地利加人欧盟后, 深感其教育体系与水平跟不上欧洲其他国家的发展步伐。2000年,经济合作与发展组织公布的31个发达国家基础教育水平测试结果, 奥地利处于中游。由此产生了一场教育改革的大讨论。为保证奥地利的教育质量,提高在国际上的竞争能力, 克服教育系中存在的诸多问题, 奥地利在2003年初,专门成立了教育改革未来委员会。经过两年调研提交了“奥地利基础教育改革方案”“方案”提出当前首要任务是必须“提高办学质量”, 采取三大措施, 制定全国统一教育标准, 建立国家监督评估系统和实施地区评估办法。要定期按基本能力和专项能力标准举行全国统考。全国统一命题, 分地区统一阅卷。每年从全国监督评价报告中获取相关信息, 与本校的教学结果比较, 以促进教学质量的提高。

　　2.3 亚洲

日本设有统一的大学人学考试制度, 由专门的国家考试机构组织实施, 考试具有高度的统一性和权威性, 同时也存在着激烈的考试和升学竞争, 故有“考试地狱”和“学历社会”之称。为改变教育完全围绕升学考试转动的局面,让教育面向全体学生,提高国民素质。改善学生学力和学习愿意下降的倾向。建立义务教育质量保障机制。日本从2007年起, 恢复中断43年的全国统一学力调查测试。2007年4月, 由文部科学省组织实施了面向全国的义务教育学力调查。此次调查是继20 世纪60 年代中断实施全国学力调查之后,首次以日本的小学和初中最高学年的全体学生(小学6年级学生与初中3 年级学生)为对象而实施的全国统一考试。其目的在于掌握2002年以来课程改革的实施状况。

根据2000年《香港教育制度改革建议》, 为了让香港各界人士了解中小学生每个学习阶段, 在中文、英文、数学基本能力方面的表现, 更有效地辅助教与学。香港从2003年起开始进行基本能力评估。基本能力评估包括两部分:学生评估(student As -sessment)及系统评估(system A ssessm ent) 。香港全港性“系统评估”是由香港政府教统局统筹, 香港考试及评核局承办的统一测试, 其功能是为了解各学校在主要学习领域是否达到基本水平, 促使学校结合评估数据与学校发展的需要, 制定改善教与学的计划。除中、英两科中的口语外,评估主要以纸笔形式进行。全港性“系统评估”只在小三、小六及中三年级实施。中文、英文和数学三科试卷, 每个学生只需要完成其中部分试卷, 通过数据统计, 获得各学校的成绩。不公布学生个人成绩。

　　3 综合评价成为学业评价的发展趋势

许多国家在强调“教育为国家服务”这一价值理念的同时, 也更加强调教育发展一定要体现人才成长规律, 主动满足人才生存和发展的全面需求。教育改革与发展要坚持以人为本, 鼓励学校进行多种人才的多元化培养模式改革试验。

不少国家从中小学阶段开始注重培养人的创造力,作为国家培养创新人才的基础, 为学生构建知识基础, 激发学习兴趣, 进行学习方法的指导, 引导学生学会反思。发现问题。归纳总结等,训练思维方法, 改革学习评价方式。

　　3.1 实施多元综合评价

由于校外统考一般是考查学生是否达到国家标准中的基本要求,且考试科目也相对较少。所以,为了评价学生更高层次的认知能力。动作技能和研究能力, 许多国家基础教育的学生学业评价, 在评价方法上, 努力将诊断性评价, 形成性评价和终结性评价结合起来。校内评价与校外统考结合起来,科学、全面地评价学生。如英国、美国、日本、加拿大等国的中小学, 在日常教学过程中都要按照国家或地区教育部门制定的校内考核等级评定量表, 可分项又可综合地评价学生的学业发展情况。各国在校内考核中采用口试与答辩, 短文与论文, 作品与方案设计, 案例分析、实验操作等直接评价的方式。将教学与评价整合, 表现性测验与实验技能教学受到高度重视。采用诊断性(学习开始)评价、形成性(学习中) 、终结性(学习结束)评价有机构成的综合评价体系, 来检查评估学生学业的进步, 可以顾及教育目标的广泛性。整体性和丰富性, 全面评价学生学业的发展进步。不仅可以为教育决策者服务,还通过用普适性的。实质性的词语去描述学习的达成情况, 有助于改进和指导学生的下一阶段学习。

　　3.2 试行发展性评价

随着教育理念的革新, 美国、英国等不再把学生学业评价仅仅作为教育管理的手段, 使学校和学生被动地接受鉴别和区分。而是强调发挥教学质量评价的改进和调整功能, 把教学质量评价作为帮助教师改进教学和帮助学生提高学习水平的手段。

虽然, 与用于升学的常模参照性考试相比较,各国学生学业评价都是依据国家课程的标准参照性评价, 作为测试学生整体水平是个好方法, 但这类测试也面临很多挑战。人们需要不断规范标准参照测试, 使其更为有效和可靠。标准自身的问题更是复杂。标准定高了, 造成学生大比例成为失败者；定低了, 不利于优秀学生展现自己的水平。而且对学生个体在一定年限中的进步, 长期使用教育标准中的基本要求评价也不适宜。近年来发展起来的以促进学生进步为目标的评价,变区分。选拔学生的相对评价, 为关注学生纵向发展的绝对评价。鼓励每个学生在不同水平上提高。

基于以上多种原因, 1984 年美国两位统计学家威廉。桑德斯和罗伯特。麦克莱恩提出的增值性评价(Value一Added Assessm ent)逐渐受到人们的关注。1992年,美国田纳西州的《教育改进法》规定采用增值评价系统, 作为该州教育改革的一项重要措施。增值性评价方法, 关注学生在指定时间内的成长,而不是学生的绝对成绩。可以显示特定学生在特定学科是否取得了预期的进步, 能够看出教学中哪些成功或哪些失败之处。还可通过回顾学生几年的成绩来测量特定教师或学校在一段时间内对学生成绩的影响。所以, 先是作为评价教师教学效果的方法, 随后被推广到学校评价和学生评价领域。到2004年, 美国已经有21个州采用增值性评价来促进学校教育发展。2005年, 美国优秀教师颁证委员会, 要求使用增值性评价模式, 作为该机构评价教师对学生学习成就影响的方式。近几年来, 增值性评价作为美国《不让一个孩子掉队》法案规定中保证各州“适当年度进步”的辅助工具, 在美国得到广泛应用。如2007 年纽约市也在中学实施了附加值评估办法, 与其他州不同的是, 在强调学生在中学过去一段时间里学习成绩的提高情况, 而不单是二学年中考试成绩的高低。在这套学校等级评估体系中,学校等级分数5% 是基于每一个学生在州阅读和数学考试中的进步程度, 30% 来自于学生最近的考试成绩, 其余15% 取决于学生家长。老师和学生对学校学习环境等因素进行评估, 包括学校安全性及学校的学术前景等的评估。

英国于1992年开始实施增值性评价, 至今已有10 余年。起因是英国统一国家课程和实行关键学习阶段末的统一测试后, 学校效能和进步受到了更多重视。但与此同时, 以统一考试成绩作为学校排名依据的公平性受到质疑。争论最多的是“取得好成绩是因为学校工作出色, 还是学生本身素质高”。为此,英国开始在部分地区试行增值性评价方法。将学生的起点、学习水平与一段时间学习后的成绩, 通过统一测试的数据进行分析, 比较学生在不同时期的学业成绩, 加上学生学习的态度、教师、家长的反馈意见等,便可得出学生、班级、学校进步的幅度。这种评价方法让处于中下水平的学生和一些基础薄弱的学校付出的努力得以呈现, 找到了自信。因此,从2004 年起, 英国将教育增值评价纳人了英国学校督导制度。

香港2003年开始的“基本能力评估”中的“学生评估”, 主要是一个网上的资源库, 通过互联网以网上测试形式提供服务, 其功能是为学校提供多一套有效的校内评估工具, 由学校按学生的需要配合其他多元化的校内评估模式(包括纸笔测试及观察学生平日参与学习活动和专题研习的表现等)进行, 以便全面有效地了解学生的学习进度和需要,及早发现问题, 及早为学生提供适切的辅导和支援。它并不是强制性的, 而是按学生的需要及教学进度, 用以辅助教师发展及选择合适的评估课业。“学生评估”若运用适当、及时, 可以用来诊断小一至中三年级学生在中、英、数学习上的强项和弱项,改进学生的学习和教师的教学。

“学生评估”原本的设计只涵盖基本能力, 为方便教师使用以应付不同学生的学习需要, 香港政府现正将它发展成为一个“促进学习评估资源库”, 资源库的题目和课业包含更多课程之内的有关课题和能力, 并会发展相应的支持学与教的材料供学生与教师使用。

2005年, 该“学生评估”系统获得日内瓦科学发明比赛银奖。

2007、2008年日本实行的全国学力调查测试不仅有助于了解日本学生的综合学力情况, 对于学校把握学生的学习状况。改善教学指导等方面也十分有益, 这主要体现在不仅考查学生的学力状况, 还进行了与生活习惯、学习环境有关的问卷调查,并且分析其与学力之间的关联。通过多种场合、多样化途径加深家长与学校的理解与合作, 齐心协力营造良好的学习环境, 使得学生学力提高, 养成良好的学习习惯。生活习惯和精神面貌。

日本全国学力调查“广义的学力”, 即包括在实际生活中应用知识技能时所必需的思考能力、判断能力、表现能力等内容的学力。通过分析学力调查结果, 不仅可以确立本校的努力方向, 促使学校谋求改善课程教学, 提高学生活用知识的能力。还可以了解学生在学习过程中的难点和障碍, 有利于教师改善教学指导工作。教师通过了解每个学生的出错倾向, 进行具体指导,促使学生提高学习欲望, 改善学习方法。

综上所述, 各国学业评价的发展趋势是十分明显的:评价过程由封闭走向开放；评价内容由片面走向全面；评价的价值观念由一元走向多元；评价对象从整体到兼顾个体；评价方法多样化；定量评价与定性评价相结合；注重在真实情境中评价学生的表现等。

　　4 启示

目前, 我国基础教育尚未能建立起科学的教学评价体系。在教育体系中, 长期以升学考试成绩作为评价的唯一指标。每次课程改革都寄希望于高考、中考的改革。而用统一的标准、公平选拔学生的升学考试是不能代替教学评价的全部内容和其他评价手段的。

从2007年开始, 部分试行高中新课程标准的省份, 在过去实施的高中毕业会考基础上, 建立高中学业水平测试。2008年教育部发文正式推行高中学业水平考试制度。作为评价高中课程教学质量评价的主要方法, 同时也作为高等学校招生录取的参考项目。其方向是正确的。

但还应总结过去实施高中会考的经验教训。学习借鉴他国学业评价的经验和模式, 利用现代教育评价理念, 建立独立于升学考试的中国基础教育学业评价和监控体系。应制定教育质量国家标准, 积极发展基础教育关键年龄段的国家课程评价项目。同时, 发展其他评价手段, 实施多元发展性评价, 建立包括学生学业成就、特长、个性特征、潜能优势、进步幅度。未来发展建议等内容的评价指标体系, 与基于统考的国家课程评价相互补充。这种以学生为本的考试评价制度, 可以全面促进教育教学质量提高, 有利于培养适应新时代需求的各级各类人才。

上一篇：不离不弃：部分家长表示英语课内不教课外补下一篇：委员批教育部“管太多” 称素质教育评价体系是有病的