刘建达：中国英语能力等级量表与英语测评-语言与人工智能重点实验室

评论观点

您当前的位置 : 首页 >> 其他栏目 >> 评论观点 >> 正文

刘建达：中国英语能力等级量表与英语测评

发布时间：2018/11/03 09:05:17

作者：刘建达，广东外语外贸大学副校长，教授。

摘要：中国英语能力等级量表是对我国英语使用者运用英语语言能力的系列描述，分3个阶段9个级别，规定了中国英语学习者和使用者的英语能力等级，描述了各等级的能力表现特征。量表以交际语言能力为基础，以语言使用为出发点，以“能……”为描述语的基本结构。量表为我国英语教学、学习和测评提供了统一标准，为我国建立终结性和形成性相结合的综合评价体系奠定了基础。

关键词：中国英语能力等级量表；英语测评；形成性评价；终结性评价

中国英语能力等级量表（以下简称“量表”）是在统一的标尺上对我国英语学习者运用英语语言能力的一系列描述，分为9个级别，根据循序渐进的原则描述我国英语学习者初级、中级、高级3个发展阶段所需达到的英语能力水平。量表包含86个表格，其中1个总表、8个分技能总表、69个分技能表和8个自评表。量表立足于中国国情和现状，从时代发展的新需求出发，注重科学性、实用性和可操作性相结合，力求服务教育、服务考试、服务社会。量表的制订基于先进的语言能力理论和心理测量理论，采用科学的研究方法。量表对英语测评有具体的指导作用，对英语学习、英语教学等相关工作具有切实的参考意义和促进作用。

1 中国英语能力等级量表

中国英语能力等级量表对语言能力进行了科学的描述和评价：使用定性和定量相结合的研究方法对语言能力进行等级划分；采用明确、直观的描述语对语言能力各等级进行“能做”描述；通过效度论证，保证量表本身的有效、可行，使量表涵盖不同层级的语言学习者和使用者，满足不同用户的需要。量表并不是对交际语言能力所需的所有具体的语言和技能单个成分进行描述，而是通过列举某些具体成分的方式来说明应该达到的能力。

1.1 以交际语言能力为基础

在信息技术和现代化交通方式飞速发展的推动下，人与人之间的交流超越了传统的时空限制，整个世界的联系更为紧密，人们对于跨越语言的障碍参与国际交流、获取最新信息的渴望和需求也愈加强烈。因此，现代外语教学必须适应外语学习者和使用者的实际需要，培养他们的交际语言能力，而与外语教学紧密相连的外语测试与评价也必须以交际语言能力为中心开展工作。

交际语言能力模型反映了人们对交际语言能力及其相关方面的基本认识，为外语教学和测试提供了基本的理论指导。量表结合中国英语教、学、测等方面的实际，对该理论模型进行了扩充和完善，结合语言能力描述的实际需要，建立了英语能力描述指标体系，搭建了详细、清晰且层级分明的描述结构框架,确保量表能够为我国英语教学大纲的制订、课程的设置、教学方法的选择以及教材的编写提供参考。

1.2 以语言使用为出发点

量表以语言运用为目标，把语言使用作为描述的出发点，主要描述不同能力水平的语言学习者和使用者的典型语言行为。这种典型语言行为体现于语言使用者在特定的情境下调动各种知识和策略完成各种交际任务，简而言之，就是学习者能用英语做什么。

量表先对语言能力进行综合性描述，然后根据学习者和使用者能力水平高低的实际情况和社会需求程度，详略有别地分项描述各种能力，包括听力理解能力、阅读理解能力、口语表达能力、书面表达能力、口译能力、笔译能力、语用能力，以及语言使用过程中涉及的一些策略能力等，同时也描述了学习者应该具备的语法知识、语篇知识、功能知识和社会语言知识等。

1.3 以“能……”为描述语的基本结构

从为交流而产生的那一刻起，语言的工具性功能就不可忽视。此外，当前学习者和使用者学习英语的主要目的也是掌握英语运用能力。在这种情况下，英语教学仍然应该着眼于培养英语学习者和使用者运用英语进行交际的能力，即能参与各种交际活动、完成各种交际任务的能力。

量表采用“能……”的方式来构建描述语，描述语言能力，直观报告具有某种能力的语言学习者和使用者能够用怎样的语言、在怎样的交际场景、参与或完成怎样的交际任务。“能做”描述从英语学习者和使用者的英语使用过程入手，描述他们所能理解的语言材料、接收与产出的过程和语言产出的结果。所能理解的语言材料是指他们能听懂或读懂的口头或书面的语言材料；语言产出的结果是指他们口头说出的话语或书面写出的语句、篇章等；接收或产出的过程涉及语言学习者和使用者调用相关知识和策略的能力。这些方面都直接反映了英语学习者和使用者的英语能力，决定了参与或完成的交际活动的最终效果。因此，这种描述方法不仅描述不同水平等级上的英语学习者和使用者使用英语参与或完成的交际任务，而且描述他们所能理解和表达的英语的语言学特征，如语音、词汇、句法、语用等各方面的特征。

2 量表对英语测评的启示

量表可以帮助我们制定能够反映学生需求、满足学生个性化学习的教学大纲、教学指南和课程大纲，这样的大纲有助于调动学生学习的积极性；量表也有助于营造一种终结性评价和包括教师评价、同伴评价、学生自评在内的形成性评价有机结合的评价氛围和文化。因此，量表既适用于英语测评，也可供英语教学、学习及其他参考。事实上，根据已有量表的使用情况，在测评中使用量表的频率最高。

2.1 对终结性评价的启示

语言测试可以不同的形式来分类。按照测试的目的，语言测试可以分为学业测试（achievement test）、水平考试（proficiency test）、分级考试（placement test）、诊断考试（diagnostic test）等。这些也是常见的终结性考试。

量表为能力等级考试提供了科学的依据，为每个级别的考试提供了参照的标准，也为组建等级考试提供了不同级别之间有机衔接的基础，可以使不同等级的考试连贯有序，促进多元发展。图1是基于量表的等级考试的示意图。利用量表的分级描述语，可以通过横向等值（horizontal equating）和纵向分级（vertical scaling）使各个级别的各种考试进行科学衔接。当然，这并不是说，量表的每一个级别（1~9级）都要有相应的考试出现。对于那些有必要开发考试的级别（尤其是那些考生群体较大的级别）来说，每个级别都可以通过量表来进行有机的纵向衔接。低层次的考试与高一层次的考试有一定比例的重叠部分，这样有利于考生选择适合自己的考试级别。同时，由于每个级别都有详细的描述，这就为“一考多用”奠定了一定基础。

undefined

量表还可以为我国建立一个多元的科学测试体系提供基础。除“一考多用”的能力水平考试，还有很多其他不同用途的考试，如针对不同行业的英语技能考试等。通过量表，可以建立一个“1+n”的考试体系（见图2），其中n是待开发的专门用途英语考试。虽然量表中含有涉及一些专门领域的描述语，但对于专门用途英语来说，还需在现有量表的基础上，继续完善和开发相应的专门用途英语量表，例如，根据量表的理论框架，翻译能力（包括口译和笔译）除包括相应的语言能力、语言知识、策略能力外，还包括翻译所需的专门知识，即口译知识和笔译知识。由于发布的量表没有专门针对翻译知识收集描述语，有关领域的学者可以继续完善翻译能力等级量表，补充翻译知识的描述语。有了完善的量表，各种专门用途英语和能力资格的考试就能有一个共同参照的标准。

量表的开发也使英语能力等级考试为考生提供多样性和针对性的分数报告成为可能。我国传统英语考试分数报告内容一般仅限于一个总分，个别考试会包括排名数据或分项分数，国外的一些考试（如托福）还提供基于常模的数据及带有诊断性的分数报告和考试结果。量表可以有效帮助各种考试提供丰富的分数报告（如总分、分项分、等级分、百分位等），同时还可以提供诊断式报告（如图3所示），由此构建一个立体式的成绩报告，全面展示考生的能力，满足多元评价的需要，做到总成绩与分项成绩相结合，量化与质性描述兼顾，个体及整体报告兼具。

2.2 对形成性评价的启示

逐步建立形成性评价和终结性评价相结合的测评体系是国家外语能力测评体系建设的内容之一。形成性评价和终结性评价是Michael Scriven首创的2个名词，用于强调二者在收集学生信息目的和使用学生信息方式上的差异。在形成性评价中，教师与学生通过收集、解释和使用学生成就的证据来决定下一步的教学，以更好地促进教学和学习。形成性评价的主要目的有：为教师提供反馈，以帮助调整下一步的学习活动和任务；发现并纠正学生的不足之处；把重点从唯分数转移到注重学习过程，增强学生的自信心，减少外在动机造成的负面影响；提高学生对他们所学知识的元认知意识；更多关注学生的进步等。在贯彻作为学习的评价（assessment as learning）的同时，形成性评价也很好地贯彻了促进学习的评价（assessment for learning）的理念。促进学习的评价其实是个连续体，在这个连续体中，各种评价活动随时随地都可以发生，例如标准化测试、能做之事测试、档案袋评价、评分标准的制定、非正式反馈、同伴评价、自我评价等，这些都需要教师和学生单独或一起观察和反思。在从学习到结果的这个连续体中，一个统一的标准始终起着重要的作用（如图4所示），量表能为形成性评价和终结性评价提供统一的标准。

undefined

形成性评价得到越来越多教师和学生的青睐。Hugh Burkhardt指出，有证据显示，那些诸如详细的学校报告之类的“丰富但又脏乱的资料”远比那些考试结果之类的“简单干净的资料”更能预测到学生未来的成功。当然，高质量的形成性评价需要教师和学生付出很大的努力，尤其是在目前人们对形成性评价的理解还存在一定偏差的情况下。高质量的形成性评价至少应该具备5个特点：第一，综合性（integrated）。与学校的其他评价协调一致，属于学校整体评价的一部分，为学校准确评估学生的语言发展提供不同的资料。要做到这一点，形成性评价需在评价标准和学习目标上与学校的其他评价保持一致。第二，动态性（dynamic）。教学是动态的，形成性评价也应嵌进具体教学之中。因此，形成性评价是叙事动态的，遵循语言教学的标准和目标。学生的语言能力会进步，教学内容会更新，因此形成性评价也应该与时俱进。第三，启发性（enlightening）。形成性评价的本质就是提供反馈来指导教学，因此，评价的内容就非常重要，否则反馈就会失去作用。例如，如果评价的重点是语言，则要确认确实是在测量语言能力，而不是其他的能力。第四，可及性（attainable）。形成性评价应该适合教学的现实需求，评价与教学之间应该实现无缝对接。如果反馈能真正影响教学，形成性评价就容易实施，对学生学习的检查对下一堂课的教学准备也就能起到很大作用。第五，相关性（linked）。学校的教师和行政人员都应认识到形成性评价的作用。如果学校为教师提供条件，让教师有时间和空间来开展与形成性评价有关的职业发展互动，就形成性评价对学生的作用和影响进行交流互鉴，形成性评价就可以更好地开展。要发挥形成性评价的作用，统一的标准是必要的。这5个方面可以称之为IDEAL准则。

中国英语能力等级量表为我国英语学习者提供了统一的标准，也为实施形成性评价奠定了坚实基础。量表提供了1~9级描述语，从英语初学阶段到高级学习阶段都有条件依据量表实施形成性评价。当然，形成性评价是一个综合评价体系，需要教师具备一定的语言测试素养（language assessment literacy），因而对英语教师语言测试素养的培训也很重要。

3 结束语

语言能力量表对语言教学、学习和测评都会起到一定的促进作用。中国英语能力等级量表为我国英语教学、学习和测评提供了统一标准，为我国语言测评发展奠定了基础。我国最新修订的各级语言教学大纲、教学指南都包含了开展形成性评价的内容，倡导终结性评价与形成性评价相结合的综合评价体系。我们有理由相信，形成性评价一定会在我国的英语教学中遍地开花，并且结出累累硕果。

原文刊载于《中国考试》2018年第11期第1—6页。

上一篇：五年社科基金数据告诉你人文社科哪家强！下一篇：推动智能翻译行业发展助力广东人工智能产业繁荣