评论观点

您当前的位置 : 首页 >> 其他栏目 >> 评论观点 >> 正文

中国高校评价的制度分析 ——兼论“双一流”建设中的高校评价问题

发布时间:2018/01/19 17:37:09

本文考察了我国高校评价制度的产生背景与社会构建机制,指出我国高校评价是高等教育规模扩张的分化产物。文章还清晰梳理并呈现了,我国陆续建立以大学科研能力、本科教学、学科发展以及学位点为评价客体的多元高校评价体系的社会构建机制。作者继之分析认为,我国现阶段所构建的高校评价在范式上具有管理主义倾向,在指标体系构建上具有对所依存社会情境抽离性与碎片化特征。为了更好地服务于我国高等教育“双一流”建设,作者提出了相应的高校评价改进策略。

关键词:高校评价;社会构建;制度分析

一、我国高校评价产生的制度背景

关于我国高校评价的制度起源,学界鲜有专门论及者。笔者以为,我国高校评价的日益制度化,是我国高等教育规模扩张到一定阶段后必然产生分化的产物。

国内外不少学者认为我国高等教育的扩张始于1999年的扩招政策,甚至有一种说法认为我国之所以在1999年推出扩招政策,是为了缓解国内当时国企改革下岗工人给劳动力市场带来的就业压力。[1]对此,笔者并不完全赞同。因为如果该解释是成立的,我们应该看不到二十一世纪以来我国高等教育持续稳定的规模增长。检视中国高等教育整个的发展历史,会发现我国高等教育的扩张远在1999年之前便已经存在了,且两次较为显著的扩张分别发生在1986年和1993年,恰是我国改革开放期间两个里程碑式教育改革文件《中共中央关于教育体制改革的决定》和《中国教育改革和发展纲要》的发布前后。相比于1978年我国高等教育的毛入学率(1.55%),1999年我国正式实施高等教育扩招政策之时高等教育毛入学率已实现近6倍的增长,此后继续以每年2个百分点的增长发展着,并于2002年达到16%正式宣告进入大众化阶段。而且,我国高等教育的扩张速度并未因此而减缓,2017年我国高等教育毛入学率达到42.7%,教育部领导继之宣布我国高等教育毛入学率计划于2020年达到50%,正式进入高等教育普及阶段。由此可见,我国的高等教育扩张政策绝非一个权宜之计。

事实上,西方各国在二十世纪,特别是六、七十年代,都经历了不同路径的高等教育扩张。美国自二十世纪以来高等教育规模便快速扩张着,特别是1958年通过设立国防教育法案并运用各种奖学金或贷款吸引大批青年进入高等学校,大学生数量由1960年的350万激增为1980年的1200万。英国的路径略有不同,英国高等教育委员会于1963年发布了《罗宾斯报告》,在否定高等教育精英模式的“有限智力库论”基础上,提供了英国高等教育扩张必备的社会合法性,但英国大学生的数量增长并不大(由1960年的12万增长为1980年的80万)。[2]和美、英相比,法国高等教育扩张的路径有所不同,它是经由1968年五月暴动为代价而实现的,运动的主旨是反对戴高乐政府高等教育入学考试的精英选拔制度,主张高等教育是人人可以享受的权利。[3]

相比之下,虽然我国高等教育的扩张晚了近半个世纪,但它却是同时期世界上以高等教育扩张作为国家发展战略的唯一的发展中国家。[4]这实际上与我国领导人主动寻求全球化的大国发展战略是不可分开的。虽然学界关于什么是全球化仍缺乏较为一致的定义,但全球化作为一种不断加深、加宽和加速的世界连接性现象却得到普遍认可。为了在全球竞争中胜出,中国大举兴建并改善基础设施,并大力打造一支大规模廉价且相对优质的劳动力以吸引全球资本。随着高等教育规模不断扩大,我国启动了高等教育机构分化策略。1995年,我国推出了211工程,即面向21世纪重点建设100所左右的高等学校和一批重点学科的建设工程,为此各省都积极整合资源打造能跻身榜单的旗舰大学,教育部的官网显示我国最终有112所高校入围211大学名单。此后的1998年我国又推出了985工程,即要努力建设若干所具有世界先进水平的一流大学,211大学中有39所大学事实上分三期入围了985大学名单。2009年,第一期进入985名单的9所高校参照美国常春藤联盟和英国罗素大学集团等模式,在被默认的情况下自发组织成立了我国首个顶尖大学的高校联盟,被称为C9。应该说,随着我国高等教育规模急速的扩大,我国高等教育机构之间的差异分化也开始显现,社会学将这一现象称为体系分化(differentiation)。

虽然社会学研究发现,一个社会体系的规模扩大必然会带来结构和功能上的分化,但是我国高等教育机构体系的分化模式却是与众不同的。如果以世界上影响最深远的美国卡内基大学分类(化)作为参照,我们可以发现卡内基体系的分类(化)标准是以知识为中心的——根据知识生产的广度(学科的数目)和深度(授予学位的层次水平)美国大学被分为博士学位授予大学、硕士学位授予大学、学士学位授予大学、副学士学位授予大学、专门机构和原住民学院几个大类。相比之下,如果分析我国大学的分类可以发现它的划分逻辑是完全不同的——基本上可以划分为世界级大学(C9)、全国旗舰大学(985)、全省旗舰大学(211)、地方大学以及位于底端的高职高专与民办院校。

美国大学的卡内基分类,虽然经历了1976年、1987年、1994年、2000年、2005年和2010年多次修订,且参与分类的美国高等教育机构从1973版的2837所增加到2015版的4665所,但从整体上看美国各类高等教育机构的比例保持着一种相对平衡。例如,各版本中博士学位授予大学所占比例保持在7%左右,硕士学位授予学院和大学所占比例保持在15%左右,学士学位授予学院所占比例保持在18%左右,三大类高校占比保持在40%左右。[5]不过其中有一点变化值得我们关注,即在卡内基分类2015年的版本中,副学士学位授予院校占比下降明显,相比专门机构的占比有较大提升,高达31%。这与我国地方性大学和高职高专,日益追求学科综合化的发展方向很不一致。而且,我国高等教育机构体系的分化虽和规模总体扩张有关,但不可否认国家政策在其中发挥了至关重要的引导作用,而这其中最为关键的影响要素便是国家资源的重点投放。数据显示,我国三期985工程国家共投入554亿人民币,加上部委和地方政府的配套资金该,我国对985工程的投入金额高达904.76亿人民币,[6]如果再算上市场资源出于优化配置的规律快速向该类院校聚集,特别是大量的社会捐赠与就业市场的专向投放,可以得出这样的结论,我国高校的分化体系是在中央政府、部委和地方政府、企业和社会力量多方共同打造下产生的一个高等教育机构分层体系。

仔细对比中美高等教育机构体系的分化,可以更清晰看到二者的区别。美国卡内基的大学分类实际上是一个分层内的分类体系,且“分类”多于“分层”。对此,我们无需美化地说美国大学分类只见分类不见分层,若果真如此,美国国内最有影响力的大学排行榜为何仍是把博士授予大学密集性地排在榜单前列?但即便如此,美国高等教育机构的分化体系的分类属性仍然很强烈,这是因为它在每一个分层内存在数量更为丰富的类型划分,且越是授予学位层次低的高等教育机构其分化类型越为丰富。例如,在卡内基分类中四年制专门机构的类型划分就有9种之多,同样地授予副学士学位的高等教育机构类型的划分也多达9种。相比之下,我国大学的分化却呈现出令人忧虑的“分层即分类、分类分层合而为一”的封闭性特征,而这势必会潜在地扼杀我国高等教育对外部环境需求适应的多样性。

总结来说,虽然中国和美国的高等教育机构分类体系都是其高等教育规模扩张到一定程度的分化产物,正如卡内基大学分类就产生于美国二战后高等教育快速发展的三十年时期,而且很长时期内卡内基分类中都把联邦政府对高校的资助列为分类考察标准之一,但是不同于我国目前的高校分化更多体现为教育体系外部权力资源体系的遴选与塑造,美国卡内基大学分类从根本上来说依据的是知识生产的广度(学科数与覆盖面)与深度(授予学位的层次),而这显然是一个教育内在特征的分类。事实上,在我国高等教育机构体系的分化过程中,如果说国家政策与资源投放是一股高校分化的拉力,那么在此期间出现的高校评价体系则是一股强大的高校分化推力,而这正是我国高校评价体系产生的制度背景。

二、我国高校评价的制度构建

虽然,我国的高校评价体系是在我国高等教育规模扩张的制度环境中产生的,是高等教育机构体系分化客观社会需求的结果,但是它得以被构建最初却是与科学计量学(scientometrics)这一科学学分支学科在我国的产生与发展分不开的。

所谓科学计量学是指运用数理统计和计算技术等数学方法对科学活动的投入(如科研人员、研究经费)、产出(如论文数量、被引数量)以及过程(如信息传播、交流网络的形成)进行定量分析,并从中找出科学活动规律性的一门科学学分支学科。科学计量学在我国的发展也许可以算是一种偶然性,因为它与学者赵红州在该领域拓荒式的研究密不可分。赵红州是一个传奇学者,物理学出身的他不仅独立发现了世界科学中心转移的“汤浅现象”,而且深刻地揭示“汤浅现象”发生的深层次原因是一个社会的科学能力。赵红州对世界科学史的计量分析,以及基于此对中国科学能力的预测和期许,得到了科学家钱学森、钱三强和钱伟长等的强烈认同,后经其推荐并由陈云同志批示于1986年9月1日成立了中国管理科学研究院。翌年,中国管理科学研究院科学学研究所就在赵红州领导下,率先利用美国《科学引文索引》(SCI)的数据,在《科技日报》上发布了《1987年我国科学计量指标的排序》,对国内86所重点大学的科研能力进行了首次排序。[7]无论是从科研能力这个概念构想(construct)的提出,还是选择对《科学引文索引》(SCI)数据的使用,以及对大学进行排序的做法,赵红州及其团队的工作都当之无愧地成为我国高校科研评价的始祖。在赵红州推出大学科研能力排序之后(1987-1989年),1992年湖南大学推出了《1992年全国86所重点高校1985~1989年科技活动评价》,紧接着1993年“广东管理科学研究院”发布了《中国大学评价》(武书连排行榜),自此中国排名式的大学评价实现了从北部地区到中部和南部地区的推进,完成了初步的社会构建。事实证明,无论是武书连中国版本的《中国大学评价》还是最初刘念才世界版本的《世界大学排行榜》,其所使用的概念和技术手段均未有超出于赵红州之外者。

如果说,基于科学计量学的大学科研能力评价,为我国高校评价奠定了范式基础,那么随此之后不断拓展的评价客体,则见证了该体系的不断丰富和完善。

1994年伊始国家教委(后改为国家教育部)便着手实施普通高等学校的本科教学工作水平评估。该项工作始于并相继经历了三种形式——合格评估、优秀评估和随机性水平评估。2002年,教育部将合格评估、优秀评估和随机性水平评估三种方案合并为一个方案,即《普通高等学校本科教学工作水平评估方案》,并从2003年至2009年对各类高校共1200余所展开评估, 这是我国规模最大、时间最长、影响最为深刻的周期性大学教学评价活动。而与此同时,几乎同步开展的还有教育部下属的学位与研究生教育发展中心开展的学科评估。自2002 年第一次学科评估开展以来,学位与研究生教育发展中心共开展了四轮评估,其中第一轮评估(2002-2004年)对229个单位的1366个学科进行了评估,第二轮评估(2006-2008年)对331个单位的2369个学科开展了评估,第三轮评估(2012年)对391个单位的4235个学科开展了评估,第四轮评估(2016)则是对95个一级学科(不含军事学门类)开展评估。[8]此时,国家已落子布局的高校学位点评估也已经在路上。我国高校评价的客体由最初的科研逐步拓展到教学(teaching)、学科(discipline)和学位点(program),可以说是捕捉到了大学学术制度的核心构成要素。

随着我国高校评价客体的不断增加,我国高校评价的主体也呈现出多元化的取向。如果我们从评价委托人、评价主体与评价客体之间的利益关联来看,我国目前的高校评价可以分为以下几类:官方评价、半官方评价和非官方评价。所谓官方评价,是指以政府为评价委托人,组织并聘请评价者对高校展开的评价,国家教委(后称教育部)所实施的普通高等学校本科教学工作水平评估便是此类。半官方评价,是指政府虽不是高校评价的直接委托人,却为评价委托人和评价主体提供了具体实施评价活动的准则,例如国家教育部下属的学位与研究生教育发展研究中心,按照教育部和国务院学位委员会颁布的《学位授予和人才培养学科目录》所展开的学科评估。而至于非官方评价,可以理解为评价并没有具体的委托人,评价主体可能来自高校内部(例如上交大排行榜),也可能来自高校外部,如某个专业领域(中国管理科学研究院)或利益相关群体(中国校友会网的中国大学排名),还有可能来自国家外部的商业机构(英国QS全球教育集团)等。

由于评价主体不同,以及评价委托人、评价主体与评价客体的利益关联不同,不同类型的评价对高校所发挥的影响也不尽相同。相比较而言,官方评价具有权威性,其评价结果可以直接用于引导政府的教育资源分配,而且它们对高校的影响可以直达高校运行体系内部,影响既直接且强大。半官方评价虽说是允许高校自愿参加,但实际上具有官方评价类似或同等的利益关联性,差别可能仅在于其评价指标和过程的决策表面上具有广泛的社会参与性。非官方的高校评价则因其评价主体与评价客体之间不存在直接的利益关联,因此对高校的影响既间接且有限,多数时候可能还会涉及咨询等相关业务的商业费用。笔者以为,这三种评价模式事实上展示了高等教育三大主体——政府、大学和市场——之间的相互构建关系。无论是官方评价还是半官方评价,政府都在其中起到了主导性的作用;相比之下,非官方评价则是更多地是市场驱动且市场在其中发挥着主导作用。

总结来说,自1987年推出第一期大学排名以来,我国陆续建立了以大学科研能力、本科教学、学科发展以及学位点为评价客体的多元高校评价体系。我国高校评价体系的建立,客观上强化了我国高等教育领域的质量意识,为完善高等教育质量保障体系奠定了基础。但是也正是这个体系的逐步确立,它在国家定向投放资源的过程中扮演了高等教育机构分化助推器的功能。事实上,我国绝大多数的官方和半官方属性的高校评价,对于高等教育机构来说都是高风险(high-stake)评价。也正因为如此,我国的高校评价一直处于风口浪尖之上,搅乱一池静水。

三、我国高校评价的不足与缺陷

虽然我国围绕高校科研能力、本科教学、学科以及学位点逐步建立起了多元评价主体的、日益制度化的评价模式与体系,但该体系建立并运行时间短,且在评价理念以及评价指标体系构建上存在着明显不足。这突出表现为:在评价理念上我国高校评价性质过于传统,基本上仍属于以测量、描述为主要特征的鉴定性评价,并表现为将高校从其所依存的社会情境中抽离出来,然后从理论上将其组织功能碎裂化为不同的观测点或指标,试图对其进行客观描述与测量,并在此基础上进行判断。这便是我国目前高校评价体系的两大核心缺陷——即评价指标对社会情境的抽离性(decontextualized)和碎片化(fragmented)特征,最终导致我国目前的高校评价对组织战略和国家战略的失焦

笔者试以较为知名的软科(上交大)世界大学学术排名为例加以说明。考察软科(上交大)评价体系可以发现,该体系主要是将国际可比性和可操作性作为核心考虑的要点,最终选择获诺贝尔奖和菲尔兹奖的校友折合数(简称Alumni,权重10%)、获诺贝尔奖和菲尔兹奖的教师折合数(简称Award,权重20%)、各学科领域被引用率最高的教师数(简称HiCi,权重20%)、在Nature和Science杂志上发表的论文折合数(简称N&S,权重20%)、被科学引文索引(SCIE)和社会科学引文索引(SSCI)收录的论文数(简称PUB,权重20%)、师均学术表现(简称PCP,权重10%)六项指标对世界大学的学术表现进行排名。

我们从它的指标选取上来看,可以发现除了该排行体系属于鉴定性评价,缺乏学生与院校发展的视角之外,仅从技术上来看它还存在着三大明显不足:第一是它将50%的权重赋予了发生概率极低的事件(获诺贝尔奖和菲尔兹奖的校友、教师折合数,以及在Nature和Science杂志上发表的论文折合数),而这会带来较大的测量偏差,这也就是该排名体系仅在排到100名次以后,便基本失去了分辨度的缘故;其次,在数据来源上该排名体系只选取了英文发表的论文,这样便将大量的基于本土需求的学术生产完全过滤掉了;最后也是最重要的,该排名体系的指标设计实际上是把一个学术组织的学术活动原子化为个体的学术获奖与学术发表,从而将现代大学有组织的学术活动其传递、创新与转化等深刻内涵过滤掉了。举例而言,中南大学与同样处于200-300名的其他中国大学相比,中南大学拥有中国高速铁路、高原铁路、重载运输的研学基地,为我国高铁的腾飞做出了重大贡献,且中南大学在若干领域拥有世界级的学派(如金氏理论、地洼学派等)。然而在软科的世界大学学术排名中,中南大学对国家、对学术界的结构化群体性贡献,被还原为个体发表篇目与引用量的简单叠加——大家都明白一把被融合锻造的剑和一堆散在的铁块在质量上也许是相同的,但其结构形态与社会价值意义完全无法等同!

另一个我国高校常常引用或对标的评价体系,是同样出身于中国管理科学研究院的武书连所主持的《中国大学评价》。与软科(上交大)的世界大学学术排名不同,武书连的评价体系设有人才培养和科学研究两项一级指标。其中,人才培养一级指标下设本科生培养、研究生培养两项二级指标。本科生培养的二级指标下又设14个三级指标,分别为本科毕业生就业率、新生录取分数线、本科教学评估结果、全校生师比、本科毕业生数、教师平均学术水平、双语教学示范课程、实验教学示范中心、特色专业、教学团队、规划教材、挑战杯本科生学术竞赛奖、本科数学建模竞赛奖、本科教学成果奖。在这其中10项指标为国家有关部门公开的数据,而新生录取分数线、全校生师比、本科毕业生数等3项指标则是根据国家有关部门公开数据为基础计算出的数据。教师平均学术水平指标是为提高本科生教学质量而设定的,其中教师数量是国家有关部门公开的数据。再比如,武氏指标体系在科学研究指标下设自然科学研究和社会科学研究二个二级指标,以及国内引文数据库论文及引用、国外引文数据库论文及引用、学术著作引用、艺术作品、专利授权、科学与技术奖、国家大学科技园共7项三级指标。其中专利授权、科学与技术奖、国家大学科技园等3项指标为国家有关部门公开的数据。国内引文数据库论文及引用、国外引文数据库论文及引用、学术著作引用、艺术作品等4项指标源于国内外公开出版的期刊。

显而易见,武书连的《中国大学评价》体系在指标选取上覆盖更全面、构成也更丰富,这无疑有助于提升评价的区分度,而且在相关指标评价所选取的数据方面,武氏体系也有效融合了国家有关部门的数据因而更契合中国的情境,但其指标选取的方式依然是将大学从其对所生存依赖的具体社会情境中抽离,并将其功能碎片化后逐一加以鉴定,既看不到学生发展与社会情境的连接性,也看不到院校发展与其所制定战略之间的连接性,特别是学科在将院校战略与外部社会情境相连接过程中所处的关键核心地位。

当然,我国高校目前常援引的还有一个外来的评价体系,它便是由总部设在英国的教育组织QuacquarelliSymonds所发表的年度世界大学排名(QS World University Rankings)。该排名的第一次发布是在软科(上交大)《世界大学学术排名》发布(2003年)后的第二年。但该排名体系在指标构建上与软科(上交大)世界大学学术排名完全使用硬性指标不同,QS体系大量使用主要依据于大规模全球问卷调查所获得的软性同行评价指标,此外它还增加了师生比与国际学生和老师的占比。具体来说,QS世界大学综合排名运用六个方面的具体指标来衡量世界大学的水平,这六个指标和它们所占的权重分别是:学术领域的同行评价(Academic Peer Review),占40%;全球雇主评价(Global Employer Review),占10%;师均论文引用数(Citations Per Faculty),占20%;教师/学生比例(Faculty Student Ratio),占20%;国际学生比例(International Student Ratio),占5%;国际教师比例(International Faculty Ratio),占5%。通过分析可以发现,QS排名中软性指标与硬性指标各占50%,虽然该评价体系增加了师生要素的考察,但其指标的碎片化特征更为突出。

对此,我们必须务实地看到,虽然我国高等教育机构分化的初始动力来源于高等教育规模的快速扩张,但它是伴随着我国作为全球化追随者姿态而确立的这一点却是毫无疑问的。无论是学者赵红州拓荒式的研究,还是软科(上交大)世界学术排名的勇敢抛出,抑或是我们对QS排名的接受,中国学术界勇于在不平等体系下接受知识竞争和科研能力挑战的姿态,既鲜明又凸出。事实上,“世界一流大学”这个概念是中国制造的,欧美并无此概念。对于欧美而言,他们就是世界。中国站在世界体系的外围和下端,要成为“世界的”,首先便需要与之融合。而这也就决定了在这一阶段,我国建设世界一流大学最核心的评价需求,便是要获得国际高等教育界的关注与认可。软科(上交大)“世界大学学术排名”酝酿推出的时间正是中国成功加入世贸组织之后(2003年首次推出)。

然而,随着我国成功地融入全球化的进程并加入全球经济的产业链,我国高等教育发展的外部环境发生了根本性的变化。2011年,中国超越日本成为世界第二大经济体,时年制造业规模超越美国跃居世界第一。也就是在此时,2011年11月美国在夏威夷举办的亚太经济合作组织峰会上提出了“转向亚洲”战略,翌年美国防长在香格里拉对话会上正式提出美国“亚太再平衡战略”,宣布美国的全球军事部署将实现朝向亚太的转移,该战略得到其盟国日本的积极追随与配合,一直想韬光养晦的中国被美国及其盟国战略锁定。为了应对美国向东方的战略调整,2013年我国领导人提出了西进的“一带一路”倡议,该倡议于两年后落地。2015年,我国正式推出《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》的行动计划,中国由全球化的跟随者被“逼”成长为全球化的潜在领导者。也就是在这年的年底,我国发布了“统筹推进世界一流大学和一流学科建设总体方案”,即所谓的“双一流”建设方案,而这正式开启了我国高等教育建设模式的变化——由世界高等教育发展的追随者,转而变为高等教育的自主发展者(如果还不是引领者)。

这一重大改变提出了改革我国既有高校评价,建设与中国新阶段相适应的新的评价体系的客观要求。

四、重建连接性——我国“双一流”高校评价之构想

如前所述,我国的高校评价体系是在科学计量学范式下建立的,而且具有强烈的管理主义倾向。这正如我国最早的大学排名,是由中国管理科学研究院这个新机构所构想并推出的事实里所蕴含的。

管理主义倾向的高校评价模式,暗含着这样的管理者与评价者关系——评价者的角色主要是技术性的(资料收集、分析和阐释),只有管理者是真正的决策者。而这就带来一个根本性问题,即评价者是无权对管理者进行评价的,特别是他们为评价所设立的目标与理性意义系统。于是在实践中,很多时候高校评价所做的不过是如美国著名评估学者古贝所调侃的,考察人们在不重要(甚至错误)的事情上究竟做得有多好。[9]在对管理主义倾向评价模式的反思上,美国是付出了代价的——直到苏联卫星发射上天以后,美国人才意识到这种看似科学却忽视价值判断的管理者本位的评价,不仅没有促进美国在科学技术上的突破,反而阻碍了科学家可能的创造性。在之后的美国科学基金会的改进计划中,很多评估者被项目开发者开除,随之不见的便是他们服务于的那些评估目标。[10]

笔者以为,美国所走过的历程以及所曾付出的代价,正困扰并阻碍着我们的前行。为此,笔者试提出“双一流”高校评价的改进思路,以对学术同仁起到抛砖引玉之用:

(一) 实现高校分类评价

学界与社会都开始意识到,我国高等教育机构按世界、全国、全省、地方、高职高专与民办的分层体系,存在潜在扼杀我国高校对环境适应多样性的不良后果。而又有鉴于我国高校评价体系已构建了科研能力评估、学科评估和学位点评估,基于这三项高校评价的制度要素,对其重新排列组合,可得到对我国高校分类的新构想,如下表所示:

表1:基于科研能力、学科与学位点评估的我国高校分类

即,把我国高等教育机构按知识的广度(学科数)与深度(学位层次)分为博士授予型高校、硕士授予型高校、学士授予型高校、专门机构型高校、大专学位授予型高校以及民办院校六大类,然后在每一类中又根据其研究活动水平的高低和活跃程度(科研能力),将其分为研究型、(升学)过渡型、就业型和混合型等亚类型,最终可以将我国高校划分为18种类型,从而放弃C9、985、211等“数字工程”型的高校分类。这样,我们便无需再用一套指标排尽天下高校了。构想中新的高校评价,将依据不同类型高校对环境适应生存所产生的组织职能,按其有效性水平建构评价的标准。对此,笔者将另行专文论述。

(二) 提炼关键性综合指标

应该说,我国目前的高校评价体系在指标构建上已取得很大进展,尤其以武书连大学排名和软科(上交大)世界大学排名为代表。但也正如本文所分析的,由于评价模式的缺陷,我国高校评价的指标体系构建,具有对所依存社会情境的抽离性(decontextualized)和碎片化(fragmented)缺陷。据此,笔者提出应该提炼关键性综合指标的观点,重建大学与其所依存社会环境的连接性。

笔者提出以下综合性指标:1)以国民素养与劳动经济参与水平,作为衡量高校教育教学的两个关键综合性指标。其中,国民素养是指学生对国家历史与文化、政治、经济与社会有充分的理解,并能有效参与国家治理和国民生活;劳动经济参与水平是指,学生进入社会劳动经济体系并能进行有效参与的能力状况。笔者以为,应该对不同类型的院校应采用不同的指标,而不是对其使用共同指标但不同标准(如就业率)。北大、清华的就业率高并不能表征其教育教学的成功。像北大清华这样旨在成为“世界一流”的高校,我们要考察的是该校毕业生跨国(境)劳动经济有效参与情况,这可能是由其国外留学生返回所在国所带来的,也可能是其国内学生通过服务国企海外拓展或是单纯的跨国(境)就业所带来的。类似的,对于专门机构,我们可以考察该类院校的学生在所对应的专门性行业里的就业与职业活跃度。2)以学术(理论)流派形成与科研产业转换能力与贡献,作为衡量高校科研能力的两个关键综合性指标。这并不是说考察高校论文数与引用率等科学计量学特征不重要,而是说要在此基础上考察我国大学的结构化群体性(collective)的贡献。关于该类指标的构建,笔者将单独行文专门论述。

(三) 在评价模式上,逐步实现鉴定性评价与建构性评价模式的融合

正如《第四代评估》作者古贝所倡议的,我们应该将利益相关者的主张、焦虑和争议作为决定高校评价焦点所需信息的基础,而不仅仅以管理者的主张作为决定高校评价焦点所需信息的基础。这是因为利益相关者是真正承担评价风险的群体。高校教师是大学教育教学和科研活动的真正承担者,也是高校评价风险的最大影响人群。事实上,高校教师对各评价指标在具体组织情境中的意义和内涵有更为深刻的理解,就像美国国家科学基金会项目中的科学家能清晰认识到很多针对项目的管理主义评价事实上阻碍了他们创造力的发挥。奈何,我国目前的高校评价,无论组织内部还是组织外部,那些敢于表达不同主张与焦虑的教师都被视为改革的阻力,受到消极对待。国内很多专家开始对这种管理主义倾向的高校评价可能带来的风险忧虑重重,即高校教师不断地被评价者在不重要(错误)的方向上考察其做得究竟有多好。[11]是时候停下脚步,反思一下我们的高校评价目标与模式了。若等到“双一流”建设完成,再多的补救措施与民族危机意识也会因为来得太晚而无济于事。

笔者衷心期待在“双一流”建设中我们能产生新的高校评价体系。这个新的评价体系,能凝练我国高等教育发展与社会经济发展相互融合促进的成功模式,并在一定程度上衔接东亚高等教育模式——以儒家文化为基础的学生高投入与社会高投入以及和国家强有力的发展导向的三者结合,最终实现用自己的标准引领我国高等教育成长为地区领导者,进而跻身于世界高等教育之林的强国目标。(作者罗燕,博士,清华大学教育研究院副教授,主要研究领域为教育社会学,教育制度分析与改进、大学生评价等)

参考文献: