李金华：学术评价环境正在悄然发生变化-语言与人工智能重点实验室

评论观点

您当前的位置 : 首页 >> 其他栏目 >> 评论观点 >> 正文

李金华：学术评价环境正在悄然发生变化

发布时间：2018/06/26 10:30:09

在学界，评价一篇文章的学术水平，往往视其发表在何种级别的期刊，倘若期刊的级别高，那么论文的水平就高。这样一来，学术评价客观上就体现为对期刊的评价。随着现代科学技术、特别是信息技术的快速发展，学术期刊的编辑、出版已呈现一些新动向，学术评价的环境正悄然发生变化，这种现象值得关注。

不再膜拜影响因子

我们看到，曾经一度备受推崇的期刊影响因子（Impact factor，IF）渐次失宠，对期刊评价的影响力不再如初。众所周知，期刊影响因子由美国情报学家和科学计量学家加菲尔德（Eugene Garfield）等于1963年提出，并最先应用于汤森路透公司的期刊引证报告，长期以来一直备受学界追捧。在中国，影响因子更是被视为评价期刊级别、反映学者学术水平的关键性指标。不过，影响因子在使用中一直饱受争议，就连这一指标的设计者也承认：即便一篇文章发表在顶级期刊，它也可能永远不被人引用，故而以影响因子来评价期刊，评价一个学者的科研能力和科研水平，都是不合理的。该指标的设计者们同时也坦承：SCI数据库仅仅是一个评估工具，而不是评估学者科学研究能力的严格标准。

近年来，影响因子再度引发关注，2016年7月，汤森路透宣布出售旗下的知识产权与部分科技业务，其中包括Web of Science、Thomson Innovation、Thomson Reuters Cortellis 和Thomson IP Manager等，令学界震惊的是出售的业务中竟然还包括了风行全球的SCI。无独有偶，美国微生物学会也在官网上宣布，旗下期刊不再支持影响因子，承诺不向研究人员宣传和推广影响因子，并将所有的影响因子标识从期刊网站上撤下。该学会认为，影响因子是一个扭曲的评价系统，它损害了科学本身，阻碍了科研工作的交流。在中国，久负盛名的《中文社会科学引文索引》（CSSCI）于2017年1月剔除了6家高校学报，更引发了期刊界的热议，一些学者批评中国学界过度注重学者在高影响因子刊物发表文章，导致了中国优秀学术资源和大量科研经费的严重外流，倡议不再膜拜影响因子，重构期刊学术评价体系。

数字期刊将占据主导地位

与新媒体融合发展，期刊数字化逐渐成为主流。2015年2月，美国期刊协会正式推出“期刊媒介360”方案，该方案建立了一套适应数字媒体时代发行和受众市场变化的全新的受众计量准则，规定了期刊的发行方式可包括印刷数字版、网络版、移动版、视频版和社会化媒体版等5种形式。可预见的是，国际学术期刊的内容将更多地以网页（Web）或者超级文本标记语言（HTML）等形式呈现，论文内容会更加丰富。

未来，数字期刊将在数字信息环境中占据主导地位、体现价值，而纸介质版本的期刊可能会退出历史舞台，只起保存馆藏之用。而且，随着数字文献保存优势和长期保存技术的提高，纸介质期刊的保存价值也会逐渐丧失。同时，由于对科研海量信息的快速需求，纸介质版期刊发行模式日益显现出局限性，科学家和学者越来越多地通过网络化集成平台来获取学术期刊的内容，越来越多地要依赖大型集成检索传播平台的强大功能。

正是在这种需求的趋动下，Google Scholar、Primo、Summons、百度等成为了学者进行学术研究的首选检索系统。一些跨出版社、跨图书馆的集成检索平台中高度集成的海量信息和灵活便捷的检索功能正成为学术论文检索、科研资源获取和传播的最佳手段，小型的单个期刊和出版机构面临生存危机，加入大型网络平台成为其生存和发展的必然途径。

评鉴机构面临方法论瓶颈

影响因子失势、学术期刊日趋数字化、集成检索传播平台应运而生，这种学术大背景的变化，客观上体现的是人们对传统学术评价准则的不认可、不支持。因此，我们有必要正本清源，厘清学术评价的本质，澄清学术评价的逻辑。

长期以来，如何评价学术期刊特别是人文社会科学期刊的水平，一直深受学界关注。关于其评价标准，国内的多家评价机构各执一词。事实上，一本学术期刊品质的优劣，根本的标志只有两个：一个是刊文水平，另一个是编校质量。刊文水平包括所发论文的理论意义、应用价值、对社会的贡献和产生的影响等；编校质量则包括所刊论文语言的流畅、标点的精准、引证的严谨、撰写的规范等。

刊文水平体现为期刊的内容，编校质量体现为期刊的形式。评判一本学术期刊的品质，或认定是否为权威期刊或核心期刊，本质上就是要评判期刊的发文水平和编校质量；将学术期刊按门类，如经济类、管理类进行评判排序，本质上就是要将期刊的发文水平和编校质量进行整体比较，这是期刊排名定序的逻辑起点，也是期刊评价应当遵循的根本准则。

期刊评判的客体是期刊，评判的内容是期刊发文水平和编校质量。任何一本期刊都是系列出版物，这就涉及期刊发文的时点和时段问题。期刊评鉴机构发布的信息表面上似乎是一个时点上期刊的状况，而实则是一段时期期刊的状况。因此，若以一个时点，如以某一期杂志的刊文水平和编校质量来代表整个期刊的发文水平和编校质量，显然样本是太小，由此作出的判断是不为真、不可信的。撇开编校质量不论，将不同学科期刊的发文水平进行评判比较，无论是对专家还是对评鉴机构的工作人员都是相当困难的。因为，任何一个专家都只是某个或某几个领域的行家里手，而不是通才。可以肯定，没有哪个学者敢放言能品鉴一个学科门类里所有文章的学术水平。现实中，即便对不同学科的单篇文章的学术水平、社会影响进行比较都十分困难，更何况是要比较不同学科的一批论文与另一批论文的学术水平。这里存在一个方法论瓶颈，是横亘在评鉴机构面前短期内难以破解的重大难题。

作定类描述是学术期刊评价的理性逻辑

比较评判期刊论文的学术水平，也就是要比较评判论文的意义、价值、影响和贡献等，这显然属于定性分析的范畴。现在一些学者总是乐于以定量分析取代定性研究，对任何需要比较评判的对象或事物，都企图通过一个数值给大众一个明确、清晰的说法。这种貌似精准确定的结论，实质上给人的是一种错觉，是自然科学思想和科学方法对人文社会科学的束缚和绑架，这不但无助于人们对客观事物的正确认识和判断，反而十分有害。

特定环境和条件下，以定量的方法研究需要定性分析的问题，会得出相对明晰、能让人理解接受的结果，但并不是任何场合定量分析都可以取代定性研究。包括经济学科在内的人文社会科学中的许多现象，有其特定的发生背景、特定的内涵实质和特定的表现形式，很难将此类复杂的系统结构和逻辑思维过程勾画成一个坐标系，以十分制或百分制的刻度来精准计量。诚如法官断案，有罪无罪只能定性判断，通过任何模型或打分来对案件定性都是危险的；对历史人物的功过评判，也只能是定性分析，功是功，过是过，功过不能相抵，试图以正负数和十分制计量人物的功过也是不科学、不理性的。

一如定性分析的基本要旨，对学术期刊的评判可分为三个层次：第一层次是现象描述，这需要真实；第二层次是逻辑分析，这需要客观；第三层次是价值判断，这需要公正。三个层次中，现象描述和逻辑分析比价值评判更重要，评判心态比评判方法更重要。三个层次中，越往后主观性越强，对评判者专业水平和素养的要求越高。这种复杂的人类认识和认知过程，以任何定量模型、计量分值或当量值都是难以精确刻度的。即便有结果推出，也很难经得起推敲和实践的拷问。

人类需要理性地认识自己的能力，对既有环境和现实有较清楚的认识和判断，有所为，有所不为。学术期刊的评价是无法用数理化描述的，也是无法用自然科学手段来研究和表达的。知名的期刊可能发表低水平的文章，而不知名的期刊可能发表高水平的文章。一本期刊此时刊发了低水平论文，而彼时可能刊发高水平论文。因此，遵循二元评价准则，对学术期刊的发文水平和编校质量进行定性分析，作定类描述，粗略分出期刊的等级而不是打分排名，这是学术期刊评价至为理性的逻辑。

（作者系《数量经济技术经济研究》常务副主编、中国社会科学院研究员）

延伸阅读

学术评价存在的问题、成因及其治理

张耀铭（《新华文摘》原总编辑、编审）

学术评价乱象之根源

学术评价从来不是一个孤立的问题，其与学术风气、学术研究、学术期刊、学术管理、学术体制、学术利益等都有着密切的联系。如果把所有的“罪恶”都归咎于学术评价，显然有失公平。这种认知的谬误在于：把不应由学术评价承担的责任归咎于学术评价。这既无益于去除学术评价之弊，亦无助于重建学术评价机制。当下学术评价的种种乱象，说到底根源有四：

第一，官本位意识导致学术资源、学术权力的不公平。

中国社会官本位意识严重，权力崇拜根深蒂固。早在十多年前，北京师范大学历史系黄安年教授曾将当时官学一体化的倾向概括为十个方面：(1)学术机构的管理衙门化；(2)职称评定、专案立项、评奖活动中的“赛跑”现象；(3)学术评价中的官僚主义和形式主义；(4)政府官员兼任学术专案主持人日益增多；(5)政府官员兼任院校长的现象有增无减；(6)学术刊物主编官员化倾向突出；(7)职称评定、奖金、住房等待遇向行政官员倾斜的力度加大；(8)“腐败文凭”中的权钱学交易；(9)学界新闻出版活动突显政府官员和行政领导；(10)一些学术团体的官方色彩明显。[36]这些年来官本位没有淡化，“不但没有淡化，反而正向社会各个领域蔓延。比如学术领域，是最不应该有官本位的，比如评教授要有成果，按照正常理解，应当是文章质量，但现实中我们却看到刊物分等级，有国家级、省部级，甚至出现地厅级，学术也开始官本位化。”[37]“官大学问大，权大经费多”已成为一种社会常态。官员们不仅垄断学术资源、项目资源、招生资源、会议资源，而且还把权力之手伸到职称评审、成果评定、课题立项、课题报奖等多个方面，“管理者通吃”已经成为高等院校、科研院所的一种特有现象。“领导者在学术与利益互动的竞争中，不能表示出应有的学术自信和道德品格，自己利用权力和权威占有和夺取下属和学生的成果，构成一种公然的‘学术剥削’；而下属和学生为了实现自己的利益需求和生存安全，而主动的请领导分享甚至完全出让自己的学术成果，对其进行一种‘学术贿赂’”。[38]学术不公正的结果，不仅带来学术权力的异化与研究者的精神变异，更带来学术的社会性危机。

第二，“一刀切”的量化评价导致学术生产的数量繁荣质量下降。

我国所有的高等院校、科研院所，不论文科理科，基础性研究应用性研究，都执行着一个制度化的、量化的、“一刀切”的学术评价体制。“科学研究在今日之中国高校，被抬高到空前的、过度重要的位置。不说研究型大学，即便是教学型乃至职业型学校，学校是否优秀，教师是否能够升等、研究生是否可以毕业，科研的成绩单成为最重要的衡量指标，甚至没有之一。老师的教学可以马虎、学生的毕业论文可以勉强通过，但只要有相当量的论文发表，便一俊遮百丑。多数高校对教师的年度考核和升等要求，都有严格的论文发表量规定，而一个大学每年的论文发表篇数，都影响到从官方和民间的各种大学排行耪的位置，是大学领导政绩工程的核心部分。于是千军万马写论文、拼数量，就像大跃进时期的全民大炼钢铁，产量是最重要的，而质量如何，倒是其次的。”[39]理工科普遍强调SCI的发文量和课题金额，人文社科则是SSCI、CSSCI和课题级别。不少高校或院系在年度工作考核中将学术评价与特定的量化指标绑定，实行“工分制”。同时，许多单位高度重视项目，甚至是“项目至上”、“项目唯一”。这种“项目化生存”的怪异现象和“一刀切”的管理方法，甚至扩大到各种学术和教育的考核、评比、提级提职、业绩考核、课题和项目的审批中，几乎达到了无孔不入的程度。过渡量化的评价模式，违背了大学学术研究的基本规律，抹杀了学科文化的差异，限制了合作、阻碍了深度研究，制造了很好看的数字，却失去了大学的精神。

第三，“评价标准异化”导致学术评价机构公信力的缺失。

笔者曾对“公信力”和“权威性”做过专文论述，认为“公信力的本质意义在于：第一，公信力映射的是一种公共权力，非公共权力也就无所谓公信力；第二，公信力是在长期的发展中日积月累而形成的信任资源，既是一种社会系统信任，同时也是公共权威的真实表达；第三，公信力指的是权力客体对权力主体在公正、公平、守信等方面的评价，获得权力客体信任、信赖的权力则具有公信力；第四，公信力权力主体与权力客体的非均衡性特征，决定了权力客体的弱势地位，一旦权力主体出现诚信、公正问题，必将导致信任的破裂。权威性，是指权力部门发布的信息或作出的决定是否具有相对的不可质疑性，如果这些信息和决定经常遭遇质疑，则不具权威性。公信力是权威性资源之一，一旦受到损伤，便会造成较大面积的‘信任危机’”。[40]学术评价的“公信力”，当然与其掌握的权力有关，而其所掌握的权力实际就是学术成果、学术期刊的评价权，能否公平、公正乃至公开地评价作者、作品及其期刊，是衡量其公信力的标准。为何目前学术评价机构公信力缺失？深层原因有二：一是学术评价标准的异化，二是学术评价过程的不透明、不公正。我们知道，引文数据库在建立的过程中，管理者和操作者发挥了非常重要的作用，指导思想、目标、要求不同，选择的统计方法与计算机软件不同，统计产生的期刊影响因子就很可能大相径庭。再加上评价指标的不完善、不科学及其先天性缺陷，使得核心期刊、来源期刊遴选的负面效应逐渐浮出水面。主要表现在以下十个方面：

（1）评价体系在获取数据时，违背统计学抽样调查原理，使原始数据和测评结果带有明显的生造臆断痕迹。表现在四个方面：一是单纯以复合影响因子、可被引文献比和转引率进行测评排序；二是混淆主体、客体，将办刊主体与期刊论文水平混合进行测评；三是迷信量化分值，以定量评分取代定性研究；四是将存量与流量混同，将主观指标与客观指标、时期指标与时点指标混用，或者以时点数反映时期现象，或者以时期数反映时点现象，随心所欲。[41]

（2）核心期刊评估体系存在着严重的时间滞后性与背离性。[42]滞后性在于：用过去的文评现在的刊，以现在的刊评未来的文。背离性在于：把期刊推举到核心期刊的论文，却不是核心期刊论文；而那些还没有指标贡献的论文，却坐享其成地成了核心期刊论文。

（3）引文索引来源文献存在致命的涵盖性缺陷。引文索引建立的重要理论依据之一是文献计量学的2/8定律，即经过筛选而确定的占总量20%的期刊上的论文可以满足学术论文引用需要的80%左右。显然80%的满足率是无法满足100%的需求的。在中文社会科学引文索引中，1998—2005年收录的近54万篇论文中，在1998--2007年间被引用过的论文篇数也只有30￥左右。因此，“来源期刊的论文并非篇篇都比非来源期刊的论文的影响大、质量高，非来源期刊的论文也并非篇篇都比来源期刊的论文差，完全按是否是来源期刊论文来评价论文和作者的作法有失公允”。[43]

（4）不同学科之间引用率存在不可比较性。首先，“热门”学科在某一个时期应用广泛，发展迅速，研究的人多，论文的影响因子普遍都高。“冷门”学科关注的人少，发展慢，研究的人少，论文的影响因子就低。其次，传统学科研究的人多，文章多，引用率也高。新兴学科研究的人少，文章相对少，引用更少。不能因此得出结论，前者的学术水平高，后者的学术水平低。再次，由于马太效应的影响，名人的文章引用多，无名的人的文章引用少，不能因此证明名人的文章篇篇都是精品。总之，理科和工科不可同比，人文学科与社会科学不可同比，应用学科与基础学科不可同比。特别需要指出，即使是同一学科不同专业的论文被引用情况，也有很大差别。比如图书情报学界，图书馆学、情报学与档案学、文献学之间的影响因子就存在巨大差别，文献计量学与文献检索学与版本学、校勘学更是一丈差九尺。

（5）不同性质的论文对期刊影响因子的影响是各不相同的。[44]学术论文由于其研究对象、内容、方法、角度的不同，其性质就不一样。某些热点问题（比如国家治理、中国经济新常态、一带一路等），写文章的人多，相互引证也会多，对期刊影响因子的贡献也就大。在高校文科综合性学报中，由于人文学科论文和社会科学、应用学科论文比重的差别而带来的影响因子差异，导致以人文学科为主的学报在评价系统发布的“排行榜”中普遍不高。当然有些热点问题，不一定都是重要问题。仅仅依据引用率一项指标，也不能说明论文学术水平的高低。爱因斯坦发现了相对论，但他研究相对论的论文发表之后，并未得到应有的较高的引用率。“往往一篇论文被大量引用，并不是出于它内容的精辟，而是由于它里面所谈方法的新颖。相当普遍的看法认为，被大量引用的论文中，方法方面的论文占很大优势”。[45]

（6）通过“策略性编辑”行为操纵期刊的影响因子。期刊影响因子目前在学术评价与科研管理中发挥着极具魔力的作用，所以大家都跟着这根“指挥棒”转，希望影响因子越高越好。其实，通过正当途径与方法完全可以提高影响因子，比如约请高被引作者撰稿，发表高质量论文，提高参考文献的编排质量，加快审稿速度、缩短发表周期，与国际著名学术出版集团合作“借船出海”，将录用论文在网站上提前发表等。除此之外，一些国际学术期刊“通过策略性编辑行为操纵期刊的影响因子，代表性做法包括：一是将预计被引次数较高的文章发表在年初的期刊上，并在官方网站上作“热点文章”推荐，以增加被引机会。二是控制质量不错但不属于热点文章的数量。三是发表一些不属于研究论文但是有利于提高被引次数的文章，如评论、商榷、社评等，尤其是作为非综述类期刊却大量发表综述文章，短期内可获得很多引用，四是下半年撰写社评大量引用本年度本刊发表文章”。[46]而在国内，有的期刊为了挤进核心期刊不惜造假，拉帮结盟互相引用对方的论文；有的期刊要求作者提交的论文必须引用本刊发表过的论文，以提高影响因子；有的期刊公开悬赏学者在CSSCI来源期刊发表引用该刊的论文，给予有偿奖励。此外，过度自引、错引、漏引、伪引、甚至歧视性的不引都程度不同的存在。

（7）引用目的存在多样性，包括批评性、批判性、反驳性的不同观点、意见的引用，即负面引用现象的存在。负面引用在定量标准中难以被识别出来，单纯或主要以定量而非定性标准来评判论文乃至期刊的高下，其片面性是明显的。

（8）用非科学的态度编造、捏造、任意取舍的实验数据，被称之为“学术造假”。而这些造假的数据，指标体系却难以识别和剔除，导致评价结果十分荒唐。

（9）评价结果软化，共享程度不高。“目前的许多评价共享程度不高，或者说因为公信度不够，无法为人所信服，因此很难达成共识，其评价结果很难为其他相类似的评价应用。”[47]

（10）评价体系浮躁。“目前的评价体系也浮躁，尚未成熟，不能将有限功能无限化，尤其是将期刊评价、定级视为主要功能的核心期刊评价体系建设，导致了话语权、支配权、利益和地位的争夺，发布排行榜，使学术研究变味，造成了争名夺利的浮躁现象。”⒀

第四，不合理的科研体制才是学术评价乱象的根源。

官本位意识、“一刀切” 的量化评价、“评价标准异化”，几种原因的叠加，使学术评价乱象纷纭。但最本质的根源，在于不合理的科研体制。朱剑教授曾撰文，为我们勾勒了一条清晰的权力和利益的关系链（当然也是工作链）：权力（资源）——评价（分配）——评价（管理）——科研（机构与人员）。链条的顶端是握有巨额学术资源分配权的行政权力部门，链条的底端是科研单位和学术界，串联起顶端和底端的是评价，而规约这一链条的则是科研体制。“评价对行政权力部门的迎合固然是其异化的原因，但若没利益链的存在，就不会催生出这么多的评价机构；若没有规约利益链的科研体制的需要，评价也不至于如此走人歧途。”⒁因此，与其说是学术评价导致了学术乱象，不如说是科研体制导致了学术乱象。

学术评价乱象的治理

学术评价乱象已成为一个社会问题，事关学术研究、学术传播、学术体制、学术利益、学术生态以及社会风气诸多方面。“当下中国学术期刊面对的评价机构之多、受影响之大，已经让学术精神、学术勇气乃至学术道德频临崩溃。”[49]针对学术评价存在的种种弊端，专家学者们已经提出了很多改革的建议，但要进行变革却是一件十分困难的事情。正如鲁迅先生所说：在中国，搬动一张桌子都要付出血的代价。因此，仅有底层呼吁是不够的，改革必须要有“顶层设计”。2013年以来，教育部先后下发了《关于深化高等学校科技评价改革的意见》《高等学校科技分类评价指标体系及评价要点》《关于开展高等学校科技评价改革试点的通知》等文件。2015年1月12日国务院又发布了由科技部、财政部共同起草的《关于深化中央财政科技计划（专项、基金等）管理改革的方案》,总体目标是“强化顶层设计，打破条块分割，改革管理体制，统筹科技资源，加强部门功能性分工，建立公开统一的国家科技管理平台，构建总体布局合理、功能定位清晰、具有中国特色的科技计划（专项、基金等）体系，建立目标明确和绩效导向的管理制度，形成职责规范、科学高效、公开透明的组织管理机制，更加聚焦国家目标，更加符合科技创新发展规律，更加高效配置科技资源”。这虽然都是针对科技改革、科技管理、科技评价，但无疑昭示了科研体制改革的方向，对哲学社会科学也是有参考价值的。因此治理学术评价乱象，必须立破并举、多管齐下、统筹协调、优化整合，才能标本兼治、扶正祛邪、鼓励创新、融合发展。

（一）建立学术评价机构准入制度和退出机制。

准入制度，应该是国家对评价机构主体资格的确立、审核和确认的法律制度。政府职能部门通过批准和注册，对机构的评价准入进行管理，既避免了大量人力、物力浪费的重复建设，又可以防止评价机构无序、无资质进入过度竞争，确保学术评价的公平、公正和工作效率。同时要探讨建立学术评价机构的退出机制，不能胡评价、乱评价，甚至老少通吃、权力寻租、金钱交易。准入制度、退出机制的建立，有利于优化学术评价资源配置，营造良性竞争环境；有利于评价机构的创新，壮大整体实力；有利于加大违规成本，确保评价的导向性。

（二）加强学术评价的回避制度和监督机制。

学术评价关系期刊定级、职称评定、教师考核、课题验收、学校评估等方方面面，关涉许多人的切身利益。因此，谁主导或掌控了评价权，谁就能左右当今中国的学术导向甚至具备了向学术界发号施令的权威。目前开展学术评价的机构或为中国社会科学院或为教育部下属的高等院校，不仅具有官方色彩，更与学术研究、学术期刊有着千丝万缕的联系，不免有既当裁判员又当运动员之嫌。在没有产生相对独立的第三方评价机构之前，必须加强学术评价的回避制度，保障学术评价制度的程序正义。那些与被评价主体有利害关系或者其他特殊关系的相关人员不得参加学术评价活动，实现利益规避，以保障被评价主体的公平竞争。要积极开展学术批评，加大媒体曝光，对学术评价机构、学术评价程序、学术评价结果进行有效监督，形成有力制约，使之心存畏惧。

（三）规范并完善同行评价制度。

早在2011年11月7日，教育部下发的《关于进一步改进高等学校哲学社会科学研究评价的意见》，就提出要正确认识SCI、SSCI、CSSCI等引文数据在科研评价中的作用，避免绝对化；并特别指出：“建立开放评价机制，基础研究以同行评价为主，大力加强国际同行评价”。同行评价是国内外公认的最为合理的学术评价制度，但在引进中国之后却发生了变异，“权力支配，人情主导，标准缺失，三者只要居其一，都会使学术评价的意义受到严重损害；可是，在我们当前的学术评价中，往往是三者一起发生作用，多路夹击，来自欧美的同行评议，怎么可能不水土不服以致彻底变异呢？”[50]因此，要严格标准，规范程序，完善专家遴选机制，建立公平公正的学术评价的基石。应综合考虑知识结构、学术成就、学术道德、“小同行”等因素来确定专家人选并建立专家库，发挥各学科专家的群体优势，调动各学科专家共同参与、共同制定相关的评价标准，实行专家定期轮换制度。要建立和健全评价结果公示、反馈、申诉、复议等制度，对同行专家的评价行为进行有效的制约，加强评价专家信誉制度建设。

（四）用“以文评刊”取代“以刊评文”。

核心期刊的概念被引入国内以之后，主要目的是为图书情报部门选购期刊提供参考依据，为图书馆员指导读者阅读提供参考依据，“不具备全面评价期刊优劣的作用，不能作为衡量期刊质量的标准，更不能作为学术评价的标准。”[51]但行政权力部门出于科研管理的需要，看准了核心期刊的“可行”、“简便”等工具理性，使之直接为资源配置和科研管理服务，由此“以刊评文”开始走红。“以刊评文”的弊端前文已经涉及，这里再做简单概括：一是以期刊的等级代替论文的学术质量，存在着明显的逻辑错误。并非核心期刊发表的文章篇篇都优质，非核心期刊上发表的文章篇篇都劣质，即使同类核心期刊或同一种核心期刊发表的论文也并非同一水平。二是机械地依据期刊影响因子来决定期刊的排序，必然导致学术评价的过分形式化、过分简单化。三是过分注重论文数量、获奖数量，必然导致平庸之作泛滥、低水平重复。四是为了迎合核心期刊、来源期刊评选的偏好，不少学术期刊更在选稿、用稿和参考文献等方面投其所好，逐渐丧失了独立风格和创新活力。五是过度追求论文被国外检索机构收录，必然导致学术评价中的崇洋媚外。“以刊评文”早为学术界诟病，应该用“以文评刊”取代。

论文是组成学术期刊的最小单元，论文水平的高低决定着期刊质量的优劣。所以，“要正确全面反映期刊的情况，较好的办法是‘以文评刊’，通过对期刊刊载论文的学科进行统计分析，计算出其各学科论文的篇均被引次数，并与统计源所有各学科论文的篇均被引次数进行比较，从而得到各期刊各学科论文的相对影响，即期刊刊载论文的学科影响。期刊刊载论文的学科影响可以根据不同的需要从不同侧面、不同角度来量化地衡量期刊的影响”。[52]论文评价应该成为学术期刊评价的核心内涵，要根据一定的评价目的采用一定的评价指标，但更重要的是通过同行评议，作出专业的、权威的、有说服力的评价结果。当然评价学术论文，期刊编辑、目标读者不能缺位。因此，“研制出针对单篇论文的评价指标体系在论文评价、期刊评价中均占有决定性的基础地位。需要社科学术期刊界和文献计量学界通力合作，共同攻克这一难题”。[53]

（五）建立独立的、客观的、民主的学术评价机构。

学术评价的本来意义，“在于评判学术的进展，鉴别学者的贡献，规范学术行为，激发学者的创造力，以达到推动学术发展的目的”。[54]为了使学术评价真正具有公信力和权威性，必须要实现从官本位到学术本位的转变，把对学术评价的权力从官方色彩的框架中剥离出来，建立独立的、客观的、民主的学术评价机构。“学术评价、学术的标准、学术上的分歧，所有学术上的问题只有依靠学术共同体才有可能得到解决。尽管学术共同体也有可能做出错误的判断和决定，但没有别的更好选择。”[55]评价的根本在于独立和客观，应当以学术水平、学术道德为标准来选择评审专家，应当独立进行分析、评价并形成专业意见，应当通过学术交流、学术批评、学术评论等“民主”的方式表达意见和进行监督，以排除评价对象、利益群体、官方机构的干扰，防止出现与权力行政部门主导学术评价相类似的问题。我们呼吁文献计量学界和学术期刊界的专家学者，不要沉浸于排行榜所带来的权力与利益之中，要聚集大家的智慧，进一步研究和夯实学术评价理论，以求取得实质性突破，以此带动我国学术评价的健康发展。（稿件节选，有删减）

文章转自微信公众号“人大复印报刊资料”。

上一篇：参与互联网教育国际标准制定伟东云教育让“中国标准”走向世界下一篇：教育部长陈宝生：不抓本科教育的高校不是合格的高校！