在我国,高校招生录取的唯一依据是高考分数,即使是自主招生,也是采取降分录取,仍是以考试分数为最后的准则,于是就有了社会上将分数看作“真金白银”的现象。那么,分数对于人才的选拔果真是“真金白银”吗?去年9月,美国斯坦福大学、麻省理工学院、芝加哥大学、加州大学伯克利分校的四位招生官,以及纽约考评局技术总监与中国多所“985”“211”高校招生办公室负责人齐聚北京大学,就中美顶尖大学人才选拔工作进行了研讨。通过理念阐述、实证体验,与会者一同探讨和分享了美国高校招生经验。虽然高校招生工作要基于一国一地的实情,也不是简单模仿可就,但这样的研讨还是让人们对人才选拔尤其是顶尖人才的选拔工作有了更多启发,本文作者是与会者之一,且常年从事高校招生工作,其认知和反思尤其有意义。
在考试方面,分数说明了什么?
美国有SAT、ACT等全国性考试,高校在招生中自主使用。SAT考试是学术能力评估测试,该考试自1947年起建立了标准分数常模,使考试可以像一把带有粗略刻度的尺子,对学生的能力水平进行测量。在长期的实践中,社会,特别是高校、考生建立了分数与能力优劣的对应认知,如,大众有对2100分或1800分所表达水平高低的基本认知。同时,SAT标准分数常模一直沿用至今,说明考试这把尺子的刻度相对稳定,故无论何时考试,其成绩均具有可比性,可多年使用。美国考试的这种设计,契合了高校人才选拔的基本需要,一则,有助于高校了解考生胜任高校学业的能力;二则,为一年多考;三则,为一次考试多次使用创造了条件。
我国有《普通高等学校招生全国统一考试》,简称高考,高校按高考成绩依考生志愿择优录取。在这种单一评价录取模式中,排位决定了考生的优先选择机会,排在前面的考生先于后面的考生选择志愿高校。故在本质上,高校录取并非依据分数本身,而是依据分数形成的排位(同分者依据比小分规则确定排位),高考成绩表达的是考生排位。其中隐含着三个问题,其一,公平性问题。从考生排位看,依据成绩确定的排位会因考试内容、难易度的变化而变化,也就是说考试的内容不同,考生的排位会发生变化;题目的难易度不同,考生的排位也会发生变化。考生通常对考题难易变化带来的影响体会最深,擅长解答难题的考生,在考题简单化之后,其原有的优势没有了发挥的空间,排位可能会随之后退。从高校招生看,高校应该招收适合的学生,不同层次高校对考生的能力要求是有差异的,高水平大学以培养创新人才为目标,通常希望进行一定难度的考试,选拔更具挑战性和发展潜质的人才;高职高专院校则希望对考生进行一般考查,了解其基本学习能力。在高等教育大众化的今天,这种差别化的需求更加凸显,且无法在一次考试中满足。故而,在高水平大学招生中,低难度考试,对擅长解决难题与应对挑战的考生不公平;在高职高专院校招生中,高难度考试,对于不擅长解决难题的考生不公平。其二,科学性问题。从测量角度看,在录取率达80%~98%的考试中,一纸考试难于承载如此之大跨度的有效区分度测量。再有,由于考试一直未建立标准分数常模,致使考生一年一考,一年一排位,成绩一年有效,高校、考生难于建立分数与能力水平的对应认知;其三,功能性问题。为高校选才的考试,命题的内容、难度应以高校需要为依据。现今,由于高考录取率较高,加之行政管理期望等因素,致使各省高考命题较20世纪有明显的简单化趋势(一些省份,一本线在一年间提高70~80分,提档线在670分以上的高校达数十所等现象均说明了这一点),以至于偏离了高校,尤其是高水平大学的人才选拔需求。
在评价方面,分数发挥了什么作用?
美国高校,尤其是高水平大学普遍采取“伯乐”式综合评价,是一种人为的相对主观的选才模式。评价的材料包括申请人的中学成绩、SAT或ACT或AP课程考试成绩等学术因素,以及课外活动、志愿服务、推荐信等非学术因素。评价维度主要聚焦在7个与成才密切相关的智力能力和个人品质,包括:创造思维、学习激情、开放与包容、社会服务、毅力、沟通能力、领导力等。这种综合评价着眼于社会的发展需求,来源于高校的使命担当,依据于成才要素的理论研究,植根于实践的检验分析,并引导大众建立全面而有特长发展的成长观念。
美国的综合评价是建立在社会对考试成绩的理性认知和诚信基础之上的。在考试分数认知方面,美国高校通常认同高分者高能,但不认为成绩高一分能力也长一分,成绩越高越优秀。因为,一方面,考试评价自身有误差,且考试中考生一两道题发挥不好不能说明水平上的差异;另一方面,高校通过对在校学生的跟踪分析,学业发展还与其他因素相关,所以,高校不会因为学生成绩的1分之差,甚至数十分之差而改变对其的评价。如,在SAT成绩的采用方面,高校通常会根据往年的招生经验,大致设定一个SAT的基本合格标准,达标后,则更多关注学生的其他所长。在一些高水平大学看来,2100分与2200分、2300分没有大的差异,表达的只是学生胜任高校学业方面的能力。而在我国把分数视为“真金白银”,每一分均决定录取结果;在社会诚信方面,美国社会的整体氛围是诚信的,有关招生人员是公平、公正的,违规是少数,且一经发现必将受到严厉处罚,这些均为采用主观性的综合评价选才创造了条件。
我国恢复高考后,一直按高考成绩来选拔人才,是一种以分数为量化标准的客观的选才方式,尽可能地减少人为的评价。以至于时至今日,仍有很多人没有“评价”的概念,认为考试就是评价。考试只是提供了一个评价的参数,如何使用这个参数选人才是评价,美国使用“申请人”与我国使用“考生”两种称谓也从侧面印证了这种情况。单一评价相对客观,在诚信氛围尚未建立的今天,是一种求其次的博弈选择,体现了公平,但也暴露出两个问题:其一,科学性问题。多元智能理论表明人的能力是多元的,社会各行各业对人才的需求是多元的,不同定位高校对人才的需求也是多元的,而仅依照分数的评价却是单一评价,多元与单一无法对应,难免存在矛盾,进而在一定程度上影响高校人才培养;其二,健康发展问题。单一评价导致分数在选才中的作用被过度强化,有学生把分数当作“命根”,有高校将其看作生源的“质标”,故而便有考生、高校对高一分的“极致”追求,从而产生应试训练、唯分数论、生源恶性竞争等一系列教育问题。应试在提升成绩方面是有效的,升学的压力越大应试训练强度则越高,多地出现军事化管理的高中也就不足为奇了。长久,且重复、被动的应试训练,极大地扼杀了学生的学习兴趣和探究主动性,让青春年华“花样”不在。
国家考试招生制度深受社会、经济、文化等多方面因素影响,故世界上多种考试招生模式并存,各有特色,并发挥着积极作用。我国与美国在选才方面有较大不同,应在尊重教育发展和人才成长规律,着眼高校责任与使命的基础上,探索适合国情、符合国策的招生模式,只有这样才有助于高校在实施创新驱动战略的今天发挥重要作用。目前一些高水平大学探索的综合评价(高考加校考等),一些省份正在推进的两依据(高考、高中学业水平考试)一参考(高中综合素质评价)模式,都是积极而有益的尝试。 (作者:虞立红,系北京师范大学招生办公室主任转自:阳光高考)