智力测试的黑历史

36氪的朋友们 · 2020-08-11
从智力测试到优生绝育再到灭绝人口的种族主义,也许就一线之隔。

编者按:本文来自微信公众号“明白知识”(ID:mingbaizhishi),作者:明白知识er,36氪经授权发布。

智力测试,想必大家都不会感到陌生。

通过回答测试题中有关语言表达、理解能力、逻辑和记忆等方面的问题,受试者可以得到一个表征自己智力水平的分数,也就是我们常说的「智商」。

有些名人的智商相当高。

美国著名脱口秀主持人奥普拉·温弗瑞(Oprah Winfrey),以及美国流行巨星麦当娜(Madonna),美国前国务卿希拉里·克林顿(Hillary Clinton),智商高达140。

不过,不是所有的名人都有一个漂亮的智商分数。根据学者们的研究,美国前总统小布什(George W. Bush)的智商大致为120,仅为美国大学毕业生的平均智力水平。

最搞笑的是美国总统川普,十分得意地公开夸耀自己的智商乃是最高的。据说他的智商测出来有156,不知真假。不过,这么炫耀智商,反而让人有不敏之感。

川普曾多次公开谈到自己的智商,并对此充满骄傲。图为川普2013年的推文,大意为「抱歉了失败者和讨厌我的人,我的智商是世界最高之一,这你们都知道的。不必感到愚蠢或不安,这不是你们的错。」

图片来源:Twitter

尽管人们对名人的智商分数津津乐道,但像人们常说「考试分数不能代表一切」,光靠回答一些测试题,真的能显示出一个人的智力水平吗?

智力测试这玩意,到底是怎么来的?

01 什么是智力

人类对智力的深入探索始于一个多世纪以前。

英国统计学家弗朗西斯·高尔顿(Francis Galton)是第一个尝试以量化方式来分析人类智力水平的科学家。

高尔顿认为,一个人的智力程度可以从他的生理特征上反映出来。也就是说,我们可以根据一个人的躯体行动是否和谐,或者他看东西的眼神是否呆滞,判断出这个人的智力发育是否正常。

但在收集和分析了各种数据之后,他没有得到任何智力水平与生理特征之间的相关性。

最终,高尔顿放弃了这项研究。

现代智力测试的诞生应归功于法国心理学家阿尔弗雷德·宾尼特(Alfred Binet)。宾尼特分别测试了儿童与成年人在速度和反应、视觉识别等多个方面的能力,发现儿童的表现并不弱于成年人,儿童与成年人之间的主要区别,在于集中精力的能力。

阿尔弗雷德·宾尼特(Alfred Binet)

图片来源:wikipedia

宾尼特意识到,智力发育的关键,可能是注意力是否能集中。因此,对躯体的观察是徒劳的,研究应集中于人的大脑。在有关智力研究的历史上,这可称得上是最重要的进展之一。

除此之外,宾尼特还注意到,儿童的语言能力无法和成年人相比。他们或许已经意识到了什么,却无法准确地将其说出来。

这一差异在我们今天看来是一个常识,但在宾尼特的时代,人们普遍将儿童视为缩小版的成年人。因此,对智力的研究也没有区分儿童和成年人,而宾尼特是第一个将年龄因素考虑进来的。

受法国政府的任命,宾尼特与同事西奥多·西蒙(Theodore Simon)一同设计了一套测试题,以从所有适龄入学儿童中检测出哪些孩子需要额外照顾。这套被称为「现代第一套智力测试」的题目发表于1905年,由30道难度逐渐增加的试题组成。

宾尼特-西蒙测验(Binet-Simon Scale)的逻辑,是检测受试者能否回答出其大多数同龄人都能回答的问题。也就是说,一个智力发育有问题的10岁孩子,也许能答对5岁孩子会做的题,但绝不可能答对正常10岁孩子会做的题。用宾尼特自己的话来说,这个智力发育有问题的孩子,其心智年龄的增长没有跟上实际年龄。

在理论上取得重大突破的,是英国心理学家查尔斯·斯皮尔曼(Charles Spearman)。他发现,人在许多方面的感知能力都应该和智力有关,因为人们在文学和语言上的表现,与在音乐上或数学上的表现之间,存在着统计意义上的关联。

查尔斯·斯皮尔曼(Charles Spearman)

图片来源:wikipedia

据此,斯皮尔曼提出,人类存在一种「常规智力」,它可以指示人在一切需要动脑的领域中的正常表现。而表征这一智力水平的,就是「常规智力指数」(general factor,简称g系数)。那些并不需要动太多脑的活动,例如更强调身体反应的体育运动,则是另一种「特殊智力」的范畴,用「特殊智力指数」(special factor,简称s系数)来体现。

斯皮尔曼的智力双要素理论——常规智力和特殊智力,为后来的智力研究提供了深厚的理论基础。心理学家们相信,他们孜孜不倦想要测量的智力,是真实存在,并且内在于人类大脑当中的。

尽管此时科学家们对智力的理解,已经从生理层面转向了心理层面,并且认为智力是人们之间最为重要的差异这一。但对「智力是什么」,他们尚未形成一个确切的定义,只要与「思维能力」有关的,似乎都可以算作「智力」。

这不禁令我们要问,智力测试究竟在测什么?为什么一百多年来,人们一直都热衷于使用智力测试?

02 风靡的真相

1916年,美国心理学家刘易斯·特曼(Lewis Terman)发布了宾尼特-西蒙测验的修订版,并命名为斯坦福-宾尼特智力测验(Stanford-Binet Intelligence Scales)。

特曼将被测者的心智年龄和实际年龄分开,并在计算中引入商数。他的计算方法是,把测试思维能力(即心智年龄)的分数除以受试者的实际年龄,再乘以倍数100,最终得到的这个数即称为智商(Intelligence Quotient,简称IQ)。

没错,我们一直讲的「智商」这个说法,这时才诞生。

智商的计算公式。

图片来源:The Dark History of IQ Tests,TED

特曼的试题中包含了不少习得性知识的成分。比如「水的沸点是多少度」这个问题,高年级学生的正确率显然比低年级学生的要高。但特曼对此的解释,竟是儿童时期,人的智力会随年龄的增长而发育。

他坚信,自己的测验不受文化背景和教育背景影响,并且结果足够显示人的内在智慧。在一篇文章中,特曼写到,研究中受试的两名低分西班牙裔男孩代表了所有美国西班牙裔家庭。他指出,智力特征是因种族而异的,并在随后的许多文章中用数据支撑了这一观点。

特曼的盲目自信使他没有意识到,西班牙裔移民对美国的文化、教育甚至语言是如此的陌生。他犯的错误,就像我们用「你认识成吉思汗吗」来检验一个外国人是否聪明一样,荒谬而可笑。

但不幸的是,美国军方接受并采纳了特曼的斯坦福-宾尼特智商测验,而这正是智商测试在全美普及和流行的开端。

一战时,美国军队的人数急剧增加。为了使管理更加高效,军方急需一种可大规模应用的评价分类体系。急需脱离医学、在科学界独立门户的心理学家们提出,使用智力测试即可实现按统一的标准,也就是按思维能力对士兵进行分类。

最初,军方对「智力」这一套说辞并不十分感兴趣,毕竟打仗作战不是一项脑力活动。但当心理学家们拿出与阶 级偏见和种族偏见相一致的测试结果时,军方肯定了这套测试的有效性,并将其用于入伍筛选和军官评选。

由于军方采用智商测试作为入伍考察的一部分,战后的美国社会对智力测试的看法发生了极大的改变。之前,智力测试仅仅被认为是用于识别智力低下者。现在,军方的支持体现了它的价值和实用性,智力测试竟然可用于对所有人进行分类!

紧随军队之后,学校间掀起对智力测试的狂热追捧。学校之所以迫切需要一个对学生的分类方法,是因为美国义务教育的年龄范围扩大,在校生数量迅猛增加。此外,大量的移民涌入也给教育体系带来额外的负担,文化基础各不相同的学生挤在同一间教室,严重降低了教学的效率。

20世纪20年代中期,心理学家为学校编撰的各类智力测试题超过75套,每年参加测试的学生达到了400万人次。

一方面,心理学的声誉在智力测试的基础上得以确立。另一方面,学校对智力测试趋之若鹜,催生了一个利润丰厚的产业,一个专门研发和出售智力测试题的产业。

韦氏成人智力测评(Wechsler Adult Intelligence Scale,简称WAIS)是美国如今通用的标准成人智商测试方法,哈考特心理测评公司(Harcout Assessment)是这套测试题的出版商。曾有人估算,仅凭出售试卷,该公司即可年入百万美元。

除了成人智力测试,还有儿童智力测试。除了入学考试,犯罪调查、法院判决甚至精神健康状况评估,智力测试都有应用的空间。科学的外衣,规模化的生产和营销,以及工业化所要求的标准化,共同助力了智力测试的风潮兴起。

03 变味的智力测试

智力测试的历史不仅仅是荒诞的,还充满了罪恶。

往轻了说,既然它无法测定智力,也就做不到预测学生之后的发展和成就。入学选拔中如此大规模地应用智力测试,必然会将许多对有潜力的人阻挡在学校的大门外。

智力测试最骇人听闻的应用,莫过于同优生学相结合的那些事迹。

优生学认为,通过对父母进行筛选,可以有目的地改善人的生理和心理特征,使新一代的人更聪明、更健壮,最终,人类社会将不再有不完美的「劣等人」。

而智力测试与优生学的渊源,从人类对智力进行深入探索时就开始了。高尔顿痴迷于研究智力的生理性表征,正是因为相信智力和其他生物性状一样,是可遗传、可演化的。

将宾尼特的研究结果从欧洲带到美国的心理学家亨利·戈达德(Henry Goddard),也是一个不折不扣的优生学主义者。戈达德是第一个根据智力测试的结果,给予不同分数段的人相应称呼和描述的。

例如,「白痴」是比2岁孩子的平均智力水平还低的人,「傻子」是智力分数在3岁到7岁之间的人,而智力缺陷最小的,则称为「低能」。

戈达德发明的这些称谓,将对智力问题的关注带入大多数人的生活。因为「低能」的人是如此难以与正常人区分开来,以至于这些人可能被当成了正常人,生活在每一个社区中。

这样的担忧并非空穴来风。20世纪初的美国,贫困、卖淫以及各种犯罪层出不穷,社会的负担越来越沉重。智力概念的普及让人们开始将智力与道德联系起来,认为愚笨的人更倾向于犯罪。

这种担忧的结果,就是为智力低下的人群所设立的「福利机构」,作为预防社会危机的手段,在全美遍地开花。

当各地能够收容低能人群的场所趋近于饱和,戈达德有了新的提议。他通过追溯一个有低能后代的家族的历史,指出智力低下是可遗传的。在此基础上,他提出只要将所有智力低下的人都找出来,确保他们不再繁育后代,问题就解决了。

随着对低能人群的担忧和恐慌不断发酵,许多低能人群收容所都在秘密进行着对女性的绝育手术。之所以是秘密进行,是由于强制节育在许多州都是违法的。

但1927年,臭名昭著的「巴克诉贝尔案」(Buck v. Bell)改变了这一情况。弗吉尼亚州法院以「智力低下」为由,判定为一名17岁少女强制实施的绝育手术合法,而美国最高法院最终判决弗吉尼亚州政府的强制绝育措施并不违宪。

弗吉尼亚夏洛茨维尔镇,为纪念巴克诉贝尔案所立的纪念牌。

图片来源:hofstra

这个案子可以说是弗吉尼亚州立收容所的自导自演。其负责人阿尔伯特·普里狄(Albert Priddy)为了证明他向州议会递交的优生绝育法案并不违宪,决定冒险地先做一例对低能者的绝育手术。

普里狄将手术人选定为卡丽·巴克(Carrie Buck)。这是一个父亲已经过世、母亲有智力缺陷、且因遭受强奸而怀孕了的少女。她被送入收容所,是因为强奸她的人为了逃脱制裁,以「智力可能存在问题」为由将她举报了。

普里狄给巴克做了斯坦福-宾尼特智商测试。这份充满习得性知识的测试题,对于没接受过多少教育的巴克来说,无疑是十分困难的。根据普里狄向议会和法院递交的证据,巴克的智力水平仅为9岁,属于中度低能。在一场几乎由优生学主义者组成的听证会后,普里狄被批准了向巴克实施绝育手术。

最高法院宣布弗吉尼亚州政府并不违宪的当年,印第安纳州和北达科他州通过了优生绝育法案。次年,密西西比州也通过了同样的立法。到了1932年,有27个州实施了强制绝育计划。

披着科学外衣的智力测试与优生学相结合,通过巴克诉贝尔案,让美国境内有超过6万人因「智力低下」被施以强制绝育手术。

04 「低能」引发的启示

巴克诉贝尔案还使强制绝育在欧洲的合理化有了依据,其中,德国纳粹就充分利用这起案子来为其残忍的种族清洗做粉饰。

纳粹掌握了德国国家政权后不久,就颁布了《预防遗传性疾病扩散法》。这项法案借鉴了美国生物学家哈里·劳克林(Harry Laughlin)所起草的一份绝育法。

1933年7月,德国国会通过《预防遗传性疾病扩散法》(Law for the Prevention of Offspring with Hereditary Diseases)。

图片来源:booklife

但纳粹的罪恶有过之无不及。美国绝育法案的实施对象仅按智力来作区分,德国的绝育法案却将矛头对准所有在身体上有缺陷的人。

举个例子,奥地利人欧文·安曼(Erwin Ammann)在接受决定他是否将被实施绝育手术的测试中,可谓表现出色。根据他的个人档案记录,他在回答生活常识、科学知识,甚至政治问题上都快速而准确。但安曼最终还是被实施了绝育手术,理由是他的长相不够协调,「有遗传缺陷」。

纳粹用身体缺陷划分人的优劣,20世纪上半叶的美国用智力将人分为三六九等,好像已经荒谬至极。但仔细想想,这与用肤色、族群、性别等人类与生俱来的自然属性去区隔人群,就本质上来说有什么不一样的呢?

用最直观可见的属性来划分人群,将一个人天生异于他人的特点,当成导致他经济社会地位,甚至是道德上差异的原因,这种思维的怠惰已在历史上结出无数的恶果。

早期使用智力测试来辅助教育的人们,也许从来不曾想到,这份测试题日后会沾满了鲜血与罪恶。

随着科学研究的越发深入,人们对智力测试的迷信也逐渐退潮。但「人有与生俱来的智力」这一观点,已经为许多人所相信和接受。

这场对智力长达一个多世纪的钻研,如今看来更多只是一场对虚构对象的不断建构。

阶 级或种族偏见使研究者们将后天形成的特征,诸如知识储备和理解能力,视作天生的自然属性。恰恰表明我们对「自然属性」的许多认知,其实是受我们身处社会中的文化所影响的。

智力研究的这段黑历史,警示着后人理性思考的重要性。

我们应当明白,从智力测试到优生绝育、再到灭绝人口的种族主义,也许就一线之隔。

参考资料:

The dark history of IQ tests - Stefan C. Dombrowski.TED-ed,2020-4-27.

斯蒂芬·默多克.智商测试:一段闪光的历史,一个失色的点子.卢欣渝(译), 2009年.

Daphne Martschenko:The IQ test wars: why screening for intelligence is still so controversial.The Conversation, 2017-10-11.

David Card and Laura Giuliano:Universal screening increases the representation of low-income and minority students in gifted education.PNAS, 2016-11-29.

National Association for Gifted Children: 2014-2015 State of the States in Gifted Education.

Richard Lynn and Tatu Vanhanen:IQ and Global Inequality.Washington Summit Publishers, 2006.

+1
11

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

下一篇

自今年3月以来,舜宇光学首次实现手机及车载镜头出货量同比、环比均上涨。

2020-08-11

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业