原文链接:http://www.eeo.com.cn/2019/0121/346137.shtml
如果不告诉你结果,你觉得你和自己的父母比谁更聪明呢?理由是什么呢?
一代更比一代强,是这么简单吗?
以下原文:
当代人类是不是在变得更聪明?
如果以智商测试分数(IQ分)作为“聪明”即智力的度量,那么答案是肯定的。自从有IQ测试以来,一百多年中,一代一代测试人的IQ平均分在持续地提高。世界范围内,从1909年到2013年,IQ的平均分每十年增加3分。标准IQ测试的平均分是100,30分的增长意味着从“智力中常”到“智力高超”的变化。因此可以说,人类智力不仅在提高,而且提高很快。
新西兰学者弗林(JamesFlynn)1984年在一篇开创性论文中,指出美国IQ平均分在1932-1978期间有大幅度提高,由此开辟了一个新研究领域。其名称叫作“弗林效应”,其内容是“IQ提高的长期趋势”。一开始,学者们,包括弗林自己,都对这个现象感到疑惑。公认智力是高度遗传性禀赋。从遗传角度看,有些社会变动会导致群体的智力提高,例如“优生学”工程,让聪明人比常人多生孩子,又如人们大批与远处乃至外族人结婚(从而避免近亲繁殖,增加混血优势)。二者都需要一代一代长期持续才能有成效。但是二十世纪中并没有大规模发生这样的变动,时间也太短,因而弗林效应无法用遗传变动来解释。
对这个新课题随后展开的研究,重点在两个方面:确认“IQ提高的长期趋势”的存在(结论是肯定的),寻求IQ提高的原因(已有基本共识)。这些研究产生了一些饶有兴味的成果,涉及社会进步和人类提升的一些重要层面。本文试做简略的考察。
如何测度智力
IQ测试是一套题目,覆盖了常识、理解、算术、类同、记忆、词汇、图像、积木、排列、拼图、符号等领域。在制定标准化IQ测试时,首先由专家出题,再找出一组标准化代表性的测试人作题。然后,对他们的得分进行标准化处理,使得测试组得分的均值为100,均方差设为15(均方差是表明一组人群得分的散布程度的指标)。经过这种技术性的标准化处理,应试者得分就呈现正态分布。
以IQ的均值为100为前提:有68.2%的人的分数落在100上下15分(一个均方差)的范围,即(85-115)区间,这组人拥有平均智力。向右方(高分方向),有13.6%的人得分在(115-130)区间,称作智力高于均值的人。得分高于130(两个均方差之上)的人有2.2%,是智力高超的人。向左方(低分方向)的情况与右方对称。
每年都有许多人参加IQ测试,参试者可以根据得分判断自己的智力在人口总体中的位置:得110分?那是中常资质。得132分?那可是智力高超!比较一个参试者在数字、空间、逻辑、词汇、创造、记忆等领域的得分与标准测试组的差异,还可以判断这个参试者智力的相对强项和弱项。
专家们已经开发了不少标准化的IQ测试,普遍采用的有用于成人的WAIS测试(WechslerAdultIntelligenceScale)和用于儿童的WISC测试(Wech-slerIntelligenceScaleforChildren)。此外还有一些注重特定领域智力的测试,例如专测逻辑思考能力的Raven测试(下文将说明)。IQ测试广泛用于征兵、招工和其他场合的人才筛选中。
一套标准化IQ测试题,使用一段时间就要更新。例如,WISC测试最初是1949年开发的,后来在1974、1991、2003和2014年更新。更新时,要找一组新的代表性测试者,参加新试题的考试,再对他们的得分作标准化处理。为了保证IQ试题的延续性,会让新测试组去做以往的测试题。这恰恰成为检验IQ提高的一个方法。弗林最初就是根据1974年更新时测试组做1949年测试题的结果,发现IQ提高的现象。他说,实际作业中,每一次这样的考试,新测试组去做老测试题的平均得分,都高于100。后来许多学者分析不同的IQ测试、不同地区、不同年代的资料,都看到同样的结果。
可以参照图一来直观地理解弗林效应。图中左边的钟形曲线是1932年测试组的得分情况,其均值为100,均方差为15。右边的钟形曲线是1997年的测试组去做1932年的测试题的情况,其得分曲线向右移动,其均值提高到120,而且,有超过20%的人得分高于130。按1932年标准,他们会被认为是智力高超者。学者就是在这个意义上说,后来的人变聪明了,智力提高了。
图一:弗林效应
解释IQ提高:弗林效应的验证
对弗林效应最大规模的经验验证,是2015年发表的Pietschnig&Vo-racek的研究,他们根据31个国家4百万人参加的271个样本,考察了1905-2013期间的IQ变动。这项研究成果可以用图二来概括。
图二中每线条代表一个地区的IQ变动情况,为便于比较,每个地区最早测试的成绩设定为0,因此每个线条就表示这个地区IQ在以后年代中的增值。例如,美洲1909-2006期间IQ提高33分,亚洲在1950年以来的半个世纪IQ提高35分。每个地区采用的IQ测试不同,测试开始的年代也不同,因此各条线之间的增长情况不可比。但是共同的趋势是一目了然的:每条曲线都是上升的,而且是连续上升,没有下降、波动。注意有些曲线的上升有趋缓迹象。
图二:1909-2013期间IQ提高情况
现在学界共识是弗林效应已经在众多扎实的数据分析得到确认:在每个主要智力测试中,对每个年龄组,在每个智力水准上,每个发达国家(后来发现在亚洲、非洲广大地区)IQ得分都在上升。世界总体的情况,如图中粗黑线所示,是一百年间IQ提高30分。
当然,在任何研究领域中学者永远有不同看法,对弗林效应,仍然有学者就概念和数值测度提出质疑。近年来有报道,在某些北欧国家IQ在下降。本文仅简介学界主流观点。
哈佛教授平克(StevenPinker),著名的认知心理学家和畅销书作者,2018年 2月出版了新著《EnlightenmentNow》(中译本《当下的启蒙》,浙江人民出版社2018年12月)。主旨是:自启蒙运动以来,人类社会一直在提升,推动力量是启蒙运动倡导的四个观念:理性、科学、人文主义、进步。书中分章列举了一些最重要方面的进步:寿命、健康、食物摄取和营养、财富、分配不均、环境、和平、安全保障、民主、平等权利、知识、生活质量、幸福,等等。全书以详实的数据展示了一幅乐观向上的图景。这些进步是经历了两次世界大战、冷战和各种天灾人祸的条件下取得的。书中在“知识”一章中简述IQ提高问题。这种全景视角有助于理解弗林效应,它是更大范围的进步的一部分。现在按照这个思路,来考察促进IQ提高的因素。
脱贫的成果
本文开始时提到学者对智力提高现象的困惑:智力是高度依赖遗传的禀赋,但没有资料表明弗林效应可以用遗传因素解释。另一方面,经济学中有许多实证研究表明,在许多国家经济增长过程中,一些同样被认为是高度依赖遗传的禀赋,例如身高、寿命,都有显著提高。促进身高、寿命提高的因素,包括消除饥饿、增加营养、减少疾病、改善健康等等。
沿着这个路径作研究,证实这些因素也促进IQ提高。这个结论易于理解。大脑这个精细的器官需要大量营养和能量,它主要由脂肪和蛋白质构成,日常消耗人体五分之一的能量。营养不良会影响大脑发育。一些疾病会影响大脑正常功能。身体健康、新陈代谢旺盛可以让大脑活跃敏锐。
改善健康、营养等因素促进IQ提高,这是经济增长的伟大贡献。但它们只能部分地解释弗林效应。原因是,它们的作用主要落实在IQ曲线的左半边,即智力偏低的人群。社会经济统计显示,低智商通常与食物短缺、健康欠佳、营养不良等指标相关,营养、健康方面的改善导致这些人的IQ提高。反之,高智商的人一开始就比较富裕,有相对良好的营养和健康,对他们,这些因素的促进作用就比较弱。研究确实发现,在一定时期、一定地区,弗林效应主要集中在IQ曲线左端,把原来智力不高的人们提升到平均水平。但是,这种作用有其限度(超过一定水平后,更多食物、营养就使人发胖而不是变聪明),也不能解释大量资料显示的人口总体的整条IQ曲线向右移动的现象。
教育的推动
要解释IQ的整体提高,学者们首先提出并确认的因素是教育——正规入学受教(formalschooling)。教育使儿童增加词汇量、提高语言和算术能力、扩展知识,这些都在IQ测试考题的范围内。在世界各国经济发展过程中,随着义务教育、男女平权等法案的实施,教育逐渐普及(更多儿童上学)、普遍(男女儿童都上学)、延伸(从小学、初中、高中到大学)。在经验研究、统计分析中,反映“教育”这个因素的最常用指标是“在校受教年数(yearsofschooling)”。大量的研究表明,“在校受教年数”的增长对IQ提高有重大的推动作用。弗林认为它是IQ提高的第一位因素。
美国15-64岁人口计平均在校受教年数(初、中、高等教育合计),普遍高于其他国家,因为美国在实施义务教育方面有领先优势。1852年从马萨诸塞州开始,1900年扩展到31个州,1918年所有州都要求学童完成小学义务(免费)教育,后来延伸到高中义务教育。在校受教年数从1870年4年增到2010年超过12年。普及教育提高人口素质,积累人力资本,从十九世纪晚期起,是美国经济起飞、高速增长、超越英法的重要推动力量。现代发达国家基本上普及了高中教育(12年)。中国的平均在校受教育年数自1940年开始上升,目前略超8年,差距是明显的。在校受教年数指标不能反映中小学教育现在存在的问题,这里不讨论。
需要指出,教育对IQ的促进作用并非单纯通过增加“在校受教年数”而体现,极其重要的是所教的内容。历史上,西班牙曾经是环球航海、地理大发现时代的强国,但后来直到二十世纪中,它的经济在西方国家中总是处于滞后地位。西班牙的“在校受教年数”指标数值其实很高,但它的教育系统一直处于天主教教会控制之下。平民儿童在学校里只接受到关于圣经、教义问答和一些简单技能的口头教学。教会认为,对训练有素的神学士以外的任何人,科学、数学、政治经济学和尘世历史都是太具争议性的内容。现代阿拉伯世界的经济落后,也同样归因于教士实行的思想禁锢。IQ的提高,主要依赖另外一种教育。
不同范畴的增量
在这方面的追溯研究成果丰富,进一步揭示了究竟在哪些领域的哪些因素,有效地促进了IQ的提高。一个代表性成果是弗林在2007年出版的《什么是智力(WhatisIntelligence)》一书。他根据美国儿童的WISC测试结果,分析了在各种智力范畴中IQ分数的增量。结果发现,只有一小部分IQ提高是在学校直接教授的知识领域(常识、词汇量、算术等),而大部分IQ提高发生在抽象思维、逻辑推理领域(诸如类同性试题、Raven测试等)。
这方面的研究成果显示在1940-2010期间,IQ总分以及一些特定领域的智力测试分数的增长情况。IQ提高中,增量最少的是常识、算术、词汇(主要通过学校教育提高的能力),进步快、增量大的依次是理解力、操作力、IQ总分、类同性判断、Raven测试等涉及逻辑推理的能力。
图三:Raven测试题
对这里谈到的智力测试作简要解释。一般把智力分成言语能力与操作能力两大类。操作能力测试有五种:完成图像,排列图像,设计积木,数码符号,组装部件。当代父母经常欣喜地看到自己的孩子在玩拼图、积木时展现出来的聪明才智,就是这种智力。
Raven测试考的是逻辑推理能力,图三给出一个例子。图中有三横行,每行三图,上两行中,从左到右三图中黑色小块在顺时针旋转,这是给定的逻辑序列。因此第三行中的第三图的答案,应该遵循同样方式确定。Raven测试完全脱离具体现实世界,只涉及抽象图形,不依赖具体知识。测试者必须能够理解用抽象符号表现的逻辑关系,并做出正确的推理。
举几个例子说明抽象思维、逻辑判断测试题。类同性(similarity):“‘小时’和‘年’有什么共同性?”(答案:都是时间单位)。类比性(analogies):“如果‘鸟’与‘蛋’相联系,那么‘树’与什么相联系?”(答案:种子)。逻辑推理:“假定在国家A任何东西都用塑料制造,那么,那里的烤箱是塑料做的吗?”
最后这个逻辑题看起来再简单不过,却有着显赫的历史。典故是:1930年代,著名心理学Luria在当时的苏联边远乡村做调研,他记录了与一个农民的如下对话。
问:在常年下雪的地方熊都是白的;国家A常年下雪;在国家A,熊是什么颜色?
答:我只见过黑熊,我不谈我没有见过的东西。
问:但是我的话语包含了什么结论?
答:要是一个人从来没有到过那里,他就不能根据某些话语说出任何意见。
这成为认知心理学的一个经典例子,上述烤箱问题就是它的一个现代版本。Luria还记录了以下问答。问:“狗与兔子有什么共同点?”答:“人们用狗抓兔子”。在IQ测试中这本来是一个归类问题,需要的智力是把具体事物放进抽象范畴中,因此要说“它们都是哺乳动物”这样的答案才对。确实,不能超越自己经验范围的事物而作抽象的理性判断,不能应对假设的问题,是智力短缺的表现。弗林认为,在抽象思维领域的进步,是促进IQ提高的第二大因素。
分析性思维方式与环境提升
很自然,接下来的问题是:在抽象思维、逻辑判断领域,又是什么促成了人们能力的提高呢?研究表明,有教育和环境两大类因素。此处说的教育,是指其内涵,涉及教学原则、内容和方法,并非“在校受教年数”指标所能涵盖。这种教育建立在开明的理念上:自然科学理论是可以证伪的假说(因为没有被证伪而保留下来),人文社会学科知识要在独立思考、质疑、辩驳、分析中领会(没有强加的不容置疑的思想禁区)。因此,强调开放、理性、启发,鼓励挑战性思维、争辩式讨论。实际上,小学、中学未必开设逻辑课,但只要教学过程的重点在理解和推理,而不是灌输和背诵,就可以培育“分析性思维方式(analyticmindset)”。上述那些IQ逻辑试题,考的正是这方面的能力。很多学者还指出,美欧国家现代教育中的考试,不以背诵知识为重,而以理解、分析、推理为主,实际上帮助了学生熟悉IQ测试题,从而提高IQ分数。
环境类的因素有很多。总起来说,现代世界充满了抽象的符号和概念,例如,地铁、机场的符号指示牌,孩子玩的电子游戏机的键盘、屏幕,成人用的计算机中的软件应用,电视新闻中常见的图表和常说的概念术语,等等。因此人们日渐熟悉越来越多的视觉符号,越来越习惯对符号概念作判断思考。当初人类老祖宗在丛林环境培养了一种本能反应能力,一有异常的声光信号,不假思索拔腿就跑,因为树丛后面可能窜出狼或虎。在后来的文明进化中,人类逐渐发展了语言、算术、常识等方面的智力。现代人身处数码技术的环境中,就像是时刻处于逻辑链条的节点,需要对(以符号表示的)事件作是、否、和、或(YES/NO/AND/OR)等判断,再采取下一步行动。这样的环境,当然导致智力测试中抽象思维、逻辑判断领域分数的提高。弗林认为,现代世界中无处不在的视觉符号,是促进IQ提高的第三个因素。
就适应环境而言,现代人适应当代世界,和采猎时代、农耕时代的前辈适应当时的世界,程度未必有多大差异。经济、技术、社会进步带来了更复杂的世界,人们的应对能力也就相应改进。这就是说,人类自己创造了新环境,又在适应新环境的过程中提高了自己的智力。
结语
现在来总结一下关于智力提高的研究成果。弗林效应,即“IQ提高的长期趋势”,已经被大量研究确认。促进IQ提高的因素包括生理体质和社会环境两方面,公认最重要的是营养、健康、教育和环境提升。教育这个因素中,在校受教年数的增长是重要的,教学内容和方式的贡献在晚近更加突出。历史经验表明,以定于一尊的教义禁锢思想的教育,以背诵、应试为核心的教育,都与提高智力相悖。现代环境激发了人们在抽象思维、逻辑推理领域的智力快速提高。
值得在最后提及智力提高对社会和个人的影响。与“什么因素促进IQ提高?”反向的因果链条是“IQ提高,影响了那些事物?”这方面的基本问题是:IQ提高是否促进了经济增长?是否促进了个人福利?研究提供了肯定的答案。就全社会看,IQ提高可以促进人均GDP增长速度,改善寿命、闲暇时间等福利指标的提升。从个人角度看,IQ提高有助于健康、长寿、职场成功、财富积累(但未必增进幸福)等等。这些研究成果符合人们基于常识的预期,同时,为IQ提高涉及有关因果因素提供了正反馈或者说良性循环的图景。
近几十年来,在世界范围兴起的原教旨主义、恐怖主义、民粹主义的逆流,其中的重要组成部分是反智主义。平克《当下的启蒙》一书展示,从启蒙运动以来人类发展的主流,是理性、科学、人文主义、进步。在新的一年开始的时候,回顾那个主流中的一个成就,人类智力的提高,给人以启迪和希望。