【导语】随着AI技术的迅猛发展,关于其对人类智力影响的讨论日益激烈。技术悲观主义者担忧AI可能导致人类智力退化,甚至带来生存风险,而乐观者则认为AI将成为人类的得力助手。近日,麻省理工学院媒体实验室的一项研究首次探索了使用AI工具进行写作任务对人类大脑活动的影响,发现依赖ChatGPT进行写作的学生的大脑呈现更低的激活状态。这一发现迅速引发科学界和公众的广泛关注,同时也暴露了科学研究在面对颠覆性技术时的解读困境。本文将深入探讨这一研究及其引发的争议,以及社会面对AI时的复杂心态。
·一方面,技术悲观主义者倾向于将AI视为一种导致人类智力退化,甚至带来生存风险的“异己”力量。这种心态使得“AI让我们变笨”这类简单而惊悚的结论极易获得传播。另一方面则是对这种悲观论调的警惕,以及对科学研究被过度简化和意识形态化的担忧。
有人认为日益强大的AI会成为人们的好帮手,也有人担心过度依赖AI会造成认知上的懒惰甚至创造力的丧失,这类结论到底符不符合事实需要科学的检验。
近日,麻省理工学院媒体实验室的计算机科学家娜塔莉亚·科斯米纳(Nataliya Kosmyna)和她的同事们在预印本服务器arXiv上发表了一项研究,首次探索了使用AI工具进行写作任务对人类大脑活动的影响。研究发现,依赖ChatGPT进行写作的学生的大脑呈现更低的激活状态。
该研究发表后引起了科学界和公众舆论的广泛关注,不仅触动了人们对AI日益增长的依赖的普遍焦虑,也暴露了科学研究在面对颠覆性技术时所(suǒ)面(miàn)临(lín)的(de)解(jiě)读(dú)困(kùn)境(jìng)。
AI会(huì)让(ràng)我(wǒ)们(men)变(biàn)笨(bèn)吗(ma)
研(yán)究(jiū)团(tuán)队(duì)招(zhāo)募(mù)了(le)60名来(lái)自(zì)波(bō)士(shì)顿(dùn)地(de)区(qū)五(wǔ)所(suǒ)大(dà)学(xué)的18至39岁的学生。参与者被随机分为三组,每组18人。他们被要求在20分钟内撰写一篇SAT(美国大学入学的标准化考试)风格的短文,回答诸如“我们是否应该在说话前三思?”之类的问题。
研究人员对三组学生使用的辅助工具进行了限制。第一组是“纯脑力组”,学生要在没有任何网络工具(jù)的(de)帮(bāng)助(zhù)下(xià)完(wán)成(chéng)写(xiě)作(zuò)。“搜(sōu)索(suǒ)组(zǔ)”的(de)学(xué)生(shēng)可(kě)以(yǐ)使(shǐ)用(yòng)网(wǎng)络(luò)搜(sōu)索(suǒ)引(yǐn)擎(qíng)查(chá)找(zhǎo)资(zī)料(liào),但(dàn)不(bù)能(néng)使(shǐ)用(yòng)任(rèn)何(hé)AI辅(fǔ)助(zhù)的(de)答(dá)案(àn)。在(zài)“ChatGPT组”中,学生只能使用由OpenAI的GPT-4o模型驱动的ChatGPT作为信息来源来撰写文章。
研究人员使用脑电图(EEG)技术,通过一顶布满电极的帽子来实时记录参与者写作时的大脑电波活动。EEG可以测量大脑活(huó)动(dòng)产(chǎn)生(shēng)的微小电压变化,从而揭示大脑不同区域之间的“对话”或连接情况。
研究发现,与另外两组相比,使用ChatGPT写作的参与者的大脑的连接性在任务期间表现得最低。而“纯脑力组”的参与者则表现出最强、最广泛的大脑区域间连接,并且有更多的大脑活动从后脑区域流向前部的决策区域。此外,当被问及能否引用自己文章中的句子时,“纯脑力组”的成员表现得最好。相比之下,“搜索组”的大脑在与视觉处理和记忆相关的区域表现出更强的激活。
然而,研究人员们强调,更多的大脑连接性并不一定意味着更好或更坏。它可能表明一个人更深入地参与了一项任务,也可能意味着思维效率低下,或者是“认知超载”的迹象。作者们明确表示,这项研究并没有也无法证明使用ChatGPT会导致“大脑变笨、变傻,或者大脑在度假”。
研究中一个更有趣的发现是,当最初使用ChatGPT的参与者转为在没有任何在线工具的情况下写作时,他们的大脑连接性虽然有所增强,但并未达到从一开始就未使用任何工具的参与者的水平。这似乎暗示,依赖聊天机器人完成初始任务,即使之后不再使用,也可能会导致大脑的参与度相对较低。
研究人员谨慎地指出了这项研究的局限性:研究只涉及几十名参与者,且时间较短,因此无法回答长期习惯性使用聊天机器人是否会重塑我们的思维方式,也无法说明大脑在其他AI辅助任务中会如何反应。科斯米纳坦言:“这篇论文中没有任何这些问题的答案”。
科学解读的困难
“技术如何影响人类认知”一直是科学研究的热门话题,在AI时代之前,互联网就已经引发了认知退化的担忧和研究。但即便是科学家们对这些研究结果的解读也难以达成一致。
根据《自然》(Nature)杂志的报道,早在2011年,哥伦比亚大学心理学家贝齐·斯帕罗(Betsy Sparrow)等人的一项研究就普及了“谷歌效应”(Google effect)这一概念:当人们知道信息可以被数字设备储存下来时,他们记住这些信息的能力会变差。人们似乎更倾向于记住信息存储的位置(比如哪个文件夹),而不是信息本身。这引发了一种普遍的担忧,即我们正在将互联网当作外部记忆库,从而削弱了自身的记忆能力。这个概念甚至催生了“数字失忆症”(digital amnesia)这样的术语。
这一观点与心理学家丹尼尔·韦格纳(Daniel Wegner)在20世纪80年代提出的“交互记忆”(transactive memory)理论相符。该理论认为,人们通过与他人(如配偶或同事)分享信息来减轻记忆负担。当互联网成为我们的“交互伙伴”时,我们似乎可以从记住大量信息的责任中解脱出来。这种将认知任务外包给外部工具(从清单、日历到智能手机)的行为,被称为“认知卸载”(cognitive offloading)。
认知卸载可以解放有限的大脑带宽,让我们处理其他事务,但也可能带来负面影响。例如,有研究表明,使用GPS导航的人在回忆路线方面表现更差。另一项研究发现,过度使用GPS的人,其空间记忆能力下降得更快。
尽管如此,许多记忆研究人员仍认为,关于“谷歌正在让我们变笨”的说法是“夸大其词”。哈佛大学的记忆研究专家丹尼尔·沙克特(Daniel Schacter)指出,尽管有证据表明技术可以影响特定任务的记忆表现,但几乎没有证据表明技术正在对记忆造成更广泛的负面影响。他认为,人们感觉自己记忆力下降,可能更多是因为衰老,或是因为我们现在需要处理的信息量远超以往。
以ChatGPT为代表的生(shēng)成(chéng)式(shì)AI的(de)兴(xìng)起(qǐ),为(wèi)这个议题增添了新的复杂性。与传统的搜索引擎或记忆辅助工具不同,大(dà)型(xíng)语(yǔ)言(yán)模(mó)型(xíng)(LLM)不(bù)仅(jǐn)能(néng)检(jiǎn)索(suǒ)信(xìn)息(xi),还(hái)能(néng)生(shēng)成(chéng)全新(xīn)的(de)、看(kàn)似(shì)原(yuán)创(chuàng)的(de)内(nèi)容(róng)。这(zhè)带(dài)来(lái)了(le)新(xīn)的(de)风(fēng)险(xiǎn),比(bǐ)如(rú)AI可(kě)能(néng)会(huì)“一(yī)本(běn)正(zhèng)经(jīng)地(de)胡(hú)说(shuō)八(bā)道(dào)”(即(jí)“幻(huàn)觉(jué)”),从(cóng)而(ér)可(kě)能(néng)在(zài)我(wǒ)们(men)的(de)记忆中植入逼真的虚假信息。此外,由于写作本身是一种促进深度思考和产生原创见解的过程,将这些过程外包给AI,可能会让学生失去学习这些宝贵技能的机会。
争议:科学与社会心态的博弈
该研究预印本一经发布,便迅速在社交媒体和新闻报道中引发讨论,其中不乏耸(sǒng)人(rén)听(tīng)闻(wén)的(de)解(jiě)读(dú)。一(yī)篇(piān)点(diǎn)击(jī)量(liàng)超(chāo)过(guò)2000万(wàn)的(de)推(tuī)文宣(xuān)称(chēng):“MIT的(de)研(yán)究(jiū)结果令人恐惧……AI正在让我们的认知‘破产’(Cognitive bankruptcy)”。尽管这种说法并不符合研究者们原来的判断,但也反映出公众对AI潜在威胁的深切焦虑。
而对于另外一些更为专业的批评者来说,这类研究本身对该类议题的把握能力非常有限。比如有批评者指出,这项研究的样本量很小(每组仅18人,第四次实验更是只有9人),且参与者都是来自波士顿顶尖大学的“WEIRD”(西方的、受过教育的、工业化的、富裕的和民主的)人群,这使得研究结果很难推广到更广泛的人群。此外,实验环境也与现实生活中的学习场景相去甚远。
一篇深入的评论文章指出,研究人员对EEG数据进行了大量的统计检验(在1024对电极之间(jiān)运(yùn)行(xíng)了(le)上(shàng)千(qiān)次(cì)重(zhòng)复(fù)测(cè)量(liàng)方(fāng)差(chà)分(fēn)析(xī))。即(jí)使(shǐ)使(shǐ)用(yòng)了(le)多(duō)重(zhòng)比较校正(如FDR),在如此海量的检验中,也很难避免出现由纯粹偶然性导致的“统计显著”的假阳性结果。而脑电技术本身也不够精确(què),研(yán)究(jiū)中(zhōng)脑(nǎo)电(diàn)波(bō)的(de)变(biàn)化(huà)可(kě)能(néng)仅(jǐn)仅(jǐn)反(fǎn)映(yìng)了(le)不同任务(如打字、阅读、编辑)之间的物理行为差异,而非深层次的认知变化。
这些争议不仅关于科学研究的严谨性,也折射出社会面对AI时复杂而矛盾的心态。一方面,技术悲观主义者倾向于将AI视为一种导致人类智力退化,甚至带来生存风险的“异己”力量。这种心态使得“AI让我们变笨”这类简单而惊悚的结论极易获得传播。另一方面则是对这种悲观论调的警惕,以及对科学研究被过度简化和意识形态化的担忧。将一项初步的、探索性的研究结果解读为对AI的最终审判,无益于科学的健康发展。更审慎、更细致的讨论是必要的。
参考文献:
https://www.nature.com/articles/d41586-025-02005-y
https://www.nature.com/articles/d41586-025-00292-z
https://thebsdetector.substack.com/p/the-cognitive-debt-of-digging-through