关键词:大语言模型,认知神经科学,语言网络,语言复杂性



论文题目:Driving and suppressing the human language network using large language models
期刊名称:Nature Human Behaviour
斑图地址:https://pattern.swarma.org/paper/2fd42544-aa8e-11ee-bc79-0242ac17000e
论文地址:https://www.nature.com/articles/s41562-023-01783-7

这项研究利用人工语言网络和功能性核磁共振成像(fMRI)研究了大脑语言处理区域对不同句子的反应。研究人员使用人工神经网络来识别那些能驱动和抑制大脑语言网络,发现语言的复杂性和意外性是关键因素。需要认知努力才能解读的句子,如语法不寻常或含义出人意料的句子,引起的大脑反应最高,非常直白的句子(比如”我们坐在沙发上”)几乎不会引起这些区域的反应,而无意义的单词序列也不会对它们产生太大影响。这项研究深入揭示了大脑如何处理语言,并有可能应用于理解更高层次的认知。

图1:研究流程:包含刺激选择,模型构建和评估

在这项研究中,研究人员重点研究了大脑左半球的语言处理区域,其中包括布罗卡区以及大脑左侧额叶和颞叶的其他部分。研究人员首先汇编一组 1000 个句子,这些句子来源广泛,包括小说、口语转录、网络文本和科学文章等。五名人类参与者在阅读每个句子的同时,研究人员使用 fMRI 测量了他们的语言网络活动。然后他们将这 1000 个句子输入一个大型语言模型——该模型可通过预测大量文本中的下一个单词来学习生成和理解语言——并测量该模型对每个句子的激活模式。

获得所有这些数据后,研究人员训练了一个被称为“编码模型”的映射模型,该模型将人脑中的激活模式与人工语言模型中的激活模式联系起来。训练完成后,该模型就能根据人工语言网络对这 1000 个句子的反应,预测人类语言网络对任何新句子的反应。

然后,研究人员利用编码模型识别出在人类大脑中产生最大活动的句子(“驱动”句子),以及在大脑语言网络中引起最小活动的句子(“抑制”句子)。研究人员在新的一组(三名人类)参与者中发现,这些新句子确实如预测的那样驱动和抑制了大脑活动。

图2:研究脑区,三类句子及大脑激活情况示意

为了弄清楚是什么让某些句子比其他句子更能驱动大脑活动,研究人员根据11种不同的语言属性对句子进行了分析,包括语法性、可信度、情感价位(积极或消极)以及句子内容的可视化程度。研究人员要求众包平台的参与者对句子的每个属性进行评分。他们还使用一种计算方法来量化每个句子的“惊奇度”,即与其他句子相比它的不常见程度。

分析结果表明,惊奇度越高的句子在大脑中产生的反应也越高。这与之前的研究结果一致,表明人们在处理意外性较高的句子时会遇到更多困难。另一个与语言网络反应相关的语言属性是语言复杂性,它是根据句子遵守英语语法规则的程度和句子的可信度来衡量的。

图3:模型预测的大脑语言区域活跃程度与实际结果的散点图,蓝色为特别简单的句子,红色为特别复杂的句子


这是首次在与语言网络等高层次认知有关的大脑区域间构建足够精确的模型,足以实现语言模型激活和大脑反应之间的映射。该研究还首次展示了对涉及高层次认知的区域进行非侵入性神经活动控制的方法。

将快速发展的大语言模型与语言处理过程中更大和/或时间分辨率更高的神经活动测量相结合,该研究将为无创治疗应用打开一扇新的大门,如对于脑部疾病患者和其他特殊人群。未来研究人员计划看能否在英语以外的语言使用者中推广这些发现,还希望探索哪种类型的刺激可能会激活大脑右半球的语言处理区域。



编译|郭瑞东

计算社会科学读书会第二季



详情请见:

数据与计算前沿方法整合:计算社会科学读书会第二季启动


推荐阅读
1. Nature速递:基于大语言模型的自动化学研究
2. 数学探索的未来:从AI引导人类直觉到数学大语言模型
3. Nature 速递:大语言模型编码临床知识
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5加入集智学园VIP,一次性获取集智平台所有内容资源
6. 加入集智,一起复杂!


点击“阅读原文”,报名读书会