论文题目:Neural mechanisms of information seeking
论文地址:https://www.cell.com/neuron/abstract/S0896-6273(24)00246-0
想象你是一个咖啡爱好者,你会如何选择咖啡店?如果你现在在居住的城市,你可能已经有了一个多年光顾的咖啡店,因此可能不需要APP的在线评论。然而,你仍然可能以不同的方式去搜寻信息:可能会不时地访问其他店铺,看看这些店铺的咖啡质量是否有所提高;当城市中开设新的咖啡店时,可能会尝试一下,看看这些新店的咖啡是否比当前的最爱更好。如果你出差去了一个新的城市,过去的经验可能不再有用,你需要重新累计对不同咖啡店的体验,你会更加积极地去探索,在不同咖啡店消费,直到找到新的最爱,并开始定期消费;作为一个咖啡爱好者,你可能会对咖啡文化保持好奇,你会阅读世界各地咖啡店的博客和社交媒体帖子。上面这个例子时我们无数日常生活决策的缩影,可以看出信息搜寻具有多样性。人们搜寻信息以解决具体决策问题或出于好奇心。
为了阐明信息搜寻的神经认知机制,一些研究聚焦于与未来结果相关的单个信息的神经活动。这些研究的实验范式中,参与者面对的是非确定性的与概率有关的奖励结果,例如金钱或果汁。参与者首先被呈现关于随机结果的线索(例如,果汁奖励的可能数量及其概率),然后选择是否一定风险获取新的信息。尽管现实世界中的某些决策问题涉及多个先验信息,但聚焦于单个信息有助于通过实验描述潜在的神经过程 。
图3 好奇心研究的实验范式
另一类文献关注好奇心的神经基础。尽管好奇心直观上会驱动信息搜寻行为,但相关研究更多集中于好奇心的心理感受,通常是通过诸如小测验或魔术之类的刺激产生的。研究显示,尽管这一领域的研究还处于初期阶段,但一些研究一致地证明了多巴胺奖励系统参与信息搜寻行为。
决策者经常需要在一段时间内收集多条信息来做出决策。目前少尝试通过实验探究单次信息搜寻的神经认知机制如何泛化到时间段内的信息搜寻,现有的研究主要集中在两类决策问题上:强化学习中的探索-利用权衡和证据积累的停止。
强化学习主体通常基于过去的行动和奖励的关联性来选择奖励最大化的行动,但这种方法在动态环境中可能导致次优行为。多臂老虎机任务经常被用来研究这种权衡。
图5 证据积累的停止决策研究:背外侧前额叶皮层(DLPFC)表征了顺序信息搜寻情境中的主观价值信息
证据积累的停止决策研究探讨了人类如何决定何时停止积累证据以做出决策,文章介绍了一些经典行为范式,并指出背侧前额叶皮层(DLPFC)在主观信息价值表征中的作用,即DLPFC追踪基于当前决策证据的信息价值变化。
尽管信息寻求的神经基础的实验研究仍处于初期阶段,但已经取得了显著进展。不同实验方法之间存在的一些关键差异,需要在未来的研究中加以解决。例如,虽然有证据表明奖励系统(VTA/SN、VS、VMPFC)在一次性信息寻求中的作用,但其在多次信息寻求中的作用证据较少。此外,是否有不同系统参与不同类型的信息寻求?奖励系统在不同情境下对信息价值的编码是否普遍适用?这些问题需要进一步研究。
人类大脑是一个由数以百亿计的神经元相互连接所构成的复杂系统,被认为是「已知宇宙中最复杂的物体」。本着促进来自神经科学、系统科学、信息科学、物理学、数学以及计算机科学等不同领域,对脑科学、类脑智能与计算、人工智能感兴趣的学术工作者的交流与合作,集智俱乐部联合国内外多所知名高校的专家学者发起神经、认知、智能系列读书会第三季——「计算神经科学」读书会,涵盖复杂神经动力学、神经元建模与计算、跨尺度神经动力学、计算神经科学与AI的融合四大模块,并希望探讨计算神经科学对类脑智能和人工智能的启发。读书会从2024年2月22日开始,每周四19:00-21:00进行,持续时间预计10-15周,欢迎感兴趣的朋友报名参与,深入梳理相关文献、激发跨学科的学术火花!
详情请见:计算神经科学读书会启动:从复杂神经动力学到类脑人工智能