导语

为什么人类能思考“为什么”?这一个颇具哲学意味的追问一直是神经科学和物理学的研究前沿。在1月12日发表于 Physical Review E 的一项研究中,清华大学心理学系&脑与智能实验室的研究团队发现神经元群的集群动力学可以自发完成对因果关系的近同态的表征,且几乎不依赖因果关系判定中历史信息的数量。
田洋 | 作者
邓一雪 | 编辑

1. 因果编码研究:进展与挑战

因果关系常被认为是最难判定的关系之一,从数学和统计学角度准确判断不同信息间的因果关系一直是公开的挑战。然而,大脑中的因果关系却不那么“高不可攀”,它“亲和”地参与了几乎所有基础的感知觉和认知过程[1]。人类对外界的感知不可避免地伴随着对多个刺激的加工。在这一过程中,不同刺激可以被视为散落于外界的节点,而刺激间的因果关系则构成了人类所感知到的外界的骨架。人类的感知觉正是由对多个刺激进行编码、集成的过程[2-4]和对刺激间因果关系进行表征的过程[3]共同组成的[2,5,6]。

然而, 当我们需要追问大脑为什么能编码因果关系时,却发现答案是空白的。当认知科学尝试基于更符合客观实验的思路去回答这一问题时[7,8],由于行为实验所能提供的信息有限,研究者们猜测的因果编码机制部分存在表述模糊、概念没有得到精确定义等问题。这导致了一种自然的推测——因果编码的机制由于是极度复杂、精妙的高阶机能,所以对其研究和精确表达才极为困难。这一思想在一定程度上影响了部分面向工程的计算神经科学研究,这些工作系统地探索了如何设计具有复杂的神经元间分工关系的人工神经环路,以使得该环路能基于特定复杂的规则模拟因果编码的特性[9-13]。虽然具备一定的借鉴意义,上述计算神经科学研究的主要目的并不在于解释为何神经系统能进行因果编码,而在于发展具备因果编码能力的特定环路的技术。
当我们综合上述研究结果时,会发现一个潜在的逻辑矛盾——我们既发现因果编码是几乎所有基础感知觉和认知过程的构成要素之一,又认为因果编码是复杂、高阶的认知机能。这样的观点是不完全自洽的。复杂的高阶认知机能的会由多个低阶认知机能组成,但一个复杂的高阶认知机能几乎不可能逆向地成为低阶认知机能的基础。恰如,人类的视觉这一基础的感知觉支撑了对绘画的视觉审美这一高阶的认知机能,但视觉审美不可能是视觉的基础。
所以,一个合理的推测是——即使因果编码是一个复杂的过程,其中也至少存在一部分编码是基础的、低阶的。虽然因果编码包含了因果推断、归因等高阶的决策能力,其也必然包含部分足够基础的过程,能用于支撑人类的基础感知觉和认知。
为了检验上述推测的合理性,来自清华大学心理学系&清华大学脑与智能实验室的研究团队进行了一项探索性研究,证明了基础的神经动力学会自发地完成对外界因果关系的表征。该研究的部分结果于2021年1月12日发表在 Physical Review E。
论文标题:Characteristics of the neural coding of causality论文地址:https://journals.aps.org/pre/abstract/10.1103/PhysRevE.103.012406 


2. 基础的因果编码——从神经元动力学开始

在这个研究中,研究者为了避免分析过程中参杂潜在的高阶认知机能,只采用神经系统中基础的要素生成神经动力学。
具体地,研究者随机生成任意节点数、任意图结构的随机图用于定义神经元群(节点对应神经元,而节点间的边对应突触连接),并不人为设计神经元群的拓扑结构(例如人工神经网络中严格的分层结构)。此外,由于真实情景下的刺激输入并不可能同时被神经元群中所有神经元接收,神经系统内总存在先接收到刺激的部分神经元,而另一些神经元则需要经过不同的时延(由于信号传输导致的延迟)后才能接收到刺激。研究者并不简化地把刺激加在所有神经元上,而是随机挑选部分神经元先接收到刺激,在其形成电信号后,通过神经元群内的复杂传输过程使得剩下的神经元间接地接收到刺激。为了便于后续区分,研究者暂时将收到刺激时延为0的神经元称为input neuron,而将收到刺激时延大于0的神经元称为intermediary neuron。
被称为input neuron的神经元更为直接地接收到刺激,其神经活动更多地受到刺激本身的影响。在真实情景中,神经元对外界刺激是有选择性的(被称为neural tuning property),任意神经元并不会无差别地对所有刺激都响应。研究者没有简化这一特性,而采用了神经科学中通用的neural tuning curve(一种描述神经元对特定刺激响应强度的曲线)来刻画上述选择性。在实验中,每个input neuron都有一个随机生成的neural tuning curve。而后,研究者定义了一个非齐次泊松过程用于描述任意input neuron在特定时段内接收到一个随机生成的刺激序列而产生的神经元活动。被称为intermediary neuron的神经元在接收刺激的过程中受到了复杂的网络动力学的影响,其神经活动不能被认为是独立的。不同神经元间存在复杂的互动关系,并不能被省略,这给描述神经元活动带来了极大的挑战。研究者巧妙地发展了一套半随机化的方法获得了intermediary neuron的神经活动数据,再基于最大似然估计还原出数据应该符合的非齐次泊松过程,从而完成了神经活动的描述。
总之,在生成神经元的群体动力学的过程中,研究者并没有添加简化条件,而是发展了一套合理的数学框架描述了基础的神经系统要素,生成了相对符合实际的神经元活动。                   

3. 基础的因果编码:
神经动力学对因果的表征



在生成了随机的刺激序列以及刺激诱发的神经动力学后,研究者开始进行因果度量。为了保证一般性,研究者使用了3种不同的因果度量方法,分别记为LG (Lasso-Ganger 方法[14])、CG(copula-Lasso-Granger 方法[15])和TE(transfer entropy 方法[16])。首先,研究者先生成多个随机的刺激序列,并度量任意两个刺激序列间的因果关系,这表征了外界刺激原本的因果性(original causal relation)。研究者进一步生成了多个刺激间原始的因果关系图(original causality graph)。而后,研究者度量了不同刺激对应的神经元集群活动(neural population codes)间的因果关系,即神经系统内部编码后的刺激信息间所具备的因果性(coded causal relation),并基于此生成了多个刺激在编码后形成的因果关系图(coded causality graph)。图1是一个具体的示例。

图1. 神经编码前和神经编码后的刺激间的因果关系。
显然,如果能够检验原本的因果关系(original causal relation和original causality graph)和编码后的因果关系(coded causal relation和coded causality graph)间的相似性,那就能够验证神经动力学是否能支撑基础的因果编码过程。研究者进行了多次大规模的随机实验,对这一问题给出了肯定的答案。
在给出最终答案前,研究者首先分析了神经编码过程会对因果关系造成什么样的影响(coding effects)。研究者发现编码前后因果关系的差异值与原始因果关系的值呈现出一定的线性关系,这意味着外界刺激间原始的因果关系的确对因果编码过程有显著影响(见图2a)。如果将编码前后的因果图进行匹配,并计算真阳性(TP)、假阴性(FN)、真阴性(TN)和假阳性(TP),研究者发现神经动力学能以相对可接受的真阳性和真阴性率编码因果关系图(见图2b)。同时,编码后的因果关系的分布相对编码前的因果关系的分布更为稀疏,不同因果关系间的差异被放大,这意味着神经动力学在某种程度上提供了因果关系的稀疏性编码(见图2c)。
     图2. 神经编码过程对因果关系造成的影响。
而后,研究者进行了更大规模的实验,通过调控提供给因果关系判定的刺激和神经活动序列的长度 (用于衡量历史信息的多少)分析了因果编码对历史信息的依赖性。研究者基于真阳性、假阳性等指标计算了精度(precision)和召回率(recall),发现其几乎不受长度  的影响。神经元群能在历史信息极少时就取得相对可接受的编码精度,而后即使增加历史信息也不会再受显著影响(见图3a)。这在一定程度上解释了人类大脑编码因果关系的高效性,并且与真实实验研究得到的结论一致[17]。同时,研究者发现基于神经动力学完成的基础因果编码召回率较低,即存在对因果关系的遗漏(见图3b),这也进一步表明因果编码是一个复合过程,除去基础的编码外,后续还有待高阶的认知机能进行调控。
图3. 历史信息对因果编码的影响。
在论文中,研究者还进行了其他方面的系统分析,并刻画了从原始因果关系到编码后因果关系的数学映射规律,在此不予展开。 


4. 总结

在这个因果编码的研究中,研究者证明了神经动力学可以自发地进行基础的因果编码。一方面,研究者发现因果编码过程受到原始因果关系的显著影响。另一方面,研究者证明了神经动力学能以较高的精度完成对因果关系的编码,且提供了对因果关系更为稀疏的表征。此外,研究者发现因果编码的准确性几乎不受历史信息数量的影响,这意味着神经系统能利用极少的历史信息就完成基础的因果编码,这与真实的实验发现相吻合,且解释了人类大脑识别因果关系的高效性。最后,研究者也发现基础的因果编码存在对因果关系的遗漏,这暗示了因果编码过程的复合型,可以预测人类大脑中还有其他更高阶的过程参与因果编码,进一步补足编码性能。在这项研究中,研究者还进一步运用统计学工具刻画了从原始因果关系到编码后因果关系的映射规律。
作为一项系统开展的物理学研究,该工作还提供了一个泛用的、不基于强假设的神经动力学生成框架,研究者发展了完整的数学描述工具,可以进一步用于其他需要生成神经元集群活动的研究中。在文中,研究者进一步指出该框架可以便捷地发展为基于主方程的随机热力学[18,19](即Schnakenberg network theory[20,21])。这意味着研究者提供的数学框架将能直接转换为对神经元集群活动的随机热力学描述,并能支撑更为复杂的动力学分析。
此外,在研究最后的讨论中,研究者进一步提出了一个有趣的观点——神经系统只是非孤立系统的一个例子,类似的系统还广泛存在于热力学[22,23]、量子力学[24,25]和生物学领域[26-28]。那,是否能将因果编码这一概念进一步推广到任意非孤立系统?通过分析非孤立系统进行的广义因果编码,研究者将能从另一个角度分析非孤立系统与外界环境的耦合关系,以及这些耦合关系如何被反应在系统内的元素间耦合关系中。基于这一角度,起源自神经科学的因果编码问题或许能为其他物理学领域提供更直接的启发。
因果编码中,有一部分基础的过程是由神经动力学自发地完成,而不依赖于高阶的认知机能。这些能迅速被编码的因果关系支撑了人类的基础感知觉和认知机能。当我们开展各类因果科学前沿研究时,或许不应忘记——我们的神经系统是天生的因果科学家。 参考文献
[1] A. Pouget, J. M. Beck,W. J.Ma, and P. E. Latham, Probabilistic brains: Knowns and unknowns, Nat. Neurosci. 16, 1170 (2013). 
[2] C. Chandrasekaran, Computational principles and models of multisensory integration, Curr. Opin. Neurobiol. 43, 25 (2017).
[3] J. K. Bizley, G. P. Jones, and S. M. Town, Where are multisensory signals combined for perceptual decision-making? Curr. Opin. Neurobiol. 40, 31 (2016).
[4] L. Shams and U. R. Beierholm, Causal inference in perception, Trends Cognit. Sci. 14, 425 (2010).
[5] M. O. Ernst and H. H. Bülthoff, Merging the senses into a robust percept, Trends Cognit. Sci. 8, 162 (2004).
[6] L. Shams and A. R. Seitz, Benefits of multisensory learning, Trends Cognit. Sci. 12, 411 (2008).
[7] B. J. Scholl and P. D. Tremoulet, Perceptual causality and animacy, Trends Cognit. Sci. 4, 299 (2000).
[8] E. Goldvarg and P. N. Johnson-Laird, Naive causality: A mental model theory of causal meaning and reasoning, Cognit. Sci. 25, 565 (2001). 
[9] W. J. Ma and M. Rahmati, Towards a neural implementation of causal inference in cue combination, Multisensory Res. 26, 159 (2013).
[10] Y. Fang, Z. Yu, J. K. Liu, and F. Chen, A unified neural circuit of causal inference and multisensory integration, Neurocomputing 358, 355 (2019).
[11] C. Cuppini, L. Shams, E. Magosso, and M. Ursino, A biologically inspired neurocomputational model for audiovisual integration and causal inference, Eur. J. Neurosci. 46, 2481 (2017). 
[12] M. Ursino, A. Crisafulli, G. Di Pellegrino, E. Magosso, and C. Cuppini, Development of a Bayesian estimator for audiovisual integration: A neurocomputational study, Front. Comput. Neurosci. 11, 89 (2017).
[13] M. Ursino, C. Cuppini, and E. Magosso,Multisensory Bayesian inference depends on synapse maturation during training: Theoretical analysis and neural modeling implementation, Neural Comput. 29, 735 (2017). 
[14] A. Arnold, Y. Liu, and N. Abe, Temporal causal modeling with graphical Granger methods, in Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (ACM, New York, 2007), pp. 66–75.
[15] H. Liu, J. Lafferty, and L. Wasserman, The nonparanormal: Semiparametric estimation of high dimensional undirected graphs, J. Mach. Learn. Res. 10, 2296 (2009).
[16] T. Schreiber, Measuring Information Transfer, Phys. Rev. Lett. 85, 461 (2000).
[17] A. Michotte, The Perception of Causality, Psychology Library Editions: Perception, Vol. 21 (Routledge, Abingdon, England, 2017).
[18] K. Sekimoto, Stochastic Energetics, Lecture Notes in Physics Vol. 799 (Springer, Heidelberg, 2010). 
[19] U. Seifert, Stochastic thermodynamics, fluctuation theorems and molecular machines, Rep. Prog. Phys. 75, 126001 (2012).
[20] J. Schnakenberg, Network theory of microscopic and macroscopic behavior of master equation systems, Rev. Mod. Phys. 48, 571 (1976).
[21] D. Andrieux and P. Gaspard, Fluctuation theorem for currents and Schnakenberg network theory, J. Stat. Phys. 127, 107 (2007). [22] R. B. Schwarz and A. G. Khachaturyan, Thermodynamics of Open Two-Phase Systems with Coherent Interfaces, Phys. Rev. Lett. 74, 2523 (1995).
[23] E. Kuhl and P. Steinmann, Mass- and volume-specific views on thermodynamics for open systems, Proc. R. Soc. London, Ser. A 459, 2547 (2003).
[24] P. Talkner and P. Hänggi, Colloquium: Statistical mechanics and thermodynamics at strong coupling: Quantum and classical, Rev. Mod. Phys. 92, 041002 (2020).
[25] M. Campisi, P. Talkner, and P. Hänggi, Thermodynamics and fluctuation theorems for a strongly coupled open quantum system: An exactly solvable case, J. Phys. A: Math. Theor. 42, 392002 (2009).
[26] A. Katchalsky and O. Kedem, Thermodynamics of flow processes in biological systems, Biophys. J. 2, 53 (1962).
[27] H. Qian and T. C. Reluga, Nonequilibrium Thermodynamics and Nonlinear Kinetics in a Cellular Signaling Switch, Phys. Rev. Lett. 94, 028101 (2005).
[28] D. T. Haynie, Biological Thermodynamics (Cambridge University, Cambridge, England, 2001).
(可上下滑动阅览)


推荐课程
课程介绍:如何将因果推理与机器学习相结合,开发可解释人工智能(XAI)算法,是迈向人工智能2.0的关键步骤之一。为此,我们希望可以通过因果科学专题读书会,研读相关论文,来试图找到回答上述问题的答案。本系列课是读书会的录播。

课程地址:
https://campus.swarma.org/course/1798

复杂科学最新论文


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:

推荐阅读

PC算法:缺失数据下的因果发现什么是因果推断 | 集智百科PRX生物物理前沿:噪声驱动的细胞不同状态跳转的动力学机理如何在观测数据下进行因果效应评估
加入集智,一起复杂!

点击“阅读原文”,追踪复杂科学顶刊论文