导语

意识是什么？意识如何测量？本文介绍了致力于解决意识难问题的新科学范式——整合信息论。整合信息论试图从公理出发，像几何学一样，推演出整个意识理论。一方面，该理论认为，意识作为一种体验，遵循内在性公理，即意识是内在的，一个人的体验只关乎自身——结果却遭遇难以验证的挑战。例如，从内在视角出发，外表毫无波澜、内心有丰富体验的冥想者仍有很高的意识程度；而人工神经网络因为整合程度很低，意识程度近乎于零。另一方面，整合信息论以信息论作为基础理论来度量意识的水平，与观察者密不可分。我们该如何调和这里的内在视角与观察者视角？本文从图灵测试，到中文屋思想实验、嘉兰测试，通过一个个思想实验，层层剖析意识谜题。

关键词：意识科学，整合信息论，观察者视角，内在视角，图灵测试，嘉兰测试

杨明哲 | 作者

梁金 | 编辑

无数人着迷于意识的问题。以前更多是哲学家谈论它，而如今，不少严肃的科学家也致力于研究意识问题，于是我们能看到很多关于意识的科学理论：全局工作空间理论，整合信息论，预测加工理论等等。这篇文章将关注两位代表性的意识科学家 Giulio Tononi 和 Anil Seth，从他们的观点立场出发，管中窥豹当前意识研究领域的共识与分歧。

我们首先要问，当我们要用科学的方法研究意识时，究竟是在研究什么？哲学家和认知科学家 David Chalmers 给了我们一个思考的框架：意识的问题可以分为简单问题和难问题。传统的认知行为与神经科学研究要解决的都是简单问题，比如人类脑电活动与做出选择的行为之间的关联。这样的研究无论多么丰富，都不能解决我们对于意识现象的一些根本困惑。

难问题则是：我们大脑的物理过程为什么总会伴随着一种意识体验？举一个具体的例子，在笔者眼中，下图（David Chalmers 的图片）是黑白灰色调的，不是红色，那你眼中它是什么颜色呢？大概率你会说，也是黑白灰呀。但这里有一种可能：你所说的黑白灰，在我眼中其实是红色，但是我把这样的颜色一直认作是灰色，于是在语言沟通上我们不会出现分歧，但我们永远也不知道自己眼中的颜色和其他人眼中的颜色，到底是不是同一种颜色。目前的科学研究，一直没有触及到这样的难问题。

David Chalmers

整合信息论：意识作为一种体验

但有一个科学家致力于缔造解决意识难问题的新科学范式，而且已经带领一个大团队在这个领域深耕20多年。他所提出的理论，整合信息论，也已经迭代到了4.0版本，成为我们谈论意识研究绕不开的一个理论。他就是美国威斯康辛麦迪逊大学的神经科学家 Giulio Tononi。

Giulio Tononi

整合信息论如今已经算是流行开来了，有不少介绍该理论的报告或文章，而且该理论受到的争议越来越大，前一阵子还有上百名科学家写信联名抵制整合信息论（参看：《124位科学家批评整合信息论是伪科学：我们该如何探讨意识难题？》）。抛开其理论是否正确或严谨，首先它概念之繁杂，计算复杂度之高，令人望而生畏。一个好的科学理论，理应简洁，理解门槛要尽可能低（虽然这不是科学家首先要考虑的事）。而整合信息论的发展历程可以说是反其道而行之。如果它复杂到同行都难以理解的地步，而且在可操作性上也是不可计算的，那么即使这个理论无比正确，也很难帮助我们增进对意识的理解。

但这个理论有一个很大的特色是我们可以借鉴的：它从公理体系出发，描述我们对于意识体验的共识，或者说，现象学性质。现象学是一个哲学词汇，最早由德国哲学家胡塞尔提出。简单来说，现象学倡导的研究方式是，我们不要纠结于现象背后的本质到底是什么，而是回到现象本身，去总结和提炼我们对所观察到的现象的共识是什么。那意识作为一种现象，它有哪些现象学性质呢？

在最新的整合信息论4.0版本里，Tononi 提出这样的公理体系：意识作为一种体验，首先是存在的，其次是内在的，特定的，整合的，排外的，有结构的。意识是存在的这条公理应该是没有争议的，一个现象首先存在了，我们才赋予它概念并谈论它。可其他公理就不一定是所有人的共识了。内在性公理，即意识是内在的，是说一个人的体验一定是只关乎他一个人的，所以要用内在的视角去评估意识体验。这个公理乍一听很有道理，可正如《意识机器》书中所说，整合信息论这个最独特的观点，也成了它最难以被检验的观点。

内在视角意味着什么？

从内在视角度量意识，是很难的一件事。读过整合信息论4.0版本后，笔者认为，该理论在概念上的繁杂，一大半都是从这个内在性公理衍生出来的。

作为一个量化框架，整合信息论以信息论作为基础理论来设计指标，而信息论和观察者视角是密切相关的。一个事件的信息量有多大，取决于这件事的发生会让你感到多么惊讶。这里的“你”，就是观察者。如果观察者事先有一些知识，使得他不会对这个事件感到惊讶，那么同样的一件事，在这种情境下带来的信息量就会减少（在信息论中，体现为条件概率和原概率之间的距离）。Tononi 认为，对意识的度量不应该这个样子，因为一个人有没有意识不应取决于外部观察者有什么知识或者处于什么状态。

那我们要怎么才能从内在视角做计算呢？显然，你不能只像一个普通观察者那样，只是做观察和统计，而要考虑一个可能有意识的系统的所有可能的运行方式。体现在整合信息论中，我们首先要得到包含系统和环境的全部物理机制，然后再把所有环境考虑进来，得到该系统在综合考虑各种环境后的“平均”物理机制。如果我们假设系统满足马尔可夫性，那么这个物理机制可以用一个概率转移矩阵（TPM）描述。去除环境影响的意思，就是在一个大TPM中，计算出一个小TPM。那么我们要如何得到TPM或者其他物理机制呢？整合信息论并不关心这一点。如果你就是这系统本身，那么你可以尝试总结出自己的“平均物理机制”，可能包括你的性格、情绪、爱好和不为人知藏在心底的小秘密等等。而如果你是正在观察这个系统的一个研究者，那你想要估计出这个“平均物理机制”可就非常不容易了。你可以收集脑电数据，但要考虑所有可能出现的脑电情况。你也可以观察这个人的行为，但要考虑他所有可能做出的行为。你还可以直接问他，让他告诉你他的感受和体验是怎样的，可他绝无可能靠自然语言把他每时每刻的体验给你客观地讲清楚。

哲学家所苦恼的解释鸿沟，似乎并没有消失，而是换了一种方式在这里存续着。

内在视角 vs 观察者视角

我们已经知道内在视角的计算是很难的，那抛开这一点，它有没有道理呢？整合信息论的繁杂，是画蛇添足，还是真的必要？如果这就是正确的方向，那我们下一步就要努力提出各种近似计算方法来克服这个难处。

其实在哲学上，这样的讨论是有历史的。广为人知的图灵测试，就是一个经典的观察者视角的判断。如何判断一个机器是否像人一样有意识？图灵给了一个办法：让一个真正的人在不知情的情况下，和其他人或者机器交互。如果他和一台机器进行问答交互时，没有判断出和他交谈的是机器，那我们就可以认为这个机器具备了意识。据说现在很多大语言模型都能通过图灵测试，那是否就说明这些人工智能已经具备意识了？

早在1980年，加州大学伯克利分校的哲学教授 John Searle 就提出了“中文屋”思想实验反驳图灵测试。假设那个和你互动的机器用中文跟你谈笑风生，那你很容易认为这台机器对汉语甚至是中国文化有着深刻的理解。但实际上，机器里面住着一个小人，他有一本万能的中汉词典，里面包含了对所有汉语语句的应对方式。当你给他输入一个汉语句子时，这个小人要做的工作只是去翻阅指南，然后根据指南的指示，用一些汉字拼出一个巧妙的回复。现在你还觉得这台机器真的理解汉语吗？

中文屋思想实验

在描述图灵测试和中文屋思想实验时，我们可以说它评估的是意识，也可以说它评估的是智能，这取决于你怎样设计这个交互过程以及有怎样的结果预期。但意识和智能是很不一样的两个概念。如果要评估智能，观察者视角很符合直觉。我们现在说大语言模型有很高的智能，就是因为它们在各种下游任务的测试上涌现出了令人惊奇的能力。但大模型有意识吗？你可以设计一套考卷，然后说考试成绩更高的学生更聪明，但你不能说考成绩更高的学生有更高的意识程度。所以意识和智能是两个维度，有的系统智能很高但毫无体验，而有的系统智能很低但可以有丰富的体验。

Tononi 应该非常喜欢中文屋这样的思想实验，因为它充分彰显了内在视角的重要性。在整合信息论4.0版本里，Tononi 设计了三个系统，其外在功能是一模一样的，都是数“1”有多少个，每当从输入中数够8个“1”，它便输出一个“1”。所以在观察者看来，这三个系统没有差异。但按照 Tononi 设计的计算方法，这三个系统的意识程度差别很大。这是一个体现意识程度要从内在视角度量的玩具模型。

除此以外，Tononi 团队还研究了节点状态对度量指标的影响。对应到我们生活中的例子，便是那些冥想者。在观察者看来，冥想入定的人一动不动，似乎和死了没什么区别。但他们内心仍有体验，而且很可能比一般人的体验还要丰富，这就和真正死去的人有本质的区别。冥想者仍有很高的意识程度。回到人工智能上，经典的人工神经网络是只有一个方向的层层堆叠，没有环，所以在整合信息论的度量下，因为整合程度很低，神经网络的意识程度近乎为0，即使它们可以在识别人脸上比大多数人都优秀。

所以我们是不是就应该采取内在视角来研究意识，亦或我们低估了观察者视角的上限？

萨赛克斯大学认知和计算神经科学教授 Anil Seth 在他的书《意识机器》里提及了嘉兰测试，或许可以作为图灵测试的升级版。嘉兰是电影《机械姬》的导演，而该测试来自于电影中的一句台词。现在还是让你和一个机器交互，而你事先已知这就是一台机器，在这种情况下，如果你仍然觉得它有意识，那么或许它真的就有意识。这是一种观察者视角，但它很难用一个考卷或量表来概括。

Anil Seth 与《意识机器》

这也正是Anil Seth在他这本书中的一个洞见。或许错误不是发生在观察者视角上，而是我们总期待着能用一个特定指标直接度量意识的程度。他认为，意识就像是生命，我们没有一个指标来度量所谓生命的程度，但这不妨碍我们区分有机的和无机的，并对生命进行分类和研究。Seth 和其他研究者也致力于提出各种各样的指标，但这些指标并不试图直接度量意识，而是尽可能抓住意识体验的某些方面。比如 Seth 等人提出的转移熵判据，可以用来判断宏观动力学解耦以及因果涌现，那么从“意识是一种涌现现象”的角度出发，或许转移熵判据触及到了意识的某种特性。他另外提出的因果密度则用来评估一个系统的整合程度，尝试捕捉一些系统中的高阶关系。他所使用的因果，来自于格兰杰因果，是从观测数据中容易估计出来的，而非 Tononi 所在意的那种严格的因果机制。（参看：意识更像温度还是生命？）

涌现、生命与意识

在我看来，Seth 并非回归到对 Chalmers 所说的简单问题的研究上，而是尝试从简单问题出发，慢慢逼近意识的真相。如果说意识问题是复杂科学和系统科学中的一个经典问题的话，那我们也应当寻找意识问题和其他复杂系统问题的关系是什么。

我们观察到，有些系统会发生涌现，另一些则不会，那涌现是什么？

在发生涌现的系统中，有些系统是有生命的，另一些系统则是非生命的，那么生命是什么？如果不只局限于生物系统，更广泛而言，有些系统如机器人集群、经济市场等也会给人具有活性的感觉，这种活性意味什么？

在各种各样的生物体或广义的生命体上，有些我们认为有意识，有些我们认为没有，那意识是什么？

顺着这样的问题序列，涌现 -> 生命 -> 意识，我们至少对所讨论对象的范围更加清晰，而且每迈出的一小步都有其实在的意义。相比于在整合信息论本已汗牛充栋的概念大厦上再建高阁，这或许是更好的研究意识的方向。

参考文献

[1] IIT4.0 版本：Albantakis, Larissa, et al. Integrated information theory (IIT) 4.0: formulating the properties of phenomenal existence in physical terms.” PLoS computational biology 19.10 (2023): e1011465.

整合信息论读书会：整合信息论基础理论——IIT4.0 深入研读 https://pattern.swarma.org/study_group_issue/766

[2] Anil Seth《意识机器》

[3]《意识科学初步：David Chalmers的简单问题与困难问题》，https://zhuanlan.zhihu.com/p/144226329

[4] 因果涌现读书会第二季：宏观动力学解耦 https://pattern.swarma.org/study_group_issue/371

整合信息论读书会

为什么我们在清醒时有意识，而在无梦的睡眠中意识水平大大降低？为什么我们的意识由大脑的某些部分产生，而非其他部分？为什么大脑的特定部分与视觉和听觉等意识体验密切相关？这些具体的问题本质上涉及到，理解决定一个系统产生意识体验的条件，以及理解决定一个系统具有何种意识的条件。整合信息论（IIT）试图用几何学一般的公理体系来解释意识是什么，意识如何测量。根据该理论，意识对应于一个系统整合信息的能力。

为了深入探索意识奥秘，系统梳理整合信息论的理论体系，北京师范大学系统科学学院教授、集智俱乐部创始人张江领衔发起「整合信息论」读书会，组织对本话题感兴趣的朋友，深入研读相关文献，激发科研灵感。读书会分为以下几个部分：整合信息论综述，基础理论框架，近似计算方法，在神经科学中的应用，在复杂系统中的拓展应用，Φ与系统临界态，以及机器意识。2024年9月28日开始，预计持续 10 期，欢迎感兴趣的朋友报名参与！

详情请见：

意识可以度量吗？整合信息论读书会启动啦！

推荐阅读

1. 意识更像温度还是生命？

2. 124位科学家批评整合信息论是伪科学：我们该如何探讨意识难题？

3. 涌现、因果与自指——“因果涌现”理论能否破解生命与意识之谜

4. 张江：第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程

5. 龙年大运起，学习正当时！解锁集智全站内容，开启新年学习计划

6. 加入集智，一起复杂！

点击“阅读原文”，报名读书会