AI 眼中薛定谔的猫是死是活？｜新春特辑

导语

薛定谔的猫是一种神奇的量子叠加态，可以同时处于死和活的状态；而在熟悉的经典世界，物体总是有确定的状态。从量子到经典的转换是如何发生的？集智科学家、加州大学圣迭戈分校助理教授尤亦庄等人做了一个脑洞大开的实验——用AI观察薛定谔的猫。

AI 眼中薛定谔的猫是死是活？是量子的叠加态还是经典的确定状态呢？研究发现，对于较小的量子系统，人工智能模型可以理解全部的量子现实；然而随着量子系统的尺寸增加，模型很快就无法解码量子相干性，只能从数据中推断出薛定谔猫的经典现实：即要么活着要么死亡，而不会是同时。这就像是人类对于世界的认知。由此推测，在人类眼中世界之所以以经典的方式呈现，只是因为我们主观上信息处理能力不足。我们眼中的经典世界，只是真实量子世界的粗糙轮廓。本文分文两部分，第一部分是尤亦庄老师基于GPT4对论文做的简要介绍，第二部分是社区成员董唯元老师结合量子贝叶斯主义（QBism）、量子达尔文主义（Quantum Darwinism）等理论所做的更深入解读。点击文末阅读原文，可观看尤亦庄老师关于这项研究的详细介绍视频。

研究领域：量子力学，量子经典转换，薛定谔的猫态，量子贝叶斯主义，量子达尔文主义，人工智能

解码薛定谔的猫：量子物理和人工智能的新颖交叉

GPT4、尤亦庄 | 作者

今天，我很高兴与您分享一场激动人心的旅程。让我们进入量子力学的核心，去探索物理学中一个历史悠久的难题——量子到经典的转换。我们的研究团队利用人工智能的能力，为这个古老问题提供了新的视角。我们将创新的人工智能技术与量子物理相结合，对量子力学中最为令人困惑的概念之一——薛定谔的猫进行建模！

图：人工智能透过随机测量观察薛定谔猫，经典现实在模型中涌现。

论文题目：

Observing Schrödinger’s Cat with Artificial Intelligence: Emergent Classicality from Information Bottleneck

论文地址：

https://arxiv.org/abs/2306.14838

薛定谔的猫之谜

薛定谔猫是物理学家厄温·薛定谔提出的一个思想实验，是一个神奇的量子叠加态，在这种状态中的猫可以同时死亡和活着，直到它被观察。然而，在我们的日常经验中，我们从未遇到过这样奇怪的叠加态。物体要么在这里，要么在那里，但从未同时。这引发了一个迫切的问题——量子世界如何转变为我们日常熟悉的经典世界的？这就是我们所谓的量子到经典的转换，这也是科学家们一个世纪以来一直在努力解决的谜题。

释放人工智能的力量

为了探讨这个问题，我们寻求了一个强大的盟友——人工智能。我们利用了生成型语言模型的力量（这是一种可以模仿人类写文章和聊天的人工智能）来模拟量子态的“经典阴影”。这些阴影是从量子多体态的随机局部测量中获得的经典记录，它们代表了量子态在退相干后弥散在环境中的经典信息。然而，通过收集这些薛定谔猫的经典阴影并在经典计算机上处理它们，我们希望解码薛定谔猫的量子本质。

通过语言模型学习量子相干性

我们希望考察这些语言模型是否能够“解读”出经典阴影数据中编码的量子相干性。量子相干性是量子力学的一个核心特征，也是量子信息处理的关键。它以描述了不同状态之间的量子叠加和干涉，类似于薛定谔的同时死亡和活着的猫。

我们发现，对于较小的量子系统，强大的语言模型可以学会刻画量子相干性，并理解全部的量子现实。然而，随着量子系统的尺寸增加，模型很快就无法解码量子相干性，因为它们被编码在数据的越来越高阶的关联之中，而这种关联的随机涨落随着系统的尺寸呈指数增长，以至于越来越难以被模型所把握。因此，人工智能模型只能从数据中推断出薛定谔猫的经典现实：即要么活着要么死亡，而不会是同时。

揭示量子之谜

这项研究弥合了量子力学和熟悉的经典世界之间的差距，揭示了我们对宇宙的量子本质的认知或许会受到我们处理经典信息的能力的限制。随着我们不断发展完善这些模型和技术，人工智能将有望帮助我们逐渐揭示量子世界越来越深的奥秘，并使我们得以更加全面地理解和利用量子力学的神奇力量。

这只是量子物理的冰山一角！我们邀请您阅读我们的完整研究论文 [arXiv: 2306.14838]（论文链接：https://arxiv.org/abs/2306.14838），与我们一起深入探索量子领域的奥秘，以及人工智能如何照亮我们穿越这个复杂丛林的道路！

量子到经典的涌现：从信息角度理解薛定谔的猫

董唯元 | 作者

1. 量子 vs 经典

经典物理理论所阐述的概念，几乎都可以借助日常体验来理解和想象，即使像弯曲时空这样的抽象概念，我们虽无法直接想象其样貌，但稍微借助低维类比就仍可以很容易地接受并运用。

然而量子理论对朴素直觉则非常不友好。比如“叠加态”概念，就总是把人们的理解能力按在地上摩擦。由此产生的论战中，还诞生了著名的物理学四大神兽之一——薛定谔的猫。虽然赌徒和盲盒爱好者都很熟悉“各种可能性的并存”，但是这只小猫所处的量子叠加态，却是一种本质上完全不同的状态。

图1. 薛定谔的猫

为了能比较直观地区别，我们需要用一个名为“相空间”（phase space）的背景空间来描画状态。对三维空间某个由10个粒子组成的系统，我们用30个位置坐标和30个速度分量，就能描述系统的状态，那么这个60维的空间就是此物理系统的相空间。如果这些粒子还有其他更多的属性用以区分状态，那么相空间的维数还会更大。

经典理论中，系统的每个具体状态都对应着相空间中的一点，演化过程对应着相空间中的一条线。也就是说，系统中的每个粒子在每一时刻都具备确定的位置、速度以及其他属性。

与此截然不同的是，量子理论中量子态所对应的是相空间中的一个概率分布（精确地说应该是只满足归一不满足正定的“准概率分布”），而且由于“不确定性关系”的存在，一个量子态在相空间中所占的体积总是大于某个下限，根本就不能收缩为一点。

图2. 相空间的精确状态（左）与概率分布（右）

如此说来，我们很容易把经典态与量子态想象成上图的样子，左边是相空间里的经典态，右边是量子态。然而，仅靠这两张图就想展现量子态的神奇，未免太简陋且缺乏说服力，两图之间的区别也许只在于我们所掌握的信息是否完整。

如果我们面对的系统过于庞大复杂，那么只有全知全能洞悉一切的拉普拉斯妖才能恰当地找到相空间中所对应的精确一点。对无法获知所有细节的肉眼凡胎来说，就不得不使用概率大致圈画出系统状态在相空间中的所处范围。

更何况经典世界中存在大量的混沌现象，原本几乎相同状态的系统能够随着演化变得大相径庭。从这个意义上来说，相空间中的一团模糊烟雾有可能只是因信息获取能力不足所造成的“近视”罢了。

要想真正体现量子态的神奇特性，我们还得祭出那只可怜的小猫，并把它的状态放到相空间中。可以想象，这必然是个维数非常大的相空间，而且其中有很多点都对应活猫态，也有很多点对应死猫态。现在请读者猜一猜，薛定谔的猫会是下图中的哪个呢？

图3

如果坚信猫态只是经典概率的叠加，那么拉普拉斯妖眼中猫的状态应该是图a中的样子，缺乏足够信息的“近视眼”会把猫态描述成图b的摸样。然而量子理论则断言，图c才是处于叠加态的小猫在相空间中真正的样子。

两团烟雾之间的那些条纹，体现的正是我们凭借经典图像直觉所无法理解的量子相干性，就像无法理解双缝干涉实验中的光子如何同时穿过两条窄缝一样。这里甚至不是比喻的说法，处于叠加态的猫，理论上就是能产生干涉效应。

另外，通过对比三个示意图，我们也能够直观地感受到量子世界与经典世界的彻底不兼容。而且二者之间存在不止一条鸿沟，而是两重差异。

一是量子系统的内禀随机性，大体可以从图a与图b的差异来感受。可以理解为量子系统无法向我们提供足够清晰的状态信息，这与我们的探测技术手段和获取信息的“近视”程度无关，也不是混沌效应的结果，而是量子系统本身就根本不具备更细节的信息。

二是量子系统的相干性，基本相当于图b与c的区别。由此产生的量子非定域性（nonlocality）和量子互文性（contextuality），导致量子世界具有非常神奇特殊的因果结构。例如大名鼎鼎的“量子纠缠”等与朴素直觉和经典逻辑无法调和的那些量子现象，几乎全都来源于此。

2. 实在性的取舍

量子力学诞生之初，许多物理学家还十分留恋传统的经典观念，并试图填平这两条鸿沟。爱因斯坦那句 “不相信上帝会掷骰子”，就是这种观念最直接的注脚。不过大量的实验铁证很快就逼迫着研究者们放弃了第一条防线，接受了玩弄骰子的上帝。随着实验事实宣告贝尔不等式被打破，第二条防线也注定无法继续坚守，任何定域隐变量理论都注定无法完整描述量子系统的行为。

图4. 爱因斯坦：上帝不会掷骰子

然而想放弃第二条防线，却要面临非常艰难的抉择。定域性（locality）是指在任何参照系中，存在因果关系的两事件都必须满足因在前果在后。隐变量则对应着实在性（reality），是指被测量的物理量其结果必然先于测量操作存在。这两条似乎都是天经地义的铁律，然而贝尔实验的结果却偏偏展示出定域性与实在性是鱼与熊掌的关系，在我们所处的世界中不能同时成立。

可以想见，理解量子世界是何等艰深的挑战。对量子世界的诠释，也成了近百年来物理学家们分歧最为严重的领域，没有之一。除了哥本哈根学派那几乎算不上诠释的诠释，学界至少还有数十种大大小小的相关理论模型。

承袭传统物理思想较多的研究者们，大多更热衷于探索和讨论保留实在性的方案。玻姆力学和多世界理论，都属于比较典型的代表。当然，这些理论为了捍卫实在性所付出的代价也相当大，玻姆力学中引入的“量子势”概念，本质上是一个可以将信息瞬间传递到宇宙任何角落的超级广播，而多世界诠释则干脆让全宇宙不停复制分裂。还有一些比较小众的诠释，比如“交易诠释”，则干脆引入了逆时间传递的波。

图5. 多世界诠释示意图

所有这些副产品初看起来都令人难以接受，但是与放弃实在性相比，许多研究者仍然愿意积极拥抱这些代价。当然这些理论也在不断发展出新的分支，例如多世界理论的全新升级版——量子达尔文主义（Quantum Darwinism），就基本上剪除了茫茫多的平行宇宙，大体上描画了从量子世界涌现出经典世界的轮廓。

量子达尔文主义

Zurek, W. Quantum Darwinism. Nature Phys 5, 181–188 (2009). https://doi.org/10.1038/nphys1202

最近几十年间，研究者们捍卫实在性的决心开始有所松动，出现了一些放弃实在性的激进理论，比如量子贝叶斯、关系诠释等。产生这种变化的原因之一，是量子信息和量子计算方面的快速发展，使新一代思想更为开放的研究者们，对量子相干性及其衍生属性有了更加全面立体的认识。

起初秉持着“物理图像为先”思想的研究者们被EPR悖论所吸引，并没有意识到其实量子相干性还能产生更多有趣且神奇的悖论。当数学家Kochen和Specker在1967年以抽象的图论语言提出K-S定理时，并没有引起多少量子理论研究者的关注。

Kochen-Specker 定理

S. Kochen; E. P. Specker (1967). “The problem of hidden variables in quantum mechanics”. Journal of Mathematics and Mechanics. 17 (1): 59–87. doi:10.1512/iumj.1968.17.17004

随着量子计算的理论进展，许多数学或计算理论背景的研究者加入这一领域。于是越来越多的人习惯了从更抽象的视角看待量子态。研究者们意识到，量子态可以被视为一个概率生成器，或者干脆就是个记录着各种测量结果概率的数据库。由于量子测量会改变量子态这一事实，对这个“数据库”的每个“读取”动作，同时也会造成大面积修改。

熟悉数据库编程的读者会感觉到，这是一种糟糕透顶的工作机制，如果再允许多个使用者同时操作的话，很容易造成数据结果错乱。遗憾的是，量子态就是这样一种糟糕的“数据库”。当存在多个量子测量操作时，其结果中就有可能出现逻辑混乱，也就是说捋着不同的逻辑推理路径，得到完全不同的结论。

这种被称为“量子互文性”的特性，要比量子非定域性更凸显量子世界的古怪，后者的存在只是阻碍了我们将经典世界的因果结构应用于量子世界，而前者的出现则是连经典世界的逻辑结构也挡在了量子世界之外。就连使用“如果A=B且B=C，则A=C”这样的推理时，都要十分小心。

为了具体直观地感受这种逻辑错乱，我们来看看名为“Hardy悖论”的思想实验。

把两台马赫-曾德尔干涉仪（MZI）肩并肩靠在一起，并让其光路在M点处交叉。再调整透镜位置，使干涉效果恰好满足：单独入射进MZI-1的粒子刚好全部在A屏被检测到，单独入射进MZI-2的粒子则只在D屏被检测到，当入射粒子间不存在相互影响时，B屏和C屏永远不会看到粒子。

图6. Hardy 悖论思想实验

如此设定好实验装置后，我们把一对相互纠缠的正反粒子p⁺和p^–分别射入两个MZI。以经典逻辑来看，如果两个粒子同时选择了橙色路径，那么它们会在M处湮灭，根本没有机会同时行走紫色路径，这种情况下四个接收屏都黑。于是得出结论，实验可能看到的情况有两种：

A屏和D屏点亮，概率是3/4；
四个接收屏全黑，概率是1/4。

总之，B屏或C屏检测到粒子的概率一定为零。

然而基于量子态的计算却给出了不同的结论：

A屏和D屏点亮，概率是9/16；
A屏和C屏点亮，概率是1/16；
B屏和D屏点亮，概率是1/16；
B屏和C屏点亮，概率是1/16；
四屏全黑，概率是1/4。

概括起来，在B屏或C屏能够看到亮点的概率并不是零，而是1/8。这突破经典逻辑限制的部分，就来源于量子态中相干项的贡献。难怪量子相干性这么难以理解，原来它根本就不在经典逻辑框架之内！

当然，这些悖论能够成为悖论的前提是量子态是真实的。如果否认量子态的实在性，那么所有测量结果都是被临时“编造”出来的，自然也就无悖可论了。我们面对量子世界时，就像懦弱的家长面对爱撒谎的娃一样，根本不应该指望收集到具备全局一致性的信息。而且这个顽劣的娃还挺聪明，提供的信息总能局部一致，不审慎思考的话还真容易上他的当。

图7. 彭罗斯三角

有研究者用彭罗斯三角来说明量子互文性所产生的古怪逻辑结构，非常形象地展示了“局部一致而全局不一致”的样貌。

盯着这个图形看一会儿，就能理解为什么有些研究者，尤其是数学背景较重的研究者们，会那么急迫地想否定量子态的实在性。因为在他们看来逻辑一致性具有至高无上的优先级。可是放弃实在性之后，我们又该从何处出发来理解世界，其实是一个非常难回答的问题。

曾有一本介绍量子贝叶斯思想的科普书《概率的烦恼》，其副标题是“量子贝叶斯拯救薛定谔的猫”。然而读罢全书你会发现，所谓“拯救”原来就是彻底否认箱子里真的有一只猫存在！至于为什么打开箱子时能看到一只死猫或活猫，量子贝叶斯主义对此的回答是：打开箱子的动作更新了我们对宇宙的认知。

图8

好吧，高兴就好。但是，正如费曼所说，“世界终究是量子的”。那些违背贝尔不等式的统计数据，和那些包含古怪逻辑关系的实验结果，都实实在在地记录在经典世界的纸面上，是我们所处的世界中不可回避的组成部分。简单粗暴地放弃量子态的实在性，未必就能成功保留住经典逻辑。

还有更为激进的“关系诠释”索性将量子世界和经典世界的实在性一并放弃，主张仅有观测者与被观测对象之间的关系是唯一真实的。这种在哲学后院肆意奔跑的物理理论，需要对太多基本概念都做出新的定义，甚至不得不重新定义什么叫实在性。

总之，我们如今虽已知晓了更多量子世界的诡异，但距离真正理解量子世界还有相当长的路要走。维护实在性的理论和主张放弃实在性的理论，都还有许多根本性的问题没有解决。

3. 用AI理解量子世界

无论哪种诠释理论，都要解决一个问题：既然这个世界的底层是量子的，为何我们所体验到的却是经典逻辑和经典因果结构呢？

从量子世界中涌现出经典世界的机制，是被称为“退相干”（decoherence）的演化过程。量子系统暴露在环境中时会与环境发生纠缠，于是自身的相干性就随之扩散到了环境中。想象把处于叠加态的小猫养在生态瓶里，连瓶带猫一起丢到宇宙中最黑暗的角落，此时这个生态瓶对我们来说，就是个具有量子相干性的系统。

如果这个生态瓶射出了一个光子打到我们的世界，那么生态瓶系统与我们就产生了一丢丢的纠缠，也可以说，有一丢丢信息泄露到了我们的世界中。于是，在我们看来，这个生态瓶的相干性就稍微变弱了一丢丢。

如此累加，当有足够多的纠缠建立起来，足够多的信息泄露之后，我们面前的这个生态瓶就彻底变成了一个经典态的系统，再没有叠加态的猫，只有或死或活的经典盲盒猫。

作为量子世界与经典世界间的桥梁纽带，退相干机制在多世界诠释和量子达尔文理论中都承担着重要作用。但那些否认实在性的理论，尽管技术上仍然大体可行，却大多羞于使用这个机制。因为，既然量子态都不是真实的，量子态的演化就更不具备真实性了。

能否为量子贝叶斯主义者也找到一种量子与经典间的过渡机制，来替换掉那个有些无厘头的“主观更新”呢？

另外，退相干机制只是使相干性从一个规模较小系统扩散到了规模更大的系统，并没有将其抹除。我们这个世界中也确实存在着违背经典逻辑的事实，例如著名的“延迟选择实验”。那么我头脑中那些坚定的经典逻辑又是如何产生的呢？

加州大学圣迭戈分校的助理教授尤亦庄等人最近完成的一个实验，为上面这些问题的解答提供了一些全新的线索。

论文题目：

Observing Schrödinger’s Cat with Artificial Intelligence: Emergent Classicality from Information Bottleneck

论文地址：

https://arxiv.org/abs/2306.14838

概括来说，实验内容是让AI去理解量子叠加态。目标系统是由N个量子比特构建的GHZ态，以此代表处于叠加态的猫。

对所有量子比特分别进行测量，就得到一组经典数据，这组数据可以看做薛定谔的猫在经典世界内的“投影”。机器学习引擎将这些投影数据作为训练样本，最终还原出AI心目中猫态的样子。如果AI所理解的猫态足够正确，它就能对一些投影数据中的空白，或尚未发生的测量结果，给出正确的预测。实验人员也正是通过这种方式，来考察机器学习引擎是否真的学会了量子力学。

在训练算法时，实验人员为AI的“马虎”程度设计了一个参数，这个参数越大，意味着AI学得越马虎大意，越小则学得越仔细认真。可以想见，不同的参数值肯定会训练出表现不同的AI。

不出所料，AI学霸果真学会了量子力学，至少理解了叠加态，能对实验者的提问给出正确的回答。而AI学渣则什么都学不会，对空白数据的预测只能靠一通胡猜，连“全选C”的策略都没掌握。

最有意思的是那些值居中的AI普通生，居然从数据样本中学到了一个经典盲盒态，而对相干性则一窍不通。可这些数据样本明明是来自于叠加态的投影，其中都携带着相干性痕迹，为什么会被AI忽略了呢？

实验人员又尝试改变系统规模N，让AI去学习不同规模的叠加态系统。结果发现，系统规模越小，AI越容易理解系统的量子特性，而当系统规模增大时，对AI“学习能力”的要求也越来越高。从趋势上能够明显看出，当系统规模到达某个上限时，即使AI拥有再强的“学习能力”，也只能从数据样本中学到一个经典态，永远都无法领悟到叠加态。

图9. N值和β值不同设定下AI的表现

这个结果像极了我们人类自己对量子世界的认知。由此猜测，也许世界之所以在我们面前以经典的方式呈现，正是缘于我们主观上在信息处理能力方面的不足。我们头脑中的经典世界，只是真实世界的粗糙轮廓。

另外，这个实验结果似乎也在暗示，客观上当系统规模增大时，量子相干性的痕迹在投影数据中的贡献自然会变得越来越淡，哪怕是对GHZ态这种纠缠度最高的量子态来说也同样如此。这倒是在暗合退相干精神的同时，直接省去了量子态演化的过程。

总之，这种从信息处理视角探索量子特性的尝试非常有创意，相信未来这方面的研究进展一定会给我们带来更多启发和洞见。

量子力学相关课程

2022年诺贝尔物理学奖授予了关于量子信息科学的基础性研究。一百多年前，量子革命为我们带来了晶体管和激光，今天，操作纠缠粒子的技术正在让我们进入一个新的量子信息时代。集智俱乐部长期关注量子科学及其在前沿交叉领域的应用，包括量子力学与机器学习、量子生物学、量子因果、量子金融等，并沉淀了一系列相关主题的文章和学习资料，参见“物理主题文章合集”与“量子世界地图”。新的一年，欢迎感兴趣的朋友和我们一起探索！