机器学习框架NIS+:通过最大化有效信息识别“因果涌现”|集智百科
导语
NIS+(Neural Information Squeezer Plus)是一个机器学习框架,可以从时间序列数据中学习出系统在微观、宏观不同尺度的动力学,并识别因果涌现。该框架通过最大化有效信息,得到一个宏观动态模型,它是对NIS框架的推广。模拟和实际数据上的多项实验可以证明该框架的有效性,以及在不同测试环境里表现出的更强的泛化能力。
近年来,张江老师带领研究组开始聚焦基于新兴AI技术进行数据驱动的自动建模研究,并立志破解复杂系统的涌现之谜。我们希望创建一个叫做“复杂AI次方”的开放实验室,实现思想共享、资源共享、跨学科交叉,共同为复杂系统自动建模而奋进。欢迎对复杂系统自动建模领域有热情,且认可这个领域发展前景的朋友一起来合作,促进这一领域的快速发展。
潘琳莉、张江 | 作者
张江、潘琳莉、杨明哲 | 审校
目录
1. 问题与背景
1.1.1 基于信息分解的因果涌现识别
1.1.2 NIS系列
2. 问题描述
3. NIS框架及其缺陷
4. 强化版神经信息压缩机(NIS+)
4.2.1.1 NIS+识别因果涌现的能力
4.2.1.2 NIS+与其他模型比较预测和泛化能力
4.2.1.3 NIS+能否发现真正的宏观动态
5. 总结与展望
1. 问题与背景
1. 问题与背景
1.1 因果涌现识别
1.1.1 基于信息分解的因果涌现识别
Rosas方法因为是基于相关性的,所以计算比较方便,不需要找到底层的动力学机制。且对系统的动力学没有马尔可夫性的假设和要求。但是该方法也存在一些缺点:
-
该方法只是基于互信息计算,因此得到的结果仅仅是相关性刻画而不是因果性的刻画; -
该判别方法得到的仅仅是发生因果涌现的近似的充分条件; -
该方法需要手动给定粗粒化策略,以及基于此粗粒化得到宏观变量V,而不同的粗粒化测量会对结果造成不同的显著影响; -
在高维系统中,Ψ作为近似条件,误差非常大,很容易得到负值,从而无法准确地判断是否有因果涌现发生。
1.1.2 NIS系列
1.2 机器学习领域的分布外泛化问题
2. 问题描述
2. 问题描述
3. NIS框架及其缺陷
3. NIS框架及其缺陷
虽然此模型在弹簧振子、马尔科夫链、布尔网络等简单模型上得到了实验验证,但是此模型还有一些缺点和尚未改进的地方:
-
此框架目前只能在小数据集上使用,难以拓展到更大规模的复杂系统上。 -
此方法的数学形式是一个泛函问题,无法直接进行优化,虽然可以通过两个阶段得到结果,但是NIS没有真正地最大化有效信息。
4. 强化版神经信息压缩机(NIS+)
4. 强化版神经信息压缩机(NIS+)
4.1 模型框架
图注:在此框架中,输入可观测的数据(如图(a),可以是轨迹、图像序列、时间序列),输出是因果涌现的程度、宏观动力学、涌现斑图以及粗粒化策略(如图(c))。在NIS+中(如图(b)),作者首先使用互信息和变分不等式的公式将互信息的最大化问题转化为机器学习问题,其中,通过学习一个反向宏观动力学
4.2 NIS+ 框架有效性的验证(数值实验)
4.2.1 SIR模型数据
4.2.1.1 NIS+识别因果涌现的能力
4.2.1.2 NIS+与其他模型比较预测和泛化能力
4.2.1.3 NIS+能否发现真正的宏观动态
4.2.2 Boids 模型数据
4.2.2.1NIS+识别因果涌现的能力
4.2.2.2 NIS+粗粒化策略的可解释性
4.2.2.3 NIS+的泛化能力
4.2.2.4 内在噪音和外部噪音对NIS+识别因果涌现的影响
4.2.3 生命游戏模型数据
4.2.3.1 NIS+的拓展
4.2.3.2 NIS+捕获模式的能力
4.2.3.3 NIS+的泛化能力
4.2.3.4 NIS+识别CE的能力
4.2.4 大脑fMRI 真实数据
4.2.4.1 对微观状态的预测能力
4.2.4.2 尝试研究粗粒化如何将输入数据转化为一维宏观状态
4.3 关键定理与证明
4.3.1 宏观EI的变分下界
编码器的通用逼近定理
证明:
首先,我们扩展基本编码器的定义,引入一个新的运算
向量
学者们曾提出一般前馈神经网络[26][27]和可逆神经网络[28][29]的通用逼近定理,将其作为桥梁,可以证明任何前馈神经网络都可以用一系列双射映射(ψ)、投影(χ)和向量扩展(η)过程来模拟。对向量展开进行扩展后的基本编码器可表示为:
式中,函数
根据通用逼近定理[26][27],对于定义在
式中,
根据引理4,
式中,
因此,如果令
在实际应用中,虽然基本编码器和扩展版本不包括展开运算符,但我们总是在输入向量为编码器输入之前展开它。因此,有理由相信此定理仍然适用于堆叠编码器。
对于任何连续函数
此后,扩展堆叠编码器具有通用逼近性质,这意味着它可以近似(模拟)任何定义在
相关引理:
4.4 机器学习算法
4.4.1 样本重加权
4.4.2 反向动力学
4.4.3 分阶段训练
4.4.4 面对大规模复杂系统的拓展
。
5. 总结与展望
5. 总结与展望
5.1 总结
5.2 展望
参考文献
(参考文献可上下滑动查看)
因果涌现读书会第五季
跨尺度、跨层次的涌现是复杂系统研究的关键问题,生命起源和意识起源这两座仰之弥高的大山是其代表。从2021年夏天至今,集智俱乐部已经陆续举办了四季「因果涌现」读书会,系统梳理了因果涌现理论的发展脉络,深入探讨了信息整合与信息分解的本质,并探索了在生物网络、脑网络、机器学习等跨学科领域的应用。此次因果涌现读书会第五季将追踪因果涌现领域的前沿进展,展示集智社区成员的原创性工作,希望探讨因果涌现理论、复杂系统的低秩表示理论、本征微观态理论之间的相通之处,对复杂系统的涌现现象有更深刻的理解。读书会已完结,现在报名可加入社群并解锁回放视频权限。
“复杂 AI 次方”开放实验室招募
作为北师大系统科学学院教授、集智俱乐部与集智学园创始人、集智科学研究中心院长,张江从2003年开始长期从事有关复杂系统建模的工作。近年来,张江带领着北师大的研究组开始聚焦在基于新兴AI技术进行基于数据驱动的自动建模研究,并立志破解复杂系统的涌现之谜。我们希望可以有对复杂系统自动建模领域有热情,且认可这个领域发展前景的朋友一起来合作,促进这一领域的快速发展。我们希望这个叫做“ Complexity AI ”,中文叫做“复杂AI次方”的开放实验室,能够真正实现思想共享、资源共享、跨学科交叉,共同为复杂系统自动建模而奋进。
详情请见:“复杂 AI 次方”开放实验室招募,挑战“涌现”难题
推荐阅读
6. 加入集智,一起复杂!
点击“阅读原文”,报名读书会