前言




飞鸟如何聚集成群?蚂蚁如何找到食物到巢穴的最短路径?阿米巴虫如何设计城市网络?大语言模型为什么会突然具备推理能力?所有这些问题都和一个复杂科学中的神秘现象有关——这就是涌现

数十年来,复杂系统研究者们为了破解涌现之谜,发明了大量的先进技术,包括多主体仿真、遗传算法、复杂网络、大数据、机器学习等等。但面对神奇的涌现现象,人们仍然需要凭借科学家个人的洞察和经验,case by case地来建立模型,而无法获得破解涌现特性的一般规律以及方法论。

2013年,理论神经科学家Erik Hoel与其导师Giulio Tononi提出因果涌现理论,可以看作是对「涌现」这一核心概念的定量刻画,这有助于回答科学中长期存在的一系列问题,包括生命、意识、智能等。比如人类的“自由意志”现象就有可能从涌现的向下因果(Emergent downward causality)的角度进行解释。然而,复杂系统展现出的涌现不只有因果,还有很多丰富多彩的涌现属性和规律。

随着新一代人工智能技术的突破,特别是有关图神经网络、自动微分计算、因果推理、大语言模型等新兴技术的突飞猛进,我们已经具备了根据一个复杂系统的行为表现,自动推断出系统背后的运行规律——动力学,以及系统内部的相互作用结构的能力,并已经在包括人群预测、基因网络重构、雾霾预报、交通流预测等领域获得了一定的成功,甚至于自动在数据中识别因果涌现,并构建内嵌的世界模型等能力。这意味着,我们完全可以根据系统的涌现行为和特征,而自动构建复杂系统的机理模型,新兴AI技术让这一切成为了可能!




Complexity AI Open Lab




作为北师大系统科学学院的教授,以及集智俱乐部、集智学园的创始人,集智科学研究中心院长,张江从2003年开始,就长期从事有关复杂系统建模的工作。近年来,张江带领着北师大的研究组开始聚焦在基于新兴AI技术进行基于数据驱动的自动建模研究,并立志破解复杂系统的涌现之谜。然而,仅靠北师大师生的团队是无法赶上新兴技术发展的滚滚洪流的。我们希望可以有对复杂系统自动建模领域有热情,且认可这个领域发展前景的朋友一起来合作,促进这一领域的快速发展。

我们希望这个叫做“ Complexity AI ”,中文叫做“复杂AI次方”的开放实验室,能够真正实现思想共享、资源共享、跨学科交叉,共同为复杂系统自动建模而奋进。


那么,理想中的Complexity AI Open Lab应该是什么样子的呢?可以分为近期目标和长期愿景:

  • 近期目标:聚焦“因果涌现”

目前,张江实验室已经将全部精力集中在“因果涌现”理论上,并已经取得了一定的进展。例如,我们不仅提出了能够从时间序列数据中自动识别因果涌现的神经网络算法,还于近期提出了基于奇异值分解的“新因果涌现理论”,并对因果涌现等相关定量研究领域进行了较为全面的综述,尝试探讨它与人工智能、机器学习等领域之间的关系。经过前期的探索,我们发现,这是一大片未开垦的处女地,还有大量的问题有待发现,例如,因果涌现与时间可逆性是什么关系?因果涌现与临界性是什么关系?什么时候会发生因果涌现?如何发现因果涌现?因果涌现与其他涌现现象的关系是什么?

本组发表的相关文献:
  • Neural information squeezer (https://pattern.swarma.org/paper/607abe04-7e5f-11ec-8888-0242ac170004)
  • Finding emergence in data by maximizing effective information (https://pattern.swarma.org/paper/37a38b68-d79b-11ee-9aa4-0242ac170008)
  • Emergence and causality in complex systems: a review of causal emergence and related quantitative studies (https://pattern.swarma.org/article/292)
  • Dynamical Reversibility and a new theory of Causal Emergence (https://arxiv.org/pdf/2402.15054.pdf)
  • 长期愿景:利用复杂系统逆向工程破解复杂系统的涌现之谜

    解读一下,这是一个技术与理论并进的领域。所以,最终的突破,必然能够在技术和理论上都获得成功。所谓的复杂系统逆向工程,指的是充分利用AI技术,根据复杂系统的行为推断其背后的简单规律,它不仅包括我们前期展开的一些“复杂系统自动建模”研究,还包括如复杂系统自动机制设计、自动优化与控制、以及“多学科大模型”等。我认为要想理解真正的复杂系统,我们绕不开复杂的人工智能模型。但这并不意味着我们要停留于此,要放弃掉可解释性,而是希望通过分析这些复杂模型,间接地破解复杂系统的涌现规律,我猜想这才是正确的道路。




    如何升级打怪,参与实验室建设?




    我们非常欢迎从事这个领域研究,对这个领域感兴趣的同学可以一起参与进来,共同推动这个领域的发展,见证未来发生。如果你感兴趣,欢迎扫码填写报名信息,提交简历,经过一系列升级打怪之后,即可加入Complexity AI Open Lab。



    第一阶段,加入因果涌现读书会社区


    集智俱乐部因果涌现读书会目前已经进行到了第五季,由张江科研团队发起,系统梳理了因果涌现理论的发展脉络,深入探讨了信息整合与信息分解的本质,并探索了在生物网络、脑网络、机器学习等跨学科领域的应用。因果涌现社区聚集了600+成员,积累了大量论文解读资料。

    为了更好地了解张江科研组的工作,以及感受集智社区的科研氛围,需要你先加入读书会,报名任何一期即可加入社区;如果你希望在社区中可以脱颖而出,欢迎报名读书会共创任务,共建因果涌现社区。

    正在进行的因果涌现读书会第五季将追踪因果涌现领域的前沿进展,展示集智社区成员的原创性工作,希望探讨因果涌现理论、复杂系统的低秩表示理论、本征微观态理论之间的相通之处,对复杂系统的涌现现象有更深刻的理解。读书会从2024年4月19日开始,每周五晚20:00-22:00进行,持续时间预计8-10周。

    扫码报名读书会

    斑图地址:https://pattern.swarma.org/study_group/43



    第二阶段,成为科研志愿者

    (考核周期:一个月)

    为了保证沟通效率,同时希望每个参与的朋友都能所有收获,都能有机会在实验室中贡献出他/她的才能。我们设定产出的标准,报名的同学必须先做共创任务成为科研志愿者,一个月内产出以下项目中的任意一项,才能参与实验室的建设,晋升为科研助理,并享受实验室的公共资源(代码库,论文列表,数据库资源等):

    • 协助整理、复现一些与因果涌现相关的代码(至少1个模型),可以方便的用于新的数据,从而加速大家的科研进展。

    • 解读实验室共同关心的经典、前沿论文(至少1篇),完善大家的基础知识体系,增进讨论,提高论文学习效率

    • 完成相关主题的词条翻译审校(至少1个复杂科学领域的知识词条)

    • 完成讲座整理(至少一期)

    • 完成相关主题视频的字幕修正的工作(至少120分钟)



    第三阶段,晋升科研助理

    (考核周期:三至六个月)

    如果你从志愿者阶段经过了考核,可以晋升为科研助理,参与实验室的课题,并可获得和在校研究生同等科研补贴。目前,我们开放了3个子课题,如果匹配合适,张江会亲自指导项目,并对相应的科研项目成果给予项目经费支持。

    第一批开放课题


    1. 基于因果涌现的机器学习模型

    背景:面对复杂系统,我们人类总是会选择合适的问题尺度,从而对原始系统进行抽象,再构建系统模型的。本项目拟根据因果涌现中的重要指标:有效信息,解决自动选择尺度并构建模型的算法。

    目标:一套能够根据时间序列,自动在多个尺度上进行建模(动力学学习与网络结构学习)的算法,并达到宏观尺度的有效信息能够最大化。

    输入:N个节点状态的时间序列。

    输出:系统做粗粒化的方案(哪些应该合并成一个节点,以及如何将每个节点状态汇总为粗粒化节点状态的映射函数),粗粒化尺度下的宏观动力学(体现为一个神经网络)以及粗粒化的因果网络。

    解决关键思路:将系统的粗粒化进行网络表示,并利用结构学习的手段解决自动粗粒化操作的问题。


    2. 模型已知的因果涌现

    背景:因果涌现是方兴未艾的领域,目前,一些基本问题尚未得到解决。例如,因果涌现何时出现?因果涌现究竟是一种客观还是一种依赖于观察者的现象?它与复杂系统的其它现象,如“临界相变”现象之间的关系是什么?为了回答这些问题,更好的研究方式是基于已知复杂系统模型的研究,而不是数据驱动的建模。因此,该子课题称为“已知模型”的因果涌现研究。

    问题:建立一种一般性的方法,能够在已知模型的情况下,定量化因果涌现,并探讨参数变化对因果涌现定量指标的影响,回答诸如“因果涌现何时出现?”“它与临界相变是何关系?”等问题。

    方案:选择一类成熟的动力系统模型,构建粗粒化该模型的方案,并探讨参数对因果涌现的影响。


    3. 因果涌现与意识现象

    背景:因果涌现与意识现象存在着广泛的联系,例如人类的“自由意志”就很有可能是一种因果涌现现象,即大脑中高层次神经激活模式构成了“涌现斑图”,从而实施了指向微观神经元的“向下因果”。

    问题我们的任务就是在可观测的大脑时间序列数据基础上,识别出这种涌现的因果关系,并尝试与被试的意识状态建立联系。




    如何参与?




    第一步:扫码报名读书会;

    第二步:领取共创任务并添加任务负责人微信;

    第三步:任务提交通过审核后成为Complexity AI Open Lab科研志愿者

    不看学历,只看实力!


    公共知识资源


    一个开放性的实验室最重要的是吸引优秀的人才以及沉淀积累相关的知识和资源,所以我们也非常注重相关资源的积累,希望可以沉淀从基础到实践的知识资源,提升科研效率,帮助大家少踩坑,多出成果。(以下为部分资源介绍)


    针对新手的入门路径

    针对一些没有基础,但是对因果涌现感兴趣的同学,实验室为大家整理了入门资料合集,从简到难,从基础到实战,让你快速入门相关内容,不走弯路。

    因果涌现入门路径:

    https://pattern.swarma.org/article/296

    综述文章:

    https://pattern.swarma.org/article/292


    相关数据库和代码库

    我们也整理收集了相关领域的代码,可以方便的用于新的数据,从而加速大家的科研进展。

    目前,我们收集的代码主要有三种类型:

    • 神经网络和图网络发展历程中的经典算法模型,如VAE,GAN,GCN等

    • 复杂系统中的时间序列数据生成模型,如传染病模型,投票模型,Kuramoto模型等

    • 经典的网络结构重构方法,如基于压缩感知的方法,CCM,ANRI等方法

    • 动力学预测方法,如复杂网络上的神经微分方程方法(NDCN)等

    数据库和代码库仅对Open lab实验室的成员开放。





    额外福利



     

    • 针对发表项目成果以及参与的项目,有额外奖励和补贴,视具体项目而定。

    • 参与项目的同学可提供在北京的食宿。



    也欢迎大家转发+推荐,如果匹配成功,将有机会获得集智俱乐部精心准备的纪念礼包。


    推荐阅读 


    点击“阅读原文”,报名读书会