Nature通讯:数据驱动的主导平衡识别模型
导语
利用主导平衡来对复杂系统进行建模可以起到四两拨千斤的作用,然而经典方法中对于主导平衡的识别有一定局限,近日一篇刊于 Nature Communications 的论文:Learning dominant physical processes with data-driven balance model, 提出一种数据驱动的主导平衡识别模型,利用非监督学习识别主导平衡,并在多种复杂系统上均取得了良好效果。
张澳 | 作者刘培源 | 审校
邓一雪 | 编辑
论文题目:
Learning dominant physical processes with data-driven balance model论文地址:https://www.nature.com/articles/s41467-021-21331-z
1. 复杂系统中的主导平衡
复杂的物理过程可以由简洁明了的方程所描述,而其局部行为甚至可以仅由方程中的某几个参数所描述。这种局部行为被称为主导平衡(dominant balance),它是研究复杂系统的重要手段,在湍流、地球洋流及光纤的研究中起到了关键作用,同时它也逐渐被应用于斑图生成(patern formation)、点滴形成(droplet formation)及生物膜动力学(biofilm dynamics)等新兴领域。 主导平衡提供了一种复杂度大大降低的模型,可以此近似完整地描述系统局部行为。流体力学中衡量粘性力与惯性力相对大小的雷诺数即描绘了典型的主导平衡。然而以往对主导平衡的研究需要进行严格的量纲分析及对现象机理的直觉,并且多应用于描述极限情况。 而该研究提出的方法可将复杂系统中主导平衡的识别推向一般化,突破以往研究方法的局限性,推广了主导平衡在系统建模中的应用。
2. 主导平衡与低维方程空间的等价
主导平衡的识别由控制方程入手,控制方程是完整描述某种现象的公式,比如麦克斯韦方程组,纳维-斯托克斯方程等。本文提出的方程空间(equation space)即为控制方程中的所有参数的取值集合所构成的假想空间,系统的每个可能状态都对应于该空间中一个确定的点。 方程空间中的点随着时间或空间的变化会形成相应轨迹,若将该轨迹视为向量,则该向量的每一个分量都对应控制方程中的一个参数。在这种定义下,主导平衡表现为方程空间中的低维子空间,即在局部区域中,部分参数即可完整描述该现象。
3. 低维方程空间及主导参数的识别
以低维方程空间描述占主导地位的物理过程,这种几何描述方法十分利于机器学习方法的应用。可将方程空间中局部区域的主导平衡视为团簇,并且该团簇在物理过程进行的方向上具有较大协方差的分量即为主导参数。而在非主导参数的坐标上,该团簇的值基本不变。 在众多机器学习方法中,作者采用了GMM(Gaussian mixture models)的方法进行聚类,并采用SPCA(Sparse principal components analysis)对每一簇中具有最大协方差的方向上进行了稀疏逼近(sparse approximation),将在该操作后具有非零值的分量作为主导参数。
4. 各类复杂系统中的应用
作者将该识别主导平衡的方法应用于多种领域,包括湍流、燃烧、非线性光学、地球科学及神经科学,其结果与应用经典方法所得结果相一致,并验证了基于物理直觉的观点,说明了该方法的有效性,其结果如下图所示。 图:各复杂系统中的主导平衡 对于每个系统,其系统示意图在最左侧,从左往右依次是二维方程空间(不同的颜色代表不同的平衡)、描述每个系统中各平衡主导参数的网格图(各列代表控制方程中的参数,各行代表系统中出现的主导平衡)以及描述局部主导平衡的示意图。从顶部开始,各系统依次为:边界层至湍流的过渡,光纤中的脉冲传播,墨西哥湾的表面洋流,描述神经元间电位传播的 Hodgkin–Huxley 模型和旋转爆震发动机的简化燃烧模型。
5. 总结
相比于主导平衡分析的经典方法,本文提出的方法不依赖于渐进标度的假设,且可识别方程空间中点状的局部平衡,表现出了较好的客观性及可重复性。 然而需要指出的是,虽然模型在各类系统中均表现出了良好效果,但在实际研究中应将该方法和经典方法一同应用,而不是以其作为经典方法的替代物。未来的工作可考虑将其应用于不具备全局控制方程的系统中,开拓经典方法以往所不曾涉足的领域。 代码:该研究所有代码均可下载于http://www. github.com/dynamicslab/dominant-balance可从原文链接获取研究所用数据,模拟及具体细节等补充信息 https://doi.org/10.1038/s41467-021-21331-z
网络科学新课推荐:网络动力学
集智学园特邀陈关荣、项林英、樊瑛、宣琦、李翔、史定华、李聪、荣智海、周进、王琳等网络科学专家作为导师,依托汪小帆、李翔、陈关荣的经典教材《网络科学导论》,自2月27日起开展系列上线课程,以网络动力学为主线构建网络科学知识体系。欢迎希望进入网络科学领域、提高网络分析能力、与一线专家探讨问题的朋友报名参加!
点击查看课程详情:2021重磅新课:探索网络动力学——网络科学第二期
推荐阅读
数据驱动的计算社会科学研究综述 | 网络科学论文速递11篇计算社会经济学:行为数据驱动预测性管理 | 周涛使用数据驱动的方法估算八个国家COVID-19的感染范围 | 网络科学论文速递30篇
加入集智,一起复杂!
点击“阅读原文”,追踪复杂科学顶刊论文