前沿进展:神经流形算子对物理系统内在维度的表征学习
导语
内在维度(Intrinsic Dimension)是表征学习中用于表示一个系统或一个状态时所需要的最小维度。在力学语境下描述运动时,这一概念与物理系统的自由度(degree of freedom)类似,可以用于表征一个系统时所需要的最小坐标维度。当坐标系处于表征该物理系统的最小表示维度时,其数学模型往往是简洁且意义清晰的。近日,清华大学地球系统科学系黄小猛教授课题组发表于人工智能顶级会议 KDD 2024 上的一项研究,探究了如何计算用于表征物理动力演化的算子在潜空间下的内在维度,并揭示了在内在维度下神经网络结构能更准确地建模物理动力。根据这一理论,该研究提出了一种名为神经流形算子(Neural Manifold Operators)的模型,能够精确建模受多种方程控制的物理动力和真实世界的物理动力。由于对物理系统进行内在维度表征,该模型在实现高精度建模的同时,也实现了轻量化和物理一致性等优点。
熊巍 | 作者
论文题目:Neural Manifold Operators for Learning the Evolution of Physical Dynamics 论文链接:https://dl.acm.org/doi/10.1145/3637528.3671779
代码链接:https://github.com/AI4EarthLab/Neural-Manifold-Operators
前言
前言
对物理动力学演化的准确建模是研究和预测物理系统的基础,在科学和工程中是一项普遍的挑战。在以往的科学发展历史中,物理学家试图从第一性原理出发而推导出物理动力学的解析模型来研究物理系统的演化,使得建模的物理系统具备了可预测性。通过解析或数值方法,对这一数学模型求解来获得对该系统未来状态的预测,这种方法孕育了许多实际应用,例 如数值天气预报等。然而,在现实场景中极高的自由度和复杂性使得物理模型的建立和求解依赖更多的近似假设条件和更高的计算成本。基于神经算子的物理动力建模方法孕育而生。
在数学中,描述 Banach 空间中映射的算子具有无 限维的特性,因此,算子的维度表示成为算子学习建模物理动力演化的关键问题。 以大气模型为例,在数值求解天气模型时连续的大气控制方程被精细的网格离散成数以万计个格点(若空间分辨率为10km级),则这一离散的大气系统的自由度就趋于1011,而这一自由度将随着分辨率的提高指数级增大。我们是否能够准确计算该系统的最 优表示维 度,并以此为基础设计神经网络结构来对其进行表征?近日发表于KDD 20 24 的 Neural Manifold Operators(NMO)模型通过计算物理系统的内在维度,来实现对物理系统演化的最优表征。
什么是内在维度(Intrinsic Dimension)?
什么是内在维度(Intrinsic Dimension)?
内在维度是描述数据或系统在低维空间中最本质表示的一种度量。它表示在不丢失信息的前提下,能够用来表征数据或系统的最小独立变量的数量。从神经网络视角下,内在维度可以看作是描述物理系统下的最小表示参数或维度;从动力系统视角下,内在维度可以类比成描述运动的最小自由度。
在冗余空间中,如果存在一个更低维的子流形(例如,在三维空间中的曲面或二维空间中的曲线),则可以通过其内在维度空间下的坐标去表示。这样构建的解析模型通常更为简洁,并且从拟合的视角看,需要被遍历的状态也更少。因此,如何准确估计未知系统的内在维度,是NMO 模型要解决的核心问题。
物理系统的内在维度如何计算?
物理系统的内在维度如何计算?
NMO 模型通过构建自编码器和时间演化算子来模拟物理系统的动力学演化。该模型通过对物理系统在时间维度上的采样来驱动自编码器的训练,从而建立物理空间到高维冗余潜在空间的坐标映射。随后,通过极大似然估计来计算潜空间中用于表示潜在算子的最优子流形的内在维度。假设通过编解码器构建的潜空间是冗余的,目标的低维子流形在低维空间存在一个未知分布且其映射光滑,并满足局部密度假设,则可以通过最近邻算法计算这一维度
这一维度m被视为该系统在这一潜空间下的内在维度,用于确定 NMO 模型中时间演化算子模块的维度,从而学习物理系统的动力学演化。
图1 NMO模型的结构示意图
使用内在维度学习目标算子的优势是什么?
使用内在维度学习目标算子的优势是什么?
计算得到的内在维度m,在理论上应独立于模型的实现结构。为了验证模型在不同结构下的有效性,NMO模型分别尝试了基于全连接神经网络、卷积神经网络和Transformer架构实现的时间演化算子模块,由下表所示,在黑潮(一种海洋西边界洋流)和Navier-Stokes 系统下,各类结构均在内在维度m时呈现出最优效果。
经研究,使用内在维度表示的时间演化算子来学习目标物理系统的动力演化,主要具备以下优势(1)由于消除冗余维度后,模型结构更加轻量化,显著降低了计算时间和成本(见图 3);(2)在未增加物理约束的情况下,该方法能够有效避免过拟合,并准确学习物理系统中的特定物理性质,如质量守恒等(见图4);(3)与同类模型相比,无论是在真实世界场景还是在偏微分方程控制的场景下,该方法均实现了最优的建模效果(见图5)。
综上,NMO 模型从数学和实验的角度,尝试回答神经算子在学习潜在算子时,如何利用有限维参数空间对无限维算子进行参数化表示的问题,并为神经算子维度的选择提供了有效依据。
相关文献
[1] Wu H, Weng K, Zhou S, Huang X, Xiong W. Neural Manifold Operators for Learning the Evolution of Physical Dynamics. In Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining 2024 Aug 25 (pp. 3356-3366).
[2] Levina E, Bickel P. Maximum likelihood estimation of intrinsic dimension. Advances in neural information processing systems. 2004;17.
集智学园最新课程:
Koopman分析在非线性动力学中的应用
推荐阅读
6. 加入集智,一起复杂!
点击“阅读原文”,报名课程