关键词:时间序列分析,递归事件,动力系统,无监督学习,因果推断,渗流转变,拓扑数据分析
![]()
论文题目:Recurrences Reveal Shared Causal Drivers of Complex Time Series
论文地址:https://journals.aps.org/prx/abstract/10.1103/PhysRevX.15.011005
在生物学和工程学中,未被发现的因果关系常常影响着实验时间序列的数据表现,例如影响基因调控的转录因子。近期发表在Physical Review X的一篇研究通过结合偏积动力系统理论与拓扑数据分析,提出了一种无监督学习算法,用于从多重观测响应时间序列中重建未知的驱动信号。本文的方法通过递归图的构建,在数据量增加时,图中会发生渗流转变,导致随机游走的弱遍历性破缺,从而揭示共享驱动力的动态特征。
研究表明,当多个时间序列中出现同时递归事件时,可以揭示其共享的未观察到的驱动信号结构。文章介绍了一种基于物理的无监督学习算法,该算法通过迭代构建具有玻璃状结构的递归图来重建因果驱动信号。递归事件在由遍历性动力系统驱动的时间序列中逐渐揭示出关于驱动吸引子的结构信息。通过对经典信号处理和机器学习技术的广泛基准测试,证明了该方法能够从生态学、基因组学、流体动力学和生理学等多种实验数据集中提取因果驱动因素。
图 1. 共享递归法(SHREC)。一个未观察到的驱动因素会影响响应系统的集合,每个响应系统都包含独特的内部动力学和随机测量滤波器。使用Rössler动力系统来驱动具有随机参数的洛伦兹系统的集合,这些系统已被随机高斯函数过滤。使用拓扑数据分析分别计算每个响应的时间点加权递归网络,然后汇总生成共识图。通过社区检测(离散时间)或扩散流(连续时间)遍历该图,以重建驱动因素的动力学。
本文利用计算拓扑工具将时间序列转换为网络,遍历该图揭示驱动力状态的时间进程,即使从高度非线性或噪声的响应测量中也能实现。该方法适用于离散和连续时间信号,以及周期性或非周期性驱动。研究发现,该方法的准确性源于时间序列邻接图中的遍历性破缺渗流转变。
在与互信息、人工神经网络和谱变换等现有方法的比较中,本文的方法在多样的数据集上表现出色。研究指出,该方法准确性来自于识别和近似驱动信号暂时影射的不稳定周期轨道,并将算法性能与潜在的动力系统的拓扑性质联系起来。
图 2. 将共享递归(SHREC)算法应用于不同的数据集。(a)四个不同实验时间序列的响应变量驱动信号示例(蓝色)及其重构(黑色)。(b)不同重建方法的运行时间与Spearman相关评分。
图 3. 共享重建识别高阶交互。(a)由两两相互作用驱动的动力学与单个乘法驱动的动力学。(b)网络推理方法在N个相互作用基因网络中识别两个乘法驱动节点的准确性。
本文提出了一种基于递归事件的无监督学习算法,成功地从多种实验数据中重建了未观察到的因果驱动力,揭示了耦合耗散系统中信息传输的性质。研究发现,驱动力的特征不稳定轨道在响应时间序列的递归图中表现为结构特征,驱动-响应耦合的强度和响应数据集的多样性影响了重建效率。本文的研究方法为时间序列分析任务提供了新的思路。
彭晨 | 编译
6. 加入集智,一起复杂!