集智


导语

一提到预测复杂系统的变化,你想到的可能是蝴蝶效应、混沌理论、洛伦兹吸引子……等等数学方法,但生态学家避开了复杂公式,开发出了一套简单有效的 R 语言软件工具。


编译:集智俱乐部翻译组

来源:Quanta Magazine

原题:A Twisted Path to Equation-Free Prediction



预测海洋渔业:

经验动态建模破解难题


有时候,我们无法解释生态数据。一个典型的例子是在加拿大Fraser河产卵的红鲑鱼。科学家从1948年就开始追踪该渔业,期间经历了无数起起落落。最开始,鲑鱼数量看起来与洋流温度呈负相关:每隔数十年,北太平洋面从暖变冷,鲑鱼数量随洋面温度的升高而降低。这个发现能说服生态学家,因为鲑鱼在冷水中数量暴增。为了避免鲑鱼灭绝,渔业管理人员也根据洋面温度和鲑鱼数量的公式设立捕捞限额。


集智

刚捕获并清洗干净的Fraser河红鲑鱼。Fraser河位于加拿大不列颠哥伦比亚省 | 摄影:Bob Kronbauer


但是在20世纪70年代,一件奇怪的事情发生了:洋面温度和鲑鱼数量不再同步。所谓两变量的紧密关联实际并不存在,鲑鱼数量看起来是随机波动的。


在生态学家George Sugihara看来,仅凭粗浅的生物学知识经营一家大型渔场愚蠢而鲁莽。现在,他和他的同事解决了Fraser河鲑鱼之谜。他们的主要突破是?——摈弃公式!


集智

George Sugihara,Scripps海洋研究所的生态学家,他认为,许多自然系统无法用公式模拟 | 来源:George Sugihara


Sugihara的团队提出了混沌系统中的经验动态建模(empirical dynamic modeling),该建模不需要做出任何关于鲑鱼生物学的假设,只需要输入原始数据。在建模设计的过程中,这些科学家们发现,虽然没有线性关联,事实上,海洋表层温度可以预测鲑鱼数量的波动。Sugihara称,经验动态建模能够揭露:自然界大量存在的复杂系统中的因果关系。


2015年,Sugihara和他的同事在美国国家科学院院刊(PNAS)发表报告,预测2014年Fraser河鲑鱼数量。经验动态建模预测鲑鱼数量在4500万到9100万之间,实际值大约8800万,比其他方法都要准确,例如太平洋鲑鱼委员会的预测是6900万到2亿。同样的成功也发生在太平洋沙丁鱼和海湾和大西洋的门哈登鱼上。准确预测好处很多,比如,渔夫可以知道接下来的捕鱼机需要多少渔船。


相关论文:Equation-free mechanistic ecosystem forecasting using empirical dynamic modeling

地址:

https://www.pnas.org/content/112/13/E1569


集智  渔夫正在装载渔网,为Fraser河红鲑鱼渔场的开放做准备 | 摄影:Richard Lam

 


追溯原理:

混沌系统的嵌入定理


经验动态建模的根源,要回到30年前。混沌理论盛行于20世纪60年代,科学家发现,许多自然的复杂现象无法预测。在混沌系统中,微小的扰动可以产生巨大的、似乎不可预测的影响,比如,蝴蝶轻扇翅膀,能够影响千里之外的天气。


“神秘的不是世界本身,而是我们看待世界的方式。”


在20世纪70年代,荷兰数学家Floris Takens试图在混沌中发现秩序。Takens和物理学家David Ruelle一起提出了“奇异吸引子”(strange attractor)的概念:在影响系统的变量组成的坐标系中,存在着一些点,随着时间的推移,就像纱线绕轴,系统中的其他点会围绕着它们旋转。


集智

Floris Takens,荷兰数学家,为混沌动态系统理论做出了很大贡献,提出混沌吸引子概念和嵌入定理(embedding theorem)


但是,在很多自然系统中,组成坐标系的相关变量数是无限的,比如一时一地的天气;而且有些变量很难测量,例如北极上空三英里的气压。


不过我们总能持续准确地测量一个变量。以如纽约市的温度为例,Takens发现,利用一变量现在和过去的值可以推得坐标系中的其他信息。这种方法需要构建一个由单一变量的过去测量值组成的坐标系,一个坐标轴是时代广场今天的温度,第二个坐标轴是昨天的温度,第三个是两天前的,以此类推,如下图。


集智

变量X的时间序列及其组成的坐标系


Takens发现,混沌系统的整体状态,至少在理论上,可以嵌入单一变量的时间序列,在1981年,Takens发表了“嵌入定理”(embedding theorem),经验动态建模可以通过其中一个变量的发展轨迹推出整体形状。


集智

集智

x轴(红)、y轴(绿)和z轴(蓝)三条坐标轴代表了三个变量,经验动态建模可以通过X轴的时间序列推知点的运行轨迹


嵌入定理:通过单一变量的时间序列可以推知混沌系统的整体状态

延伸阅读:

https://cnx.org/contents/k57_M8Tw@2/Takens-Embedding-Theorem


乔治梅森大学的Tim Sauer称,该定理“引发了热烈的讨论”。


下一步就是在现实中应用“嵌入定理”,但是Takens纯粹的数学公式难以应用在杂乱的自然中。虽然天气推动了混沌理论的建立,仍然不能预测它。因为天气涉及了太多持续变化的变量,而且无法真正测到哪怕一个变量。Sauer说,Takens的定理在变量较少的系统中更有用。


集智

Tim Sauer,弗吉尼亚州费尔法克斯郡乔治梅森大学(George Mason University)的数学家,扩大了“嵌入定理”的应用领域


Sugihara跟从Robert May学习Takens的“嵌入定理”。1990年,Sugihara和May在Nature上发表了一篇论文,关于如何运用Takens的“嵌入定理”,预测一些非线性系统的短期演变。核心方法是识别系统吸引子图中靠近系统目前状态的点。经过一两个单位时间,通过过去的行为,可以预测系统的相似演变。这篇论文的引用已过千,遍及各学科。这篇论文也促使Sugihara在职业生涯的中期涉足金融领域,用类似生态学中的经验动态建模来预测股价。


集智

Hao Ye等人根据嵌入定理,编写了一个开源的 R 语言软件包——rEDM,来实现经验动态建模(Empirical Dynamic Modeling)| 地址:https://github.com/ha0ye/rEDM


集智

向 rEDM 程序中输入1700-1900年的太阳黑子历史数据,可以较好地预测其后50年的数据


经验动态建模的基本机制。视频展现了时间序列和动态吸引子之间的关系,并说明了如何利用Takens嵌入定理重建整体运动轨迹。


在2002年,Sugihara回到科学界。当时,他尚未完成研究:证明生态系统即使复杂而混沌,也是可被预测的,而且管理人员可以通过这些预测来优化所做工作。Sugihara说:“我觉得我有责任让人们明白如何预测自然系统。”

 


生态学应用:

公式模型 vs 经验动态建模


近一世纪前,提现了第一个生态学模型,自出现起就深受物理学和工程学影响。在过去200年间,也提出了许多描述系统演化的微分方程。比如,最常用的渔业模型是加拿大生物学家William Ricker于20世纪50年代提出的Ricker模型,预测现有鱼群次年的出生率。渔业管理人员仍然高度依赖Ricker模型,通过包括温度的变量,预测不导致鱼类资源锐减的“最高持续产量”。


Sugihara指出,这样的预测太过简单,Ricker模型假设鱼群数量与环境因素的关系是线性且静止的,然而包括气候、洋流和人类活动这些环境因素是持续变化的,“而且Ricker模型不会随着样本量的增大而优化”。


相反,只要加入新数据,经验动态建模就会得到优化。当数据量足够形成密集的吸引子时,Takens的“嵌入定理”表现的最好,更容易发现接近过去的当前状态。任何新的数据点都会帮助使用者预测系统的优化。


Sugihara的研究不是“扶手椅上的数学”(指脱离实际应用),科研人员都可以使用Sugihara的程序,Sugihara的学生还开办了教授使用方法的讲习班。


顶尖生态学家希望能将Sugihara的方法应用于更需要预测的其他生态系统,不止在海洋渔业上。美国地质调查局迈阿密分局的生态学家Don DeAngelis称经验动态建模为“重大理论突破”。DeAngelis几乎一生都在使用公式建模,也说他希望在工作中用Sugihara的方法预测佛罗里达大沼泽地的鱼群数量变化。


集智

Don DeAngelis,美国地质调查局迈阿密分局(U.S. Geological Survey in Miami)的生态学家



建模局限:

数据、稳定性、短期


虽然在医药和神经科学等领域,正以超出科学家处理能力的速度喷涌着巨大量的数据集,然而,经验动态建模的数据缺乏仍未解决,生态学依旧在通往大数据革命的路上艰难前行。


Sauer指出,更为困难的问题在于经验动态建模的稳定性(stationarity)。我们不确定,一天后,一年后,十年后,或者仅仅是下一次,建模是否还具有测量意义。稳定性是实验室科学的标志:现在的蛋白质分子或酵母细胞和一世纪前一模一样,但是,2015年和1950年指的“Fraser河红鲑鱼”是同一种鱼吗?在这段时间内,加拿大渔业海洋部曾经改变过鲑鱼种群的定义;而且,鱼类本身也会进化。


此外,DeAngelis指出,经验动态建模只能做出短期预测。回到混沌系统的基本问题:两系统如果初始条件错之毫厘,演变轨迹就会差之千里。实践意义上,即使该建模能够很好地预测明年的鲑鱼数量,也不能从今年起预测数年后的鲑鱼的数量。


集智

混沌系统的初值敏感性 | 来源:Cg. tuwien. ac. at

 


终结公式建模:

转向复杂非线性系统


因为上面提到的和其他原因,Sugihara开始推广经验动态建模,应用于生态学以外的其他领域。Sugihara等人将该建模应用在金融学,神经科学,甚至基因学中。这些领域都涉及复杂而持续变化的现象,很难或不可能用近300年来主流的公式建模来预测。DeAngelis称,经验动态建模很可能是复杂系统研究的未来。


DeAngelis甚至走的更远。在2015年发表于PNAS的评论文章中,DeAngelis指出:长期以来,主流科学都使用公式建模,经验动态建模可能是转变的一部分。许多评论家认为,公式没有在生态学中取得和物理学一样的成功,生态学需要全新的研究方法。


相关论文:Equation-free modeling unravels the behavior of complex ecological systems

地址:

https://www.pnas.org/content/112/13/3856


Sugihara同意DeAngelis的看法,静态平衡的公式在工程上可能很有用,但是,对于自然界中的复杂非线性系统,是时候摈弃这种静止的观念了。Sugihara观察到,一段时间内可能会出现很有诱惑力的线性相关,但是在混沌系统中,这种相关性是错误的,如前所述:“神秘的不是世界本身,而是我们看待世界的方式。”


几年前,Sugihara收到了分子生物学家Gerald Pao的邮件。隶属于Salk生物研究所Inder Verma实验室的Pao确信,Sugihara的方法可以用于解释基因表达的数据。


相似的应用也发生在神经科学领域。神经科学家可以预测癫痫等后果严重的疾病的发作,其中一些通过Takens的嵌入定理构建神经元网络的激发模式。Sauer表示,相比生态学家,神经科学家可能更容易应用该定理,但是,“真正的杀手级应用还未出现”。


Sugihara也同意Sauer的判断:“Takens的嵌入定理很神奇”,但是,“它潜在的应用前景尚未得到充分的认识。我认为这只是转变的开始……我认为我们正在克服壁垒。”


编译:杨清怡

审校:李周园

原文:

https://www.quantamagazine.org/chaos-theory-in-ecology-predicts-future-populations-20151013

rEDM包:

https://github.com/ha0ye/rEDM



推荐阅读


机器学习能否破解混沌?| PRL论文详解

下一秒火焰如何燃烧?机器学习成功预测混沌

人类行为预测:从社会物理学到机器学习

计算社会经济学:行为数据驱动预测性管理 | 周涛

Nature评论:为何主流经济学无法预测经济危机?

加入集智,一起复杂!


推荐课程


集智

PC端观看地址:

http://campus.swarma.org/gpac=397



集智


集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智