M.Mitchell Waldrop ,科学记者,著有《复杂:诞生于秩序与混沌边缘的科学》

集智

上图是一个多主体仿真模型的快照。其中,白宫附近的一枚核弹熄灭几小时之后,一股放射性尘埃(黄色)向东延伸到华盛顿特区。图中柱状体的高度表示一个地点的人数,颜色表示人们的健康状态,色表示健康,红色代表疾病或者死亡。

编译:集智翻译组

来源:sciencemag.org

5月的一个星期一上午11时15分,一辆普通的货车开进了位于华盛顿市中心的16街和k街的交叉口,就在白宫以北几个街区。


突然,货车中的自杀式袭击者按下了一个开关。

瞬间,大部分城市街区在一个核火球中消失了,核火球的面积有席卷日本广岛的火球的三分之二。 这次爆炸是由恐怖分子几周前劫持的5公斤高度浓缩铀提供动力,爆炸的冲击波毁掉了至少1公里之内的建筑物,造成了成千上万的伤亡。强大的电磁脉冲还炸毁了5公里以内的手机。随着电路被毁,城市也陷入了大面积黑暗。 风把爆炸之后的蘑菇云切成了放射性尘降物(radioactive fallout),向东漂移到马里兰郊区。 道路上很快就挤满了慌张的人,有些人试图逃离这个地区,但更多的人在寻找失踪的家庭成员或寻求医疗救助。

当然,这完全是虚构的,但却有着很严肃的意义。 


这个被称为国家规划情形1(NPS1)的核袭击故事线作为一种战争游戏起源于20世纪50年代,是用来测试国家安全官员和应急管理人员在必须应对的真实情况发生之前,如何采取应对计划的一种安全方法。

六十年后,官员们仍然在定期的 NPS1演习中考虑核灾难的后果。只是现在,他们没有按照固定的故事线和提前对核袭击下人类行为进行预判来进行演习,而是使用计算机来模拟整个人工社会的情景: 这是一种叫做多主体仿真模型(agent based model)的先进的计算机仿真方法。

1.何为多主体模型

今天的 NPS1模型包含了每一个受到炸弹影响的建筑物的数字模拟,每一条道路,电力线,医院,甚至是手机信号塔等等。 这个模型还引入了天气数据来模拟尘降物的扩散情况。另外,这个场景大概涉及了730000个主体,这个数量与统计学计算的该地区受影响的实际人口相同,并且每个主体还带有不同的特征,包括年龄、性别和职业等。 每一个主体都是一个自主的子程序,它会以合理的人为的方式来响应其他主体和不断变化的灾难——它会表现出各种各样的行为:例如恐慌、逃跑、努力寻找家庭成员等等。

这样的模型的目的是为了避免像传统经济学和流行病学等领域所做的那样用从上到下的固定的方程式来描述人类的行为。其实正相反,诸如金融崩溃或疾病蔓延等结果是自下而上的,通过许多个体的相互作用,让真实世界产生了大量的丰富性和自发性,这些是传统的方法难以模拟的。

计算机科学家Christopher Barrett表示,这类细节正是应急管理人员所需要的。Christopher Barrett是一位计算机科学家,他在弗吉尼亚理工学院和布莱克斯堡州立大学(弗吉尼亚理工大学)创立了生物复杂性研究所,这个研究所为政府开发了 NPS1模型。 NPS1模型可以警告管理人员,例如,x 点的停电很可能会导致 y 点的交通堵塞。 再比如,如果他们决定在危机初期部署移动电话塔以恢复通讯,NPS1也可以告诉他们是更多的还是更少的人们会往电话塔那条路上走。 Barrett说:“多主体仿真模型是看你如何把所有碎片进行整理,然后观察它们的相互作用”。

多主体仿真模型也存在缺点。像 NPS1这样的模型往往很大,模型的每次初始运行都需要500微处理器组成的计算集群进行一天半的运算——这也迫使这些主体必须相对简单。Jonathan Pfautz 表示:“在个体的复杂性和模拟的规模之间必须作出权衡”,Jonathan Pfautz是弗吉尼亚州阿灵顿国防高级研究计划局(Defense Advanced Research Projects Agency)的项目经理,为社会行为的多主体建模研究提供资金。

集智

但是,随着用来填充和校准模型的数据集越来越大,计算机也越来越强大。 在经济、交通、公共卫生和城市规划等多种领域,越来越多的决策者正在认真对待多主体仿真模型。 盖恩斯维尔佛罗里达大学(University of Florida)的Ira Longini表示:“它们是最灵活、最详细的模型,这也使得它们在理解和指导政策方面最为有效。”

2.多主体建模的发展

多主体建模的根源其实至少可以追溯到20世纪40年代,当时,像阿兰•图灵(Alan Turing)这样的计算机先驱利用单机的交互式软件建模物理学和生物学中的复杂行为。 但目前我们所见的发展浪潮是从20世纪90年代中期才开始的。


社会学领域


有一个早期的成功案例是”寻找糖”(Sugarscape),是由弗吉尼亚州费尔法克斯的经济学家Robert Axtell和纽约大学(NYU)的Joshua Epstein共同开发的。因为他们的目标是在普通的台式电脑上模拟社会现象,所以他们将基于多主体的模型简化成了最基本的形式: 一组简单的主体围绕一个网格移动,寻找”糖”——一种在某些地方很丰富、在另一些地方很稀缺的食品类资源。 尽管这个模型很简单,但是却产生了令人惊讶的复杂的群体行为,例如迁移、战斗和邻居隔离。

集智

原始糖域模型的复制品:初始状态(左),2 步后(中)和 100 步后(右)。来源:Sugarscape


城市规划领域


20世纪90年代的多主体模拟发展的另一个里程碑是交通分析和模拟系统(Transims) ,这是一种基于多主体的交通模型,由Barrett等在新墨西哥州的洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory in New Mexico)开发。与传统的交通模型不同,传统的交通模型使用方程组将大量移动的车辆作为一种流体来描述,而Transims模型将每辆车和每个司机作为单独的穿过一个城市公路网的主体。这个模拟还包含了现实中的汽车、卡车和公交车,由不同的年龄、能力和目的地的人作为主体驱动。当应用道现实城市中的道路网络时,Transims比传统模型在预测交通堵塞和当地污染程度上做得更好。这就是为什么受Transims启发的多主体仿真模型在现今交通规划中成为一个标准工具的原因。


公共卫生领域


类似的转变也正在传染病学家中发生。 在上个世纪的大部分时间里,传染病学家都在用相对简单的方程组来估计传染病的爆发,他们将人们分成几类——比如易感染的,感染性的和免疫的——同时假设这几种类别的人完美混合,也就是说,在受影响的地区每个人都与其他人保持联系。 这些基于方程组的模型首先在纸上运算,然后在电脑上运行。这样的估计方式仍在广泛使用。


然而,传染病学家越来越多转向采用多主体仿真模型,这样能够将方程组为基础的模型所忽略的因素考虑在内,比如地理、交通网络、家庭结构和行为改变——所有这些都可以强烈影响疾病传播的方式。


举例来说,2014年在西非埃博拉(Ebola)疫情爆发期间,弗吉尼亚理工大学研究小组使用多主体仿真模型来帮助美国军方识别适合建立战地医院的地点。规划人员需要知道当所有流动的部门最终就位时,哪里的疾病感染率将会最高,病人能够在该地区状况极差的道路上行进多远以及他们能够多快通过这些路段等等。多主体仿真模型还能捕获一系列未能被传统的方程组考虑在内的问题。

集智

再举一个例子,Epstein在纽约大学的实验室正在与城市公共卫生部门合作,对可能爆发的寨卡(Zika)病毒进行建模,该病毒依靠蚊子传播并且可能会导致灾难性的出生缺陷。


该研究小组设计了一个模型,其中的主体包括代表全部850万纽约人,以及一小部分蚊子用来代表整个蚊子群体中,蚊子数量从捕捉陷阱中估计出来。该模型还包含了人们通常如何在家庭、工作、学校和购物场所流动的数据,性行为的数据(Zika病毒可以通过无保护的性行为传播)以及影响蚊子数量的因素,比如季节性温度波动情况、降雨量和繁殖地点,比如人们储存起来的废旧轮胎等等。 最终得到一个模型,该模型不仅能预测这种病毒爆发可能会有多糟糕(这是流行病学家从方程组为基础的模型中就可以确定的),还能够建议出病毒爆发最糟糕的地点可能是哪里。


经济学领域

在经济学中,多主体仿真模型可以成为理解全球贫困的有力工具,在华盛顿特区的世界银行的经济学家Stéphane Hallegatte说,如果你看到的只是标准的经济指标,比如说国内生产总值(GDP)和总收入,那么在大多数国家你只看的到富人,因为穷人的钱太少,他们几乎没有算在国内生产总值这样的指标里。

为了更好地理解全球贫困,Hallegatte和他的同事们正在考虑考察单个家庭。他的研究小组建立了多主体仿真模型,其中的主体代表全球140万个家庭——大约每个国家10,000个——然后他们考察气候变化和灾害将会如何影响健康、食物安全和劳动生产力。该模型估计了风暴或干旱会如何影响农民的作物产量和市场价格,或者地震如何通过摧毁工人的汽车、道路甚至工厂,来降低他们的收入。

该模型表明了一些显而易见的事情:穷人比富人在灾害和气候变化面前更加脆弱。但是Hallegatte的团队还发现了非常可观的差异性。例如,如果在一个特定的国家,穷人大多数是农民,当全球食品价格上涨时,他们可能实际上会受益于气候变化。但是如果这个国家的穷人大多数都集聚在城市,食品价格上涨可能会导致严重损害。

这种模型的精细程度使得世界银行更容易根据每个国家的需求调整方案,Hallegatte说,而且更容易用人们通俗易懂的语言来解释模型的结果,而不是使用经济学术语。“不要告诉一个国家,气候变化会使国内生产总值下降X%,” 他说,“你可以说1000万人将陷入贫困,这是一个更容易理解的数字。”

3.如何使用和解释模型

鉴于这些模拟的结果事关重大,Barrett说,用户们总是想知道为什么他们应该相信模拟的结果,他们怎么能确信模型输出的结果与真实世界有任何关系——尤其是在例如核灾难等并没有经验数据可以依靠的情况?

Barrett说这个问题有几个答案。首先,用户们不应该期望这些模型能够做出具体的预测,比如说,下周二股市将崩盘。实际上,大多数建模者通过对每一种场景进行多次模拟,然后进行平均化处理来应对不可避免的不确定性,以及,模型其实会显示一系列可能的结果,比如飓风的登陆预测。但是这仍然允许规划人员使用该模型作为测试平台,以便提前知道采取行动A,B或C的相应后果。

其次,Barrett说,建模者应该不只是把模型组合起来,然后看看最终的结果是否有意义。相反,他们应该像建立模型那样,校验他们的模型。当他们在模型中加入每一个元素时——比如说人们如何上班下班——他们应该观察模型的每一部分,并且将其与运输机构,人口普查等其他来源的真实数据相匹配。 “在建模的每一步,你都有你用来校准的数据,”他说。


集智

计算机仿真模拟人群运动


建模者也应该尝试用心理学的研究来校准模型中主体的行为。这样做可能是棘手(tricky)的,因为人类很复杂,但是在危机情况下,这可以使建模行为变得更容易,因为它往往可能更加趋向本能反应。例如,NPS1模型通过引入的内置规则,让模型中的主体在以下几种行为状态中来回切换,包括 “寻求医疗照顾”、“寻求避难所”以及“撤离”。

即使如此,实地研究(field research)也指出了重要的细微差别。法国Grenoble大学的人工智能研究员Julie Dugdale研究压力下的人类行为。她说, “在地震中,我们发现人们会更害怕没有家人或朋友在身边,而不是害怕危机本身。”人们第一件事就是会去寻找他们所爱的人,并且愿意在这个过程中将自身陷入危险。 在火灾当中,也是同样的情况,Dugdale说。工程师倾向于假设当警报响起时,人们会立即有序的向出口行进。但是看看下次你所在的建筑进行防火演习时,她说:“如果人们不先与他人交谈,他们不会先选择撤离”——以及如果需要的话,他们会先将朋友和家人找齐。


我们发现人们会更害怕没有家人或朋友在身边,而不是害怕危机本身。


证据还表明,盲目的、不经思考的恐慌是罕见的。在2011年发表的多主体仿真模型中,社会学家Ben Aguirre和他在Delaware大学的同事试图重现在2003年的Rhode Island俱乐部大火中到底发生了什么事。人群如此密集地挤在一起以至于没有人能够移动,最后导致100人死亡。通过警察,当地报纸和幸存者的叙述,Aguirre的团队得到了关于受害者的较为完整的数据,包括他们的行为以及他们与他人的关系。当研究人员将这些关系纳入模型中后,他说,在与实际火灾情况最相符的模型中,基本上没有恐慌。 “我们发现人们试图和朋友、同事以及亲人出去玩,”Aguirre说。“他们并没有想要伤害对方。那是个意外。”

集智

集智

NPS1模型中也试图纳入这样的情况,让模型中主体进入“家庭重组”模式(寻找朋友和家庭)的数量远多过进入“恐慌”模型(没有连贯性的目标地四处奔走)的数量。有时候结果可能是违反直觉的。 例如,模型表示在刚遭到袭击后,应急管理人员应该会看到一些人冲向一楼,疯狂地挤在道路上试图从学校接孩子放学或是找到失踪的配偶。


该模型也指出了一个好的减少混沌的方法:快速恢复部分通讯服务,让人们可以确认他们的亲人是安全的。

4.模型优势:使决策更科学

如果多主体仿真模型有一个最高优先级任务,那就是使模拟更容易构建、运行和使用——因为这可以让现实世界的决策者更容易使用模型。

举个例子,Epstein设想在一个国家中心,在那里决策者可以访问他称之为一百万GB(petabyte)的书:一个包含了每个大型城市的数字版本的图书馆,同时还有一个预先计算好的将每个潜在的危险纳入其中的模型。 “那么,如果真的有事情发生的话,比如有毒的污染源”,他说,“那么我们可以挑选出最匹配的模型,并做近乎实时的计算,从而得到像避难所和疏散撤离等的最佳组合。”

弗吉尼亚理工大学计算机科学家Madhav Marathe也在考虑这个问题。当五级飓风发生时,他说,像San Juan市长这样的人不能等待一周左右才得到关于风暴对于波多黎各(Puerto Rico)电网影响的可能性分析。她需要可操作的信息——“而那意味着具有简单操作界面的模型,在云中运行,并且能够在很短的时间内完成非常复杂的分析。”

Marathe称之为“服务型多主体仿真建模。”他的实验室已经花了4年的时间开发和测试一种网络工具,可以让公共卫生官员进行大规模流行病模拟并且做假设性分析,而不必雇用程序员。只需点击几下,用户就可以指定关键变量,比如感兴趣的区域,小到单一的城市,大到整个美国,以及感兴趣的疾病种类,比如说流感、麻疹、埃博拉病毒或者其他新的疾病等等。然后,通过使用该工具内置的地图和图形,用户可以看到整个模拟在他们面前实现,以及可以看到模型建议的治疗方案可能产生的效果。

尽管专门针对流行病,Marathe说,但是该工具的所涉及的地理模型和合成人口是通用的,他们可以应用于其他各种灾难,如化学品泄漏,飓风和电力能源的连锁网络故障。最终,他说,“我们希望的是建立这样的模型以提供个性化的服务 ——为你,你的家人或你所在的城市”。或者,正如Barrett所说:”如果我送吉米今天上学,他染上寨卡病毒的可能性是多少?”

集智


所以不仅仅是官员们可以使用这些系统,Barrett补充说到。它也可以为你所用。“它会像谷歌地图一样成为生活的日常。”

翻译:张章、张洪

审校:辛茹月

编辑:王怡蔺

原文地址:http://science.sciencemag.org/content/360/6385/144/tab-e-letters

推荐阅读

 

 多主体仿真与人工社会 | AI&Society 第六期 

Nature最新论文解读:最小车队问题与“乌托邦”交通系统 | 张江

如何预测Twitter用户的地理位置| 复杂性文摘10篇

加入集智,一起复杂!集智俱乐部团队招新啦!



集智

集智QQ群|292641157
商务合作|zhangqian@swarma.org
投稿转载|wangting@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

始发于微信公众号: 集智俱乐部