关键词:随机博弈,合作演化,信息价值,反馈模型



论文标题:The effect of environmental information on evolution of cooperation in stochastic games
论文来源:Nature Communications
斑图链接:https://pattern.swarma.org/paper/2ff02582-2109-11ee-a0b6-0242ac17000d
原文链接:https://www.nature.com/articles/s41467-023-39625-9

合作可以概念化为一种为他人创造利益的个体高成本行为,人类通常通过直接互惠来支持合作,他们会优先帮助曾经帮助过自己的人。为了规范地描述直接互惠,传统的合作模型考虑了重复面对相同策略博弈的个体,然而这些模型假定互动发生在一个恒定的社会和自然环境中,一轮博弈中的个人行为不会影响未来的具体博弈,与此相反,在许多应用中,环境是自适应的,此类应用最好用行为与环境之间存在反馈的模型来描述。

随机博弈中,个体在多个时间段内相互作用,每个时间段内,博弈者的环境会处于几种可能状态之一。这种状态会根据当前状态、博弈者的行动和偶然性在不同时期发生变化。状态的变化会影响博弈者的可用策略及其可行回报。但在许多应用中,对环境状态的任何了解充其量都是不完整的。这种不确定性反过来又会对人类行为产生巨大影响。

作者比较两种情况下探讨随机博弈中的状态不确定性如何影响合作的演化。同时引入了“信息价值”(value of information)这一指标来量化状态信息的重要性,该值反映了获得当前状态信息后人群合作率的变化程度,数值为正,意为信息的获取会使人群更加合作,称之为“信息收益”;数值为负,则是“无知的益处”。

第一种情况是个体能够了解环境状态并根据当前状态做出决策的情况,这种情况称被为“全信息环境”(full-information setting);第二种情况是个体可能意识到他们正在进行随机博弈,但他们忽略或无法获得有关当前状态的信息,因此他们的决策与环境无关。这种情况被称为“无信息环境”(no-information setting)。结果表明信息的影响并不小,三种情况都可能发生:状态信息对合作有利、中性或有害。

图1 全信息和无信息下的随机博弈(ALLC:无条件合作;ALD:无条件变节;TFT:针锋相对;WSLS:赢-留-输-移)


作者先讨论两个例子的动态变化来说明信息的影响(如图2所示)

上行表示只有当双方都合作时,博弈者才会停留在更有利可图的第一状态,如果其中任何一方叛变,他们就会过渡到较差的第二状态,一轮之后再回到第一状态;下行表示只有当两个棋手中至少有一方合作时,才会出现劣势状态。结果表示:1)在不同情况下,状态信息可能有利的,也可能降低博弈者的合作程度;2)状态信息有利的随机博弈与不利的博弈只有微小差别;3)即使一个随机博弈呈现“无知的益处”,这种益处也不一定存在于所有的参数值中。

2 两种博弈中信息价值的比较

进一步,作者考虑在弱选择的极限情况下64个随机博弈,发现:1)信息受益博弈和无知受益博弈的数量一样多;2)在21个博弈中,有信息和无信息时的合作率是相同的,这些博弈是中性的,要么是因为存在吸收状态,要么是因为过渡与状态无关;3)在其余的博弈中,绝大多数博弈都能从信息中获益。

图3 具有确定性转换的博弈分类

我们确定了接受信息对合作演化是更好、中性还是更坏的环境。大多数情况下,信息是非常有益的。然而,也有一些值得注意的例外情况,即当种群对其状态一无所知时,它们可以实现更多的合作。



编译|董佳欣

复杂经济学读书会第二季



本季读书会详情与报名方式请参考:
直面复杂系统,重识经济规律:复杂经济学读书会第二季启动


推荐阅读

1. PNAS | 中美博弈背景下华人科学家的恐慌与回归
2. 口罩与疫情的博弈:为什么传染率低反而感染更多人?
3. PNAS 速递:婚姻是一场博弈,谁先撤出谁受益?
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5. 《张江·复杂科学前沿27讲》完整上线!
6. 加入集智学园VIP,获得20周年“涌现”学术年会入场券!
7. 加入集智,一起复杂!


点击“阅读原文”,报名读书会