关键词:复杂网络,高阶新奇性,随机游走,幂律



论文题目:The dynamics of higher-order novelties

论文地址:https://www.nature.com/articles/s41467-024-55115-y

期刊名称:Nature Communications


在我们的日常生活中,新奇性是一种常见的体验,无论是首次探访一个新地点、尝试一个新餐厅,还是听一首新歌曲,这些都是新奇性的表现。然而,新奇性不仅仅体现在个人层面,更广泛地存在于社会和科技创新中。了解新奇性的形成机制,对于揭示人类创造力和社会及神经机制至关重要。


近期发表在Nature Communications的一篇文章聚焦于“高阶新奇性”(higher-order novelties),这是一种在已知元素基础上通过组合形成的新奇性。与以往研究单一新奇元素不同,高阶新奇性涉及多个元素的首次组合,如两个词汇或概念的首次结合。研究通过定义高阶 Heaps 指数来表征这种组合的发现速度,并通过实证数据分析揭示了这一过程的动态特性。


研究发现,听歌记录、书籍文本和科学文章的关键词三个数据集的高阶新奇性都遵循 Heaps 法则,但其指数值随着组合阶数的增加而下降。这些发现表明,即使在发现单个新奇项的速度相同的情况下,更高阶的新奇组合的发现速率也存在差异。


图 1. 真实数据集中高阶Heaps指数


为进一步解释上述实证结果,研究提出了一个基于随机网络的理论模型:边权重增强随机游走(Edge-Reinforced Random Walk on a Network, ERRWT)。该模型将新奇性探索过程抽象为一个随机游走过程,节点表示单个元素(如单词、歌曲等),首次访问某个节点会触发新的节点及其连接的生成;边表示元素之间的关系(如词汇组合或歌单),首次访问某条边时,会触发新的边或组合的生成。每次随机游走时,既可能访问新的节点(发现新元素),也可能触发新的边(发现新组合),且模型中设定的触发参数(如节点和边的触发概率)决定了不同阶新奇性增长的速度。模型的研究发现,节点触发参数决定了1阶新奇性的增长速度,而边触发参数主要控制高阶新奇性的增长;随着时间增加,高阶组合的增长受到网络结构的限制,但这一过程仍保持幂律性质。


图 2. ERRWT模型示意图


最后,通过将ERRWT模型与传统的触发型Urn模型(UMT)进行对比,研究进一步验证了ERRWT模型的优势:ERRWT模型更适合描述高阶新奇性,能够捕捉到边和节点触发的交互作用;在高维数据(如科学文献)中,ERRWT模型提供了更准确的拟合结果。


图 3. 真实数据拟合ERRWT模型


这项研究不仅提供了一种新的视角来理解新奇性的产生,还通过高阶新奇性的概念,拓展了我们对人类探索行为的认知。通过网络模型和随机游走理论,研究揭示了探索过程中的复杂动态,为理解创新发展过程提供了新的理论工具。此外,这种方法对于预测技术发展趋势、优化信息传播策略等领域也具有潜在的应用价值。



彭晨 | 编译



AI+Social Science读书会


详情请见:
AI+Social Science:大模型怎样重塑社会科学 | 计算社会科学读书会第三季启动



推荐阅读
1. 基于复杂网络的随机游走方法,量化城市社会空间区隔
2. Nat. Rev. Phys.速递:高阶网络上的传染动力学
3. 拓扑深度学习捕捉数据的高阶关系:信息传递拓扑神经网络概述
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5. 龙年大运起,学习正当时!解锁集智全站内容,开启新年学习计划

6. 加入集智,一起复杂!



点击“阅读原文”,报名读书会