Nat. Commun. 速递:高阶新奇性的动力学
论文题目:The dynamics of higher-order novelties
论文地址:https://www.nature.com/articles/s41467-024-55115-y
期刊名称:Nature Communications
在我们的日常生活中,新奇性是一种常见的体验,无论是首次探访一个新地点、尝试一个新餐厅,还是听一首新歌曲,这些都是新奇性的表现。然而,新奇性不仅仅体现在个人层面,更广泛地存在于社会和科技创新中。了解新奇性的形成机制,对于揭示人类创造力和社会及神经机制至关重要。
近期发表在Nature Communications的一篇文章聚焦于“高阶新奇性”(higher-order novelties),这是一种在已知元素基础上通过组合形成的新奇性。与以往研究单一新奇元素不同,高阶新奇性涉及多个元素的首次组合,如两个词汇或概念的首次结合。研究通过定义高阶 Heaps 指数来表征这种组合的发现速度,并通过实证数据分析揭示了这一过程的动态特性。
研究发现,听歌记录、书籍文本和科学文章的关键词三个数据集的高阶新奇性都遵循 Heaps 法则,但其指数值随着组合阶数的增加而下降。这些发现表明,即使在发现单个新奇项的速度相同的情况下,更高阶的新奇组合的发现速率也存在差异。
图 1. 真实数据集中高阶Heaps指数
为进一步解释上述实证结果,研究提出了一个基于随机网络的理论模型:边权重增强随机游走(Edge-Reinforced Random Walk on a Network, ERRWT)。该模型将新奇性探索过程抽象为一个随机游走过程,节点表示单个元素(如单词、歌曲等),首次访问某个节点会触发新的节点及其连接的生成;边表示元素之间的关系(如词汇组合或歌单),首次访问某条边时,会触发新的边或组合的生成。每次随机游走时,既可能访问新的节点(发现新元素),也可能触发新的边(发现新组合),且模型中设定的触发参数(如节点和边的触发概率)决定了不同阶新奇性增长的速度。模型的研究发现,节点触发参数决定了1阶新奇性的增长速度,而边触发参数主要控制高阶新奇性的增长;随着时间增加,高阶组合的增长受到网络结构的限制,但这一过程仍保持幂律性质。
图 2. ERRWT模型示意图
最后,通过将ERRWT模型与传统的触发型Urn模型(UMT)进行对比,研究进一步验证了ERRWT模型的优势:ERRWT模型更适合描述高阶新奇性,能够捕捉到边和节点触发的交互作用;在高维数据(如科学文献)中,ERRWT模型提供了更准确的拟合结果。
图 3. 真实数据拟合ERRWT模型
这项研究不仅提供了一种新的视角来理解新奇性的产生,还通过高阶新奇性的概念,拓展了我们对人类探索行为的认知。通过网络模型和随机游走理论,研究揭示了探索过程中的复杂动态,为理解创新发展过程提供了新的理论工具。此外,这种方法对于预测技术发展趋势、优化信息传播策略等领域也具有潜在的应用价值。
彭晨 | 编译
AI+Social Science读书会
6. 加入集智,一起复杂!