关键词:语言扩散模式,语言演变,系统地理学,语言速度场估计



论文题目:Inferring language dispersal patterns with velocity field estimation
论文期刊:Nature Communications
论文地址:https://www.nature.com/articles/s41467-023-44430-5
斑图地址:https://pattern.swarma.org/paper/c8662ce0-a9c5-11ee-bc79-0242ac17000e

重建语言的空间演变可以加深我们对语言扩散和文化传播的理解。然而,常用的系统地理学方法在推断语言扩散模式时存在局限性,主要是因为系统发生树无法完全解释语言之间的横向联系所引起的语言演变,如词语借用和区域扩散。该研究引入了不依赖系统发生树的语言速度场估计法来推断语言的扩散轨迹和中心,其有效性和稳健性通过模拟和实证研究得到了验证。

与系统地理学方法类似,语言速度场也包括两个主要方面,但不涉及系统发生树。首先是建立一个速度场(velocity field),以描述语言特征的非同步进化轨迹,从而形成所观察到的语言相关性。这个速度场的功能类似于系统发生树,但它还能捕捉到横向联系的归因。然后是根据语言相关性与语言地理之间的相关性,将这一速度场投射到地理空间中。这类似于系统发生树的地理投影,有助于勾勒出语言在地理空间中的传播轨迹。

图1:语言速度场在推断语言传播轨迹和中心时的流程示意图

模拟验证使用 1000 个模拟数据集验证了语言速度场的计算有效性和鲁棒性,模拟数据集给出了语言的散布模式。作者根据估计模式与给定模式之间的差异,以验证语言速度场的有效性,并在不同参数设置下评估了其稳健性。

在实证应用中,作者利用该方法可推断出四个农业语系(印欧语言、汉藏语系语言、班图语系语言和阿拉瓦克语系语言)和语群的扩散模式,共包含约 700 个语言样本。研究结果表明,这些语言的扩散轨迹主要与古 DNA 和考古材料推断出的人口移动路线相吻合,而且其扩散中心在地理位置上靠近古代农业或新石器文化的故乡。在过去的一万年中,农业语言是伴随着非农化扩散和文化传播而扩散的。作者预计,语言速度场估计有助于语言演变的空间分析,并进一步扩展到人口和文化动力学研究。

图2:四大语言经由不同方法推测的传播路径对比

图3:语言速度场在语言传播的路径推断上,与其它方法的对比



编译|郭瑞东

计算社会科学读书会第二季



详情请见:

数据与计算前沿方法整合:计算社会科学读书会第二季启动


推荐阅读
1. PNAS速递:人类语言语义空间的局部相似性与全局差异性
2. PNAS 速递:增量语言产生中的信息论原则
3. Sci. Adv.速递:语义网络分析自动识别阴谋论
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5加入集智学园VIP,一次性获取集智平台所有内容资源
6. 加入集智,一起复杂!


点击“阅读原文”,报名读书会