经典综述回顾:计算社会科学的5种研究方法-集智俱乐部

导语

如何分析社交网络的信息流动?如何系统地观测社会地理信息的变化?如何在计算机中模拟众多个体的社会行为?这些都是计算社会科学的研究内容。作为一门脱胎于社会科学、计算机科学、复杂性科学的交叉学科,计算社会科学研究方法众多,有学者在2010年就做了详细的综述,让我们一起来回顾。


编译:集智翻译组

来源:wiley.com

原题:Computational Social Science


社会科学是一门从认知、决策、行为、团体、组织、社会、和世界体系等多个层面上对人类行为、社会动态以及社会组织进行考察分析的学科领域。计算社会科学是将社会调查与信息处理方法与高级计算媒介、复杂性科学等多门学科综合起来形成的一门学科。


目前,计算社会科学领域涉及到的研究方法主要有,自动信息提取系统、社交网络分析、社会地理信息系统(socio-GIS),复杂性建模和社会仿真模型。就好比伽利略使用望远镜作为更真实地理解宇宙的关键工具一样,计算社会科学家正在利用先进的、日益强大的计算技术工具了解一些超越传统学科分析范围的新鲜事物。


我们在本文中主要是对计算社会科学的研究领域、与社会科学之间的关系、现有的主要的理论作简要的概述。虽然历史并不长,计算社会科学已经涵盖了许多研究领域以及研究主题,其中有些领域与主题超出了社会科学以前在人类行为和社会动态的研究领域。越来越多的学者的加入这个学科,他们逐渐界定了这门学科的主题和研究范围。在这些学者的研究中,有的是重点研究最新的社会动态,有些则关注早期的基金会的形成与发展,或者是为了吸引读者,而不对计算科学一些深入的技术细节进行阐述的研究。


在我们的读者当中,可能有一些对一般的社会科学不熟悉的读者,因此在本文的第一部分,我们介绍了相较于计算社会科学更为广泛的人文科学,同时也包括了计算社会科学关于集群行为的研究方法与模型。


背景


在开始的介绍部分,我们提到社会科学或社会科学的学科领域考察各式各样的人类行为、社会动态以及组织形式。根据研究的范围和侧重点的不同,传统的社会科学学科被分为了五个:社会心理学、人类学、经济学、政治科学和社会学。而每一个学科又都包含几个分支专业,例如:

  • 人类学由体质人类学(又称,“自然人类学”、“人体学”)、文化人类学(又称为“社会人类学”)、考古学、语言人类学组成;

  • 政治科学包括比较政治学、国际关系、公共政策管理与研究方法等分支学科;

  • 统计作为科学的分析方法在所有的社会科学学科中发挥着重要的作用,不仅仅是社会科学及其分支专业中,还在地理学(人类和社会地理学)、历史(社会科学史和气候学)、语言学、管理科学等其他人文科学学科中扮演着重要的角色。


在过去的两个世纪,自启蒙运动触发了对社会进行科学研究以来,社会科学已经发展了三种当代社会科学研究方法:统计学、数学和计算。使用这些研究方法主要是为了描述和归纳(统计)、发展理论研究(数学)、和模拟复杂系统(计算),这些研究方法由于与社会科学相似的原因也被物理科学和生物科学所用。社会统计和数学社会科学是迄今为止三种方法中最古老的方法,他们有着悠久的历史传统并且植根于“政治算术学”的理论和概率论。有意思的是,“统计学”曾经是“政治学”的原名,政治学是作为国家和政体的学科,就好比经济学是经济的学科,而语言学时语言的学科。


计算社会科学是一个较现代的学科,最远可以追溯到20世纪中后期电脑刚刚发明的时候。在20世纪60年代,社会科学家开始使用电脑进行统计数据分析,当时SPSS、SAS等统计分析软件才刚刚开始出现,也正是在这时,出现了计算社会科学的第一代奠基人:Herbert A. Simon(1916-2001)、Karl W.Deutsch(1912-1992)、Harold Guetzkow(1915-2008)和Thomas C. Schelling(1921),他们更偏向计算社会科学理论方面的研究。


计算社会科学社会系统当作信息处理的组织,通过先进的计算方法对社会系统进行综合性的跨学科的研究。因此,社会科学中的计算范式有着双重来源:实质性的(作为理论视角)和工具性的(作为一种方法论)。前者所指的信息处理和控制论来源是基于Ross Ashby,Norbert Wiener,Claude Shannon和Ludwig von Bertalanffy早期的研究,在这里,我们将重点放在后者,也就是计算社会科学研究方法。


就像伽利略利用望远镜作为关键的观察工具最终获得对物质世界更深刻、更真实的理解一样,计算社会科学家正在学习利用先进和日益强大的计算工具来超越传统的学科。因此,计算社会科学是一种由分析工具支持的科学学科,在这个方面,社会科学与微生物学、射电天文学或纳米科学类似,这些学科分别由显微镜、雷达和电子显微镜等仪器设备支持,来推动发现新的科学研究领域。在工具支持的学科中,分析考察工具都是推动这些学科理论和实践发展的关键因素。

目前,根据使用环境的不同,计算社会科学方法主要分为五个:

  • 自动信息提取 

  • 社会网络分析(SNA) 

  • 地理空间分析(又被称为社会地理信息系统、地理信息系统、社会GIS)

  • 复杂系统建模

  • 社会仿真模型


同样的,每个方法下面也被系统的划分为多个模型,例如计算社会模拟模型包括系统动力学,微观分析模型,排队模型,细胞自动机,多主体模型,学习和演化模型,包括一些组合方法【例如,结合系统动力学和多主体仿真模型(ABMs)】。另外,这五种方法之间的几种组合也很常见,如在由反弹道导弹模拟时引入表达社会复杂性的幂律分布模型,计算社会科学领域还如此的年轻,并非所有可组合协调的模型都已经尝试过,一些领域仍然有待探索,欢迎各位读者尝试。不久之后,数据可视化和 “声处理”也将有可能成为计算社会科学的专业分支。最重要的是,每种计算方法都可能超越传统社会科学方法,甚至超越以前的统计和数学方法,从而提供解决问题的独特的科学见解。


 目前计算机社会科学研究组织是由多个国际协会组成的,其中包括北美计算社会及组织科学协会(NAACSOS),欧洲社会模拟协会(ESSA)以及亚太多主体仿真社会系统科学协会(PAAA)。每个区域协会都会举行年度会议并出版会议记录,此外每隔几年召开一次联合世界大会,2004年在日本京都理工学院举办,2006年在美国乔治梅森大学举办、2010年在德国卡塞尔大学举办。主要同行评审的专业期刊包括《人工社会与社会仿真》(JASSS)、《计算数学组织理论》(CMOT)、《社会科学计算机评论》(SSCR),《复杂系统进展》(Advances in Complex Systems)和《经济互动与协调期刊》(Journal of Economic Interaction and Coordination)。计算社会科学研究在许多社会科学期刊(如《美国社会学研究》,《美国政治科学评论》和其他主流期刊)以及跨学科期刊(IEEE Transactions on Systems,Man and Cybernetics)中也越来越容易见到。


方法一:自动信息提取


文本分析曾经是一种非常普通的分析方法,它通过编码文档从中提取信息与数据。近来,文本分析方法不断演变,除了文字文本之外,还可以分析音频、图像、视频。由于政府和学术界的不断推进,文本分析方法的计算效率在学术界有了一个很大的提升,但在实际应用方面仍存在着很大的缺陷。


今天,伴随着人工智能和其他计算算法的出现,文本分析,信息提取将很有可能在实际应用上取得巨大的突破。自动化提取的主要用途之一,是获得“事件数据”(events data),使用时间序列分析、语义分析、隐马尔科夫模型、微波分析、事件生命周期建模等方法分析“事件数据”。这些方法经常与其他的方法结合使用,比如在下一节中提到的复杂系统理论的方法。除了这些方法,还有许多的自动文本提取算法和系统可以挖掘网络数据结构,比如从图论和社交网络分析中组合出来。


在应用领域,自动信息提取技术由于可以挖掘实时的数据流,如新闻广播或其他电子报告,不仅可用于异常检测和预警,同时也可用于监测趋势和评估干预和项目执行等。若自动信息技术再完美些,应该能够成为日常工作系统升级或运营中心不可缺少的一部分。社会科学领域可以说是文字丰富但数据较差,因此自动信息提取技术和文本挖掘技术在该领域有大展身手的空间,如果能合理应用,将来一定会在计算社会科学研究中取得重大突破。


方法二:社会网络分析(SNA)


现代的社会网络分析(以下简称SNA)以纯粹的数学理论为基础,社会网络图更像是一个数学图表。我们首先来简单描述社会网络,社会网络将个人或一个社区看作一个点,个体(社区)与个体(社区)之间可能存在的相互依赖关系用连边表示,这样许多人(社区)就构成了一张社交网络。联盟、恐怖组织、贸易体系、认知信仰体系和国家社会体系本身都是常见的社会网络,是社会科学家们感兴趣的研究对象,例如Stanley Milgram 研究提出了著名“小世界”网络。


社会科学家们提出许多研究SNA的计算算法,不仅方便了SNA结果的可视化,还方便了对网络适应性、功能性、弱点及网络分解的理解。例如SNA可以根据网络的节点和关系的结构模式,如弹性、脆弱性、可分解性、功能性等得出关于组织结构更深层次的信息,另外,SNA可以应用于设计更强大和可持续的网络如交通运输网络等。


通过社会科学家们深入的思考,SNA有了许多实际应用:

  • 信仰系统,以了解极端主义思想和进程比如激进化;

  • 联盟和条约系统,以了解它们的历史沿革;

  • 国际和跨国组织,例如可分析推测恐怖分子网络;

  • 网络游戏,例如了解扩散者与反扩散者之间,非法贩运者与政府之间的关系网。


网络在社会系统和任何重要的科学研究中都存在,同时也是许多政策问题的组成部分。

经典综述回顾:计算社会科学的5种研究方法-集智俱乐部

   图1  互联网构成的社交网络

图片来源:http://www.tooopen.com/view/1057706.html


方法三:社会地理空间分析

(socio-GIS information systems)


地理信息系统(GIS)最初是社会地理学家和制图员研究地理现象的可视化工具和空间分析的工具。社会地理空间分析(以下简称社会GIS)目前在社会科学中有了许多应用,比如在犯罪学和区域经济学应用社会GIS可以有效的量化冲突,与其他的量化技术结合在一起可以产生一些使用数学和统计模型无法获得的有趣的见解。这一领域目前正在积极地向地理空间科学发展,Google 地球及其数据设施的发展为社会GIS增加了另一个维度,带来了新的调查方法;而该领域另外一个重要的发展是成立了国家地理信息与分析中心,一个致力于地理信息科学及其相关技术(包括地理信息系统)基础研究和教育的独立研究联盟。


方法四:复杂系统建模

(Complexity modeling)


20世纪末,复杂系统科学兴起,这一新兴学科对生命系统、人脑系统、社会系统、经济系统等复杂的系统进行了研究。那什么是复杂系统呢?抽象的说是指个体之间的相互作用比较复杂的系统,比如常见的生态系统、经济市场、社会系统都属于复杂系统的范畴。


系统之所以复杂,是由于系统表现出非线性、涌现、自适应等不同的特性,而导致系统不能使用普通的、简单的线性模型来表示。常见的复杂系统建模有神经网络建模、基于主体的建模方法、遗传算法、粒子群优化算法、蚁群优化算法等。复杂系统的理论模型为社会科学中的非均衡系统的动态分析提供了理论支持,非均衡动态系统的例子常常发生在全球最具有挑战的社会科学研究中,如恐怖袭击、发展中国家的财富和贫困,政治不稳定,外国援助分布和国内和国际冲突等。


相比之下,均衡系统的特点是状态变量接近正态分布(高斯分布或“钟型”分布),很少偏离中心,而非均衡动态系统则被发现系统中的几个重要变量是遵循幂律分布的,如在战争中的死亡率服从幂律分布


幂律分布计算社会科学中最常见的复杂系统模型。帕累托首次将幂律分布函数应用于经济学中,给定变量X,则有概率密度函数p(x)~x^(-a),其中a>0,是所谓的帕累托指数。

经典综述回顾:计算社会科学的5种研究方法-集智俱乐部

图1  正态分布(“钟型”分布)

经典综述回顾:计算社会科学的5种研究方法-集智俱乐部

图2  幂律分布

很早之前,科学家们就在社会科学研究领域进行复杂系统的研究,重要的基础已经存在,然而伴随着复杂性理论的概念和模型的持续发展,在社会科学研究中应用复杂模型这一领域,仍然有很大的提升空间。


方法五:社会仿真模型


仿真(Simulation)又被翻译作模拟,泛指基于实验或训练为目的,将原本的系统、事物的关键特性或者行为功能予以系统化和公式化,从而对关键特征做模拟,从而达到预计系统的发展趋势、发展结果等效果。仿真不仅仅是一项技术,也是一种解决问题的方法。


对于社会经济等系统,很难在真实的系统上进行实验。早期的计算社会科学的仿真模拟起源于对国家安全和国家政策的研究。计算机仿真模型在基础社会研究和政策分析一个特别有价值的应用特征是能够运行当前的和备选的策略,观察不同策略对系统的影响,以评估不同策略效果。

经典综述回顾:计算社会科学的5种研究方法-集智俱乐部

比如你要研究美国发动与俄罗斯之间的战争将会给美国带来多大的损害,不可能去真正的发动一场美国与俄罗斯之间的战争,这时使用计算机模拟仿真技术可以模拟一些不同的发动战争的策略,对战争引起国家的损失进行预估,从而寻找到最优的方案。另一个非常有价值的特征是仿真模型能够在模拟过程中对各个参数进行灵敏度分析,以观察各个参数的鲁棒性,或验证模型的性质和假设。假设在社会科学研究中非常的关键,验证假设的正确与否关系到研究的结果的正确与否。


系统动力学

系统动力学模型开始之初主要应用于工业企业管理、市场股票与市场增长的不稳定性等研究上,因此早期被称为“工业动力学”。它起源于美国麻省理工学院 Jay W.Forrester 教授的名著《工业动力学》,随着研究范围的逐渐扩大,改称为系统动力学。所以系统动力学不应当理解为一个简单的模型,也不应当理解为计算机仿真模型下的一个分支,它是系统科学与管理科学交叉的一门学科。它将系统理论与计算机仿真模拟紧密结合形成了自己独特的一套理论。系统动力学从解决问题的角度出发,建立实际问题的计算机仿真模型系统,设计、测试选择解决问题的方案。常见的系统动力学案例有传染病模型、城市发展规划模型等,麻省理工学院的N. Choucr等人在《International Politics and Conflict Dynamics》一论文中提出了政治动态模型,使用系统仿真分析确定了一系列缓解叛乱的政策 , 通过传统的数据分析或其他传统的社会科学研究方法是无法获得这么有洞察力的结果的。


基于主体的仿真建模(ABMs)

多主体仿真模型的本质是计算机模拟,它模拟一个给定的目标系统,包含系统中一系列可交互的参与者、互动规则、静态或动态的环境特征,对个体的行为准则进行建模,进而解释个体行为或集体和宏观行为的出现。它被广泛应用于集体、公众情绪影响范围。这些也是社会科学应当主要研究的领域。如果对基于主体的仿真建模有兴趣,建议读者们读一些有趣的故事:Bhavnani R等的《Simulating closed regimes with agent based models》中的卢旺达种族灭绝模型;MASON RebeL的《An Agent-Based Model of Politics, Environment,and Insurgency》一文中提出的不规则的战争模型等。

经典综述回顾:计算社会科学的5种研究方法-集智俱乐部


小结


在本文中,我们从社会科学出发,逐步引入计算社会科学的概念,计算社会科学有别于以往的社会科学的地方就在于其借助大量新兴研制出来的计算机软件,如R语言、Python、Stella 软件或Vensim软件,以及新开发的优化算法和模型。正如近代物理学中使用的实验工具大大推进了物理学的发展一样,应用这些新的软件模型或将使社会科学真正进入现代科学范畴,建立科学的研究范式。


另外,我们向读者介绍了计算社会科学最主要的5种研究方法,自动信息提取系统、社会网络分析SNA、社会地理信息系统、复杂系统建模和社会仿真模型。这些模型必须符合内部和外部有效性标准。先进的社会科学研究方法越来越多,在当下和未来,我们可以预见到社会科学能够帮助我们分析和理解所面临的最复杂的社会问题。


作者:Claudio Cioffi-Revilla 

(社会复杂性中心,Krasnow高等研究院,美国乔治梅森大学教授)

译者:陈孟园

审校:张洪

编辑:TT

原文地址:

https://onlinelibrary.wiley.com/doi/full/10.1002/wics.95

推荐阅读



Nature 最新:你的创作高峰即将到来,赶快趁热打铁迎接“奇迹年”!

Nature 研究:所谓黄金年龄在科学家和艺术家身上可能并不存在

小群体如何改变大习俗? | Science 最新论文

一文读懂复杂网络与群体智慧

计算社会科学时代的来临 | 小世界网络之父邓肯·瓦茨经典回顾

加入集智,一起复杂!


推荐课程


经典综述回顾:计算社会科学的5种研究方法-集智俱乐部

PC用户可以输入网址链接:http://campus.swarma.org/gcou=10140




经典综述回顾:计算社会科学的5种研究方法-集智俱乐部

集智QQ群|292641157
商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

经典综述回顾:计算社会科学的5种研究方法-集智俱乐部


让苹果砸得更猛烈些吧!

始发于微信公众号: 集智俱乐部