社会物理学:探索社会经济复杂系统的百年历程
导语
社会学是否是一门自然科学?这一直是争议问题。2008年诺贝尔经济学奖得主保罗·克鲁格曼(Paul Krugman)曾写道:“经济学比物理学更难;幸运的是,它没有社会学那么难。[1]” 复杂科学家Doyne Farmer等人曾提问:“经济学是一门自然科学吗?”在某种程度上,只要个体以特定方式相互作用,他们的集体行为就可以被建模和分析。而捕捉社会经济复杂系统中的现象和机制,则不应仅仅依靠社会学,更应该团结物理学、统计学、数据科学、计算机科学等多个领域。本文发表于Physics Today杂志,文章梳理了社会物理学(sociophysics)对于理解社会经济复杂系统所做的种种尝试以及研究历程。作者Frank Schweitzer是瑞士苏黎世联邦理工学院的系统设计教授。
研究领域:社会物理学,复杂网络,复杂系统,计算社会科学
Frank Schweitzer | 作者
Murkyy | 翻译
刘培源 | 审校
邓一雪 | 编辑
对这两个领域的交叉持合理的怀疑态度,可能确实比对当今一些物理学刊物持有不合理的乐观态度要好。但物理学和社会学之间有着富有成果的融合,其中大部分与计算社会科学等的新兴领域有关。这一趋势是由工程师和计算机科学家提供的新的社会数据所驱动的,工程师制造的传感器越来越多地记录我们的日常生活,而计算机科学家则利用程序收集数据。为了阐明这些逐渐发展中的联系,从历史的角度出发是很有帮助的。
在《人性论》中,苏格兰哲学家大卫·休谟(David Hume, 1711-1716)提议以数学和物理学的精神建立一门关于人类的新科学。19世纪,新的物理理论出现了。电磁学表明,两种看似不同的现象可以从一个普遍的视角理解。而热力学的发展则引入了一个新的、相当抽象的“系统”概念,法国哲学家奥古斯特·孔德(Auguste Comte,1798-1857)提出,社会和物质世界一样遵循一般规律。为了确定这些定律的经验基础,比利时统计学家阿道夫·凯特勒(Adolphe Quetelet,1796-1874)将概率论应用于人类数据。在他于1835年发表的关于社会物理学的文章中,他根据正态分布推导出了普通人的统计定律,例如,他定义了体重指数来量化肥胖。他还分析了犯罪和公共卫生。在发现凯特勒将“社会物理学”(social physics)一词用于其统计方法后,孔德决定将“社会学”(sociology)一新词用于他的关于人与社会的新科学。
进入20世纪,物理学再次成为了新的基础理论的核心角色。相对论修正了空间和时间的概念,量子力学引入了不确定性原理,都为观测者的角色和观测过程赋予了新的视角。现代物理学对哲学和社会科学产生了如今看来令人惊讶的广泛影响。到了20世纪下半叶,物理学的影响不再是通过基础理论,而是通过普遍抽象的建模方法。早在20世纪40年代,格点模型(后来被推广为元胞自动机)就已经被用于研究社会隔离。这些模型中有许多可调参数,比如迁移距离,以及一个人所在社区中可容忍和不可容忍居民的比例。
元胞自动机的价值在于其模拟和可视化社会动力学的能力。然而,一些元胞自动机也使得进行正式分析成为可能。1924年,恩斯特·伊辛(Ernst Ising)提出一个抽象的自旋系统来解释铁磁性,现在被称作伊辛模型(Ising model),他令一维或二维晶格上格点的自旋是+1或-1,根据相邻自旋之间耦合常数的强度,给出的伊辛模型的解包括自旋在同一方向排列的铁磁相,或相邻自旋反平行的反铁磁相。虽然伊辛模型后来成为观点动力学的典范,正自旋和负自旋分布代表不同观点。但伊辛模型对于理解社会现象的见解相当有限。在观点动力学中,人们往往感兴趣的是达成共识的条件(铁磁性阶段)或观点如何稳定共存[1]。投票模型和其他简化模型将这种分析形式化,并将其扩展到各种拓扑结构,包括网络。但选民们并没有按照这些模式投票。相反,他们复制随机选择的自旋的“观点”。
虽然伊辛模型让社会学家感到满意,但并没有给他们留下深刻印象。直接应用物理中的模型和结论,如相变和标度律,可能会揭示很多关于统计物理的信息,但这些结论很少涉及社会动力学。仅仅使用物理隐喻和类比并不能使物理定律适用于社会学。只有在物理学家关注现有社会理论的少数情况下才有明显的例外。其中一个例子是社会影响理论,它是由社会心理学家在20世纪80年代建立的,用来描述个人如何作为社会影响的来源和目标。这一理论的基础是一种社会力量的概念,它的作用非常类似于一种物理力量。个人能够说服持相反观点的人并支持持相同观点的人,但他们的影响力随着社会距离的增加而增加。当模拟这种相互作用时,人们仍然可以观察到一定范围内观点相同的个体聚集在一起,但这种现象比类伊辛模型要丰富得多[3]。
另一个在社会物理学中成功采用社会理论的例子是文化传播模型,该模型最初于1997年由政治学家罗伯特·阿克塞尔罗德(Robert Axelrod)提出(见图1)。它的社会物理学版本[4]可以被看作是Potts模型中观点动力学的推广,其自旋可以有两个以上的值。文化传播模式旨在整合社会机制,如同化现象(个体在互动时变得更相似)和同质性(个体在相似时互动更频繁)。
另一类社会物理学模型在20世纪70年代全面展开,当时自组织(self-organization)这一概念被形式化,它是如今复杂系统理论的先导概念。自组织被视为一个普遍的概念:对系统动力学来说,重要的不是系统的元素,而是它们之间的动态交互。因此,对B-Z反应(Belousov–Zhabotinsky reaction)和其他物理化学系统中结构形成原理的见解可以推广到生物或社会系统。社会物理学中确实应用了自组织理论,主要是作为社会动力学的形式化方法[5],其应用包括迁移和观点动力学。但是,正如它所处时代的典型特征,它缺乏与社会数据的联系。
在1995年至2005年的十年间,随着用于模拟的计算能力的逐渐提高,物理学界兴起了对社会物理学的讨论。物理学家对几乎所有社会学概念都进行了建模和模拟:观点动力学、婚姻不忠、有性生殖、语言演化、等级制度的出现——所有这些以及更多的现象都受到了社会物理学家的关注[6, 7]。对现实的简化既是这些模型的优点也是缺点。例如,在对儿童如何习得语言进行建模时,生成机制(generative mechanisms)——即产生效果的过程——是假设的,而不是现实的。这样就可以研究机制的影响以及某些反馈过程对系统动力学的作用,而无需考虑手头问题的所有细节。
1. 计算社会科学
1. 计算社会科学
物理学家最近对社会经济问题的兴趣部分是由大数据的可用性驱动的。20世纪90年代中期,物理学家们开始分析金融市场的大数据,与20世纪80年代中期对高能物理实验中的大数据的兴趣相同。经济物理学(econophysics)的发展就是结果。在21世纪中期,物理学家们开始对通过互联网,尤其是通过在线社交网络获得的大数据感兴趣。就像经济物理学中的情况一样,早期的尝试主要是寻找数据中的特征模式和普遍的统计规律。
这一对经济物理学的探索很好地呼应了奎特莱特(Quetelet)早期确定统计规律的尝试,并得出了一些有趣的发现。例如,在人类交流方面,即两条连续消息之间的时间间隔,被证明是由幂指数分布描述的(见图2)。这个幂指数在不同的传播媒体中似乎普遍存在。其他普遍存在的幂律分布例子还包括使用比例代表制的选举投票和科学刊物的引用[7]。
这些发现说明了英国经济学家尼古拉斯·卡尔多(Nicholas Kaldor,1908-1986)所说的“程式化事实”——社会世界中的规律性,这些规律在不同的观察中都很稳定。物理学家们发现了可以复制这种规律的动力学机制,但并没有声称这些机制抓住了社会互动的要点。尽管如此,经济学家和社会学家被物理学家所强调的普遍性所激怒,并对其重要性和起源提出了质疑。如果社会现象属于物理普遍性的范畴,那么它对人类意味着什么?如果他们不这么做,这意味着什么?
当前社会物理学的发展趋势与现在所谓的计算社会科学(computational social science)密切相关,计算社会科学指的是一种以数据为导向的社会现象研究方法。这些数据表明了人类在使用手机、在线社交网络、搜索引擎、在线银行等电子产品时的行为。以往的社会学没有对大量数据对要求,即使将以前的实证分析的数据范围扩大了几个数量级也完全不足。这个空白现在由制造和安装更多传感器的工程师和收集处理越来越多海量数据的计算机科学家填补。
亚历克斯·彭特兰(Alex Pentland)的书《社会物理学》(Social Physics,中译本《智慧社会)[8]和其他该主题的著作与物理学关系不大,更多与大数据分析相关。在这方面,他们分享孔德哲学(Comte’s philosophy)的初衷,即在观察和实验的基础上建立知识。但大数据分析师的重点不是理解一种现象背后的生成机制,而是监控流量等流程,开发利用大数据的优步(Uber)等应用程序,以及解决预测客户在线订单数量等问题。
尽管缺乏对现象的理解,但大数据科学的最新趋势为完全基于数据处理的新型社会科学带来了希望。2008年,《连线》杂志的前物理学家兼主编克里斯·安德森(Chris Anderson)写道,“面对海量数据,这种科学假设、模型和测试的方法正在变得过时。”他预测的是一个数据量达到千万亿字节(PB)级的时代:“无处不在的传感器。无限的存储空间。处理器云集。我们获得、存储和理解海量数据的能力正在改变科学……随着我们收集的事实和数据的增长,找到基本问题答案的机会也将增加。因为在大数据时代,更多不仅仅是更多。多则不同(More is different)。”[9]
安德森所说的新科学是由数据和技术驱动的,这一点没有错。但一直以来科学最重要的组成部分是对具体问题的研究。数据科学可能有助于回答一些基础研究问题,但它无法自行解决这些问题。先收集数据,然后看看可以提取什么样的模式,这种做法将识别出新的相关性(尽管这些相关性大多是假的),但它不会引导我们理解因果关系。在社会学中,问题不仅在于如何,还在于为什么。因此,我们需要的新的推理系统类型。
2. 复杂系统数据驱动模型
2. 复杂系统数据驱动模型
开发这样的模型不仅是一项技术挑战,也是对物理学概念的挑战。物理学家可以建立在与其他学科研究人员合作开发的复杂系统的一般理解之上。复杂系统由大量强相互作用的元素组成,通常被称为主体(agent)。在统计物理学的传统中,复杂系统中的方法旨在预测主体相互作用产生的集体效应。物理学家贡献了两种形式化方法,例如,推导系统宏观动力学的随机方程,以及对此类系统建模的计算方法。事实上,计算物理中使用的基于粒子的模拟方法与不仅在社会学和经济学中,而且在计算机科学中发展的基于主体的模型有很多共同之处。
如上所述,过去的大多数社会物理学模型都旨在揭示普遍的见解。这些模型的有限复杂性并没有反映出任何特定社会系统的复杂性,所以它们无法根据实际数据进行校准和验证。因此,我们需要明确开发模型,解决大数据无法验证的问题,并根据实际数据进行校准和验证。
另一个问题,在以前的社会物理学模型中,主体本身的复杂性也大多被忽略。声称代表人类的主体几乎无法完全由物理学中的上下自旋来简单描述。人类的决定反映了个人偏好、社会规范和他人的影响。适应这些因素不仅仅是增加自由度的问题。社会经济系统中的主体也是异质的——它们在相似情况下的互动方式差异很大。他们也具有适应性,这表现在他们可以通过学习经验来应对激励和制度的变化。与此同时,他们还通过消耗资源或进行创新等方式改变制度。异质性和适应性使预测社会经济系统变得困难。
成功的社会物理学模型往往与经验数据和社会理论相结合。没有其他的学科交叉时,人们仍然可以发现有趣的现象和新的结果。但它们与现有学科知识的关系尚不清楚,对研究结果的影响也可能很小。第一个交叉面有助于定义模型要解决的问题,通常是需要解释甚至创建的新数据。尽管机器学习方法本身可以对相同的数据进行分类和预测,但它们缺乏对潜在生成机制建模的能力。
成功的社会物理学模型也在微观和宏观之间架起了桥梁。也就是说,它们将小规模、局部规模上的有相互作用的主体与大系统范围内的动态变化联系起来,并以具体且可测试的方式实现。理想情况下,此类社会物理学模型遵循数据驱动建模的原则:根据相关学科(如语言学或人类学)的标准对主体进行建模,基于主体的模型允许根据经验数据校准交互机制。然后,通过将模拟的系统动力学与观测值进行定量比较,最后对模型进行验证。
该方法的一个应用是行人动力学[10]。主体模型考虑了行人之间的社会力量、首选移动方向和障碍物。其结果是对行人集体动力学的真实模拟,然后可用于模拟恐怖袭击或其他恐慌情况下的逃生动力学,或优化建筑物和街道的设计。类似的模型描述了动物王国不同分支的生物群集现象。
数据驱动建模的另一个成功例子是预测流行病通过全球航空交通的传播[11]。根据校准后的模型,科学家提出了流行病控制策略。第三个例子是集体情绪动力学的建模(见box),关于主体情绪互动的假设已经根据数据进行了测试。校准后的模型正确地再现了各种在线平台上的大规模集体情绪的影响。
当人们在亚马逊上阅读书籍和其他产品的评论时,他们可以选择将评论评为有用或无用。他们也可能会受到启发,撰写并提交自己的评论,除了获得0到5颗星的评级外,评论的情绪可能会从负面到正面。亚马逊客户在情感上相互影响的程度如何?
为了回答这个问题,我的同事戴维·加西亚(David Garcia)和我分析了亚马逊对16个网站的180万条匿名评论 670种产品[14]。我们使用情绪检测器自动对评论进行评分,评分标准为10分-5(高度负)到+5(高度正)。零被省略。然后,我们给自己设置了一个挑战,用布朗主体框架复制集体情绪分布。
该框架如左图所示,包含了一个成熟的情绪影响心理模型,即迂回模型。主体的情绪状态由v来量化,它代表与情绪相关的快乐,范围从-5(高度负)到+5(高度正)。觉醒(a)代表由情绪引起的活动,如购买或评价评论。当a超过某个阈值时,主体会以某种程度的情绪表达自己。主体通过社交媒体和其他方式传递和接收情感信息(h),他们受到外部情感影响(I),例如主流媒体对产品的报道。
右边的图表显示了在《哈利波特与死亡圣器》(2007)一书中运行该模型的结果。蓝条是评论的真正情感价值。红色值是基于主体的模拟。我们的研究表明,除其他外,个体评论者确实受到其他人的影响。
3. 复杂网络
3. 复杂网络
行人、流行病和情绪动力学的模型似乎与电磁学、热力学和其他物理学分支相去甚远。然而,这些模型和传统物理学一样,使我们更接近于理解现实世界中的现象,比如社会现象。虽然物理概念可能无法推广到其他学科,但物理方法可以在社会科学中以一种普遍的方式对系统建模做出贡献,并带来巨大益处。方法论上的贡献并不局限于交互式系统,其中基于主体的模型就是突出案例。相反,它们还扩展到所谓的统计模型,用于测试有关数据生成过程的假设。
这种模型属于机器学习领域。随着大量数据分析能力的提高,机器学习变得更加重要。尽管有效地处理TB级的数据是一项技术挑战,但由于数据集包含关系信息,因此处理大小适中但结构复杂的数据集也带来了另一项科学挑战。例如,朋友和家人的在线社交网络、科学论文的引用网络,以及通过专利数据库和其他知识库的导航模式。物理学家们提出的信息提取方法超出了计算机科学或社会科学的范畴。这些方法属于社会物理学的另一个领域,即复杂网络,接下来将对其进行更详细的讨论。
复杂网络是表示复杂系统的一种方式。主体由节点表示,它们的交互由网络中的链接表示。然后,系统属性由交互结构(即网络拓扑)来解释。与基于主体的模型相比,网络模型有不同的优点和缺点。网络节点(主体)的内部动态没有明确建模。此外,所有类型的交互都被分解为两个主体之间的二进制交互。如果主体以不止一对的群体形式行动,则该方法的适用性是有限的。
另一方面,利用拓扑学对复杂系统进行建模,在社会科学领域产生了适用的、有影响力的见解。一个例子是小世界网络[12],当一个节点与其本地邻居之间的一些链路重新连接到远程节点时,它出现在规则的晶格拓扑上。重新布线会产生较短的路径长度(任意两个节点之间的连接)和较高的聚类系数(三个相邻节点之间的链接形成三角形)。因为社会学家已经独立地讨论了类似的性质,他们可以将自己的理论基础与一种明确的生成机制——重新布线联系起来。
另一个拓扑例子是谷歌的PageRank。该算法根据链接到某个网页的其他网页的数量和重要性来量化该网页的重要性。从形式上讲,该算法体现了一个在物理学中广为人知的特征值问题的解,其重要性的度量与特征向量的中心性有关。由于特征值问题的一般性质,PageRank根据网站的相互联系而不是内容来评估网站间的相关性。
这种拓扑分析需要网络的知识,而网络必须从数据中重建。默认情况下,网络是时间聚合的。比如说,它们没有考虑用户在到达给定网页之前访问的其他网页的顺序。然而,如果包含这种时间相关性,重要性排序会发生剧烈变化,可以捕捉到上下文相关的行为(见图3)。形式上,使用高阶马尔可夫(Markov)模型计算时间条件,其中阶数表示导航路径中内存的持久性。从马尔可夫模型中,我们还可以确定在什么条件下,在重建网络时可以安全地忽略时间相关性。时态网络的最新发现大大增强了现有的描述人们如何浏览维基百科和其他社会知识空间的方法。
长期以来,社会学家一直使用社会网络分析来描述静态网络中节点的拓扑位置。物理学的贡献主要来自于系综方法。与统计力学一样,这些集合定义了哪些拓扑结构与特定约束相容,它们发生的可能性,以及网络的预期属性。例如,使用这些方法,我们可以确定哪些节点特征(如性别、共同的朋友和爱好)会影响链接的形成。这些结果可以用来形成关于因果机制的假设,社会科学家可以在实地进行测试。
4. 超越学科间界限
4. 超越学科间界限
进一步推进社会物理学和计算社会科学的研究,使所有涉及物理学、社会科学、计算机科学和工程学的学科都能受益,有哪些挑战和障碍?
当然,还有制度上的必要性。大学教育的发展必须使课程和学位反映社会物理学所需的专业知识。网络科学和复杂系统领域的现有课程可以作为起点。但社会物理学也需要围绕主题和问题(而非方法和学科)的高质量期刊。这类期刊将成为科学成果的家园,否则这些成果将落入不同学科之间的裂缝中,无法获得广泛认可。招聘机构和终身教职委员会还应该认识到具有多学科背景的科学家的价值。
必须鼓励和发展对每个学科提供的不同科学贡献的相互尊重,为此,我们可以从承认目前没有一门学科拥有真正理解人类社会这样复杂领域所需的所有工具、方法、理论和知识开始。数据挖掘、自然语言处理、机器学习和人工智能的其他应用目前不在物理学的核心方法之列。但它们应该受到物理学家的欢迎,因为它们让物理学家能够得到他们通常无法获得的数据并进行分析。
对社会现象感兴趣的物理学家应该对社会科学积累的大量工作有更深入的了解。事实上,社会学家在面对社会物理学家的论文时,对其工作缺乏认识和理解是主要的批评之一。就社会学家而言,他们应该比过去更多地认识到,需要与其他学科的研究人员合作,以使计算科学深深嵌入社会科学。社会学家对程式化事实和幂律分布的厌恶可以通过共同开发的正式的模型来克服,该模型基于学科理论解释此类发现。
在合作开始之前应该建立多学科合作的现实预期。如果仅仅是假设来自不同学科的科学家互相填补彼此的知识空白,然后共同创造出定义其合作领域最先进水平的结果,这是非常天真的。因为永远无法保证这种做法会取得成功,许多合作最终会失败,因为它们的科学语言之间存在障碍,科学文化存在差异,在哪里发布和公布结果方面也存在分歧。促进多学科合作应该包括提高对不可避免的障碍的认识。
科学家个人的期望也应该是现实的。面对从方法驱动转向问题驱动的挑战,许多社会物理学家最终发现,他们真正的动机在于基于物理的方法,而不是社会现象或数据处理。因此,潜在的社会物理学家可能会放弃从社会科学和计算机科学中收集必要的知识。这种努力风险很大,而且可能得不到社会科学家、物理学家或机构的赞同。明智的决定至关重要。
然而,随着物理学越来越多的成功应用于社会学,那些愿意做出努力的物理学家会受到更多的激励和指导。他们可以从迷人的发现、复杂的方法和现实问题中获得灵感。它们可以为计算社会科学的基础做出贡献,这一领域基础仍在奠定之中。
参考文献
(参考文献可上下滑动查看)
复杂科学最新论文
集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:
推荐阅读
-
跨学科探索社会经济复杂性:2021年诺贝尔奖深层意蕴的启示与思考 -
2021年诺贝尔经济学奖评述:解决重大社会问题的自然实验因果框架 -
“计算社会经济学“长文综述:洞察社会经济发展的跨学科新视角 -
《张江·复杂科学前沿27讲》完整上线! -
成为集智VIP,解锁全站课程/读书会 -
加入集智,一起复杂!
点击“阅读原文”,追踪复杂科学顶刊论文