导语


接受多元的想法在经济增长中发挥了什么作用?地理定位通信和经济数据的新形式使得我们可以对人类互动模式进行定量化的测量,并且可以在很细的粒度上预测个人、社区和国家的经济产出。其中最强有力的预测是,可以用社区间互动的多样性来衡量收入、生产力和增长。在发表于Journal of Social Computing 期刊的文章中,计算机科学家彭特兰(Alex Pentland)综述了大数据背景下新的投资机会和新的风险评估方法。另外,由于大数据的使用还会带来隐私和安全上的风险,本文的最后一部分描述了如何应对这些风险。


集智俱乐部组织的「计算社会科学读书会」已经启动报名,将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会6月18日开始,持续8-10周,详情见文末。


研究领域:想法流,社交网络,数据革命,计算社会科学

Alex Pentland | 作者

陶如意 | 译者

梁金 | 审校

邓一雪 | 编辑







1. 大数据背景下的发展与创新




移动手机、社交媒体、数字支付以及一些其他技术的广泛使用,使得人们对于社会和经济的理解能力有了质的飞跃,这种持续定量地、广泛范围观察人类行为的能力创造了一门新的科学学科,称之为计算社会科学(computational social science), 并且它也开始改变一些其他学科,如社会学、政治学和心理学。
 
这些新颖的数据形式对现有科学的主要贡献在于,让研究人员发现人类互动的模式对社会和经济的影响。人类之间的交互,是很多社会行为和社会现象的媒介。最近在理解这些相互作用模式方面取得的进展,已经帮助决策者解决了很多具有社会重要性的问题。例如监测社会经济贫困和犯罪水平,绘制疾病传播,以及了解自然灾害、环境风险和其他紧急情况的影响,等等。在文章中称之为“数据革命(data revolution)
 
同样的,数据革命也开始改变经济、金融和投资等领域。经济理论和我们的大多数制度,都是建立在“人类是理性的个体”这一观念之上的。本文认为,这种模型不足以让我们充分理解在无约束的自然条件下的经济产出。因为即使是理性的“自利”行为者,也不应该被看做是孤立的个体,也会(1)决策受到他人的影响;(2)从同伴互动中获得巨大的收益,特别是那些跨越社区边界的互动。实际上,这些社区之间的“社交桥梁”(social bridge)往往是预测经济产出的最大要素之一。
 

因为:

1. 交互多样性高的人会有更多的机会,因此可以获得更多的财富。

2. 人类增加交互多样性的行为,和其他物种的觅食行为类似,即一定概率探索新的资源,一定概率保留已知的路径和机会。而这二者的平衡是经济发展的关键决定因素。

3. 跨社区的社交桥梁有助于提高创新速度,导致强大的经济产出。
 
在本篇文章中,作者利用来自美国、欧盟和亚洲多个城市的数据资源,对以上三个命题的证据进行综述。作者还对这些新的发展会如何挑战主流的经济和投资理论做出评论。另外还对当前数据安全性、如何安全利用已有的数据资源来建立更好的投资和风险管理系统发表了自己的见解。
 
 



2. 财富来自于发现更多的新机会




人是社会网络中的生物。图1展示了个体在社会网络中的互动多样性和收入之间的关系[1],而互动多样性可以认为是是遇到新机会可能性的衡量。对于网络结构多样性的不同指标——无论是使用网络集聚系数(clustering coefficient)或者衡量结构新颖程度的指标Burt-style——都能得到类似的结果[2]。

图1. 随着个体社交网络结构越来越多样化,如和更具有多样性的社区交互,他们的收入会随之增加[1]。图中数据来自随机抽样100,000个来自中收入国家中的人。


对这些数据的分析还表明,穷人主要和其他穷人交互,富人则与富人交互。因此,最好的机会主要在富裕的圈内循环[1]。此外,机会的隔离主要不是由于居住范围导致的,而是由于不同的行为偏好。例如什么地方你觉得待的比较舒服,以及什么设施你觉得使用起来更舒适等。
 
与此同时,收入的增加也会导致社交网络更加多样化。财富创造是一个复杂、动态的反馈过程,没有一个明确的因果关系。与其问因果关系,不如问这个复杂的动态系统每个部分的相对重要性,而图1有力证明了,接触不同的思想对于财富创造过程有着重要的影响。
 
交互模式的重要性让很多人感到惊讶,因为人们通常认为个人特征远远大于社交网络因素。然而,与其把人们看作是独立的创新者,不如把人类看作是一个不断寻找可以复制的创新和应用已知创新新机会的物种,这种描述好像更加准确。社交网络是发现新的创新和机会的主要——也许是主导的资源。像所有其他社会物种一样,我们人类喜欢利用现有的环境,同时也探索发现新的机会,并在这二者之间保持平衡[20] ,如图2所示。在动物相关的文献中,这被称为“觅食行为(foraging behavior)

图2. 觅食行为是世界各地人类金融模式的特征。上图显示了一个人在一个月内的信用卡购物地点。圆圈大小与购买频率成正比,箭头表示购买地点之间转换的可能性[3]。通常人们在维持习惯(大圈子和箭头)和探索(小圈子和箭头)之间保持平衡。

 
图2展示了美国1亿人的信用卡数据。大多数人的购买行为是习惯性的,发生在少数几个地方(大圈子),并且是高度可预测的。然而每周有一到两天,人们会打破习惯,去探索新的地方,这些购买行为则是高度不可预测的。而社区中的探索性行为越多,经济增长就会越快。
 
此外,那些没有表现出这种行为模式的人,通常在某种程度上处于生病或者压力状态。因此,这种行为模式还能作为一个人的生活是否健康的指标[4]。美国最大的医疗服务之一正在利用这种方法来跟踪高危患者的健康状况。甚至还可以使用这种模式来准确预测一个人是否有财务问题,并能提前三个月发出警告[5]。另外,还可以根据这种行为的对偶模式,对商店的访问网络进行估计,从商店顾客的行为中,去判断商店未来的财务健康状况 [from Bloomberg April 15, 2019]
 
从城市发展的角度,如果一个城市的基础设施促进了更多样化的物理互动,从长期来看,城市的发展也会更好。这一思路建立了个体行为和城市发展的联系,可以极其准确地预测每平方公里的国内生产总值(GDP)[6]。这表明我们通常考虑的因素——投资、教育等为了提高个体技能的举措——可能不是影响GDP增长的直接原因,可能只是因为这些举措帮助或阻碍了个体寻找新机会。
 




3. 投资机会——构建社交桥梁




通过两个社区X和Y之间的物理距离,来量化社会学习潜力(potential for social learning)的一种方法是,测量来自X社区的个体在来自Y社区的个体附近停留的可能性。可以是一个社区的人访问另一个社区,也可以发生在两个社区的人共同出现的地点(工作或者购物)。这种跨社区的连接,就是我们这里所说的“社交桥梁”。
 
丰富的社交桥梁连接成的群体还可以形成当地文化。通过了解一个人经常去的地方,你就可以了解他们的喜好和行为。思想和行为倾向也可以快速在这个社区集群内传播,如一些时尚潮流、一种政治观点等。每个社区内都拥有各自的信息或者机会,因此社区之间的互动可以增加人们获得生产活动、经济增长和思想所需的机会。
 
社交桥梁的结构通常比人口统计学属性更能预测经济结果,因为社交桥梁是人们相互影响、发现新创新和机会的主要渠道。表1的结果展示了,社交桥梁结构在预测人口行为方面的准确度,比传统的人口统计数据要好3倍[7]。
 

表1. 社交桥梁——邻居之间的物理交互模式,用来预测购买和经济决策比传统的人口统计资料好3倍 [7]

 
还有一些实证研究进一步证实,不同社区之间的融合会强烈影响创新和经济增长的速度。研究[8]通过对中国3000多家初创企业的调查,认为文化多样性是创业公司成功启动和融资的最大因素,而行业经验多样性是这些创业公司后续成长的最重要因素。研究[9]关注的是高速铁路基础设施的投资与专业性公司创建率的因果关系。发现拥有新的铁路连接的城市,公司创建的速度会增加50%。另外,对于美国、亚洲和欧洲来说,同样发现社交桥梁的多样性能够很好地预测GDP的增长[10](如图)
 
图3. 社交桥梁的多样性(左侧)和北京市每年经济增长(右侧)
 
通过了解这些社交桥梁,我们可以开始建立更好的投资体系,创建一个更创新的社会。例如,为了促进一个特定社区的发展,可以改变交通网络,使该社区更容易进行交互,我们还可以投资不同的商店和设施,吸引不同的人流。将来自不同社区的人们聚集在一起,将是建设一个充满活力和财富的城市的最佳方式。
 
 



4. 发现新机会的优化算法




上述的研究表明,优化社会结构,使其有利于新思想和新机会的流动是经济发展的一个重要方向。假设对新机会和新思想的探索是发展的核心,那么我们应该问,人类如何权衡探索新机会的成本与投资熟悉机会的成本。为了回答这个问题,作者转向一个更简单的例子,即人们如何在金融投资中进行这种权衡。
 
使用汤普森抽样算法(Thompson sampling)让每个个体寻找最大化财务回报的策略,这类方法的核心思想是,决策者面对各种各样的可选行为,且每一种行为的汇报都是未知的,通过最小化投资后悔来优化新机会的决策。而在社会环境中,通过观察网络中其他成员的收益,这被称为分布汤普森抽样(distributed Thompson sampling)。这种社会学习极大地提高了整体的表现,并减少参与者的认知负荷。图6展示了在真实的交易平台上分析约580万笔交易员的交易,发现表现最好的群体近似于分布式汤普森抽样策略[11]。

图4. 社交交易:(a) 金融交易员使用最近的表现来做决定,但 (b) 是通过使用流行信号作为“交易是好的”先验概率来调节的,这种策略被称为分布式汤普森抽样。与个人交易相比,使用这种策略可以产生更好的投资回报 [11]

 
 



5. 值得信赖的数据




由于无处不在的计算使得数据指数增长,当今的数据生态正在发生变化。媒体对网络安全漏斗和情报丑闻的报道增多,人们对个人数据的安全产生了担忧。我们需要一个“数据新政”(new deal on data),将安全问题和透明度、垄断与隐私问题相匹配,并将其设计为所有数据驱动服务的核心。
 
实现可信任的数据架构,关键是创建能够认真应对隐私、数据所有权、数据证券化和网络安全挑战的系统。为了解决这些问题,作者团队开发了开放算法体系结构(Open Algorithms,下简称OPAL),以及基于OPAL构建的高安全性机器学习方法[12]。
 
 



6. 总结




本文认为,即使是理性的“自利”主体也能从互动多样性——尤其是社交桥梁——获得巨大的利益,因此,经济理论和政策不应该基于假设人类是孤立的个体决策者。为了支持这一论点,文章首先着重表明,互动多样性更大的个体可以有更多的财富,而且这种互动的障碍是不平等持续存在的一个重要因素。其次,人们表现出与大多数物种相同的寻找新资源的觅食行为,即探索新机会与开发已知资源的平衡,这是经济产出的关键。最后,研究表明,跨社区的社交桥梁还能预测经济结果。
 
这些发现与经济产出是由于个别决策者的行为与传统形成了鲜明的对比。我们过去通常会认为,人类是理性的个体,是独立思考者。我们利用自由市场,我们把民主作为政府的理想,我们的学校注重培养学生更好的技能。但现在通过一系列的研究,作者团队发现,这种模型过于简单。我们的行为受到周围人的强烈影响。我们的成功很大程度上来自于从别人的经验中学习。我们不是个体,而是社会中的成员。
 
对于一个稳定的市场体系,简单的人性模型可以运转得不错。但对于复杂的环境来说,尤其当试图刻画增长和创新的时候,如果缺乏对交互的刻画,模型就非常容易失效。

 

参考资料


[1]E. Jahani, G. Saint-Jacques, P. Sundsøy, J. Bjelland, E. Moro, and A. Pentland, Differential network effects on economic outcomes: A structural perspective, presented at Int. Conf. Social Informatics, Oxford, UK, 2017, pp. 41–50

[2]R. S. Burt, Structural Holes: The Social Structure of Competition. Cambridge, MA, USA: Harvard University Press, 1992

[3]C. Krumme, A. Llorente, M. Cebrian, A. Pentland, and E. Moro, The predictability of consumer visitation patterns, Scientific Reports, vol. 3, p. 1645, 2013

[4]A. Madan, M. Cebrian, S. Moturu, K. Farrahi, and A. Pentland, Sensing the “health state” of a community, IEEE Pervasive Computing, vol. 11, no. 4, pp. 36–45, 2012.

[5]V. K. Singh, B. Bozkaya, and A. Pentland, Money walks: Implicit mobility behavior and financial well-being, PLoS One, vol. 10, no. 8, p. e0136628, 2015

[6] W. Pan, G. Ghoshal, C. Krumme, M. Cebrian, and A. Pentland, Urban characteristics attributable to density-driven tie formation, Nature Communications, vol. 4, p. 1961, 2013.

[7]X. W. Dong, Y. Suhara, B. Bozkaya, V. K. Singh, B. Lepri, and A. Pentland, Social bridges in urban purchase behavior, ACMTransactions on Intelligent Systems and Technology, vol. 9, no. 3, p. 33, 2017

[8]X. Yuan, Y. Qiu, Y. Wei, and S. Y. Liu, Research on the relationship between entrepreneurship diversity and performance of regional innovation networks—Micro data analysis based on 3255 Chinese incubators, Theory & Practice, no. 9, pp. 152–155, 2017.

[9]X. Yuan, Y. Qiu, Y. Wei, and S. Y. Liu, Research on the relationship between entrepreneurship diversity and performance of regional innovation networks—Micro data analysis based on 3255 Chinese incubators, Theory & Practice, no. 9, pp. 152–155, 2017.

[10] S. K. Chong, M. Bahrami, H. Chen, S. Balcisoy, B. Bozkaya, and A. Pentland, Economic outcomes predicted by diversity in cities, EPJ Data Science, vol. 9, p. 17, 2020.

[11]P. M. Krafft, J. Zheng, W. Pan, N. Della Penna, Y. Altshuler, E. Shmueli, J. B. Tenenbaum, and A. Pentland, Human collective intelligence as distributed Bayesian inference, arXiv preprint arXiv: 1608.01987, 2016

[12]T. Hardjono, D. L. Shrier, and A. Pentland, Trusted Data. Cambridge, MA, USA: MIT Press, 2019.


(参考文献可上下滑动查看)



文题目:

Diversity of Idea Flows and Economic Growth

论文链接:

https://ieeexplore.ieee.org/document/9241510



计算社会科学读书会第二季


计算社会科学作为一个新兴交叉领域,越来越多地在应对新冠疫情、舆论传播、社会治理、城市发展、组织管理等社会问题和社科议题中发挥作用,大大丰富了我们对社会经济复杂系统的理解。相比于传统社会科学研究,计算社会科学广泛采用了计算范式和复杂系统视角,因而与计算机仿真、大数据、人工智能、统计物理等领域的前沿方法密切结合。为了进一步梳理计算社会科学中的各类模型方法,推动研究创新,集智俱乐部发起了计算社会科学系列读书会。


新一季【计算社会科学读书会】由清华大学罗家德教授领衔,卡内基梅隆大学、密歇根大学、清华大学、匹兹堡大学的多位博士生联合发起,自2022年6月18日开始,持续10-12周。本季读书将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会详情及参与方式见文末,欢迎从事相关研究或对计算社会科学感兴趣的朋友参与。



详情请见:

数据与计算前沿方法整合:计算社会科学读书会第二季启动



推荐阅读



点击“阅读原文”,报名读书会