《人世间》是2022年初的热播剧,以角色个人生活轨迹为线索,展示了几十年来中国社会的变迁。而从数学视角来看,在这部接地气的电视剧中,竟然处处透露着复杂网络的规律。
Irvinechenlong | 作者
CAM传习录 | 来源
廖戴丽 | 编辑
我们把《人世间》中的每个人物看成是一个点,如果两个人相互认识,这两个点就用线连起来,形成一条边。边可以有权重,比如说亲情的连接权重就大一些。点和边形成的数学结构叫“图” (Graph)。复杂网络 (Complex Network) 是具有非平凡拓扑特征的图。
我们今天就来讲讲社交网络中的几个特性。
2. 小世界特性(Small World Theory)
《人世间》第51集中,周蓉提出让蔡晓光帮忙给朋友的孩子找找上省实验学校的关系,蔡晓光虽然不直接认识人,但提到了一个六度分隔理论:两个人之间,最多通过六个人就能联系起来。
注意,这个相连,是指两人相互认识。我认识奥巴马,但奥巴马不认识我,这不能算是相连。
朱棣文给许进超老师颁发证书,他们可以算是相连的。这样,我和奥巴马只要三条边就连起来了,和川普、拜登都只要4条边。
在数学圈子里,有所谓的Erdős 数。描述了数学家 Paul Erdős 与另一个人之间的“合作距离”。Erdős 自己的Erdős 数为0,直接和他合作写论文的数为1,然后依次增加。
我的Erdős 数为4:Erdös →Barak →Saylor →Holst →Chen
我的爱因斯坦数为6:Einstein →Bergmann →Lebowitz →Collet →Titi →Holst →Chen
以上是举例,不能算是证明。Watts 和 Strogatz 1998 年在自然杂志上发表了一篇文章。
Watts, D. J.; Strogatz, S. H. (1998). “Collective dynamics of ‘small-world’ networks” . Nature. 393 (6684): 440–442. Cited by 48475
Watts 和 Strogatz 表明,随机网络中两个节点之间的平均路径长度(也称为分离度)等于lnN/lnK ,其中 N= 总节点,K=每个节点的熟人。具体的例子是N=3 亿,K=30,则分离度 =19.5/3.4=5.7 ,如果 N=60亿(世界人口的 90%, 去掉 10% 连接度太少的人口)且 K=30,则分离度 =22/3.4=6。
有了社交网络之后,这个平均路径长度有所下降。2016年Facebook 在研究了社交网站上活跃的 15.9 亿人之后,确定这个数字实际上是 3.57 。
相互关注比相互认识容易多了。在每个人的微信朋友圈里,有很多是根本没有相互说过话聊过天的。
在图论中,团(clique) 是一个子图,其中任意两个顶点之间均存在边相连。例子是《人世间》中的六小君子。
社区结构 (community structure) 是指网络可以划分成不同的节点组,组内连接密集,而不同组之间连接稀疏。
现在我们把社区结构换一个名词:阶层。《人世间》一个重要的主题是阶层的冲突。
德宝在聚会时感慨,吕川和向阳因为读了大学,工作之后有了自己的圈子,很少参加聚会。
秉义和冬梅就郝家送回礼物的对话:没有误会,只有差距,不同阶层之间存在的客观差距。
有条捷径:婚姻。曹德宝的少年梦想是娶一个落难的公主,有朝一日“公主”翻身,实现阶层跨越。
曹德宝的梦想,周秉义实现了。但这门婚姻并不理想,两亲家至死没有见过面。因为省长家要洁身自好,怕粘上一堆人情。在冬梅和秉义闹离婚那集,秉义提到了这些年住在女方家的憋屈。
但不可否认的是,最终改变他命运,让他实现阶层跃升的,还是他的丈母娘。没有金月姬的推荐,秉义大概率是在理论研究室赋闲终老。
在《人世间》小说原著中,周秉义去世仅仅四个多月,郝冬梅就再婚,嫁给了一个红二代的商人,回到了她所在的阶层。梁晓声对阶层固化的观点可见一斑。
中国自古以来保持阶层流通的最常见方式还是读书。除了吕川和向阳,周蓉、周楠、冯玥、周聪、孙胜都是通过读书,走出了光字片。
复杂网络的一个重要特性是 Power law。我们把每个点相邻边的数目称之为这个顶点的度。对社交网络而言,就是一个人的朋友数(至少要相互认识)。引入函数 f(x):自变量 x是顶点的度数,f(x)是度数为 x 的顶点数。幂律分布是指 f(x)∝ xˉk,其中k 是参数。大家可以想象初中就学过的 f(x)=1/x ,对应 k=1。很多复杂网络的度分布满足2<k<3 的幂律分布。
如图所示,网络中大多数节点的度数都很小,即好友数很少;但同时有少量的节点,它们的度数非常的高。连接度高的节点通常被称为HUB,而很多的低度节点会形成非常密集的子图(前面提到的团和社区)。这些子图通过HUB相互连接。HUB是造成小世界现象的原因。
《人世间》中,蔡晓光就是一个HUB,其实周秉昆更像一个HUB,秉昆 →秉义 →冬梅 →郝省长,还有更直接的连接: 秉昆 →曲老太。
优先附着原理。在复杂系统的增长过程中,新节点更愿意连接到已经与其他节点有大量链接的节点(数学描述是新增点与原来网络中的某个点相连的概率正比于该点的度数)。于是这样就形成了一种马太效应(正反馈),一个点连上的线越多,那么新来的点连上它的概率就越大,它就更容易连上更多的点。
在社交网络例子中,一个人人脉越广,就越容易结识更多的朋友。
Power law 并不仅仅存在于复杂网络系统中。很多统计量都服从 power law。和复杂网络不同的是,不需要引入节点之间的连接关系。19世纪末20世纪初意大利经济学家帕累托就发现了此现象,因此也被叫做帕累托定律 Pareto principle。
比如说:财富的分布服从 power law,更为常见的说法叫:二八法则。20% 的人掌握了 80% 的财富。
下图可以看作是所有的人按照财富来排序形成的函数,那么绿色部分,从人口比例来说只有 20%(在横轴上绿色的区间长度大概是黄色区间长度的1/4), 但绿色部分的面积,代表他们的财富总和,却占了总财富的 80%.
对科技工作者而言,20%的文章就占了所有引用数的 80%,对个人而言是这样,对整个科学共同体而言也是这样。换个角度来讲,我们大部分工作的影响都是微不足道的,有 20%的代表作就已经很不错了。
从经济学的角度来讲, 80%的营业额是20%的商品产生的。那么一个利益相关的问题出现了:是应该侧重头部 20%的商品还是尾部只占营业额 20% 的商品?
答案似乎是显然的,显然应该把资源集中在产生 80%效益的那 20%的商品。
在下图中,纵坐标为单个产品的销量,横坐标为不同类型的产品。传统的二八法则说, 20%的产品占据了 80% 的销量,传统商业模式所看中的是 20% 的大众消费品。
2004年《连线》杂志编辑克里斯·安德森在一篇文章中提出了“长尾理论“。2006 年他写了一本书《长尾:为什么企业的未来是积少成多 (Selling Less of More) 》。”长尾理论”提出:
在互联网时代,商品的存储成本降低,某些商品比如歌曲,电子书等等几乎没有仓储成本。成本低,收益就会提高。虽然尾部客户销售额小,但是通过满足小众客户的需求,这个长尾巴增加的收益,可能会慢慢超过主流。
比如说,消费者能够在Amazon的网站上找到各种各样的书,因此这根长尾巴可以转变为销售量,而在实体书店中受仓储成本的限制,是没有办法找到这么多书的。这样 Amazon 就可以将潜在市场转变为销售量。
从图上来讲,就是把原来尾部的曲线稍微抬上去一点(降低成本提高收益),那么尾部的面积就不再是 20% 了,甚至有可能超过 50%,因为尾部很长很长。
从现实社会的关系网到虚拟的互联网,从线下到线上,我们的生活始终没有脱离复杂网络。真实的复杂网络从其诞生开始就不断地演化着。网络节点不断地增加,节点之间的连接不断地增长。然而,复杂网络的形成机制是什么?具有什么样的演化规律?它们的演化机制对网络的功能和动力学行为有什么影响?为了回答这些问题,科学家们对复杂网络的探索从未停止。
网络科学是一个蓬勃发展的崭新交叉学科,可以看做复杂系统的骨架,核心是研究各种大型复杂网络之间的共性和处理它们的普适方法,其研究对于发展复杂系统的基本理论及构建产生了极大的推动作用。
网络科学的第三个十年,已经过去了几年。从国内外网络科学研究的发展趋势来看,各种各样的更复杂的网络模型和结构以及高阶相互作用动力学引起了人们的极大兴趣。为了回应这种迫切需求, 我们网络科学第三期课程将围绕复杂网络的数学建模与应用进行多角度的介绍。
集智学园特邀陈关荣、樊瑛、周进、李翔、张江、闫小勇、刘宗华、石川、虞文武、赵海兴、史定华加入打造第三期课程,欢迎你的加入。
推荐阅读