集智

导语

对一个国家而言,产品出口战略是极为重要的。何时将新兴产品出口市场,产品的出口顺序是什么,这些问题复杂棘手却又非常关键。 来自MIT的研究人员在一篇关于产品空间的经典研究中,提出一种实施多样性策略的算法。该算法能够确定各个时刻应当开展何种经济活动,从而使国家和城市的经济最优发展,对于新兴国家如何在已有的贸易网络中找到发展空间和扩张路径尤其有借鉴意义。这项工作于 2018 年 4 月发表在 Nature Communication,本文是对 该工作的解读。

经过真实数据,验证本文所建议的策略,和真实世界里各国出口多样化策略、研究领域多样化的策略相比,非常接近。这些发现增加了人们对经济多样化的理解,也让人们对网络传播方式的普遍性有了更深理解。

论文题目:

Optimal diversification strategies in the networks of related products and of related research areas

论文地址:

https://www.nature.com/articles/s41467-018-03740-9

站在巨人的肩膀上能够看得更高,这对产品网络也不例外,相关产品的蓬勃发展,会促进与之相关的新产品的诞生。然而,区域经济,或者说国家经济,需要寻求产业发展的多样化,才能丰富经济模式应对国际贸易中的挑战

一个以农业为主的国家,发展新的农业关联产业,纵然成本低廉、易于发展,但如果不顾其他产业,将错失很多发展机遇;如果在错误的时机,贸然投身制造业、高新技术业等,可能会损失更加惨重,并且影响发展势头原本较好的农业。

综上所述,选对产品很重要,选对时机很重要,选对合适的产品在合适的时间进入市场很重要。

新旧产品的关系:

节点间的路径依赖

从直觉上来看,新产品和旧产品的联系越大,新产品越有可能成功推出市场,这在科研领域也不例外,新的研究总是建立在旧研究基础之上。为了直观描述这种依赖性,研究者分别构建了产品网络和科研领域网络。

在产品网络中,如果两个产品有很大的概率共同出口(推出),那么这两个产品节点之间就存在连接。同理,如果某学者有很大的概率在两个不同领域发表文章,那么这两个科研领域节点就存在连接。

两个网络的可视化如下:

集智

a,b- 为了直观描述产品间、科研领域间的依赖性,研究者分别构建了产品网络和科研领域网络。

研究者将这种依赖关系定义为路径依赖,为了更加清晰的展示这种路径依赖关系,研究者探索了新产品出现概率和相关旧产品之间的关系。

集智

c,d- 新产品出现概率和相关旧产品之间的关系建模

如图 c 所示,在未来四年内,新出口产品能够稳定立足市场的概率,随着相关旧产品的密度增加而增加。科研领域网络中也出现了相同的规律,如图 d 所示,在未来三年内,某国家会在新的领域持续活跃的概率,随着相关已存在的研究的密度增加而增加。

通过观察发现,图中的曲线可以用幂函数来拟合 ,这个规律告诉我们,开展新的相关活动(出口新产品、开展新的研究)的代价,比开展新的不相关活动的代价要低得多,这和我们的经验认知是一致的。

最优多样性策略

为了将这种规律一般化,研究者对这种路径依赖进行了建模。研究者发现,开展新活动的概率与相关产品的密度、路径依赖的重要性 α 有关。

α 越大,路径依赖作用越强,新的节点出现的概率,随着与之相关节点的数量增加而增加;如果 α = 0 则表示不考虑路径依赖的作用。

上图中的 α 稍稍大于 1,因此呈现一种超线性增长规律。更进一步,我们可以描绘新产品出现概率与相关产品密度和 α 的关系,如下图所示。

集智

e- 新产品出现概率与相关产品密度和 α 的关系

研究者定义了三种节点状态,分别是激活态、潜在激活态、未激活态,如下图所示。潜在激活态的节点具有一定的概率被激活,其激活概率遵从上述规律。

集智

f- 节点的三种状态:激活态、潜在激活态、未激活态

基于上述定义,研究者将优化问题转化如下:每次选择一个节点进行激活,寻找一个最优的激活序列,使得激活所有节点的总时间最少。这是一个典型的网络传播问题,研究者将用复杂传染机制,对网络传播进行建模。

从产品网络的角度来看,该问题的实质就是使得产品最快具有多样性。近年来,沙特阿拉伯、秘鲁、智利、印度尼西亚等国家,一直在致力于国家发展中的经济多样化,在这种时代背景下,本文研究的问题具有很高的参考价值。

研究者将上述策略定义为最优多样性策略,为了验证该策略的有效性,研究者将该策略与 5 个其他策略进行对比,分别是:

  • 随机策略(random)

  • 度高优先策略(high-degree)

  • 度低优先策略(low-degree)

  • 贪心策略(greedy)

  • 每次激活具有最高激活潜力的节点

  • 主体策略(majority)

    每次激活具有最多已激活邻居的节点

为了评价这 6 个策略的性能,研究者在三种网络上进行了模拟,分别是:轮状网络、一般化轮状网络、无标度网络。

对三种网络进行建模

  • 轮状网络

集智

a-轮状网络

如上图所示,轮状网络共有 Z 个节点,其中只有 1 个 hub 节点,Z-1 个外围节点。轮状网络中的最优策略可以简化为,激活 hub 节点的最优时间点,因此研究轮状网络能够直观的呈现各策略的特性。

最优多样性策略的目的就是最小化网络的激活时间,通过与其他几种策略进行对比,得到了各策略激活整个网络所需的时间。

集智

d- 各策略激活整个网络所需的时间,随着激活 hub 节点之前所用的时间(用激活 hub 节点之前激活的节点数占比表示)的关系,红色的线为最优多样性策略。

当 α 接近于 0 的时候,路径依赖的影响微乎其微,总激活时间不再取决于何时激活 hub 节点;当 α 逐渐增加时,路径依赖开始发挥了作用,最优策略就显现了它的性能,比其他策略更快的激活了整个网络。

从图 d 中可以发现,最优策略比贪心策略和低优先策略要更早激活 hub 节点,但是比度高优先策略、主体策略要晚,然而最优策略的性能却是最好的,这说明 hub 节点的激活时机不能过早和过晚,而是处在一个中前期的时间点上。

集智

e- 更加清晰的描述了这一时间点,该图展示了最优策略每次所激活节点的平均度,随着激活进程的变化。

从e中可以看出,hub 节点在中前期的一个时间点被激活。

从轮状网络中,我们可以获得如下启示:

  • 最佳激活 hub 节点的时间点要比贪心策略早;

  • 过早的激活 hub 节点会带来较差的效果(例如 度高优先策略);

  • 图 d 中最优解和次优解的差异,随着 α 的增长而变大,这表明,当路径依赖越来越强时,最优策略越能够提高性能;

  • 图 d 中随着 α 的增长,最优策略激活 hub 的时间点越来越晚,这表明,当路径依赖较高时,我们需要晚一点激活 hub 节点。

一般化轮状网络

集智

b- 一般轮状网络

通过对轮状网络的讨论,我们对最优策略有了一定的认识,接下来,我们考虑更一般的情况:一般化轮状网络。如上图所示,该网络中有 m 个 hub 节点,以及 KH 个外围节点,网络的平均度为 KL << KH,外围节点的平均度为 n 。

研究者对最优策略的激活时间进行了数值探索,同样的,研究者对比了其他 5 种策略的激活时间,如下图所示。

集智

研究者对比了其他 5 种策略的激活时间,图 f 中黑色的线代表最优策略的激活时间曲线。

从图中可以看到,当 hub 节点的度越高,亦即网络越异构,最优策略和其他策略的效果差距越大,最优策略的激活时间要明显小于其他策略。

这意味着,当网络的异构性越高时,采取最优多样性策略,这种动态的策略更加有效。

事实上,对于图中异构性最高的网络,最优策略的激活时间只有贪心策略的 80%,同时也只是随机策略用时的70%。图 g 也展示了和普通轮状网络相似的结果,在激活过程的中前期,用一段较集中的时间激活 hub 节点。

无标度网络

集智

c-无标度网络

更为一般的,我们考虑无标度网络中的网络传播,仍然采取数值的方法来探索最优策略的激活时间。

在无标度网络中,将最优策略定义为贪心策略和主体策略的概率融合,它们的概率分别为 p 和 1-p ,此时,最优策略也可以称为混合策略(mixed – strategy)

集智

图 h 展示了各策略的激活时间随 α 的变化,其中,紫色的线为混合策略的激活时间曲线。

可以看到,混合策略比其他策略的性能都要强大,而且当 α 增大时,混合策略的优势更加明显。

集智

图 i 展示了三种策略在激活过程中,每一步所激活节点平均度的变化。

从图 i 中可以看出,混合策略要比贪心策略更早激活度较高的节点。

在真实网络中依然有效

前文证明了最优多样性策略,在轮状网络、一般化轮状网络和无标度网络上的有效性,那么真实网络呢?为了验证,研究者对用真实数据构建的产品网络和科研领域网络进行了数值探索。

集智 图 a 展示了国家出口产品网络中,新激活节点的平均度随着激活进程的变化,其中,激活进程是产品多样性不断增加的过程。

从真实数据中容易构建经验行为的激活过程,如图中红线所示。研究者将经验行为的激活过程和混合策略(贪心策略和主体策略的混合)、随机策略进行对比,从图中可以发现发现,经验行为和混合策略的模式较为相似,它们的曲线都呈现一种倒 U 状,而且会在中前期激活度较高的节点(加强节点之间的联系),这和之前讨论的三种网络具有相似的特性。

然而,相比于混合策略,经验行为似乎在早期激活了更多的节点,而在中期,激活的节点相对较少。相似的现象在科研领域的网络中也存在,如图 b 所示。

集智 科研领域的网络中类似的不同策略下的多样性进程

这些结果告诉我们,在国家出口网络和科研领域网络中,实际观测到的多样化进程和本文致力于最小化激活时间的最优策略,在总体上较为相似。因此本文的最优策略,对于现实中的相应问题,具有很高的参考价值。

总结

本文运用网络传播理论,将网络的最优多样性策略转化为,在复杂传染机制下,最小化网络传播的总时间。

运用该方法,本文先对简单拓扑网络(轮状网络)进行了理论推导和仿真,然后对复杂拓扑网络(一般化轮状网路、无标度网络)进行了数值仿真,最后将该方法运用到真实数据(国家出口产品数据、科学研究领域数据)上,对该方法的合理性进行了验证。

实验结果表明,最优多样性策略具有如下特点:在节点激活过程的中前期,用一个较小的时间段,集中激活度较高的节点。该策略不仅考虑了节点激活的顺序,还考虑了何时激活度较高的节点,提高节点间的连接性。

本文研究的最优化目标是多样性,然而本文的方法也可以拓展到其他目标上,例如出口产品对GDP的贡献,消除经济不均衡等等。

作者:鄢鹏高

编辑:王怡蔺

推荐阅读

知识可以无限共享,就意味着它会扩散到世界各地吗?

犯罪也能像传染病一样在城市中传播吗?

社会传染动力学:阈值模型及其扩展

《多样性红利》:个人能力与群体智慧

加入集智,一起复杂!集智俱乐部团队招新啦!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智