网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部
导语

海运占国际贸易总值的 70% 以上,占所有货运量的 80%。全球供应链是一个复杂的贸易网络,该网络的结构不仅影响有关地区的社会经济发展,还影响其生态系统。2020年7月新发表在 PNAS 期刊的一篇论文,借助海洋贸易网络模型和机器学习方法,对全球海上贸易流量进行了严格而全面的分析。本文是对这篇论文的解读。


8月1日(本周六)晚,我们邀请汪小帆教授以网络科学为主题在集智做直播,开放预约中,详情请下拉至文末。


网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部

论文题目:
Network effects govern the evolution of maritime trade
论文地址:
http://www.pnas.org/content/117/23/12719


1.  为何要研究海上贸易网络?


海洋运输行业是全球经济的支柱,海上运输占世界贸易总值的 70%。海上运输被视为全球贸易和全球经济的骨架,其海上贸易关系相当于一个复杂的贸易网络,这种网络结构对社会经济发展起到重要的作用。

随着北极航运业的发展,迫切需要了解海上贸易潜在机制,进而设计新航道与预测未来贸易流量。据统计到 2025 年,北海航线的运输量将增加到每年 8000 万吨。这种快速发展带来了经济,环境,政治和社会挑战,这是多个政府关注的焦点。北极航运的发展不仅会影响由于其地理位置直接参与北极航线和港口的国家,而且还会影响那些可能成为新的转运中心的国家。目前,还只有少数的研究工作提供了海洋贸易流量分布情况的详细介绍及其背后的发展规律。

此外 ,当前对海上运输和港口的研究往往集中于特定的运营商或航运业,地区的某些部门以及特定的面板数据分析,而分析整个海上网络历史演变及其形成机理的研究却很少。其主要原因是难以开发或获取有关海上贸易流的数据。
 
在 2020 年 7 月发表于 PNAS 期刊的一项研究中,作者使用了由劳埃德情报局(Lloyd's List Intelligence)提供的 1977 年至 2008 年之间的世界船队每日移动数据及其贸易流统计数据(主要包括世界上绝大多数港口间不同类型船舶的贸易流量数据),对海上贸易流进行建模与分析,进而填补了该领域研究的空白。
 
该研究将港口间贸易关系数据构建成贸易网络模型,进而利用网络科学的分析方法研究影响海上贸易关系及其流量的潜在机制。
 
在本文构建的海洋贸易网络模型中,节点代表港口,连边表示船舶在一年内在两个港口之间的航行情况。当两个港口运输的船舶总载重吨数(DWT)超过特定阈值k时,该港口间存在连边。此外,文章还依据不同的商业船舶类型构建一系列子网络,包括集装箱运输船,干散货运输船,一般货船,石油运输船和液化天然气轮船等。

网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部

图1:文章构建的海上贸易网络示意图。同时该图也说明了共同邻居的概念,即港口Tangier 和 Palermo的共同邻居是Marsaxlokk(Malta Freeport) and La Spezia (也就是图中红色的节点,因此上述港口间的共同邻居数是2)。

进一步,为了预测港口间的未来运输流量,本文综合考虑了港口特征(如港口区域的人口,GDP,港口吞吐量等)和连边特征(如港口距离,文化与历史联系,共同邻居数量等)定义了一对港口((i,j)之间的连接概率,或者说是港口之间的流量值:
 网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部

为了更好地识别港口间的连接概率和提升模型的预测质量,该研究将利用符号回归,机器学习以及引力回归等方法对解释变量进行组合建模,以此降低人为因素的影响。


2. 海上贸易关系预测的

关键是贸易网络共同邻居数


本文利用不同拓扑信息或者港口特征信息所构成的模型对海上贸易网络进行链路预测。为了比较不同模型的预测效果,文章采用正确预测连边数量与新产生的连边数量的比例来刻画,并对不同类型的子网络进行了验证。

在这些模型中,预测效果最好的模型是“共同邻居数-海洋距离”所构成的模型,即两个港口之间的共同邻居越多,它俩的链接概率越高;而两个港口越近,它俩的链接概率越低。研究结果表明建立海上贸易直接关系的关键特征是共同邻居数。在不同类型船舶的子网络上,该模型都适用。在 1997 年- 2008 年的整个研究区间内,模型的预测效果都很稳定。


此外,基于港口的人口潜力、国家的 GDP 值和港口海洋距离的经典引力模型的性能较差。而将 GDP 值或人口潜力数据与共同邻居数量相结合,并不会提高共同邻居的预测准确性模型,表明这两个变量对预测海上贸易联系没有更多的附加值。

为什么共同邻居数能很好地预测港口间的贸易关系?研究者认为捷径道路的选择趋势( The tendency to shortcut routes)是一种可能的解释,即两个港口间的共同邻居数量和它们间的网络中的两条路径的数量是一致的。可以预期的是,共享大量邻居的两个港口之间,会有更大的间接贸易流。为此,建立直接贸易连接可降低运输成本。

网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部  网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部
图2:1978年至2008年之间,不同预测模型结果的对比情况。使用不同模型正确预测的链接打开量的百分比度量。Y+ 1年的预测基于Y年的特征。表中提供了该期间的平均结果。在度量的设计中,将每个模型要预测的连边数设为连续几年之间实际创建的连边数,因此,误报率=误报率=(100%–百分比量度)。用于链路预测的模型的相对质量是稳定的,且依赖于公共邻居数量的模型的预测结果始终是最好的。
 


3. 共同邻居数实现了

对海洋贸易货物流量的最佳预测

 
该部分将上述链路预测的方法拓展到加权方案来预测海上贸易网络中连边的流量。现对公式 1 进行改写,wij 被定义为在 Y+1 年对港口 i、j 之间绝对值流量的估计,即 wij代表从港口i流向港口j的份额。一般地,在 Y+1 年,港口 i,j 之间流量的估计值可被计算:
网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部

其中,dead weight tonnage(DWTi)表示 Y 年份通过港口 i 总的船舶自重吨位值。N(i)表示港口 i 的度值,港口i的直接贸易伙伴的集合,Φ 是参数的拟合函数。在本研究中,将公式 2 定义为“流出模型”。在流量预测的过程中,使用了 Y 年的未加权网络数据和港口的吞吐量(Port DWT)来预测年的流量。
 
与链路预测结果相类似,依赖于公共邻居的数量和海洋距离的模型,可以实现对海上贸易中实际货物流量的最佳预测,且预测结果在不同类型的海洋贸易网络中表现一致。他们的对数流量确定系数在 0.33 至 0.45 的范围内,并且其性能优于其他的测试模型。
 
与经典引力模型预测结果对比来看,基于人口,GDP 和港口之间的海上距离的重力模型预测效果不佳。此外,在忽略港口的历史和文化联系对确定系数的影响很小。
 
进一步,在仅考虑海洋距离的情况下(不考虑共同邻居特征)流量的确定系数降低 0.10 至 0.14,而海上距离对流量预测的效果在不同类型的船舶网络中表现不同。对于干散货船和油轮,仅基于共同邻居的流出模型可提供良好的预测质量(与包括海洋距离的模型相比,其系数降低了 0.03 至 0.05),而对于集装箱和普通货船,其系数比包含海距的模型低 0.12。
 
共同邻居数对流量预测起到关键作用的原因,文章给出的解释是从港口出来的船舶及其贸易遵循着加权随机游走(在加权的国际贸易网络中以一定的概率随机跳跃)。通过这种方式,港口的总吞吐量在其邻居之间分配(分配比例与模型描述的权重成比例)。最佳流出模型依赖于权重 wij,该权重 wij 是港口之间共同邻居的数量及其海洋距离的函数。

网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部
图3:利用1978-2008年间的数据,通过回归模型分析贸易流量预测质量。


4. 实证分析:“神户港关闭事件”


1995年1月13日,世界上最繁忙的集装箱港口之一神户港,被一场严重的地震摧毁。该港口不得不完全关闭,原本应该流向神户的流量必须流入到其他港口。此事件为捕捉神户与其他港口之间的航运贸易关系创造了一个机会之窗,而这一事件创造了一种罕见的自然实验,即完全外生的冲击导致单个重要港口的关闭,迫使港口的流量在贸易网络的约束下重新分配。
 
为了了解网络结构对海上贸易的作用,在这部分作者使用了更细粒度的网络数据以及有关运输连接拓扑的信息(即对子网络进行分析)。分析子网络的好处是,即使某些单个港口的流量较弱,我们也能够从有关子网中流量重新分配信息中,得到重要的统计结论。
 
结果表明在短期内,1995年从神户到其他港口的流量,与灾难发生前夕有关港口与神户的共同邻居数量有关。这种关系文章从两个方面分析了原因。
 
第一,共同邻居的数可以看作是贸易网络中节点相似性的量度。从业务的角度来看,与神户有更多邻居的港口能够服务于与地震前神户相同的市场,因此是一个很好的替代品。
 
第二,从一个港口出发的货物流经神户港后,更倾向流入与上述两个港口都有贸易关系的第三个港口。因此,在神户和港口 k 之间的公共邻居数量越多,可以预期的重新分配到的流量越大。
 
总体而言,这印证了研究者的猜想:贸易流在底层网络结构上随机游走,而游走的下一跳是从可用邻居的集合中选择的。
 


5. 窥探未来的研究方向:

贸易与生态齐发展?


本文提出了一种预测海洋贸易关系与流量的模型,其最大的优势是简单与依赖少量的解释变量即可实现准确的预测。该模型对设计新的海洋运输路线有着重要的作用,即新运输路线的开发和现有贸易关系上的货物流量,取决于底层的网络结构,即贸易网络中节点的共同邻居数。共同邻居数量对于预测海上贸易网络中的新增链路及其流量的良好性能非常重要。
 
海上贸易系统的演化可以被贸易关系网络的拓扑结构所解释,该方法在预测贸易关系与流量时均不依赖于历史交易量。对比经典引力模型的预测结果,海运网络的现状结构是预测未来贸易流量的重要因素。促进海洋贸易发展的是运输联系及其结构,而不是经典引力模型所表述的。
 
该方法可成为相关领域研究者建模海上贸易并模拟潜在冲击或对当地外部环境变化的工具。未来的应用主要可以从两个方面开展。第一,预测航运线上的海上贸易流量,为商业决策提供科学依据。第二,该模型可应用于流行病学和生物入侵等领域的研究,即建模流行病或生物入侵传播的未来载体,而无需借助完整的全球数据库。
 
本文数据集可从下方链接获取
https://github.com/zuzannastamirowska/maritime

相关阅读

[1] Hidalgo C A, Hausmann R. The building blocks of economic complexity[J]. Proceedings of the national academy of sciences, 2009, 106(26): 10570-10575.
[2] 吴宗柠 ,樊瑛*.复杂网络视角下国际贸易研究综述[J].电子科技大学学报,2018,47(03):469-480.
[3] Zongning Wu, Hongbo Cai, Ying Fan, Zengru Di, and Jiang Zhang. A topological analysis of trade distance : evidence from the gravity model and complex flow networks [J].Sustainability, 2020, 12(9), 3511.
[4] Kosowska-Stamirowska Z, Ducruet C, Rai N. Evolving structure of the maritime trade network: evidence from the Lloyd’s Shipping Index (1890–2000)[J]. Journal of Shipping and Trade, 2016, 1(1): 1-17.


作者:吴宗柠

审校:刘培源、王婷

编辑:张爽



8月1日直播预告



由十位知名网络科学专家主讲,以《巴拉巴西网络科学》为教材,持续5个月的网络科学·集智课堂正在开班。本周六(8月1日)19:30-21:30,汪小帆教授将做客集智直播间,解读人类网络化进程,回顾复杂网络研究的兴起,开启你的网络科学之旅!


直播详情:8月1日汪小帆直播:开启网络科学之旅

扫描下方海报二维码,点击“我要听”,预约本次直播。

 

网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部
扫描二维码,点击“我要听”预约。直播前你将收到微信服务号提醒,附带直播地址



推荐阅读


与网络科学家一起,“集智”学习《巴拉巴西网络科学》
职业关系网络如何影响城市经济转型?
一文读懂复杂网络与群体智慧
加入集智,一起复杂!




网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部


集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?-集智俱乐部

让苹果砸得更猛烈些吧!


👇点击“阅读原文”,了解更多论文信息