导语

在新型冠状病毒疫情不断发展的同时，信息扩散的规模和速度也在增大，而信息扩散与疫情扩散之间有何关联？来自阿里巴巴商学院复杂科学中心的张子柯等人分析了 1 月 1 日 -1 月 31 的舆情数据与确诊病例数据，验证了二者之间的相关性。这项研究还基于复杂网络理论为疫情防控提供了数学模型，并佐证了信息公开、大规模人群分区块隔离等策略的有效性。

一、引言

近日，新型冠状病毒肺炎（以下简称新型肺炎）在武汉爆发，并随着春运大潮迅速蔓延成全国性的疫情。而随着新型肺炎的扩散，各类相关信息也如潮水般涌来。这段时间，相信大家的朋友圈里每天都会看到有关疫情的消息，虽然没有人真正欢迎它们。这些消息里包含的信息主要分为以下几类：

（1）疫情最新发展态势通报；

（2）疫情相关救助、处理情况；

（3）对疫情的评判和讨论；

（4）与疫情相关的谣言。

海量信息的井喷如同一把双刃剑。从利处考虑，它预示着公众对疫情的关注程度空前提高。而从弊处考虑，一方面信息满天飞，让民众不知如何应对、徒增焦虑与恐慌；另一方面信息真假不定，辟谣新闻努力消灭着层出不穷的谣言。这些干扰项，极大地伤害了大伙抗击疫情的热情。那么，究竟如何利用网络信息研究新型肺炎疫情发展呢？

为此，我们分析了网上与本次疫情相关的全媒体信息，来源涵盖了2020年1月1日-31日期间来自新闻媒体报道、微博、微信公众号、论坛、各大客户端等媒体共计720多万条信息，并对比了同期的疫情发展态势。如图1 所示，舆情信息与疫情发展二者之间，有着明显的相关性。这预示着通过网络舆情信息来研究疫情发展态势是可行的。

图1：2020年1月1日-31日全国确诊病例和舆情信息对比图

接下来，我们分析了新型肺炎疫情和网络信息舆情的地理分布情况（如图2所示）。可以看出，总体而言，这两者之间存在一定的相关性。同时也可以看出，舆情信息最多的地方其实并不是疫情最严重的地方（如湖北省，但也不排除疫区无暇处理信息的情况），而是北京市、上海市和广东省这样的一线省市（这几个城市形势依然严峻，只是较于湖北省相对稳定）。

图2：截止1月31日全国确诊病例数和舆情信息地理分布图

在累计量外，我们进一步观察了在疫情爆发后，即1月26日-31日连续几天的当天舆情信息增量（如图3所示）。同样，来自湖北省的舆情信息仍然没有几个其他地区的多，这一方面可能反映了疫情的扩散情况，另一方面也反映了当地公众对疫情的关注程度。

图3：1月26日-31日全国舆情当日信息地理分布图

二、基于信息扩散的新冠肺炎网络传播模型

上述结果对我们有两点启发：

（1）网络舆情信息可以一定程度上反映疫情发展的态势；

（2）（正面）舆情信息有助于帮助人们了解新型肺炎，并积极做好防范措施。

此外，鉴于一个感染者不太可能接触到所有其他人员（即有限接触范围），因此在人群构建上我们选用了传统网络模型——BA网络（即无标度网络）。基于以上几点，我们考虑构建了基于信息扩散的新冠肺炎传播的SEIR模型，其中S为健康人群，E为处于潜伏期的感染人群，I为感染人群，R为恢复人群。其中，处于潜伏期的人群也有感染易感者的风险。伴随着肺炎病毒的传播，相关信息也会在人群中传播开来，因此，我们又将人群分为有疾病意识的人群（A）和无疾病意识的人群（U）。无意识的人群会通过网络媒介或口口相传得知疫情信息，从而成为有意识的人群。有意识的易感者（S^A）会通过减少出行、戴口罩、自我隔离、以及洗手消毒等行为减少被感染的风险。同时有意识的感染者（I^A）会被隔离起来，其感染人群的概率也会相应减少。模型架构如图4所示。

图4：基于信息扩散的新冠肺炎网络传播模型示意图

符号解释：

β : 易感者被感染的概率
η : 潜伏期的个体转化为感染者的概率
μ : 感染者恢复概率
γ : 有意识的易感者感染概率减少因子
γ₁ : 有意识的感染者感染别人概率有效因子
γ₂ : 有意识的潜伏者感染别人概率有效因子
γ₃ : 无意识的潜伏着感染别人概率有效因子
α : 新型肺炎相关信息传播率
N：网络规模总数（即人数）
( b_ij)_NxN：信息传播层网络邻接矩阵
( b_ij)_NxN：疾病传播层网络邻接矩阵

通过计算该模型（具体过程略），可以得出疫情爆发时的有效感染阈值 β ^c/μ （注：当疾病传播的有效传播率达到或者大于该值时，疾病会在网络上持续传播并发生爆发，反之则不会传播且逐渐消亡）可以转化为计算矩阵 H=[1-(1-γ)p_i^A]bji 的特征值问题，

（1）

图5：（A）疫情爆发阈值与随着舆情信息扩散公众采取自我保护措施概率的关系

（B）R0 随着公众采取自我保护措施概率的关系

图5A显示了疫情爆发阈值 β ^c/μ 与随着舆情信息扩散公众采取自我保护措施概率的关系。结果显示，公众自我保护意识越强烈，疫情越难爆发。同时，模型结果也表明：疫情爆发阈值和人群规模相关。因此，除了加大信息公开和宣传力度外，将大规模人群分区块隔离，也可以有效降低疫情爆发的概率【成文期间，笔者得知已有不少县（百万级人口）由于采取了极为严格的防范封闭措施，即使相邻地区疫情严重，目前也没有出现任何疑似病例】。

进一步地，我们可以得到基本再生数R₀（注：R₀可以简单地认为是一个传染者其平均患病期内可所以传染的人数）为：

（2）

其中，S^U 为无疫情意识的人口比例，S^A 为有疫情意识的人口比例，我们参考文献[1]中的方法来估计基本再生数。图5B显示了R₀ 随着公众采取自我保护措施概率的关系。图中紫色虚线为R₀ =1，即疫情不再扩散的临界点。结果表明，在人口数为千万级的城市中，如果自我保护意识概率达到在0.5以上，同时疫情关注度在0.9以上时；或者自我保护意识概率在0.75以上，同时疫情关注度在0.7以上，疫情将极有可能被抑制，不再蔓延。

三、结论

本文从通过分析全国网络舆情和疫情扩散信息，启发得出疫情防控策略的数学模型。数据分析和模型证明：大力宣传正面的疫情信息可以帮助大众提高防范意识，加强自我防护措施；同时，采取化整为零，将大规模人口分成小区域进行管理，能进一步地有效缓解疫情发展。由于本文成文时间仓促，还有大量数据正在分析当中，同时模型也将进一步得到修正，可以参考后期更加正式的学术论文。

特别致谢：感谢清博大数据提供数据支持、以及北京交通大学闫小勇教授的宝贵意见。

参考文献：

[1] Tang, B., Wang, X., Li, Q., Bragazzi, N. L., Tang, S., Xiao, Y., & Wu, J. (2020). Estimation of the Transmission Risk of 2019-nCov and Its Implication for Public Health Interventions. Available at SSRN 3525558.