免费医学论文发表-从世界航空运输网络推断特定国家的疾病输入风险
抽象
疾病在国家之间的传播很大程度上取决于它们的有效距离,这是世界航空运输网络(WAN)的一项衡量标准。它将大流行的复杂传播模式简化为从疫情爆发国开始的波状传播,与疾病未缓解传播的到达时间建立线性关系。然而,在疫情的早期阶段,各国决策者关心的是了解活跃病例抵达本国的相对风险,即在疫情发生地点登机感染活跃病例的可能性。虽然有数据拟合模型可用于估计这些风险,但仍然缺乏准确的机理、无参数模型。因此,我们在这项研究中引入了“进口风险”模型,该模型使用有效距离框架定义进口概率。该模型假设航空公司乘客沿着从疫情起源开始的最短路径树分布。结合随机游走,我们考虑了所有可能的路径,从而推断出主要的转机航班。我们的模型优于其他移动模型,例如具有不同距离类型的辐射和重力模型,如果包含其他地理信息,则该模型会进一步改进。对于广域网内联系较强的国家,进口风险模型的精确度有所提高,它揭示了地理距离依赖性,这意味着分销过程中的拉动而不是推动动态。
作者摘要
对于传染病的传播,人类的流动性使遥远的地方变得接近,而地理上较近的目标实际上可能更远。全球飞行网络对于长途旅行至关重要,先前提出的“有效距离”将这种移动性转化为与疾病到达时间相关的距离测量。我们使用有效距离来生成自下而上的,从而在飞行网络上生成无参数的乘客分配过程,该过程考虑了所有可能的飞行路线。这使我们能够确定疾病的输入概率。我们的“进口风险”模型优于或匹配已建立的流动性模型,其中一些模型需要使用稀缺或昂贵的数据进行校准。相比之下,我们的方法依赖于最小的航班网络数据,即机场之间的飞机数量及其载客量,而不是乘客数据。其自下而上的方法使未来能够研究针对特定国家/地区的措施来控制和遏制受感染的乘客,这是对现有模型的挑战。因此,“导入风险”模型的优势在于其数据简单性、与流行病的相关性以及无参数设计。
数字
图7图8图1图2图3图4图5图6图7图8图1图2图3
引文: Klamser PP, Zachariae A, Maier BF, Baranov O, Jongen C, Schlosser F, et al. (2024) 从世界航空运输网络推断特定国家的疾病输入风险。PLoS 计算生物学 20(1): 编号:E1011775。 https://doi.org/10.1371/journal.pcbi.1011775
编辑 器: 亚米尔·莫雷诺, 萨拉戈萨大学:西班牙萨拉戈萨大学
收到: 2023年5月3日;接受: 2023年12月21日;发表: 1月 24, 2024
版权所有: ? 2024 Klamser et al.这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 用于计算导入风险的软件“ImportRisk-v1.0.0”可在 Zenodo 存储库 https://doi.org/10.5281/zenodo.7852476 下使用。
资金: B.F.M通过嘉士伯基金会的CF20-0044资助“希望:民主国家如何应对Covid-19”获得了资金,并获得了约阿希姆·赫兹基金会(Joachim Herz Stiftung)作为跨学科生命科学附加研究员的支持。P.P.K, A.Z, F.S 通过德国联邦卫生部的 D81870 号拨款 COVID-19 Lockdown-Monitor 获得了资金。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
利益争夺: 作者声明没有竞争利益。
介绍
近几十年来,移动性有了显著增长:2006年至2015年间,全球乘用车数量平均每年增长约4%,2015年达到约10亿辆[1]。这种增长与海运集装箱数量的年增长相当[2],2004年至2019年期间,全球定期航空旅客数量也经历了约6%的年增长[3]从本质上讲,世界在客运方面正变得越来越相互联系,无论是小规模(汽车)还是大规模(空中交通), 以及货物的进出口。这种高度的连通性促进了商品和人员的分配,正如通过农业进口分配的400多种入侵物种所证明的那样,这是全球贸易网络的最佳预测[4]。连接良好的地区不良副作用的一个典型例子是可能发生大流行,并伴有死亡、经济损失以及对幸存者、移民和少数群体的潜在污名化[5–7]。由于罗马帝国的密集商业,公元 541 年在埃及尼罗河三角洲开始的第一次瘟疫大流行已经在 8 年内蔓延到 2 个受影响帝国的领土(地中海、北欧和近东)[6]。如今,加强交流将大流行到达世界各地的时间缩短到几个月,就像2009年H1N1病毒在5个月内从墨西哥传播到各大洲一样[8,9],或者最近的COVID-19大流行,其变种在几个月内传播到全球[10\u201213]。
世界各区域之间的联系强度只能部分地解释为它们的地理接近性。相反,由于历史上的地缘政治关系[14,15],大流行病的传播距离相当大,该距离来自世界航空运输网络(WAN)[16\u201219],或者,如果应用在较小规模上,也来自其他运输方式[16,20]。根据有效距离,如果从 A 到 B 的客流量大于到其他目的地的客流量,则区域 B 最接近区域 A。一个有趣的扩展是多径有效距离,它通过考虑WAN上随机步行者所走的所有路径来增强对疾病到达时间的预测[17]。有效距离通常用于分析流动性对疾病传播的影响,例如MERS [21]、埃博拉病毒[22]、寨卡病毒[23]以及最近的COVID-19 [20, 24–26]。虽然它能够对疾病到达时间进行定性估计,但在描述受感染乘客从特定来源输入到目标时,其适用性受到严重限制。然而,这些导入事件与政治决策者高度相关,并能够进行建模预测。
在这项工作中,我们通过“导入概率”p(B|A),它等效于元素 T 的起点-终点 (OD) 矩阵八表示从 A 到 B 的行程数,不同之处在于概率由从 A 开始的所有行程归一化,即 p(B|A) = T八/T一个.有一些迁移率模型可以拟合OD矩阵,需要参考OD矩阵,如重力模型所示[27\u201231]。此外,一些模型将较小尺度的OD矩阵拟合模型与全球航空运输网络的OD矩阵相结合,创建了一个多尺度的移动网络来表示所有运输方式[32,33]。 请注意,多尺度流动性模型已被成功用于分析过去的大流行[34\u201236]。然而,获得OD矩阵可能非常困难,大多数情况下,它是通过小型调查[37]或与人口普查[38]一起估计的。即使对于从预订系统得出的航空运输网络,OD也只是一个近似值,因为乘客越来越多地直接在航空公司预订(2015年,汉莎航空所有航班中有30%是直接预订的,2018年增加到52%[39]),而不是通过大多数OD估计值得出的大型GDS(全球分销系统)[40, 这意味着,为了精确计算航空运输OD矩阵,必须购买/估计和合并所有GDS和约900家航空公司的预订。因此,不依赖于现有参考OD矩阵的模型很重要,这些模型要么假设一个潜在的决策过程,而不整合交通信息作为辐射模型[42,43],要么应用最大熵方法沿已知交通网络的可能路线分布未知的OD行程[30,44,45].然而,上述方法均未使用有效距离及其与疾病传播的定性联系,也没有一种方法基于交通网络上的机械分布过程。根据我们的理解,机械过程模仿了交通网络上乘客的详细运动行为,既不只使用位置的数量和位置之间的数量(重力和辐射模型),也不依赖于热力学平衡中的系统原理(最大熵模型),换句话说,它是一种自下而上的方法。这种方法使我们能够对观察到的模式进行机械理解,使我们能够研究修改如何影响乘客分布。例如,我们可以分析沿配送路线的遏制干预措施如何降低受感染乘客的输入概率。
在这项工作中,我们引入了导入风险模型,该模型基于基于有效距离的广域网最短路径树的分布过程。此过程与随机步行器相结合,随机步行器可探索 WAN 内的所有潜在路径。我们使用2014年的WAN数据,并将其与2014年的全球跨国流动性数据集[40]进行比较,作为地面实况基线。此外,我们通过多种比较措施研究了重力[27,31]和辐射模型[43]等进口风险和替代迁移模型的差异。我们发现,导入风险模型优于其他模型,并且仅在仅包含广域网信息和机场之间的大地测量距离时略有改善。最后,我们评估了特定国家/地区的进口概率估计的质量,并评估了测地线距离是否以及如何在进口风险估计中编码。
结果
关联 WAN、OD 概率和有效距离
在这项工作中,我们引入了进口风险,它估计了从机场 A 出发的乘客在全球任何机场结束旅程的概率,即使是那些与始发机场没有直接连接的机场。该估计基于飞机的交通流量和机场之间各自的最大载客量,即世界航空运输网络(WAN),由官方航空公司指南(OAG)提供[46]。这个推理问题很有意思,因为监控飞机的始发地和目的地要比监控可能多次转机航班直到最终目的地的乘客要容易得多。在我们的研究中,我们使用 2014 年的 WAN(图 1A),并将推导的导入概率与参考数据集进行比较。参考导入概率基于2014年的全球跨国流动性数据集(GTN)[40,47],该数据集将来自全球主要分销系统(GDS)的始发地-最终-目的地数据集与世界旅游组织的旅游数据集相结合(图1B,有关数据的更多详细信息,请参阅材料和方法)。在引入进口风险模型之前,我们对两个数据集进行了对比,引入了有效距离[16],并量化了其作为我们所提出的模型的基础指标的潜力。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 1. WAN、OD-概率、SPT和有效距离之间的关系。
答:世界航空运输网络 (WAN) 代表了 2014 年机场之间的直飞航班连接和最大座位容量,此处显示的是从五个选定国家/地区出发的航班。它基于航班时刻表数据。这些线是捆绑的,并不代表具体的飞行路线,但说明了与国外机场的联系。B:基于2014年全球跨国流动性数据集[40,47]的OD矩阵(始发地-目的地)的参考从加拿大到所有国家的进口概率。它结合了SABRE和世界旅游组织(UNWTO)国家之间的始发地和最终目的地旅行。这些线说明了与共同来源国的联系。C:基于有效距离 d伊芙 = d0? ln(p) 以加拿大最大的机场为源(YYZ:多伦多皮尔逊国际机场)构建的最短路径树 (SPT)。链路颜色和粗细显示跳跃距离,即转机航班的数量。D:参考导入概率(如B,但所有国家作为源)与有效距离d的指数衰减伊芙(源自 WAN (A) 的 SPT (C))。每个点代表一个国家-国家/地区的链接,这些线是中位数,包括所有来源国家或仅来自特定大陆。地图是用geopandas创建的[48]。
https://doi.org/10.1371/journal.pcbi.1011775.g001
通过将世界航空运输网络(WAN)与GTN的特定国家/地区的参考进口概率进行比较(比较图1A和1B),我们看到通过直接链接连接的机场属于进口概率也很高的国家。然而,由于物理限制和物流优化,并非所有进口概率为非零的国家都与来源国的机场直接相连;相反,他们可以通过转机航班到达。在进口概率方面,基于测地线距离和目标国家人口的估计是有用的,但在某些情况下表现出局限性。例如,意大利的进口概率大约是德国的 1.4 倍,尽管德国在地理上更接近加拿大并且人口更多。有效距离是一种基于网络的替代距离测量方法,它不仅仅依赖于直接连接和地理信息[16\u201219]。相反,它基于客流 Fij从j到i及其与流出F的关系j通过转移概率 Pij = Fij/Fj.与恒定距离偏移 d 一起0,直连机场之间的有效距离为
(1)
没有直接连接的机场之间的有效距离是沿最短路径树 (SPT) 的累积距离,由 d伊芙,如图 1C 所示的加拿大最大机场(多伦多皮尔逊机场,YYZ)。请注意,距离偏移量为 d0= 0 将使两条路线无法区分,只要沿每条路线的转移概率的乘积相同,但 d0> 0 中转航班较少的一条航线实际上更短。既往研究表明,疾病到达国家的时间与其有效距离呈线性依赖性[16\u201219]。我们表明导入概率也与 d 相关伊芙 (图 1D),因此相关性高于其他距离测量(参见 S1 文本中的图 A)。事实上,导入概率随着有效距离的发生指数衰减(图1D中半对数尺度上的线性衰减),对于以恒定有效速度和恒定出口率行驶的乘客,可以在简化模型中再现。因此,有效距离似乎可以很好地表示底层分布过程,并且是我们提出的进口风险模型的基础,直接估计进口概率的一个有前途的候选者。
导入风险模型
导入风险模型背后的思想是两个要素的组合:(i)随机游走,具有步行者在当前节点完成其旅行的退出概率,以及(ii)从d伊芙SPT(图 2)。Iannelli等[17]提出了随机游走的方法,他们可以改进d的到达顺序预测伊芙通过包含所有可能的路径。退出概率使我们能够将随机游走与分配机制相结合,该机制分配每个节点成为最终目的地的可能性,如第二步中详细解释的那样。第一步,我们使用 WAN 的转换网络表示,并让随机步行者从源 n 开始0在每一步之后,它要么在当前节点 i 处退出,退出概率为 q我或继续走路。让我们定义步行者继续步行到节点 n 的概率,因为它之前在节点 n ? 1 并且最初从 n 开始0由
(2)
带 Pn,n?1作为从 n ? 1 到 n 的转移概率。现在,沿着路径行走的概率Γ从 n 开始0在 n 处退出是继续走 S 的概率我,J沿着作为路径一部分的每个链路 (i, j) 乘以最终节点的退出概率
(3)
其中我们省略了对源 n 的显式依赖0.我们的目标是描述步行者可以从 n 中获取的所有可能路径0到 n。我们将使用矩阵 S,其元素是继续行走 S 的概率我,J.矩阵乘积的元素 (i, j) 与自身 S ? S = S 2长度为 l = 2 且以 i 结尾、以 j 开头的所有路径的总和。接下来,我们可以将步行者在遍历所有长度为 l 的路径后在 n 处退出的概率定义为
(4)
最后,导入风险是在给定所有长度的所有路径的情况下在 n 处退出的概率
(5)
其中,我们使用了几何级数与单位矩阵 I 的收敛。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 2. 进口风险方案。
从过渡网络(左)开始,根据有效距离(中心底部)计算最短路径树。基于最短路径树,退出概率 q° = q(°|?) 计算。在公式中,几何符号表示相应节点的估计人口,也可以进行距离加权(取决于确切的模型)。定义了一个具有退出概率的随机游走过程(顶部):在每一步中,游走者要么以概率退出节点。° = q(°|?),或继续以 prob. (1 ? q°).进口风险p∞(°|?)(右)是步行者在节点 ° 处退出的概率,假设它在考虑所有可能的路径的情况下从节点 ? 开始。
https://doi.org/10.1371/journal.pcbi.1011775.g002
在第二步中,我们近似退出概率 q我(n0),但尚未指定。因此,我们假设乘客从源机场 n 开始0,沿 SPT 行进,并在节点 i 处以退出概率退出
(6)
以 N(i) 为机场 i 和 Ω(i|n) 作为 SPT 上 i 下游所有后代节点的集合,以源 n 为中心0.因此,节点 i 的退出概率由节点 i 处的种群与 SPT 上 i 的所有下游节点(包括节点 i)的总种群之比决定。
我们使用机场 i 在 WAN 上的流出量来估计其人口,表示为 N(i) = F我.为了汇总国家层面的进口概率,我们将目标相加,并对来源机场应用加权平均值,以人口为加权因子。
阐明有关节点之间地理距离的附加信息如何影响 p∞,我们探讨了导入风险模型的两种变体:在具有“测地线距离加权”退出概率的变体中,方程 6 中的种群被替换为 ,其中 是 i 和 n 之间的测地线距离0.为了控制模型复杂度的增加,我们研究了“有效距离加权”退出概率,即不使用地理信息,但模型结构是等效的。
替代模型。
许多替代模型估计OD矩阵,从中可以推导出导入概率[30,31,42,43,49–52]。其中,重力[27]和干预机会[42,43]模型应用最为广泛。后者的最新变体是辐射模型[43]。尽管过去的研究发现,重力模型在小尺度上优于辐射模型[38,53,54],但特别是辐射模型在大尺度上的良好性能[38,54]使其成为WAN上移动性的有趣模型。 它最初是为通勤流[43]概念化的,其中周围的人口作为可能的工作机会的代表。通过根据机场的流出量来估计机场的人口,我们将概念从就业机会调整为旅游机会。它从机械决策过程推导而来,使其无参数,因此与我们的模型相似并进行了很好的比较。但是,它只需要有关人口密度的信息,并且不整合飞行数据。
我们将我们的模型与具有指数和幂律距离依赖性的重力模型以及辐射模型进行了比较(有关定义,请参阅材料和方法)。这些模型仅依靠来自 WAN 的流出数据来估计节点的人口和地理位置。为了结合广域网的结构信息[55],还用测地线路径距离(沿SPT的测地线距离)和有效距离实现了备选模型,即总共有9个备选模型:辐射模型、具有指数和幂律距离衰减函数的重力模型,每个模型都用测地线、 测地线路径和有效距离。通过将最佳拟合指数分配给六个比较度量(Pearson 相关、均方根误差、通勤者公部分、Kendalls 秩相关和对数度量的相关性和 RMSE,均在材料和方法中定义)并取其平均值(参见 S1 文本中的图 B 和 C),将六个重力模型的指数拟合到参考导入概率).作为比较度量,我们选择了三个与绝对误差相关的度量和三个与估计值和参考值之间的相对误差相关的度量。
回头客的对称性。
12 个模型中的每一个都提供了导入概率 p(i|n0),用于通过与相应的源总体 N(n 相乘来计算 OD 矩阵 T0).通过比较 T 与参考 OD 矩阵的对称性,我们发现参考数据中的对称性更高且质量不同(参见 S1 文本中的补充注释 B,图 D)。高度对称性可能是由于游客(家庭、商务、旅游等)主导了国际旅行。他们在有限的时间内返回自己的家乡[56],只有少数旅行者是移民,即永久留在目的地。有趣的是,进口风险模型具有最高的对称性,但仍然比参考数据对称性低 4 倍。因此,在对估计值进行详细比较之前,我们通过对称的OD矩阵来纠正导入概率估计值(通过提取对称部分并重新计算导入概率;有关详细信息,请参阅S1文本中的材料和方法以及补充说明B)。这种修正可以看作是双约束模型的另一种版本,在该模型中,通常通过迭代比例拟合来确保流入和流出的约束[31]。
模型比较
在随后的分析中,我们通过四种方法根据参考数据评估进口概率估计值:(i)直接比较和评估其中位数以识别潜在的系统误差,(ii)应用六个不同的拟合优度指标来评估单个模型的排名和相对性能,(iii)确定进口风险最高的国家的分类任务, 在大流行的背景下尤其重要,以及 (iv) 对 20 种疾病和 SARS-CoV-2 变体到达时间的相关性研究。
定性比较。
在图 3 中,导入概率估计 p(i|n0)与参考导入概率进行比较。当使用有效距离时,重力模型与参考数据表现出最接近的一致性,如中位数所示(图 3,第一列和第二列)。相比之下,辐射和进口风险模型的中值相对稳定,受距离指标或其相关权重(第三列和第四列)变化的影响较小。所有模型都高估了最低的进口概率中位数(图3中最左边的橙色点),因为估计的进口概率总是不为零,但由于观察期有限和/或离境乘客数量不足,大部分最低参考进口概率为零。在p(i|n0) ≤ 10?4适用于重力风险模型和进口风险模型。然而,在具有指数距离衰减函数和有效距离度量(图 3I)的重力模型中,这种高估明显不存在,其中中位数显示与参考数据最接近的对齐方式。辐射模型(第三列)系统地高估了最高的输入概率(p(i|n0) ? 10?1),因此低估了较低的进口概率。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 3. 通过具有指数(第一列)和幂律(第二列)衰减距离函数的重力模型、辐射模型(第三列)和进口风险模型(第四列)估计进口概率。
前三个模型(第 1-3 列)使用测地线(第 1 行)、测地线路径(第 2 行)和有效(第 3 行)距离作为距离。导入风险模型是从广域网计算的,测地线距离 (D) 或有效距离 (L) 作为退出概率的权重,或者不加权 (H),即在最后两种情况 (H、D) 中仅使用 WAN 信息。橙色线表示中位数,灰色线表示 y = x,说明了完美的映射。
https://doi.org/10.1371/journal.pcbi.1011775.g003
通过多种措施的拟合优度。
我们通过皮尔逊相关性、均方根误差 (RMSE) 和通勤者的公共部分将每个模型与参考导入概率进行比较。这些措施对强联系更敏感,即大进口概率,当重点放在最有可能进口乘客的国家时,这一点很重要。但是,如果重点是获得包括所有链接在内的公平比较,则上述度量或秩相关性的对数版本更合适。因此,我们还通过度量对数的相关性和 RMSE 以及 Kendall 秩相关性来量化一致性。除一项措施外,三个导入风险模型变体在所有方面都优于其他模型,其中采用测地线距离加权退出概率的变体表现最佳(图 4A)。继进口风险模型之后,基于有效距离的两种重力模型也表现出较强的排名。相比之下,其余模型在所有六个指标中都缺乏一致的高排名,并且更均匀地分布在下半部分。该模型分类也适用于模型的相对性能(图 4B),其值在两者之间呈线性缩放(参见方程 22)。与排名相反,当重力模型包含有效距离时,中位数的相对性能显示出显着的改善。然而,在进口风险模型中,相对表现中位数的差异仍然很小。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 4. 进口风险估计模型的排名和相对性能。
通过等级 (A) 和相对性能 (B) 比较不同的导入概率模型,最高值代表最佳方法。显示了六个比较度量(corr、logcorr、RMSE、logRMSE、cpc、τ)中每个(黑点)的排名和相对性能肯德尔) 方框表示四分位距,水平线表示中位数,红色三角形表示平均值。方框的颜色说明了正在使用的不同距离测量。导入风险模型 (I.R.) 的异常值度量是 logRMSE,其中具有有效距离的重力模型表现最佳。有关比较措施的定义,请参阅材料和方法,有关绝对和详细的相对性能,请参见 S1 文本中的图 E、F。
https://doi.org/10.1371/journal.pcbi.1011775.g004
导入风险模型优于具有有效距离的重力模型的唯一度量是logRMSE(S1文本中的图E,F)。从引力模型在进口概率中值与参考数据的广泛范围内的良好一致性以及进口风险模型对低进口概率的高估可以看出。这种高估可以通过模型修改来减少,这些模型修改引入了有利于在具有大量人口的节点处退出的参数(有关详细信息,请参阅S1文本中的补充说明C和图G,H)。但是,我们避免增加模型的复杂性,因为它的通用性是其关键方面。
十个最高风险国家的分类。
在大流行的背景下,确定输入概率最高的国家特别有意义。我们分析了十二个代理模型的分类能力,如果一个国家是进口概率最高的十个国家之一。同样,导入风险模型的表现优于其他模型,具有测地线距离加权退出概率的模型是最高预测因子,灵敏度为 71.1%(图 5D)。所有基于距离的有效模型都具有高灵敏度(? 65%),包括具有66.8%的辐射模型,其相对性能最低,平均等级第二低(图5I-5K)。对于这些高进口概率,进口风险模型现在在RMSE和对数RMSE方面也优于其他模型,即风险最高的10个国家不仅被进口风险模型分类最好,而且定量评估最好。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 5.
按指数(第一列)和幂律衰减距离函数的重力模型、辐射模型(第三列)和进口风险模型(第四列)对进口概率最高的10个国家进行分类。真阳性或假阳性(T.Pos.或F.Pos.)意味着该国家是或不是参考输入概率最高的10个国家。假阴性 (F. Neg.) 表示它属于参考集,但未被相应的模型检测到。饼图说明了模型的敏感度。
https://doi.org/10.1371/journal.pcbi.1011775.g005
疾病到达时间。
在我们的最终比较中,我们评估了疾病到达时间与疾病爆发国估计输入概率之间的相关性。请注意,作为输入风险模型基础的有效距离已经与疾病到达时间有明确的关系,并且开发输入风险模型是为了将这种定性关系扩展到输入的定量乘客数量,正如最近一项关于SARS-CoV-2变异株大流行潜力的研究所做的那样[11]。然而,通过每个模型的导入概率的负对数,当然可以与到达时间进行定性比较,我们将其称为有效模型距离,它与到达时间t呈线性关系[16,19] 一个(我|j) 疾病
(7)
以 J 为疾病暴发国。到达时间t一个(我|j)是指从疾病暴发到目标国家I报告首例病例之日之间的天数。我们评估了相关性 C(t一个、dM)为2009年开始的H1N1流感大流行[8]、2019年开始的COVID-19大流行[57]及其18种变体。除了导入概率模型外,测地线、测地线路径和有效距离与 t 的相关性一个都包括在内。我们的分析表明,使用有效距离作为距离测量的模型始终优于那些依赖测地线或测地线路径距离的模型(图 6A)。有趣的是,无论采用何种特定的距离度量,具有幂律衰减距离函数的重力模型始终表现良好。我们没有观察到专门针对某些疾病的特定模型。相反,我们在模型中观察到相同疾病的相似相关值(图 6B),这表明到达时间 t 存在相当大的噪声一个这因疾病而异。噪音可能与疾病特定的传播速度有关:我们的假设,即疫情国家是唯一的源头,随着疾病传播速度越慢,就会越来越受到破坏,因为其他国家成为次要来源。均值相关〈C(t的简单线性回归一个、dM)〉 和平均到达时间 〈t一个〉 支持这一假设(r = ?0.44,p = 0.055,S1 文本中的图 K)。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 6. 相关性分析:疾病到达时间与有效模型距离的关系。
每个模型的导入概率都转换为有效距离 dM(我|n0) = ?ln(p(i|n0)) 与 n0作为各自疾病的暴发国。相关结果 C(t一个、dM) 与到达时间 t一个(i) 在目标国家的疾病中,i 按模型 (A) 和疾病 (B) 分组。作为比较距离,测地线、测地线路径(在有效最短路径树上)与有效距离与 t 的相关性一个显示。每个点代表 21 次考虑的疫情(2009 年的 H1N1、2020 年的 COVID-19 以及 2020-2022 年其 18 种变体的传播)的相关结果。
https://doi.org/10.1371/journal.pcbi.1011775.g006
国家和地区的输入风险
在量化了进口风险模型的性能之后,我们现在重点关注 (i) 其预测质量的特定国家差异,(ii) 由于没有机场相互联系更紧密的行政单位(例如国家)的概念而可能受到的限制,以及 (iii) 测地线距离如何在进口风险模型中编码,即距离依赖性如何仅从广域网信息中出现。
特定国家/地区的性能。
在导入风险方法中,我们假设对系统的了解很少,即只有广域网是已知的。因此,我们仅通过网络属性来区分国家/地区,其中之一是节点的程度,或者更准确地说是节点强度,因为广域网是一个加权网络。这是最简单的指标,也很容易根据国家层面的视角进行调整。在国家层面,节点强度直接对应于国家C的流出量
(8)
这种国家特有的特征表明一个国家有可能影响网络的结构,因为来自小流出国的流量被大量流出国稀释。从生态学的角度来看,流出量与一个国家的国内生产总值密切相关(S1文本中的图N)。导入风险 p 的对数之间的相关性 (logcorr)∞参考进口概率随着来源国的流出而提高(图7),如英国(GB)是WAN中流出最多的国家,厄立特里亚(ER)是流出最少的国家之一。随着国家资金流出的预测改善,表明广域网由大量资金流出的国家主导,因此,对于广域网流出量较低的国家,预测会恶化。然而,预测改进也存在于完全不使用 WAN 信息的模型备选方案中(例如,具有测地线距离的重力,S1 文本中的图 M)。我们排除了替代模型显示这种改善的解释,因为这些模型通过其进口概率与参考数据拟合,从而确保了国家之间的权重相等,因此显示出这种改善。相反,它表明低流出区域的流动性行为是不同的,这也得到了广域网流出量为 F 的国家的突然性能饱和的支持C? 106 (图 7 和图 M 在 S1 文本中)。可能,他们的乘客分布受到其他因素的限制,并且仅限于附近的地区。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 7. 来源国的预测质量和广域网流出。
进口风险的对数与参考进口概率之间的相关性随着相应来源国的流出而改善(上图)。流出量特别低(ER、厄立特里亚)和高(GB、英国)、log_corr的来源国的例子,以及它们的进口风险和对目标国家的参考进口风险(中间行)。与具有可比流出量的来源国相比,log_正措施特别低的国家要么在历史上与特定地区有关,如澳大利亚(AU)和以色列(IL)与欧洲国家(右下图),要么在政治上与澳门(MO)作为中国的特别行政区有关。
https://doi.org/10.1371/journal.pcbi.1011775.g007
与澳大利亚(AU)、以色列(IL)和澳门(MO)等具有类似WAN外流的疫情国家相比,进口风险估计更差。这些国家之所以联系在一起,是因为与特定地区的历史关系,这些地区要么不在其直接邻国(非盟和伊利诺伊州的欧洲国家)中,要么比裸露的邻国所暗示的更重要,例如澳门是中国的一个特别行政区。澳门对中国的进口风险被低估,因此高估了对其他国家的进口,而对非盟和伊利诺伊州的欧洲则被低估,从而高估了其他地区(图7)。AU、IL 和 MO 作为示例说明,WAN 可能无法完全封装导入风险模型可访问的所有相关信息。我们的方法论方法中缺少的另一个概念是一个国家或另一个行政单位的概念。相反,它统一对待机场对,而不考虑它们的国家隶属关系。由于我们知道从广域网离开特定国家/地区的国际航班,因此我们可以运行自洽分析,即不需要参考进口概率数据。我们可以通过进口风险模型估计离开C国的流出量,如下
(9)
如果我们将其与 F 进行比较C从国 C 流出的广域网流量(见式 8),事实证明,进口风险模型系统性地高估了流出一个国家的流量(S1 文本中的图 I 面板 A)。事实上,相对误差随着属于该国的机场数量而增加(S1文本中的图I面板B)。对这种高估的可能解释包括,进口风险模型中没有针对特定国家的概念,以及无意中将过境旅客纳入机场集水区的人口统计中(因为我们使用流出作为人口的代理)。但是,我们可以很容易地纠正国家层面分析中的这种高估,方法是将机场人口标准化,从而恢复WAN国家的流出量。
测地线距离依赖性。
导入风险模型估计导入概率,但没有明确的测地线距离信息(不包括具有距离加权退出概率的变体)。由于经典模型已证明距离是人类流动性的良好预测指标,因此我们假设它被编码在WAN结构中,并因此被编码在进口风险估计中[58]。为了更加清晰,我们汇总了全球22个地区的进口风险数据。我们观察到,随着到源的测地线距离的增加,单个目标的导入风险以类似于幂律的方式降低(图 8A 和 8B 以及 S1 文本中的图 L)。当我们改变视角并检查从单个源到所有目标区域的距离依赖性时(图 8D和8E),观察到的依赖性与形式的幂律拟合不太一致(图8C)。这是令人惊讶的,因为导入风险是通过以源为中心的视图计算的(通过计算源自每个源的最短路径树的退出概率),这表明从一个源到其可能目标的距离依赖性应该是最好的。一种可能的解释是,每个目标都具有自己的吸引力,与源区域无关。这表明分布动力学可能类似于拉动机制而不是推动机制。事实上,我们发现,随着流出目标区域的广域网流量的增加,幂律拟合的拟合指数α会减小,这可以作为区域吸引力的代理(图8F)。换言之,一个地区越有吸引力,从更远的来源地区进口的风险就越大。拟合指数 c 与 α (τ肯德尔= 0.89),即系数也取决于该区域的吸引力。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 8. 在区域层面汇总的“目标”与“源头”的进口风险及其测地线距离依赖性。
区域间测地线距离预测进口风险p∞从所有源(A、B)到单个目标比从单个源到所有目标(D、E)要好,这可以从幂律拟合 p 的 p 值 (C) 中看出∞(d) = c?d?α每个选定的示例都用灰线(A、B、D、E)表示。单个目标的输入风险的拟合指数α随着从目标区域流出的区域广域网流量(F)而减小,即一个区域连接得越多,输入风险随距离的衰减就越弱。水平虚线表示单个目标(A、B)或单个源(D、E)的平均导入风险。点的颜色与所描绘的世界区域相对应(右)。地图是用geopandas创建的[48]。
https://doi.org/10.1371/journal.pcbi.1011775.g008
讨论和结论
基于导入概率对有效距离的强烈依赖性,我们结合WAN上的随机游走,实现了基于有效距离最短路径树退出概率的导入风险模型。因此,我们可以推断其运输车辆 (WAN) 交通网络内的乘客行程分布。当我们将无参数模型与已建立的流动性模型的变体进行比较时,我们观察到它在大多数比较措施中都超过了替代方案。唯一的例外是具有有效距离的两个参数拟合重力模型表现最佳。输入风险模型在确定输入概率最高的国家方面最准确,是与20种疾病到达时间相关性最高的模型之一,显示了其对流行病相关问题的重要性。然而,它系统性地高估了低进口概率,对于每年旅客流出量低于100万的国家,其表现更糟。尽管缺乏任何明确的测地线距离信息,但导入风险模型恢复了测地线距离依赖性。与相反的情况相比,当考虑单个目标的所有来源时,这种区别更为突出。我们将这种现象归因于目标的特定吸引力,我们使用其节点强度(即目标的乘客流出量)来估计。
具有有效距离的重力模型优于进口风险模型的唯一度量是 logRMSE。这可能是由于它们在很宽的导入概率范围内具有良好的一致性(图 3I 和 3J)。进口风险模型相对于logRMSE表现不佳,因为它系统性地高估了低进口概率。请注意,第二个无参数模型,即辐射模型,系统地低估了低进口概率,其方式与进口风险模型相同。这是意料之中的,因为任何参数调整都无法纠正与假设的偏差。我们确定了几种方法来减少进口风险对低进口概率的高估,方法是引入一个附加参数,该参数可以缩放各个机场的人口,沿最短路径树更改退出概率或仅更改特定节点的退出概率(有关详细信息,请参阅S1文本中的补充说明C和图G,H(有关详细信息,请参阅S1文本中的补充说明C和图G,H)).总之,我们发现引入修改以增加在机场或人口众多的节点退出的可能性可以减轻高估的问题。然而,我们将其作为模型的可能扩展,并强调它在所有相关度量中都优于其他模型,说明了它的巨大潜力。
辐射模型的糟糕性能可能归因于其初始设计,该设计侧重于由工作机会驱动的小规模通勤流[43],这表明自下而上的方法通常仅限于其特定用例,但可以进行调整,例如扩展辐射模型[59],该模型不再无参数,并且具有与重力模型相似的性能[54].有趣的是,辐射模型是唯一一个没有通过测地线路径或有效距离包含飞行网络信息的模型(图4)。辐射模型对网络信息的不敏感可以归因于它仅从距离数据中提取等级信息,导致信息大量丢失。等级表示存在一个问题,即直接跟随其等级的机场可能被山脉或海洋隔开,即等级差异很小,但实际距离很大。此参数适用于任何距离信息。
我们通过对应于双约束模型的特定形式的相应 OD 矩阵的对称化来校正导入概率。通常,约束条件仅确保每个位置的流出和流入与观测值相对应[31,52,54],相反,我们假设由于回访者而两者相等。我们在不进行校正的情况下重复了模型比较:它降低了与72个模型-测量组合中除5个之外的所有参考数据的一致性(S1文本中的图F),这与先前的研究一致,这些研究报告了双约束模型的更好性能[54]。重要的是,如果进口概率估计值没有得到纠正,进口风险模型的表现仍然优于其他模型(将图 4 与 S1 文本中的图 J 进行比较)。需要注意的是,当游客和游客占主导地位而移民可以忽略时,回头客的假设是适用的。然而,这一假设可能不适用于低收入和高收入国家或冲突地区之间的联系。
在疾病到达时间分析中,所有使用有效距离的模型都表现相似,包括所有具有幂律距离衰减的重力模型。疾病到达时间t一个与估计导入概率的对数相关,即结果应与拟合结果的对数优度一致。有效距离模型的对数测量值最大值仅相差 0.07,这些模型基于 183 个国家作为潜在来源(S1 文本中的图 J)。然而,到达时间分析中的20种疾病只有10个独特的暴发国家。此外,由于国家/地区之间的检测率不同、到达时间的不确定性和其他因素等因素,样本量可能不足以恢复 logcorr 结果。为了降低 t 上的噪声一个,我们通过对数拟合对早期情况推断到达时间来重复分析,即假设初始指数增长(参见 S1 文本中的补充说明 D)。由于这一程序,一些数据不足以进行推断的国家不得不被排除在外,这反过来又导致排除了更多的疾病。然而,结果与t一个通过第一次计数进行估计(比较 S1 文本中的图 6 和图 P)。
我们发现,在不向导入风险模型提供任何测地线距离信息的情况下,即使从以源为中心的视图计算导入概率,对于单个目标的导入概率,距离依赖性也比从单个源更强。由于广域网在空间上是嵌入的,并且具有三个网络维度[58],因此其连接在一定程度上反映了嵌入空间的特征。这解释了导入风险模型通常捕获距离依赖性的能力。在以目标为中心的观点中,距离是更好的预测指标,这与之前的一项研究非常吻合,在该研究中,特定于目标的人类流动性模型通过为每个目标分配与目标人口成正比的特定吸引力,将移动数据折叠到多个目标[51]。
对于广域网外流量较小的国家,进口风险模型的预测情况会恶化,而且由于该国的广域网流出量与其国内生产总值成正比,因此该模型对GDP较低的国家(即人口少和/或中低收入国家)的表现较差。这是很不幸的,因为我们的模型从具有成本效益的交通流监控中获取始发地-目的地 (OD) 信息(直接监控成本高昂),因此对于资源有限的地区特别有价值。然而,我们发现模型替代方案(重力、辐射)在低流出国家的表现也很差,后者的乘客分布很可能受到GDP的限制,因此仅限于有效邻近的目标区域。为了规避这个问题,可以汇总邻近的低流出国家,直到企业集团超过F的流出阈值C= 106在此之上,我们观察到性能饱和(图 7 和 S1 文本中的图 M)。当然,这种折衷方案的空间分辨率较低,我们强调未来需要朝这个方向进行研究。
虽然我们已经评估了该模型在世界航空运输网络上的表现,但其适用性扩展到其他交通方式,如地铁系统、汽车、公共汽车和火车。未来的研究将探索该模型可以有效应用的具体条件。此外,仅根据机场集水区内的出行人口对出行人口的基本估计还有改进的余地。这一估计目前没有考虑到枢纽的重要作用和过境旅客信息的缺失。仅依赖交通网络的简单框架很有吸引力,但在某些情况下,可以通过使用有关GDP,基尼系数或人口密度的信息来改进其预测。
我们的比较集中在无参数辐射模型和拟合重力模型上,但我们承认存在本研究未包括的有希望的变化和替代模型[30,31,54,59]。 然而,重力模型被广泛应用,并且已被证明与替代方案[59]同样好或更好[54]。但也有例外,例如,在没有完整移动网络的情况下,类重力模型的迭代计算优于普通重力模型[29]。此外,辐射模型在长距离连接方面优于重力模型[38,54]。尽管如此,重力模型的简单性和通过参数调整的适应性使其成为强大的对应物。模型替代方案通过使用有效距离来利用广域网结构信息,例如任等人[60],其中具有时间距离的辐射模型优于道路网络上的行进距离,以预测每个链路上的交通。同样,我们观察到,与疾病到达时间相关的有效距离在预测输入概率方面优于测地线路径距离。
导入风险模型与从交通数据估计 OD 行程的经典方法有根本的不同,因为后者找到最能再现流量数据的 OD 行程 [28, 30, 44, 45],而我们的模型在交通数据网络上运行分配过程。因此,我们的模型是一种自下而上的机理方法,而经典方法要么适合并需要了解参考行程数据[28,30],要么基于跨链路的行程分布遵循最大熵原理的假设,即OD行程被认为是最有可能由最多数量的微观状态实现的[44, [45]. 请注意,最大熵方法需要估计每个 OD 对之间的路线及其替代方案,而我们允许所有路线都由随机步行者采用。据我们所知,我们的模型在机理性质上是独一无二的,可以研究其潜在分布过程的修改。例如,这包括旨在减缓或限制大流行的遏制战略。一个直接的实现可能是测试一小部分乘客 C我≤ 1 在每个过境机场 i 中,这相当于将受感染乘客继续行走的概率(方程 2)降低到 C = [C
1、C2, ...]可以允许机场之间的测试能力不同。
材料和方法
数据源
OAG(官方航空公司指南)[46]提供的广域网包含航班数量和各自的最大座位容量F我,J2014 年 I 和 J 机场之间的汇总。参考进口概率基于“全球跨国流动性数据集”[40,47],该数据集结合SABRE公司的世界航空运输始发地-最终目的地数据集,以及UNWTO(世界旅游组织)的跨境访问和过夜住宿,将2014年全球从n国到m国的旅行次数分配给全球。 因此,不仅代表了通过航空旅行的流动性,还代表了通过其他方式(参见公路、铁路)的流动性。然而,航空旅行在长途旅行中占主导地位,这使其成为航空运输始发地-最终目的地矩阵的公平参考集。有关数据集如何组合的详细信息,请参阅S1文本中的补充说明A。
备选方案
重力模型指出,区域 n 和 m 之间的旅行次数随着其种群规模的增加而增加(Nn和 Nm) 并随着距离 d 的增加而减小纳米
(10)
以 f(d) 为随距离 d 单调增长的函数,最常被选为幂律 f(d) = dγ或指数 f(d纳米) = eγd.
在辐射模型中,从 n 到 m 的行程取决于它们各自的种群规模 Nn、Nm(或其他作为就业机会的措施)和人数锰在半径为 r 的圆中锰以位置 n 为中心,包括 Nn和 Nm:
(11)
两个模型的导入概率都是通过对相对于源区域的行程进行归一化来计算的
(12)
行程对称化
我们通过对称OD矩阵来校正导入概率:(i)计算估计的OD矩阵
(13)
根据导入概率估计,(ii) 通过计算其对称部分来校正它
(14)
(iii)通过以下方式计算相应的校正导入概率
(15)
通过这些步骤,不对称性大大减少,但仍然存在。因此,我们重复步骤 (i) 直到 (iii) 直到 p(3)(答|B),它返回了所有模型的均值和中位数与参考数据相当的不对称性(有关详细信息,请参阅S1文本中的补充说明B)。
比较措施
我们通过Pearson相关性将导入概率模型与参考数据进行比较
(16)
以 as 平均值,均方根误差
(17)
通勤者的共同点[59]
(18)
如果所有链接都相同,则为 1,如果所有链接都不一致,则为 0。上述所有措施都对强链接更敏感,即大导入概率。但是,如果重点是获得包括所有链接在内的公平比较,我们更感兴趣的是上述度量或秩相关性的对数版本。因此,我们通过相关性比较了导入概率的对数
(19)
均方根误差
(20)
并使用 Kendall 秩相关系数
(21)
其中 C 和 D 为一致和不一致对的数量,Tx和 Ty分别作为 x 和 y 中的纽带。
为了简化和推广比较,我们通过计算每个模型的平均秩来组合上述六个定义的度量,即最佳相关模型具有最高 (12) 和最差具有最低 (0) 秩,一个模型的平均秩是所有六个秩的平均值。
为了量化模型之间的平均差,我们将一个模型 M 的相对性能定义为
(22)
使用 f(xM) = f(xM, y) 作为具体比较函数和 best(f(xk)、k) 和最差(f(xk),k) 作为使用此比较函数的所有模型的最佳和最差性能值。请注意,对于均方根测度,best(...) = max(...),其中 min(...)(模拟最坏(...))。
疾病到达时间
疾病到达时间t一个(i) 在国家I中,根据首例报告的H1N1和SARS-CoV-2病例的日期进行估计。对于 SARS-CoV-2 变体,我们使用该国的第一个测序样本。然而,对于某些变异株,一些测序样本出现在WHO宣布的疫情暴发日期[61]之前的统计月中,我们将其视为错误分类,将其丢弃,转而使用WHO列出的相应国家暴发后的第一个样本(详见补充说明D和S1正文中的图O)。对于每种疾病/变异株,我们使用了我们能接触到的、最接近相应疫情日期的广域网(见S1正文中的表B),作为疫情爆发国家,我们使用了WHO列为第一个拥有相应变异株首次测序样本的国家[61]。对于2009年的H1N1疫情,我们使用了FluNet提供的病例数据[62,63](第AH1N12009栏),对于COVID-19病例,我们使用了通过 ourworldindata.org 访问的WHO COVID-19仪表板[64],使用文件gisaid_variants_statistics.json通过GISAID[65–67]访问了测序样本的数量。
支持信息
S1 文本 -
跳到无花果分享导航
补充资料“从世界空气中推断特定国家的疾病输入风险交通网络”帕斯卡尔·克兰瑟(Pascal P.Klamser)1,2, 阿德里安·撒迦利亚1,2, 本杰明·迈尔1,2,3,4, 奥尔加·巴拉诺夫5,6, 克拉拉·琼恩1,2,弗兰克·施洛瑟1,2, 德克·布罗克曼1,2,7,?,1柏林洪堡大学理论生物学研究所生物系,德国柏林2罗伯特·科赫研究所,柏林,德国3DTU Compute,丹麦技术大学,Kongens Lyngby,丹麦4哥本哈根大学哥本哈根社会数据科学中心,丹麦哥本哈根5慕尼黑大学医院传染病和热带医学科,慕尼黑,德国慕尼黑6德国感染研究中心 (DZIF),慕尼黑合作伙伴站点,慕尼黑,德国7系统协同中心 (SynoSys),德累斯顿工业大学跨学科数字科学中心,德国德累斯顿?通讯作者E-mail: dirk.brockmann@tu-dresden.deSupplementary Note A: Origin-destination data (“Global Transnational Mobility Dataset”)We use the “Global Transnational Mobility Dataset” (1,2) as a reference data set of the import probabilities. It is a combinationof the World-Air-Transportation-Origin-Destination (WOD) data set from the company SABRE, and cross-boarder visits (CBV)from the UNWTO (World Tourism Organization). The WOD has in contrast to the WAN the real number of passengers fromtheir origin airport to their final destination that booked their tickets via SABREs global distribution system (GDS). The WTOdata is based on cross border visits that include an overnight stay of non-residents, thus the backflow of residents in the countryis not monitored. The study (1) processed and combined the two data sets by:1.decomposeWODin trend-, seasonal- and noise-component and only use thetrendcomponent timeseries :)WODall,89=)WOD,89+)WODseason,89+)WODnoise,892.symmetrize the tourism flow matrix (to account for returning residents):?)WTO,89=)WTO,89+)WTO,983.correct theWODdata since it underestimates the mobility flow for close countries (the mobility on land or water ismissing):?)WOD,89=?3(8,9)3<0G◆1/2)WOD,89with2?6.8,3(8,9)as the distance between countries8and9and3<0Gas the maximal distance between all countries.I.e., the closer two countries, the stronger the correction and the connection of the two farthest countries is not corrected.4.combine the 2 data sets by the following rules: if only one data sets provides info on the connection, take this one,otherwise take the larger flow?)89=8>>><>>>:?)WTO,89if?)WOD,89=;?)WOD,89if?)WTO,89=;max(?)WOD,89,?)WTO,89)otherwise(A)Note that the reference data set?)89is possibly an overestimation because the WOD data is increased for short connections.The origin to final-destination data from SABRE is derived from bookings via its GDS. However, SABRE only had about 31%market share in 2014 of all GDS‘ (Global Distribution System) (3) and an increasing number of bookings were not done viaGDS but directly via the airline company (e.g. about 30% of all Lufthansa flights were booked directly with an increasing trend(4)). The WTO data is limited to overnight stays, i.e. private accommodations are not captured, also tending to underestimatethe passenger flow, especially for long-range connections where passenger transport is dominated by airplanes. Thus, thereference is only an approximation and likely underestimates the real number of passengers.Klamseret al.| Infer import risk from the WAN1
Supplementary Note B: Symmetrized flowsWe assume, that the observed system is in equilibrium, i.e. there is no population change due to the human mobility on theWAN. In other words, we neglect migration and assume that every visitor returns to its origin (5), i.e. the OD-flow)out ofregionis the sum of the native population?#and the visiting populations:$=?#+’?#??=(|?)(B)with?=(|?)as the import probability of only the native population. As a consequence, we expect the true OD-matrix to besymmetric, if it describes the human-mobility over a long time period. The shorter the time period represented by the OD-matrix, the higher it is influenced by fluctuations (e.g. not yet all visitors returned to their origin). Thus, we expect a largerasymmetry between distant countries (weakly connected countries), because the few visitors might stay longer.We estimate the asymmetry by0BH<(,?)=|)?)?|麦克斯()?,)?)(三)并观察参考 OD 矩阵与所有其他估计值相比,均值和中位数的最低不对称性(比较无花果。DM 带 A-L)。由进口风险模型估计的OD矩阵(图1)。DD、H、L)是最对称的;然而,不对称性仍然是参考行程的两倍(比较图。DL 和 M)。此外,典型的与参考相比,模型估计中更强连接的较低不对称模式要少得多数据。我们通过以下方式对称 OD 矩阵:(i) 计算估计的 OD 矩阵)(0)<,==?(0)(<|=)#=(四)根据导入概率估计,(ii) 通过计算其对称部分来校正它,S=(T+T>)/2(五)(iii)通过以下方式计算相应的校正导入概率?(1)(|?)=S?/(?.(六)通过执行这些步骤,表示大于相应回流的流量的导入概率为减少,反之亦然。但是,第一次修正后的导入概率?(1)(|?)结果在 OD 矩阵中T(1)之更高的对称性,但仍然具有明显的不对称性,例如?(1)(|?)对于具有指数距离衰减的重力模型和有效距离,中位不对称性从"??(0BH<)=0.84自"??(0BH<)=0.15.因此,我们递归地迭代"=3通过步骤 (i) 直到 (iii) 的次数,即直到?(3)(|?),对于所有模型,它都返回一个可比的0BH
下载
无花果分享
S1 文本。
补充说明A:始发地-目的地数据(“全球跨国流动数据集”)。补充说明B:对称流动。补充说明C:关于高估低进口概率。补充说明D:疾病到达时间分析。表 A.日志案例的过滤标准适合推断到达时间t一个.如果 (C0:) 在峰值 0 之前检测太稀疏(数据少于 6 周),(C1:) 峰值 0 的病例数低于 30(否则信号太嘈杂),(C2:) 推断的到达时间在世卫组织疫情日期之前,则排除一个国家。N是可以生成病例数据的国家数目。NC0和 NC1是通过标准 C0 和 C1 的国家/地区。NC 0 和 C1和 NC 0 & C 1 & C2 是通过多个条件的国家/地区数量。表 B.疾病和 SARS-CoV-2 变体爆发信息和 WAN 日期。对于每种疾病/变体,将显示用于使用不同模型计算输入概率估计值的爆发国家和广域网的日期。请注意,我们只有 2014 年和 2019 年的年度分辨率和 2020-2022 年的月度分辨率。我们从 2020-01-01 月开始使用 WAN 重复了对 COVID 的分析,而不是使用 2019 年的年度 WAN,后者给出了可比的结果。图 A.导入概率依赖于地理距离 (A)、有效距离 (B) 和地理路径距离 (C)。橙色线表示中位数,C(x, y) 是两个度量之间的相关性,无论是对数变换还是非对数变换。国家之间的地理距离是所有机场对的平均值。地理路径距离是沿 WAN 派生的最短路径的地理距离,使用 d伊芙,即它是地理和网络信息的组合。轴刻度对应于相关性最高的轴刻度,即距离和路径距离 (A, C) 的 .log-log 和有效距离 (B) 的 y 对数。图 B.重力模型扫描。将模型估计的导入概率与参考导入风险进行比较的度量的参数依赖性。因此,“corr”是相关性,“cpc”是通勤者的共同点,“log_corr”是对数尺度上的相关性,“rmse”是均方根误差,“kendalltau”是通过Kendalls tau的秩相关性。显示了两个版本的重力模型,其距离函数呈指数衰减 f(d) = e?γd(左列:A、C、E)和幂律衰减距离函数 f(d) = d?β(右列:B、D、F)。 作为距离,使用测地线距离(第一行:A、B)、测地线路径距离(第二行:C、D)和有效距离(第三行:E、F)。水平虚线表示以导入风险为模型的比较度量,并具有相同的颜色。图 C.重力模型的平均最优参数。对于每个具有指数和幂律衰减距离函数的重力模型,以及使用三种不同距离度量(测地线距离、测地线路径距离和有效距离)之一的重力模型,将显示导致最佳拟合参考导入风险的指数γ或β。通过相关性(corr)、对数变换进口风险(log_corr)、均方根误差(rmse)、对数变换进口风险的均方根误差(log_rmse)、Kendall秩相关(kendalltau)和通勤者公共部分(cpc)进行量化。每个模型的平均最优参数用水平线标记,其值为 γ = [6.71, 6.41] * 10?4对于地理和地理。有效距离的路径距离和 γ = 0.84,β geo., geo.路径和有效距离。图 D.OD矩阵的对称性检查。每个点代表在 2 个国家/地区之间往返旅行的乘客人数。OD矩阵由辐射模型(第1列)、具有指数(第2列)和幂律衰减(第3列)距离函数的重力模型以及进口风险模型(第4列)计算。模型的OD矩阵是通过将导入概率乘以源流出来计算的。参考行程和回程具有最高的对称性(第 5 列,M)。橙色线表示中位数,灰线表示 y = x,表示完美对称。均值 (AVG(a符号)) 和中位数 (MED(a符号)) 根据S1文本中的方程C计算的流动不对称性显示在每个面板中。参考行程 (M) 显示出最低的不对称性,尤其是对于大客流。图 E.进口概率估计的相对比较度量。不同导入概率估计模型的等级 (A) 和相对性能 (B)。根据特定度量,与参考进口风险最一致(最差)的模型具有最高(最低)秩和 1(零)。然后,相对性能是最佳和最差模型之间的线性插值。比较措施是相关性 (corr)、对数变换进口风险之间的相关性 (log_corr)、均方根误差 (rmse)、对数变换进口风险的均方根误差 (log_rmse)、Kendall 秩相关 (kendalltau) 和通勤者公共部分 (cpc)。作为重力模型的指数,使用平均最优参数(S1 文本中图 C 中的水平线)。图 F.进口概率估计的绝对比较度量。比较措施是相关性 (corr)、对数变换进口风险之间的相关性 (log_corr)、均方根误差 (rmse)、对数变换进口风险的均方根误差 (log_rmse)、Kendall 秩相关 (kendalltau) 和通勤者公共部分 (cpc)。作为重力模型的指数,使用平均最优参数(S1 文本中图 C 中的水平线)。颜色描绘了 4 种不同的模型。实心圆是通过对称其OD矩阵来校正导入概率的模型,透明正方形是相应模型的未校正导入概率。图 G.导入风险比较及其与线性关系的偏差。散点图(左),只有指数拟合的中位数和 IQR(右)。图 H.进口风险模型的变体,用于研究其他参数如何影响进口风险与参考进口风险之间的关系。A:流量缩放指数 ν,根据机场 i 的 WAN 流出流量 F 估计机场的出行人口 N(i)我via(默认值:ν = 1)。B:有效距离偏移量 d0这会惩罚有效距离 d 中较大的跳跃距离伊芙(我|n0) = d0? ln(Pij) 时创建最短路径树(默认值:d0= 1)。C:在最短路径退出概率中引入的后代分数,其中 0.5 是默认值,大于 0.5 的值意味着与当前节点相比,后代(或后代)节点退出的可能性更大。D:为最短路径树退出概率引入不同的权重选项。默认情况下,节点填充不加权。权重是测地线或有效距离的倒数。E:手动设置叶节点(死端节点)的最短路径退出概率。默认情况下,退出概率为 1。降低到 0.9 或 0.8 不会在视觉上改变中位数。图一.按进口风险进行国家外流重建。WAN 中流出国家 F 的流量C由进口风险模型估计 TC= ∑n∈C∑m?C p∞(米|n)Nn.直接比较两种措施 (A),并根据相应国家/地区的机场数量计算相对误差 NARPT的 (进口风险模型不包括国家的概念,这在一定程度上解释了对大型机场的高估。另一种解释是高估了各自的机场人口Nn = Fn通过输入风险模型的WAN流出(由于需要排除的过境乘客,真实人口较少)。请注意,这里使用的是 WAN,即我们检查模型的自一致性,并且不包含参考数据。图 J.未校正的模型:排名和相对性能。与图 4 中的正文中的分析相同),但是,这里使用了未校正的模型预测,即没有对称 OD 矩阵。图 K.到达时间与有效模型距离与平均到达时间估计的疾病速度之间的平均相关性 〈t一个((三)?C,在所有国家 C 上平均。相关性 C(t一个、dM) 到达时间之间 t一个和有效模型距离 dM是所有模型的平均值。数据点的大小说明了该疾病覆盖的国家数量。图L.将全球区域之间的风险导入到特定目标区域。与其推导相反,导入风险显示在以目标为中心的视图中,即每个面板显示从所有源区域到单个目标区域的导入概率。世界区域之间的距离是其机场位置之间的平均距离。灰线表示幂律拟合 p∞ = c ? d?α.每个世界区域的平均进口风险用水平虚线标记。22 个目标世界区域根据其平均进口风险进行排序。地图是用geopandas创建的[48]。图 M.两个重力模型的来源国预测质量和广域网流出量。与图 7 中的模型结果表示相同,但这里不是导入风险模型,而是使用测地线 d 的幂律距离衰减函数的重力模型地理(左)或有效 d伊芙(右)应用距离。同样对于这些模型,导入概率估计 p(i|n0),广域网外流量较大的国家的参考数据有所改善。图 N.国家/地区的广域网流量与人口和 GDP 的关系一个国家的广域网流量最好通过其国内生产总值(GDP,C)与其人口(A)或人均GDP(B)的比较来绘制。线性双对数回归结果显示在每个面板的下部(r值和p值)。每个国家的面积与其人口 (A) 相对应,颜色代码其大陆。GDP取自世界银行2014年的数据集[69]。图O.针对每个所考虑的变体的变异爆发检测和测序样本的比例。为了说明变异的传播及其在全球发生的频率,绘制了所有测序探针中变异的比例,即如果它达到 1,则所有测序探针都是相应的变异。WHO的官方疫情爆发日期[61]以红色垂直虚线突出显示。我们估计暴发日期在测序样本比例达到其全球峰值的2.5%之前45天。橙色垂直线(下行线)显示每个国家/地区的变体到达情况,由第一个测序探针(“count1”)估计。黑色垂直线(上行)表示疫情爆发后的到达时间,这些时间在正文中使用。图P.与日志案例估计到达时间的相关性分析。每个模型的导入概率都转换为有效距离 dM(我|n0) = ?ln(p(i|n0)) 与 n0作为各自疾病的暴发国。相关结果 C(t一个、dM) 与到达时间 t一个(i) 在目标国家的疾病中,i 按模型 (A) 和疾病 (B) 分组。作为比较距离,测地线、测地线路径(在有效最短路径树上)与有效距离与 t 的相关性一个显示。每个点代表 10 次考虑的疫情(2009 年的 H1N1、2020 年的 COVID-19 和 2020-2022 年其 8 种变体的传播)的相关结果。在分析中,仅将那些疾病/变异与10个以上的数据点一起使用(参见S1文本中的表A)。图 Q.通过日志案例选择标准的国家/地区的 Alpha 变体的新病例数适合推断到达时间 t一个试图减少噪音。垂直虚线标记了WHO列出的疫情[61],黄色星号是从日志病例拟合中推断出的到达时间,用黄线表示。为了确定峰值-0(用垂直线标记),我们对平滑的新病例数据进行了差异分析。图 R.未达到对数病例选择标准的国家的 Alpha 变体的新病例数适合推断到达时间 t一个试图减少噪音。垂直虚线表示WHO列出的疫情[61]。通过标准C0和C1的国家(详见S1文本中的表A)显示出对数案例的拟合度。请注意,后者具有外推的 t一个在世界卫生组织列出的疫情日期之前。为了确定峰值-0(用垂直线标记),我们对平滑的新病例数据进行了差异分析。
https://doi.org/10.1371/journal.pcbi.1011775.s001
(PDF格式)
确认
我们感谢 Marc Wiedermann 的深刻评论。
引用
1.Carlier M. 2006 年至 2015 年全球使用的乘用车和商用车数量;2021. 可从: https://www.statista.com/statistics/281134/number-of-vehicles-in-use-worldwide/.
2.经合组织。集装箱运输(指标);2023. 可从: https://data.oecd.org/transport/container-transport.htm.
3.Statista研究部。2004-2022年全球空中交通——定期旅客;2023. 可从: https://www.statista.com/statistics/564717/airline-industry-passenger-traffic-globally/.
4.查普曼 D、Purse BV、Roy HE、布洛克 JM。全球贸易网络决定了入侵性非本地物种的分布。全球生态学和生物地理学。2017;26(8):907–917.
查看文章Google 学术搜索
5.Yashadhana A, Derbas A, Biles J, Grant J. 与大流行相关的种族歧视及其对高收入背景下非土著种族少数群体的健康影响:系统评价。健康促进国际。2021;37(2).
查看文章Google 学术搜索
6.瀚纳仕 JN.流行病和大流行病:它们对人类历史的影响。ABC-克里奥;2005.
查看文章Google 学术搜索
7.Daftary A, Frick M, Venkatesan N, Pai M. 抗击结核病的耻辱感:我们需要应用从艾滋病毒行动主义中吸取的经验教训。BMJ 全球健康。2017;2(4):e000515.PMID:29225954
查看文章PubMed/NCBI的Google 学术搜索
8.芬伯格HV。大流行防范和应对——2009年甲型H1N1流感的经验教训。新英格兰医学杂志。2014;370(14):1335–1342.PMID:24693893
查看文章PubMed/NCBI的Google 学术搜索
9.Fraser C, Donnelly CA, Cauchemez S, Hanage WP, Van Kerkhove MD, Hollingsworth TD, et al. 甲型流感 (H1N1) 毒株的大流行潜力:早期发现。科学。2009;324(5934):1557–1561.PMID:19433588
查看文章PubMed/NCBI的Google 学术搜索
10.贾建, 陆旭, 袁莹, 徐刚, 贾杰, 克里斯塔基斯 NA.人口流动推动了COVID-19在中国的时空分布。自然界。2020;582(7812):389–394.PMID:32349120
查看文章PubMed/NCBI的Google 学术搜索
11.Klamser PP、D'Andrea V、Di Lauro F、Zachariae A、Bontorin S、Di Nardo A 等。在持续的大流行期间,从部分和嘈杂的数据中加强全球防范。PNAS枢纽。2023;2(6).PMID:37351112
查看文章PubMed/NCBI的Google 学术搜索
12.Hadfield J、Megill C、Bell SM、Huddleston J、Potter B、Callender C 等。Nextstrain:实时跟踪病原体进化。生物信息学。2018;34(23):4121–4123.PMID:29790939
查看文章PubMed/NCBI的Google 学术搜索
13.Tegally H, Wilkinson E, Martin D, Moir M, Brito A, Giovanetti M, et al. SARS-CoV-2 关注变体的全球扩张:航空旅行的传播模式和影响。medRxiv的。2022. PMID:36451885
查看文章PubMed/NCBI的Google 学术搜索
24 分钟萨科 PL, 阿里纳斯 A, 德多梅尼科 M.地缘政治条约的多关系结构的弹性与过去的殖民世界秩序和离岸财政避风港密切相关。复杂性。2023;2023:1–9.
查看文章Google 学术搜索
15.基辛格 H. 世界秩序。企鹅图书;2015.
16.布罗克曼 D, 赫尔宾 D.复杂的、网络驱动的传染现象的隐藏几何形状。科学。2013;342(6164):1337–1342.PMID:24337289
查看文章PubMed/NCBI的Google 学术搜索
27 分钟Iannelli F、Koher A、Brockmann D、H?vel P、Sokolov IM。流行病在复杂网络上传播的有效距离。物理评论 E. 2017;95(1):012313.PMID:28208446
查看文章PubMed/NCBI的Google 学术搜索
18.Gautreau A, Barrat A, Barthélemy M. 全球疾病传播的到达时间统计。统计力学杂志:理论与实验。2007;2007(09):L09001–L09001.
查看文章Google 学术搜索
19.Gautreau A, Barrat A, Barthélemy M. 全球疾病传播:到达时间的统计和估计。理论生物学杂志。2008;251(3):509–522.PMID:18222486
查看文章PubMed/NCBI的Google 学术搜索
10 分钟Nohara Y, Manabe T. 日本第一波和第二波疫情期间人类流动性和网络对 COVID-19 传播的影响:一种有效的距离方法。公共科学图书馆一号。2022;17(8):e0272996.PMID:35951674
查看文章PubMed/NCBI的Google 学术搜索
11 分钟no K, Otsuki S, Chowell G, Nishiura H. 预测中东呼吸综合征 (MERS) 的国际传播。BMC 传染病。2016;16(1):356.PMID:27449387
查看文章PubMed/NCBI的Google 学术搜索
12 分钟Otsuki S, Nishiura H. 2014 年旅行限制导致输入埃博拉病毒病的风险降低:一项回顾性流行病学建模研究。公共科学图书馆一号。2016;11(9):e0163418.PMID:27657544
查看文章PubMed/NCBI的Google 学术搜索
13 分钟no K, Mizumoto K, Miyamatsu Y, Yasuda Y, Kinoshita R, Nishiura H. 估计寨卡病毒感染的输入和本地传播风险。同行J。2016;4:e1904。PMID:27069825
查看文章PubMed/NCBI的Google 学术搜索
24.Edsberg M?llgaard P, Lehmann S, Alessandretti L. 了解 COVID-19 大流行期间流动性的组成部分。英国皇家学会哲学汇刊 A:数学、物理和工程科学。2022;380 (2214).
查看文章Google 学术搜索
25.科埃略足球俱乐部、拉娜 RM、克鲁兹 OG、维莱拉 DAM、巴斯托斯 LS、帕斯托雷和皮翁蒂 A 等。评估COVID-19在巴西的传播:流动性、发病率和社会脆弱性。公共科学图书馆一号。2020;15(9):e0238214.PMID:32946442
查看文章PubMed/NCBI的Google 学术搜索
26.Adiga A、Venkatramanan S、Schlitt J、Peddireddy A、Dickerman A、Bura A 等。评估国际航空公司停飞对COVID-19早期全球传播的影响。medRxiv的。2020. PMID:32511466
查看文章PubMed/NCBI的Google 学术搜索
17 分钟齐普夫 GK。P 1 P 2 D 假说:论人员的城际流动。美国社会学评论。1946;11(6):677.
查看文章Google 学术搜索
18 分钟Cascetta E, 阮 S.一个统一的框架,用于根据流量计数估计或更新起点/目的地矩阵。运输研究B部分:方法论。1988;22(6):437–455.
查看文章Google 学术搜索
19 分钟Lenormand M, Huet S, Gargiulo F, Deffuant G.通勤网络的通用模型。PLoS 一号。2012;7(10):e45985.PMID:23049691
查看文章PubMed/NCBI的Google 学术搜索
30.Abrahamsson T. 使用流量计数估计始发地-目的地矩阵——一项文献调查。奥地利拉克森堡:IIASA;1998. 可从: https://pure.iiasa.ac.at/id/eprint/5627/.
31.Barbosa H、Barthelemy M、Ghoshal G、James CR、Lenormand M、Louail T 等。人类移动性:模型和应用。物理报告。2018;734:1–74.
查看文章Google 学术搜索
32.Balcan D, Colizza V, Gon?alves B, 胡 H, Ramasco JJ, Vespignani A. 多尺度移动网络和传染病的空间传播.美国国家科学院院刊。2009;106(51):21484–21489.PMID:20018697
查看文章PubMed/NCBI的Google 学术搜索
33.Balcan D, Gon?alves B, 胡 H, Ramasco JJ, Colizza V, Vespignani A. 模拟传染病的空间传播:GLobal 流行病和流动性计算模型。计算科学杂志。2010;1(3):132–145.PMID:21415939
查看文章PubMed/NCBI的Google 学术搜索
34.Tizzoni M、Bajardi P、Poletto C、Ramasco JJ、Balcan D、Gon?alves B 等。全球疫情传播的实时数值预报:2009年甲型H1N1pdm病例分析。 BMC Medicine.2012;10(1):165.PMID:23237460
查看文章PubMed/NCBI的Google 学术搜索
35.Poletto C、Gomes MF、Pastore y Piontti A、Rossi L、Bioglio L、Chao DL 等。评估旅行限制对2014年西非埃博拉疫情国际传播的影响。欧洲监视。2014;19(42).PMID:25358040
查看文章PubMed/NCBI的Google 学术搜索
36.Poletto C, Pelat C, Lévy-Bruhl D, Yazdanpanah Y, Bo?lle PY, Colizza V. 使用一种新的最大似然分析方法评估中东中东呼吸综合征冠状病毒 (MERS-CoV) 流行和国际传播风险。欧洲监视。2014;19(23).PMID:24957746
查看文章PubMed/NCBI的Google 学术搜索
37.Gómez-Garde?es J, Soriano-Pa?os D, Arenas A. 由网络中反应扩散过程的循环流动模式驱动的临界制度。自然物理学。2018;14(4):391–395.
查看文章Google 学术搜索
38.Masucci AP, Serras J, Johansson A, Batty M. 重力与辐射模型:关于通勤流中规模和异质性的重要性。物理评论 E. 2013;88(2):022812.PMID:24032888
查看文章PubMed/NCBI的Google 学术搜索
39.O'Neill S. Lufthansa 现在直接推动了一半以上的预订;2019. 可从: https://skift.com/2019/03/14/lufthansa-now-drives-more-than-half-its-bookings-directly/.
40.Recchi E, Deutschmann E, Vespe M. 在全球范围内估计跨国人口流动。SSRN电子期刊。2019.
查看文章Google 学术搜索
41.克里斯蒂迪斯 P, 克里斯托杜卢 A.COVID-19 大流行全球传播期间航空旅行模式的预测能力:风险、不确定性和随机性。国际环境研究与公共卫生杂志。2020;17(10):3356.PMID:32408602
查看文章PubMed/NCBI的Google 学术搜索
42.斯托弗公司。干预机会:关于流动性和距离的理论。美国社会学评论。1940;5(6):845.
查看文章Google 学术搜索
43.西米尼 F、冈萨雷斯 MC、玛丽坦 A、巴拉巴西 AL。移动性和迁移模式的通用模型。自然界。2012;484(7392):96–100.PMID:22367540
查看文章PubMed/NCBI的Google 学术搜索
44.de Grange L, González F, Bekhor S. 使用链路流密度的路径流和脱扣矩阵估计。网络与空间经济学。2017;17(1):173–195.
查看文章Google 学术搜索
45.Englezou Y, Timotheou S, Panayiotou CG.使用来自无人驾驶飞行器的链路计数观测值估计始发地-目的地矩阵。在:2021年IEEE国际智能交通系统会议(ITSC)。IEEE的;2021 年,第 3539–3544 页。可从: https://ieeexplore.ieee.org/document/9564959/.
46.官方航空公司指南。OAG全球航空公司时刻表数据;2014. 可从: https://www.oag.com/airline-schedules-data.
47.Recchi E, Deutschmann E, Vespe M. 全球跨国流动性数据集;2019. 可从: https://doi.org/10.5281/zenodo.3911054.
48.Jordahl K、den Bossche JV、Fleischmann M、Wasserman J、McBride J、Gerard J 等人。 geopandas/geopandas:v0.8.1;2020. 可从: https://doi.org/10.5281/zenodo.3946761.
49.Song C, Koren T, Wang P, Barabási AL. 模拟人类流动性的缩放特性.自然物理学。2010;6(10):818–823.
查看文章Google 学术搜索
50.布罗克曼 D, 赫夫纳格尔 L, 盖塞尔 T.人类旅行的缩放规律。自然界。2006;439(7075):462–465.PMID:16437114
查看文章PubMed/NCBI的Google 学术搜索
51.Schl?pfer M、Dong L、O'Keeffe K、Santi P、Szell M、Salat H 等。人类流动的普遍探视法则。自然界。2021;593(7860):522–527.PMID:34040209
查看文章PubMed/NCBI的Google 学术搜索
52.努拉斯 A、塞拉托 S、兰比奥特 R、庞蒂尔 M、马斯科洛 C.许多城市的故事:人类城市交通的普遍模式。PLoS 一号。2012;7(5):e37027.PMID:22666339
查看文章PubMed/NCBI的Google 学术搜索
53.Liang X, Zhao J, Dong L, Xu K. 揭开城市内人口流动中指数定律的起源.科学报告。2013;3(1):2983.PMID:24136012
查看文章PubMed/NCBI的Google 学术搜索
54.Lenormand M, Bassolas A, Ramasco JJ. 行程分布规律和模型的系统比较.交通地理学报.2016;51:158–169.
查看文章Google 学术搜索
55.Pastore y Piontti A, Gomes MFDC, Samay N, Perra N, Vespignani A.全球流行病的感染树。网络科学。2014;2(1):132–137.
查看文章Google 学术搜索
56.Belik V, Geisel T, Brockmann D. 传染病的自然人类流动模式和空间传播。物理评论 X. 2011;1(1):011001.
查看文章Google 学术搜索
57.Ciotti M, Ciccozzi M, Terrinoni A, 江 WC, Wang CB, Bernardini S.COVID-19 大流行。临床实验室科学的批判性评论。2020;57(6):365–388.PMID:32645276
查看文章PubMed/NCBI的Google 学术搜索
58.Daqing L, Kosmidis K, Bunde A, Havlin S. 空间嵌入式网络的维度.自然物理学。2011;7(6):481–484.
查看文章Google 学术搜索
59.Yang Y, Herrera C, Eagle N, González MC. 在没有校准数据的情况下通勤流量的可预测性限制。科学报告。2014;4(1):5662.PMID:25012599
查看文章PubMed/NCBI的Google 学术搜索
60.任 Y, Ercsey-Ravasz M, Wang P, González MC, Toroczkai Z. 使用基于时间范围的辐射模型预测空间网络中的通勤流量。自然通讯。2014;5(1):5347.PMID:25373437
查看文章PubMed/NCBI的Google 学术搜索
61.SARS-CoV-2病毒进化技术咨询小组。SARS-CoV-2变异株的历史工作定义和主要行动;2023. 可从: https://www.who.int/publications/m/item/historical-working-definitions-and-primary-actions-for-sars-cov-2-variants.
62.Flahault A, Dias-Ferrao V, Chaberty P, Esteves K, Valleron AJ, Lavanchy D. FluNet 作为网络上全球流感监测的工具。贾玛。1998;280(15):1330–1332.PMID:9794312
查看文章PubMed/NCBI的Google 学术搜索
63.日内瓦:世界卫生组织。世卫组织:全球流感规划——FluNet;1997. 可从: https://www.who.int/tools/flunet.
64.日内瓦:世界卫生组织。世卫组织COVID-19仪表板;2020. 可从: https://covid19.who.int/.
65.Elbe S, Buckland-Merrett G. 数据、疾病和外交:GISAID对全球卫生的创新贡献。全球挑战。2017;1(1):33–46.PMID:31565258
查看文章PubMed/NCBI的Google 学术搜索
66.Shu Y, McCauley J. GISAID:共享所有流感数据的全球倡议——从愿景到现实。欧洲监视。2017;22(13):30494.PMID:28382917
查看文章PubMed/NCBI的Google 学术搜索
67.Khare S, Gurry C, Freitas L, Schultz MB, Bach G, Diallo A, et al. GISAID在大流行应对中的作用。中国疾病预防控制中心周刊.2021;3(49):1049.PMID:34934514
查看文章PubMed/NCBI的Google 学术搜索
68.Maier BF, Klamser PP, Zachariae A, Schlosser F, Brockmann D. ImportRisk-v1.0.0;2023. 可从: https://doi.org/10.5281/zenodo.7852477.
59 分钟世界银行。世界银行:人均国内生产总值;2023. 可从: https://data.worldbank.org/indicator/NY.GDP.PCAP.CD.