免费医学论文发表-使用部分观察对网络中未观察到的感染进行集成推理
抽象
未被发现的感染助长了许多传染因子的传播。然而,由于对感染的观察有限,对关键传播参数的了解不完全,识别未观察到的感染者仍然具有挑战性。在这里,我们使用集成贝叶斯推理方法,通过部分观察来推断未观察到的感染。集成推理方法可以表示模型参数中的不确定性,并使用所有集成成员共同更新模型状态。我们在模型生成的网络和现实世界的网络中进行了广泛的实验,其中个体具有差异但未知的传输速率。集成方法优于各种网络结构和观测率的几种替代方法,尽管模型指定错误。此外,该算法的计算复杂度几乎与网络中的节点数和观测值数成线性关系,显示出应用于大规模网络的潜力。推理方法可以支持不确定性下的决策,并适用于网络中的其他动态模型。
作者摘要
网络中的数学模型可用于推断未观察到的感染,并支持疫情控制和管理的决策。然而,这些模型在操作使用中的一个主要挑战是模型规范错误——模型是否可以可靠地代表现实世界的疾病传播过程。由于我们只能观察到传输过程的一部分,由于模型结构和参数的不确定性,数学模型本质上是错误的。因此,可靠的建模方法应该对这种不确定性和传输动力学的不完全了解具有鲁棒性,以支持实时决策。在这项研究中,我们使用集成推理方法通过部分观察来推断未观察到的感染。我们将个体具有差异但未知的传播速率的情况视为模型不确定性的一个例子,反映了现实世界中遇到的情况。我们发现集成推理可以使用模型参数不确定的部分观察来稳健地推断未观察到的感染,尽管参数的分布是错误的。集成推理算法为网络中传播动态的推理提供了一个通用框架,并可能为在模型不确定性和有限观测条件下支持运行流行病控制的工具箱做出贡献。
数字
Fig 7图1图2图3Fig 4Fig 5Fig 6Fig 7图1图2图3
引文: 张 R, Tai J, Pei S (2023) 使用部分观察对网络中未观察到的感染进行集成推断。公共科学图书馆计算生物学19(8): e1011355. https://doi.org/10.1371/journal.pcbi.1011355
编辑 器: 冯傅,达特茅斯学院,美国
收到: 4月 2023, 12;接受: 七月 2023, 7;发表: 2023月 <>, <>
版权所有: ? 2023 张等这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 集成推理算法和修改后的 DMP 算法的C++代码可在 GitHub 存储库中找到:https://github.com/SenPei-CU/EnsembleInference。网络数据是从公开可用的存储库下载的。此处提供了这些存储库的链接:1.社交联系网络(http://www.sociopatterns.org/datasets/infectious-sociopatterns)。2. 仓鼠友谊网(http://konect.cc/networks/petster-hamster-household)。3. 科学合作网络(https://networks.skewed.de/net/new_zealand_collab)。4.美国电网(http://konect.cc/networks/opsahl-powergrid)。5.公路运输网络(http://konect.cc/networks/tntp-ChicagoRegional)。6. 斜杠朋友网(https://www.aminer.cn/data-sna#Slashdot-small).7.迪格回复网(http://konect.cc/networks/munmun_digg_reply)。8. 推特关注网络(http://www.konect.cc/networks/ego-twitter)。9. 互联网P2P网络(http://www.konect.cc/networks/p2p-Gnutella31)。
资金: 这项工作得到了辽宁省自然科学基金(批准号:2022-MS-152)、中央高校基本科研业务费专项资金(DUT22LAB305-RZ)、大连市高层次人才创新计划(批准号:2020RQ061)、国家重点研发计划(2020YFA0713702-RZ;2021ZD0112400-RZ)、疾病预防控制中心(U01CK000592至SP;75D30122C14289至SP)的支持。 美国国家科学基金会(DMS-2229605至SP)和州和地区流行病学家委员会(NU38OT00297至SP)。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
竞争利益: 提交人声明不存在相互竞争的利益。
介绍
新发和反复出现的传染病是对人类社会的永久威胁[1]。对于大多数人际传播疾病,有效控制需要及时隔离感染者[2]。然而,在现实中,由于监测资源有限或无症状和症状前脱落,只能观察到部分感染者。例如,10年春季,美国报告的COVID-19感染不到2020%[3-6];在医院环境中,大多数携带耐药细菌的患者除非出现临床症状,否则无法识别[7]。未观察到的感染对几种传染病的维持、生长和持续起着至关重要的作用。有证据表明,未记录的感染推动了SARS-CoV-2在中国的早期传播[8],在英国两家医院中,75%的传播事件中,未被发现的耐甲氧西林金黄色葡萄球菌(一种流行的耐药病原体)携带者[9]。建模研究进一步表明,由于广泛的隐形传播,忽视未观察到的感染的干预措施可能无法控制疫情[10-13]。因此,使用稀疏观测的数据识别未观察到的感染对于疾病控制至关重要。
网络中的流行模型(或基于代理的模型)经常用于模拟传染病传播[14]。与基于同质人口混合假设的区室模型相比,基于代理的模型可以捕获复杂和异质的人与人接触模式。然而,将基于代理的模型与真实世界的数据进行校准(即推断模型参数和个人状态)具有挑战性[15]。以前的研究已经解决了网络中流行病模型的推理问题。例如,给定某个时间点个体状态的快照,开发了一种基于中心性的方法来推断流行病的起源[16-18]。后来,提出了基于信息传递和信念传播的更准确的算法来定位暴发源[19,20]。最近,推理算法与基于代理的模型相结合,以吸收多个数据流,以推断COVID-19[21,22]和抗菌素耐药病原体的个体感染风险[23-25]。为了解决不完整观测值的问题,使用数据增强技术来增加缺失的数据,确保增强的数据与观测数据一致[26]。该技术已与贝叶斯方法(例如马尔可夫链蒙特卡洛)相结合,利用流行病学、接触和基因组数据重建传染病传播链[27-30]。
推断缺失感染的问题也在计算机科学和物理学文献中得到了广泛的研究。一个重要的主题是使用全部或部分观测来学习传播过程的传播网络。一些研究根据特定的传输模型和模型参数,开发了基于观察到的级联似然最大化的推理方法[31-34]。另一项研究是使用Steiner树采样在不同观测模型下重建节点感染时间的传输网络[35-38]。这种方法不需要对传播模型和模型参数进行假设,可用于估计节点感染概率。更一般地说,开发了一个动态消息传递框架,以从部分观察中推断传播模型的参数[39]。尽管做出了这些努力,但在现实世界中,使用稀疏观察来推断未观察到的感染仍然具有挑战性。
在将推理系统投入运营使用之前,需要解决一些挑战和实际考虑因素。使用基于流行病模型的方法成功推断需要一个可以合理地代表现实世界疾病传播过程的明确指定的模型。然而,在实际应用中通常无法获得有关传输过程的详细信息。因此,推理系统中使用的模型不一定能捕捉到现实疾病传播动态的全部复杂性。例如,以前的大多数研究都使用具有恒定传播率(即易感个体和感染者之间接触的感染概率)的流行病模型来验证和比较推理算法。相比之下,由于复杂的免疫学环境和其他易感性的个人差异,真实世界的传播率可能是高度异质的。例如,接种疫苗的人在接触感染流感[40]和SARS-CoV-2[41]的人后不太可能被感染。忽略这种个体差异可能会导致严重的模型错误规范并破坏推理准确性。此外,稀疏的观察给识别未观察到的感染带来了额外的挑战。对于操作用途,需要一种能够处理模型错误规范和稀疏观测值的鲁棒算法。
在这项研究中,我们使用集成贝叶斯推理方法,使用部分观察来推断网络中未观察到的感染。集成方法可以处理模型结构的不确定性,并被证明能够支持操作传染病预测(例如流感和COVID-19)的稳健预测[42-44]。为了利用有限的观察结果,我们将从这些观察中获得的信息传播给联系网络中未观察到的个体。我们使用具有异质传播速率的改进易感感染-恢复(SIR)模型模拟网络中的流行病爆发,其中仅观察到部分个体的状态。我们在合成和现实世界网络上评估了所提出的推理算法,并将其与几种替代方法进行了比较。结果表明,当流行过程的参数不完全已知时,集成推理算法可以更好地识别未观察到的感染。这种推理算法不需要特定形式的传播动力学,可以灵活地推广到其他流行病模型。
材料和方法
疫情模式
我们在网络中使用改进的SIR模型来模拟流行病爆发。对于无向网络 G(V,E),其中 V 是顶点集,E 是无向边的集合,每个节点都处于以下三种状态之一:易感 (S)、感染 (I) 和恢复 (R)。易感个体 i 可能被感染的邻居感染,传播速率β我每一天,独立于其他邻居的状态。感染者康复的概率为1/D,其中D是平均感染期。个体传播率从双峰分布中随机抽取,模仿某些种群受到部分保护的情况(见S1文本中的图A)。暴发是由一组随机选择的种子引发的。在这项研究中,我们专注于流行病的生长阶段,此时可以使用及时的推断来为干预措施提供信息。具体来说,我们选择了初始种子、传播速率分布和模拟时间的配置,以便在模拟结束时感染的个体百分比约为 25-35%(参见 S1 文本中的表 A)。
观测模型
为了模拟现实世界的观察过程,根据个人的状态,每天对个体进行概率测试。我们假设感染者比易感和康复者更有可能接受检测,因为感染者可能有症状。在模型模拟中,总测试人口的百分比范围为10%至55%。鉴于每日测试概率低且模拟周期相对较短(S1文本中的表A),大多数被观察的个体只测试了一次。这些部分观察结果用于支持定位未观察到的感染的推断。我们还测试了另一个基于接触者追踪的观察模型。接触者追踪被广泛用于发现感染以控制流行病[45]。在此模型中,每个节点都以每日测试概率进行测试,类似于之前的观察模型。然而,一旦一个人在第t天检测呈阳性,接触网络中所有感染的邻居在第二天t+1进行检测。由于观察感染的邻居会增加观察次数,我们调整了每日测试概率,使测试个体的百分比在10%到50%之间。
问题陈述
定义为个体 i 在第 t 天处于状态 X∈(S,I,R) 的概率。对于网络中的节点子集,观察它们在某些日期的状态。将观测值数据定义为 ,其中 (io,吨o,O) 表示个人 io在第 t 天在 O∈(S,I,R) 状态中观察到o.目标是估计每个节点,i给出了个体状态的部分观察:对于i = 1,?,N,其中N是网络中个体的总数。我们对最后一天T的估计值特别感兴趣,这可以用来为控制疫情的前瞻性干预措施提供信息。
推理
我们使用集成贝叶斯推理方法,使用稀疏观察来推断未观察到的感染。的演化由一组主方程控制:
(1)
(2)
(3)
在这里,β我是节点 i 的传播速率,?i 是节点 i 的邻居集合,D 是平均感染持续时间。当网络具有树状结构时,方程 (1–3) 是准确的。对于没有太多短环的真实网络,先前的研究发现方程(1-3)提供了很好的近似值[46]。
根据初始条件和模型参数,存在无限数量的可能配置。所提出的方法维护了一个配置集合,每个配置代表一种可能的实现。我们在第一天通过为每个节点随机分配一个小的感染概率来启动每个集合成员。在每个融合成员中,各个传输速率β我是从合理范围内的均匀分布中得出的。我们用这个集合来表示异构传输速率的不确定性,因为对个体的传输速率了解不完全。注意,β均匀分布我在推理系统中与爆发模拟中的实际双峰分布不匹配;尽管如此,如后面所示,推理结果对于此错误指定的设置是稳健的。
我们使用稀疏观测值按顺序更新每个集成成员的概率。每天t,执行三个程序。
向后时间传播:假设单个 io在当天的状态O中观察到(图1A)。对于每个系综成员,我们估计 i 的概率o在每个状态 X∈{S,I,R} 在第 t 天给定第 , 的未来观测值,使用贝叶斯方法和主方程(图 1B)(详见 S1 文本)。我们对t天后的所有观察执行此过程。此过程将未来观测中的信息向后传播到当前日期 t。
交叉集成协变性调整:我们更新i 的概率o的邻居使用个体 i 的概率之间的交叉集成协变性o和邻居(图 1C)(见 S1 文本)。交叉集成协变性捕获了io和传输动力学中的邻居,并使用所有系综成员直接计算[36]。我们对第 t 天后的所有观测值执行此更新。此过程在第 t 天将观察到的个体的信息传播到他们的邻居。
模型积分:我们使用从t天到t+1天的更新概率对主方程进行积分,并演变为所有个体(图1D)。此过程进一步在空间(即节点的邻居)和时间中传播信息。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 集成推理算法的图示。
(A). 时间 t 的模型状态和时间 t 之后的观测值。在时间t后观察到两个感染者。红色代表感染的可能性。我们使用模型状态的集合来表示传播率的分布和感染概率的分布。我们使用贝叶斯规则和主方程在时间上向后传播信息,并估计在时间t:观察到的个体的感染概率,其中观察到节点i在时间T处于状态O。我们使用交叉集成协变性来调整连接到观察到的节点的个体的感染概率。表示每个融合成员在观察到的节点 i 上的调整。节点 j(节点 i 的邻居)上的调整为 ,其中 。这里是 和 和 之间的协方差,两者都是使用融合成员计算的。红色箭头表示感染概率信息传播到观察到的节点的邻居。我们将主方程积分到时间t+1。红色箭头表示有关感染概率的信息进一步传播到邻居。在这三个程序之后,来自这两个观察的信息到达网络中的其他六个人。
https://doi.org/10.1371/journal.pcbi.1011355.g001
我们每天依次执行上述三个程序,直到最近一天进行观察。我们预计来自部分观察的信息最终可以到达网络中的大多数个体。的平均值估计值是所有融合成员的平均值。在这项研究中,在推理中使用了100个集成成员。结果中报告了具有更多融合成员的实验。该算法的伪代码在 S1 文本中提供。集成推理算法的实现详细信息在 S1 文本中提供。
竞争方法
使用许多现有方法来对个体的感染概率进行排名。(1).学位。假设与其他节点具有更多连接的节点具有更高的感染概率。(2).联系方式。我们根据节点与观察到的感染的连接数对节点进行排名。假设观察到的感染暴露更多的节点具有更高的感染概率。(3). 一种改进的动态消息传递(DMP)算法。DMP 算法使用一组消息传递方程来量化个人状态概率的演变。DMP算法最初用于确定流行病的起源[19],本研究修改了DMP算法,以推断每个节点的感染概率。为了表示传输速率的不确定性,我们实现了两个版本的改进DMP算法。在第一个中,表示为 DMP1,传输速率设置为常数,即均匀分布的平均值;在第二个中,表示为 DMP2,所有个体的传输速率都是从均匀分布中随机抽取的,与集成推理算法相同。我们发现这两种方法的性能相似。S1 文本中提供了修改后的 DMP 算法的详细信息。我们注意到(1)程度和(2)接触在许多以前的研究中被用作基线;然而,由于这些策略被广泛使用并且易于在现实环境中实施,我们决定将它们包含在实验中。
结果
模拟网络中的实验
我们首先使用模拟网络上的合成爆发来验证集成推理算法。我们将集成推理的性能与几种替代方法来定位未观察到的感染进行了比较。这些方法分别使用与其他节点的连接数(程度)、与观察到的感染的连接数(接触)和修改后的动态消息传递方法[19](DMP1和DMP2)对个体的感染概率进行排名(见S1文本)。我们在模拟结束时应用每种方法对所有节点的感染概率进行排名,并使用受试者工作特征(ROC)曲线来评估性能[47]。ROC曲线下大面积(AUC)的方法具有推断未观察到的感染的卓越能力。
我们首先在树上验证了推理算法,主方程(1-3)是准确的。我们在具有 781 个节点和 780 条边的树中运行了一个 SIR 模型。每个节点最多有 5 个子节点,树的最大深度为 4。传输速率来自双峰分布(S1文本中的图A)。在不同的时间点观察到18%、36%和55%的个体的状态。我们使用部分观察来通知集成推理算法,以估计每个节点在模拟的最后一天被感染的概率。集成推理算法的性能优于其他方法(图2)。特别是,排名靠前的个人的准确性很高,这可能是由于树结构中的精确主方程。DMP算法被证明可以在树木上提供精确的推断,以推断流行病的起源[19]。然而,对于本研究中的推理任务,改进的DMP算法的性能下降可能是由于不兼容的观察模型以及使用稀疏观察求解DMP方程的困难造成的(请参阅S1文本中有关改进DMP算法性能的详细讨论)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 树形图中不同方法的性能。
该树有 781 个节点 780 条边。比较了五种不同的方法,包括集成推理(ENS-I),具有固定传输速率的修改动态消息传递(DMP1),具有均匀分布传输速率的修改动态消息传递(DMP2),连接数(程度)和与观察到的感染的接触(接触)。显示了不同观测率 18.44% (A)、32.64% (B) 和 55.95% (C) 的 ROC 曲线。相应的AUC值在(D,E,F)中进行比较。在通过不同方法选择的高危人群中确定的感染人数显示在(G,H,I)中。
https://doi.org/10.1371/journal.pcbi.1011355.g002
然后,我们在同构网络上验证了推理算法。使用Erd?s-Rennyi(ER)模型生成同质随机网络[48]。我们生成了一个包含 1,000 个节点且平均度数为 2.6 的 ER 网络,在网络中运行了一周的 SIR 模型,并观察了大约 15%、30% 和 50% 的个体在不同时间点的状态。我们估计每个节点在模拟的最后一天的感染概率。有关模型配置的详细信息,请参见 S1 文本中的表 A。
集成推理算法优于具有不同观测率的ER网络的其他方法(图3A–3C)。改进后的DMP算法比程度和接触算法表现更好,表明包含进化动态的方法可能比纯粹基于网络结构的指标更有效。集成推理的AUC高于其他方法(图3D-3F)。集成推理能够仅使用来自总人口的0%的观察结果来产生对感染概率的体面估计(AUC = 804.15),即使传播率的分布被错误地指定。本实验表明,集成推理算法对个体传输速率的不确定性和变化具有鲁棒性。集成推理算法的准确性随着观测次数的增加而提高;然而,总的来说,边际效益随着观察的增加而减少(图3A-3F)。边际效益递减的一个可能原因可能是,其他观测值可能包含当前观测值中已经存在的重叠信息。例如,观察现有观测值的邻居可能不会提供太多附加信息。一项优化呼吸系统疾病监测网络的研究表明了这一观点[49]。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 同构网络中不同方法的性能。
ER 网络有 1,000 个节点,平均度数为 2.6。比较了五种不同的方法,包括集成推理(ENS-I),具有固定传输速率的修改动态消息传递(DMP1),具有均匀分布传输速率的修改动态消息传递(DMP2),连接数(程度)和与观察到的感染的接触(接触)。显示了不同观测率 15.98% (A)、32.74% (B) 和 49.72% (C) 的 ROC 曲线。相应的AUC值在(D,E,F)中进行比较。在通过不同方法选择的高危人群中确定的感染人数显示在(G,H,I)中。
https://doi.org/10.1371/journal.pcbi.1011355.g003
在现实世界中,通常,鉴于资源有限,只有感染概率较高的个体被优先进行检测。因此,排名靠前的个人的推理性能与实际使用更相关。我们比较了通过不同方法选择的高危个体的实际感染数量(即,通过筛选排名靠前的个体可以发现多少感染)。集成推理算法可以识别比其他方法更多的感染,用于给定数量的估计高风险个体(图3G-3I)。
还进行了几个额外的实验,以确定集成推理算法在同构网络中的有效性。所提出的算法在具有更多节点和不同平均度的ER网络中优于竞争方法(S1文本中的图B),以及从幂律分布中得出传输速率时,代表传播疾病的异质能力(S1文本中的图C)。集成推理算法在平均度数为 8 和 10 的密集 ER 网络中性能下降(S1 文本中的图 D),可能是由于密集网络中主方程的精度较低。但是集成推理算法仍然可以在前 10% 的高风险节点中识别更多的感染,尤其是在观察结果更多的情况下(S1 文本中的图 D)。我们使用 50、100、300、500 和 1,000 个融合成员运行集成推理算法,发现即使使用更多的集成成员,性能仍然相似(S1 文本中的图 E,请参阅讨论部分中的讨论)。我们还在随机规则图上运行了实验,其中所有节点具有相同的程度。与其他推理相比,集成推理显示出更好的性能(S1 文本中的图 B)。
进一步提高改进后的DMP算法性能的一种潜在方法是(1)使用动态消息传递算法[39]估计特定于链路的传输速率,以及(2)使用估计参数和标准DMP算法来估计节点在给定时间被感染的概率。然而,模型参数的推理需要有关节点激活时间的部分信息[39]。对于本研究中使用的观察模型来说,观察节点的激活时间是困难的,并且在现实世界中由于从感染到阳性测试的不确定时间段而通常具有挑战性。为了规避这一困难,我们将实际传输速率(或具有10%随机高斯噪声的实际传输速率)分配给修改后的DMP算法。改进后的DMP算法的性能仍然不令人满意(S1文本中的图F),可能是由于观测模型和使用稀疏观测求解DMP方程的问题。
我们在ER随机网络中进行了额外的实验,使用另外两种双峰分布来计算传输速率,假设人群中的保护水平不同。在第一个分布中,随机选择20%的个体,从高斯分布中抽取较低的传播率,而其他个体的传播率较高(0.22,0.01)。在第二种分布中,80%随机选择的个体具有较低的传播率(),而其他个体的传播率较高()。对于这两种情况,集成推理算法的性能优于其他方法(S1 文本中的图 A)。
我们进一步测试了另一个基于ER随机网络中接触者追踪的观察模型(参见材料和方法部分)。接触者追踪可以在感染者的邻居中发现感染。因此,观察到的感染并非彼此独立。尽管如此,集成推理算法仍然取得了令人满意的性能(S1文本中的图E)。
最后,我们在无标度(SF)网络中进行了实验。SF 网络是使用配置模型 [50] 生成的,幂律度分布为 P(k)~k?γ,其中幂律指数 γ = 2.5。集成推理算法的性能优于其他方法(图4)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. 无标度网络中不同方法的性能。
无标度网络有 2,044 个节点,幂律指数为 2.5。比较了五种不同的方法,包括集成推理(ENS-I),具有固定传输速率的修改动态消息传递(DMP1),具有均匀分布传输速率的修改动态消息传递(DMP2),连接数(程度)和与观察到的感染的接触(接触)。显示了不同观测率 14.48% (A)、29.01% (B) 和 40.31% (C) 的 ROC 曲线。相应的AUC值在(D,E,F)中进行比较。在通过不同方法选择的高危人群中确定的感染人数显示在(G,H,I)中。
https://doi.org/10.1371/journal.pcbi.1011355.g004
真实网络中的实验
现实世界的网络比模型生成的网络具有更复杂的结构(例如,社区结构、聚类、分类混合等)。这种结构复杂性可以导致传输动力学的丰富行为。为了验证集成推理的性能,我们在九个真实网络中运行了爆发模拟,这些网络从开源存储库下载[51-53]。这些网络跨越广泛的系统,包括联系和社交网络(社交联系和协作)、基础设施(道路和电网)、技术系统(互联网点对点(P2P)网络)和在线社交网络(仓鼠、Twitter、Digg 和 Slashdot)。S1 文本的表 B 中提供了网络和实验设置的详细说明。
集成推理算法在不同的网络中表现出强大的性能——它在大多数网络中的表现优于其他方法(图 5 和 6)。DMP 算法的性能与多个网络(Hamster、P2P、Slashdot 和 Digg)中的集成推理相当,但在所有考虑的网络中,集成推理的整体性能更好。接触方法效果不佳,可能是由于对感染的观察有限。具有不同观测率的实验产生了类似的结果(S1文本中的图G和H)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. 不同方法在实际网络中的性能。
九个真实网络中不同方法(集成推理 (ENS-I)、具有固定传输速率的修改动态消息传递 (DMP1)、使用均匀分布传输速率 (DMP2)、连接数 (Degree) 和与观察到的感染接触 (Contact))的 ROC 曲线。这些网络的观测率从12.64%到17.61%不等。有关网络、模型参数设置和观测速率的详细信息,请参见 S1 文本。
https://doi.org/10.1371/journal.pcbi.1011355.g005
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图6. 在现实世界网络中推断高风险个体。
显示了通过不同方法选择的高风险个体中发现的感染数量,用于九个真实世界网络。比较了五种不同的方法,包括集成推理(ENS-I),具有固定传输速率的修改动态消息传递(DMP1),具有均匀分布传输速率的修改动态消息传递(DMP2),连接数(程度)和与观察到的感染的接触(接触)。
https://doi.org/10.1371/journal.pcbi.1011355.g006
计算复杂度
为了检查集成推理的可扩展性,我们在具有不同数量的节点、边和观测值的 ER 网络中运行了该算法。当观测值数 No (No= 200)且平均度数?k?(?k?=3.0)固定,运行时间RT几乎随网络中节点数N:RT(N)~N1.144 (图 7A)。对于固定数量的节点 (N = 3,000) 和平均度数 (?k? = 3.0),计算时间与观测值数量 N 呈线性比例o: RT(No)~No0.979 (图7B)。对于固定数量的节点 (N = 3,000) 和观测值 (No= 200),计算时间随平均次数?k?:RT(?k?)~?k?0.172 (图 7C)。如果观察到的节点的百分比固定为 15%(即 No= 0.15 N, ?k? = 3.0),运行时间随节点数二次增加:RT(N)~N2.118 (图 7D)。我们还发现,计算时间几乎与系综成员K的数量成线性关系:RT(K)~K0.973当其他设置保持不变时(N = 3,000, ?k? = 3.0, N o= 200)(图 7E)。鉴于多项式计算的复杂性,可以将集成推理算法应用于更大的网络。此外,该算法可以进一步加快,因为不同系综成员的主方程的积分可以独立和并行运行。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图 7. 集成推理算法的计算复杂度。
(A). 增加具有固定观测值数量的节点数量的计算时间(No= 200)。在平均度数为3的ER随机网络上进行实验。从 100 次运行中获得运行时间的分布。框显示中位数和四分位数。晶须显示距离盒子底部或顶部的四分位数间距的 1.5 倍。插图显示了计算时间与节点数的拟合(均为对数转换)。(B).随着观测值数量的增加,固定节点数为3,000和固定平均度数为3的计算时间。(C).固定节点数3,000和固定观测数200的计算时间,平均度数增加。(D). 具有固定观测值百分比的节点数量增加的计算时间 (15%)。(E). 在具有 3,000 个节点、平均度数为 3 和 200 个观测值的 ER 随机网络中增加集成成员数量的计算时间。
https://doi.org/10.1371/journal.pcbi.1011355.g007
讨论
所提出的推理方法可以应用于多种设置。例如,在无症状感染率较高的新病原体暴发期间,部分观察到的感染加上详细的联系信息可用于支持对未观察到的传播者的推断。在医院环境中,推理方法可用于根据对临床感染的稀疏观察来识别抗菌素耐药微生物的无症状携带者,从而限制这些病原体的院内传播。
在参数不确定性下集成推理的优势可能是由于信息在网络上的传播方式。我们使用交叉集成协变性来调整与被观察个体相连的节点的定植概率。这种调整利用了具有各种参数设置[54-56]的所有融合成员(因为我们需要所有融合成员来计算协变性),从而防止了仅依赖于一个参数设置的调整。相比之下,消息传递等技术使用一组预定义参数传播信息[57,58]。如果这些参数接近真实值,则基于消息传递的方法可以实现非常高的准确性,因为感染概率的演变可以通过消息传递方程准确描述[19,39,57–60]。但是,在参数未知的情况下,如果预定义的参数与事实相去甚远,则调整可能会导致较大的误差。此外,这种误差可能会被网络中个体连续调整的非线性动力学进一步放大。集成推理可以通过使用具有不同参数的模型状态集合来避免出现极大误差的调整。虽然当已知正确的参数时,集成推理中的调整可能不如消息传递中的调整准确,但它确实提供了给定未知参数的更强大的推理。在最近的一项研究中,还发现集成推理方法对具有噪声和昂贵可能性的模型有效[61]。
鉴于流行病模型的高维性,令人惊讶的是,推理算法中的几百个集成成员可以产生良好的性能。这可能是由于几个潜在原因。首先,对每条边使用传输速率集合的目的是避免因使用单个错误参数而导致的大误差。只要融合能够覆盖合理范围内的边缘特定传输速率,估计误差就可能会受到限制和阻尼。换句话说,融合不需要是特定于边缘的传输速率的所有可能组合的代表性样本。其次,许多个体的模型状态集合可以使用与邻居的协变性进行动态调整。此“微移”过程可以提供模型状态的部分校正,以便模型可以更好地拟合观测值。在粒子滤波器(或顺序蒙特卡洛)[62]和集成卡尔曼滤波器[54,55]的比较中也观察到了这种现象。在粒子过滤器中,模型状态的分布由大量粒子的加权平均值表示,每个粒子表示模型参数和变量的潜在组合。在模型更新期间,粒子的权重被调整,但模型状态保持不变(除非粒子退化,即由少量粒子主导,需要重新采样)。在这种情况下,发现所需粒子的数量随着参数和变量的数量呈指数增长[63],这限制了其在高维系统中的应用。相比之下,集成卡尔曼滤波器虽然对于非线性模型来说不是最优的,但可以使用相对较少的集成成员应用于高维系统,例如天气模型[54]和元种群流行病模型[64]。关键原因是可以根据观测值轻推集成成员,从而在模型状态中创造更大的灵活性。需要更多的研究来探索集成大小对推理性能的影响。
观察模型是推理问题的关键。推理问题的计算复杂度和性质随观察模型而变化。事实上,在很多研究中,观察模型往往决定了解决问题的具体技术方法。文献中使用了几种观察模型,包括所有或部分节点的感染时间[19,31,35]以及给定快照下所有或部分节点的状态[20,65,66]。在这项研究中,我们使用每日测试策略来模拟在不同时间点进行的部分人群中的测试,这与大多数真实世界的测试场景一致。我们注意到,集成推理算法的输入是在不同时间观察到的一部分总体的状态(即 )。只要观察模型可以提供这样的信息,集成推理算法就适用。这为推理算法提供了灵活性,适用于不同的观察模型。
这项研究有一些局限性。首先,主方程对于树状网络是准确的,没有太多的短循环。对于具有强聚类的密集网络,推理的准确性下降。需要进一步研究以应对这一挑战。其次,推断需要一个合理的传播速率范围,而这在新出现的疫情期间可能不容易获得。随着更多流行病学证据的积累,可以更新传播率的先前范围。第三,在将推理应用于现实世界之前,需要解决几个实际障碍。例如,除非在某些环境中(例如,在电子健康记录中记录患者的运动的医疗保健系统),否则很难收集真实世界的接触网络数据。更好地表示联系网络可能会提高推理的性能。实验中没有考虑测试敏感性和特异性(我们假设是完美的测试),但应该将其纳入推理系统。
支持信息
补充材料。
跳到无花果共享导航
1补充材料疫情模式对于无向网络,每个节点都处于以下三种状态之一:易感 (S)、受感染 (I) 和已恢复(R)。易感个体?可能被受感染的邻居感染传输速率??每一天,独立于其他州邻居。感染者个人恢复概率1/?哪里?是平均感染期。一起实验,我们修复了?=7日。为了表示传输速率的变化,??被抽中从双峰分布,由叠加两个高斯分布(图一个).一个权力-传输速率的规律分布(?(?)∝???,?=2.5) 还进行了额外的测试实验。选择一组种子在完全易感的人群中引发暴发。种子选择传播速率分布和模拟时间以产生感染的暴发25-到模拟结束时,35%的人口(即感染者(I)和康复者(R)个体占 25-最后一天为35%的人口)。我们模拟了网络中爆发 7 天节点少于 5,000 个,在需要更多时间感染的大型网络中需要 14 天目标人口百分比。我们选择这种流行病制度是为了对推理算法–如果鲈鱼感染人群的tage非常高(低),推断估计所有(没有)个人都被感染将产生人为的高精度。在此外,这种流行状况代表了疫情的早期到中期,当准确时推断恩斯对真实有用-时间疾病控制。我们使用不同人群的每日测试概率对观察过程进行建模国家。每天,每个节点都会根据状态以随机概率进行测试。我们假设受感染的 PERSON比易感和康复者更有可能接受检测。这被测试个体(S、I 或 R)的状态在不同的测试日期获得。通过每天变化测试概率,我们可以调整观察到的个体的百分比。在实验,我们模拟了大约15%、30%和50%的总人口的观察结果。详细疫情模型配置,包括传播率分布和检测概率,见表一个.推理框架的演变?(???)(?∈(?,?,?)) 可以用一组主方程来描述:??(???)??=??(???)[1?∏(1????(???))?∈??],(S1)??(???)??=?(???)[1?∏(1????(???))?∈??]??(???)?,(S2)
2??(???)??=?(???)?,(?3)这里??是节点的传输速率?,??是节点的邻居集?和?是平均感染持续时间。方程式 (1-3)当网络具有树形结构时是准确的。真实-没有太多SH的世界网络ort循环,以前的研究发现方程(1-3)提供良好的近似值[1].合奏?(???)在时间启动?=0由随机抽取?(??0)从均匀的分布和设置?(??0)=1??(??0)和?(??0)=0.传音出率??对于每个节点都是从均匀分布中抽取的,并且在模型仿真期间已修复。估算?(????|??????=?)(???>?),我们使用贝叶斯方法:?(????|??????=?)∝?(????)×?(??????=?|????),(S4)哪里?(????)是先验概率和?(??????=?|????)是观察状态的可能性?个人人数??在时间???给定状态????在时间?.在顺序推理算法中,事先?(????)可以通过整合??的时间状态??1到时间?.可能性?(??????=?|????)可以使用主站进行计算方程,其中状态??在时间?固定为?,?或?.我们使用规范化计算后验的条件?(????|??????=?)为????=?,?和?.更多细节是在下一节中提供。从理论上讲,理想的估计概率????给定所有未来观察,即?(????|{????},??>?),因为网络中节点的状态可能是相互依赖的。然而这种方法需要为每个观察到的个体运行主方程??分别到计算可能性?({????},??>?|????),这对于大型计算可能令人望而却步具有大量观测值的网络。对于随机观察到的稀疏观测,我们可以假设它们状态的相互依赖性可以忽略不计,并估计??,?(????|??????=?),而不考虑其他节点的观测结果。这种简化可以显著加快了可能性的计算速度?(??????=?|????):如果观察到个人是独立的,我们可以计算出r 所有观察到的节点同时。在综合测试中,我们发现简化算法产生了可比的性能作为考虑观察节点相互依赖性的算法(图sB,D,E,F,G).要检查观测值的相对独立性,We执行了分析检查接触网络中观察到的个体之间的距离。我们计算了三个实数中观测节点之间成对最短距离的分布-世界网络–Slashdot、Twitter 和 Digg (无花果我).平均而言,大多数对之间的距离
下载
无花果分享
S1 文本。 补充材料。
扩展的方法和分析。
https://doi.org/10.1371/journal.pcbi.1011355.s001
(英文)
引用
1.福奇、莫伦斯·传染病的永恒挑战。新英格兰医学杂志。2012;366: 454–461.密码:22296079
查看文章PubMed/NCBI谷歌学术搜索
2.弗雷泽 C, 莱利 S, 安德森 RM, 弗格森 NM.使传染病暴发可控的因素。美国国家科学院院刊。2004;101: 6146–6151.密码:15071187
查看文章PubMed/NCBI谷歌学术搜索
3.Pei S,Yamana TK,Kandula S,Galanti M,Shaman J.19年美国COVID-2020的负担和特征。自然界。2021;598: 338–341.密码:34438440
查看文章PubMed/NCBI谷歌学术搜索
4.Bajema KL, Wiegand RE, Cuffe K, Patel SV, Iachan R, Lim T, et al.截至 2 年 2020 月,美国 SARS-CoV-2021 血清阳性率估计值。美国医学会实习医生会 181;450:33231628。密码:<>
查看文章PubMed/NCBI谷歌学术搜索
5.帕金斯 TA, 卡瓦尼 SM, 摩尔 SM, 奥伊特曼 RJ, 勒奇 A, 波特雷克 M. 估计美国未观察到的 SARS-CoV-2 感染。美国国家科学院院刊。2020;117: 22597–22602.密码:32826332
查看文章PubMed/NCBI谷歌学术搜索
6.Kalish H, Klumpp-Thomas C, Hunsberger S, Baus HA, Fay MP, Siripong N, et al.美国COVID-2大流行前6个月内未确诊的SARS-CoV-19血清阳性。科学翻译医学 2021;13: eabh3826.密码:34158410
查看文章PubMed/NCBI谷歌学术搜索
7.麦金农MM,艾伦KD。长期MRSA携带在医院患者中。医院感染杂志。2000;46: 216–221.密码:11073731
查看文章PubMed/NCBI谷歌学术搜索
8.李蕊, 裴淑, 陈斌, 宋轶, 张婷, 杨文, 等.大量未记录的感染有助于新型冠状病毒(SARS-CoV-2)的快速传播。科学。2020;368: 489–493.密码:32179701
查看文章PubMed/NCBI谷歌学术搜索
9.Worby CJ, Jeyaratnam D, Robotham JV, Kypraios T, O'Neill PD, De Angelis D, et al.估计隔离和非殖民化措施在减少医院普通病房耐甲氧西林金黄色葡萄球菌传播的有效性。美国流行病学杂志。2013;177: 1306–1313.pmid:23592544
查看文章PubMed/NCBI谷歌学术搜索
10.Cooper BS, Medley GF, Stone SP, Kibbler CC, Cookson BD, Roberts JA, et al.医院和社区中的耐甲氧西林金黄色葡萄球菌:隐形动态和控制灾难。美国国家科学院院刊。2004;101: 10223–10228.密码:15220470
查看文章PubMed/NCBI谷歌学术搜索
11.史密斯 DL, 杜肖夫 J, 佩伦塞维奇 EN, 哈里斯 AD, 莱文 SA.医院病原体中持续定植和抗生素耐药性的传播:耐药性是一个区域性问题。美国国家科学院院刊。2004;101: 3709–3714.pmid:14985511
查看文章PubMed/NCBI谷歌学术搜索
12.Bootsma MCJ, Diekmann O, Bonten MJM.控制耐甲氧西林金黄色葡萄球菌:量化干预措施和快速诊断检测的效果。美国国家科学院院刊。2006;103: 5620–5625.密码:16565219
查看文章PubMed/NCBI谷歌学术搜索
13.张蕊, 王莹, 吕志, 裴淑. 评估居家和隔离措施对COVID-19传播的影响。BMC 感染病 2022;22: 648.密码:35896977
查看文章PubMed/NCBI谷歌学术搜索
14.Pastor-Satorras R, Castellano C, Van Mieghem P, Vespignani A. 复杂网络中的流行病过程。修订版 Mod Phys. 2015;87: 925–979.
查看文章谷歌学术搜索
15.克兰默 K, 布雷默 J, 卢佩 G.基于模拟的推理的前沿。美国国家科学院院刊。2020;117: 30055–30062.密码:32471948
查看文章PubMed/NCBI谷歌学术搜索
16.Shah D,Zaman T.检测网络中计算机病毒的来源:理论和实验。ACM SIGMETRICS计算机系统测量和建模国际会议论文集。美国纽约:ACM;2010.第203–214页。https://doi.org/10.1145/1811039.1811063
17.Shah D, Zaman T. 网络中的谣言:谁是罪魁祸首?IEEE跨信息理论。2011;57: 5163–5181.
查看文章谷歌学术搜索
18.Comin CH, da Fontoura Costa L. 确定复杂网络中扩散过程的起点。物理学修订版 E. 2011;84: 056105.密码:22181471
查看文章PubMed/NCBI谷歌学术搜索
19.Lokhov AY, Mézard M, Ohta H, Zdeborová L. 使用动态消息传递算法推断流行病的起源。物理学修订版 E. 2014;90: 012801.pmid:25122336
查看文章PubMed/NCBI谷歌学术搜索
20.Altarelli F, Braunstein A, Dall'Asta L, Lage-Castellanos A, Zecchina R. 通过信念传播对网络上流行病的贝叶斯推断。物理学修订版 2014;112: 118701.pmid:24702425
查看文章PubMed/NCBI谷歌学术搜索
21.施耐德 T, 邓巴 ORA, 吴 J, 博特彻 L, 布罗夫 D, 加布诺-伊尼戈 A, 等.通过依赖风险的个体接触干预进行流行病管理和控制。莫雷诺·公共科学图书馆计算生物学. 2022;18: e1010171.密码:35737648
查看文章PubMed/NCBI谷歌学术搜索
22.贝克 A, 比亚佐 I, 布劳恩斯坦 A, 卡塔尼亚 G, 达尔阿斯塔 L, 英格罗索 A, 等.通过接触者追踪数据的统计推断来缓解流行病。美国国家科学院院刊。2021;118: e2106548118.密码:34312253
查看文章PubMed/NCBI谷歌学术搜索
23.贝聿铭, 莫罗内 F, 利杰罗斯 F, 马克塞 H, 萨满 JL.耐甲氧西林金黄色葡萄球菌院内传播的推断和控制。电子生活。2018;7: e40977.密码:30560786
查看文章PubMed/NCBI谷歌学术搜索
24.Pei S,Liljeros F,Shaman J.在医院环境中识别抗菌素耐药病原体的无症状传播者。美国国家科学院院刊。2021;118: e2111190118.密码:34493678
查看文章PubMed/NCBI谷歌学术搜索
25.Eyre DW,Laager M,Walker AS,Cooper BS,Wilson DJ,代表CDC建模医疗保健传染病计划(MInD-Healthcare)。包含医疗保健相关艰难梭菌测序数据的概率传播模型优于启发式规则,并识别传播中的菌株特异性差异。Kouyos RD,编辑。公共科学图书馆计算生物学 2021;17: e1008417.密码:33444378
查看文章PubMed/NCBI谷歌学术搜索
26.库珀 BS、混合泳 GF、布拉德利 SJ、斯科特 GM。一种用于分析医院感染数据的增强数据方法。美国流行病学杂志。2008;168: 548–557.密码:18635575
查看文章PubMed/NCBI谷歌学术搜索
27.Jombart T, Cori A, Didelot X, Cauchemez S, Fraser C, Ferguson N. 通过结合流行病学和基因组数据重建疾病爆发的贝叶斯。田中MM,编辑。公共科学图书馆计算生物学. 2014;10: e1003457.密码:24465202
查看文章PubMed/NCBI谷歌学术搜索
28.Campbell F,Cori A,Ferguson N,Jombart T.使用症状时间,病原体基因组和接触数据的传播链的贝叶斯推断。皮泽尔,编辑。公共科学图书馆计算生物学. 2019;15: e1006930.pmid:30925168
查看文章PubMed/NCBI谷歌学术搜索
29.Cauchemez S, Bhattarai A, Marchbanks TL, Fagan RP, Ostroff S, Ferguson NM, et al.在2009年H1N1大流行性流感社区暴发期间,社交网络在塑造疾病传播中的作用。美国国家科学院院刊。2011;108: 2825–2830.密码:21282645
查看文章PubMed/NCBI谷歌学术搜索
30.考赫梅兹 S, 努韦莱特 P, 科里 A, 琼巴特 T, 加斯克 T, 克拉珀姆 H, 等.揭示中东呼吸综合征冠状病毒传播的驱动因素。美国国家科学院院刊。2016;113: 9081–9086.密码:27457935
查看文章PubMed/NCBI谷歌学术搜索
31.迈尔斯、莱斯科维奇·关于潜在社交网络推理的凸性。神经信息处理系统的进展。2010.第1741–1749页。可用: https://proceedings.neurips.cc/paper/2010/hash/cd758e8f59dfdf06a852adad277986ca-Abstract.html
查看文章谷歌学术搜索
32.Gomez-Rodriguez M,Balduzzi D,Sch?lkopf B.揭示扩散网络的时间动态。第28届机器学习国际会议论文集.美国威斯康星州麦迪逊:全媒体;2011.第561–568页。可用: https://dl.acm.org/doi/10.5555/3104482.3104553
33.杜淳, 宋玲, 袁敏, 斯莫拉. 异质影响的学习网络.神经信息处理系统的进展。2012.第2780–2788页。可用: https://proceedings.neurips.cc/paper/2012/hash/d759175de8ea5b1d9a2660e45554894f-Abstract.html
查看文章谷歌学术搜索
34.Netrapalli P, Sanghavi S. 学习流行病级联的图表。SIGMETRICS 执行评估修订版 2012;40: 211–222.
查看文章谷歌学术搜索
35.Rozenshtein P, Gionis A, Prakash BA, Vreeken J. 随着时间的推移重建流行病。第 22 届 ACM SIGKDD 知识发现和数据挖掘国际会议论文集.美国纽约:计算机协会;2016.第1835-1844页。https://doi.org/10.1145/2939672.2939865
36.肖H,阿斯莱C,吉奥尼斯A.斯坦纳树采样的鲁棒级联重建。2018年IEEE数据挖掘国际会议(ICDM)。2018.第637–646页。
查看文章谷歌学术搜索
37.张H, 派 S, 阿迪卡里 B, 佩玛拉朱 SV.具有风险意识的时间级联重建,以发现无症状病例。知识信息系统 2022;64:3373–3399。pmid:36124337
查看文章PubMed/NCBI谷歌学术搜索
38.Mishra R, Heavey J, Kaur G, Adiga A, Vullikanti A. 使用Steiner Connectivity重建流行病爆发。AAAI 2023 会议。2023.
查看文章谷歌学术搜索
39.Lokhov A. 从部分观测值重建扩散模型的参数。神经信息处理系统的进展。2016.第3467–3475页。可用: https://proceedings.neurips.cc/paper/2016/hash/404dcc91b2aeaa7caa47487d1483e48a-Abstract.html
查看文章谷歌学术搜索
40.Osterholm MT,Kelley NS,Sommer A,Belongia EA.流感疫苗的功效和有效性:系统评价和荟萃分析。柳叶刀传染病。2012;12: 36–44.密码:22032844
查看文章PubMed/NCBI谷歌学术搜索
41.Hall VJ, Foulkes S, Saei A, Andrews N, Oguti B, Charlett A, et al. 英格兰卫生保健工作者的COVID-19疫苗覆盖率和BNT162b2 mRNA疫苗抗感染的有效性(SIREN):一项前瞻性,多中心,队列研究。柳叶刀。2021;397: 1725–1735.密码:33901423
查看文章PubMed/NCBI谷歌学术搜索
42.Reich NG, Brooks LC, Fox SJ, Kandula S, McGowan CJ, Moore E, et al.美国季节性流感预测的多年、多模式合作评估。美国国家科学院院刊。2019;116: 3146–3154.密码:30647115
查看文章PubMed/NCBI谷歌学术搜索
43.Reich NG, McGowan CJ, Yamana TK, Tushar A, Ray EL, Osthus D, et al.美国季节性流感实时多模式集合预报的准确性 Pitzer VE,编辑。公共科学图书馆计算生物学. 2019;15: e1007486.密码:31756193
查看文章PubMed/NCBI谷歌学术搜索
44.克莱默·安永, 雷·埃尔, 洛佩兹 VK, 布拉彻 J, 布伦嫩 A, 卡斯特罗·里瓦德内拉 AJ, 等.评估美国 COVID-19 死亡率的个体和整体概率预测。美国国家科学院院刊.2022;119.密码:35394862
查看文章PubMed/NCBI谷歌学术搜索
45.贝聿铭, 坎杜拉 S, 卡斯坎特维加 J, 杨 W, 福尔斯特 S, 汤普森 C, 等.接触者追踪显示纽约市存在COVID-19社区传播。纳特公社。2022;13: 6307.密码:36274183
查看文章PubMed/NCBI谷歌学术搜索
46.梅尔尼克 S, 哈克特 A, 波特马, 穆夏 PJ, 格里森 JP.基于树的理论对聚类网络的不合理有效性。物理学修订版 E. 2011;83: 036112.密码:21517563
查看文章PubMed/NCBI谷歌学术搜索
47.福塞特·ROC 分析简介。模式识别字母。2006;27: 861–874.
查看文章谷歌学术搜索
48.埃尔德斯·关于随机图的演变。Publ Math Inst Hung Acad Sci. 1960;5: 17–61.https://users.renyi.hu/~p_erdos/1960-10.pdf
查看文章谷歌学术搜索
49.Pei S, Teng X, Lewis P, Shaman J. 使用不确定性传播优化呼吸道病毒监测网络。自然通讯.2021;12: 222.pmid:33431854
查看文章PubMed/NCBI谷歌学术搜索
50.莫洛伊·具有给定度数序列的随机图的临界点。随机结构和算法。1995;6: 161–180.
查看文章谷歌学术搜索
51.Kunegis J. KONECT:科布伦茨网络收藏。第22届万维网国际会议论文集.巴西里约热内卢:ACM;2013.第1343–1350页。https://doi.org/10.1145/2487788.2488173
52.罗西、艾哈迈德·具有交互式图形分析和可视化的网络数据存储库。AAAI。2015;29.
查看文章谷歌学术搜索
53.Tang J, Lou T, Kleinberg J. 推断跨异质网络的社会关系。第五届ACM国际网络搜索和数据挖掘会议论文集。美国西雅图华盛顿:ACM;2012.第743–752页。https://doi.org/10.1145/2124295.2124382
54.安德森·用于数据同化的集成调整卡尔曼滤波器。Mon Wea Rev. 2001;129: 2884–2903.
查看文章谷歌学术搜索
55.Evensen G. 数据同化:集成卡尔曼滤波。施普林格科学与商业媒体;2009.
56.Katzfuss M, Stroud JR, Wikle CK. 了解集成卡尔曼滤波器。美国统计学家。2016;70: 350–357.
查看文章谷歌学术搜索
57.卡勒B,纽曼MEJ。一般流行病模型的消息传递方法。物理学修订版 E. 2010;82: 016101.pmid:20866683
查看文章PubMed/NCBI谷歌学术搜索
58.坎特威尔GT,纽曼MEJ。在具有循环的网络上传递消息。美国国家科学院院刊.2019;116: 23398–23403.密码:31685640
查看文章PubMed/NCBI谷歌学术搜索
59.Altarelli F, Braunstein A, Dall'Asta L, Wakeling JR, Zecchina R. 通过消息传递技术遏制流行病爆发。物理修订版 X. 2014;4: 021024.
查看文章谷歌学术搜索
60.Lokhov AY, Mézard M, Zdeborová L. 单向动力学模型的动态消息传递方程.Phys Rev E. 2015;91: 012811.pmid:25679661
查看文章PubMed/NCBI谷歌学术搜索
61.邓巴 ORA, 邓肯 AB, 斯图尔特 AM, 沃尔夫拉姆 M-T.具有噪声和昂贵可能性的模型的集成推理方法。暹罗应用动态系统学报 2022;21:1539–1572。
查看文章谷歌学术搜索
62.阿鲁兰帕拉姆 MS, 马斯克尔 S, 戈登 N, 克拉普 T.关于用于在线非线性/非高斯贝叶斯跟踪的粒子滤波器的教程。IEEE Transactions on Signal Processing.2002;50: 174–188.
查看文章谷歌学术搜索
63.Snyder C, Bengtsson T, Bickel P, Anderson J. 高维粒子过滤的障碍。每月天气回顾。2008;136: 4629–4640.
查看文章谷歌学术搜索
64.Pei S, Kandula S, Yang W, Shaman J. 预测流感在美国的空间传播。美国国家科学院院士。2018;115: 2752–2757.密码:29483256
查看文章PubMed/NCBI谷歌学术搜索
65.阿尔塔雷利 F, 布劳恩斯坦 A, 达尔阿斯塔 L, 英格罗索 A, 泽奇纳 R.嘈杂观察的零患者问题。J 统计机械. 2014;2014: P10016.
查看文章谷歌学术搜索
66.Bindi J, Braunstein A, Dall'Asta L. 从部分观察预测接触网络上的流行病演变。公共图书馆一号。2017;12: e0176376.pmid:28445537
查看文章PubMed/NCBI谷歌学术搜索