恶性疟原虫多克隆感染的中性与非中性遗传足迹
弗雷德里克·拉贝,何启鑫,齐湛,凯瑟琳·迪翁·阿吉罗普洛斯,谭文华,安妮塔·甘萨,凯伦·梅赛德斯·帕斯夸尔
发布时间:2023 年 1 月 3 日
抽象
在监测疟疾控制和根除工作的有效工具至关重要的时候,分子数据的日益普及促使将其应用于流行病学。感染多重性(MOI)定义为共同感染宿主的遗传上不同的寄生虫株的数量,是评估疟疾干预措施的一个关键流行病学参数。对于高传播环境而言,估计MOI仍然是一个挑战,因为个体通常携带多种同时发生的感染。已经开发了几种定量方法来估计MOI,包括两种依赖于分子数据的具有成本效益的方法:i)REAL McCOIL方法基于假定的中性单核苷酸多态性位点,以及ii)VaR编码方法是一种指纹图谱方法,它依赖于编码主要恶性疟原虫的VaR多基因家族的多样性和有限的库重叠 血期抗原PfEMP1,因此正在选择中。在这项研究中,我们通过模拟P来评估这两种方法生成的MOI估计的稳健性。恶性疟动态在三种传播条件下使用先前开发的基于随机因子的模型的扩展。我们证明这些方法是互补的,最好在不同的传播强度中考虑。虽然var编码可能会低估MOI,但它允许稳健的估计,特别是在高传输率下,曲目重叠与频率相关的选择极为有限。相比之下,真正的MCCOIL经常大大高估MOI,但仍然为低传播和中度传播提供了合理的估计。无论传输强度如何,THE REAL McCOIL的结果表明,在高MOI值下会产生不准确的尾部,并且在高传输时,高估和低估之间的某种补偿可能会产生明显合理的估计MOI分布。由于许多国家都在追求消除疟疾的目标,强烈建议根据样本量和当地传播强度确定最合适的方法来估计MOI,以监测干预计划的影响。
作者摘要
尽管作出了控制和消除努力,但疟疾仍然是一个严重的公共卫生威胁,特别是在高传播地区。用于评估这些努力的分子工具包括那些试图估计感染(MOI)的多重性(或复杂性)的工具,共同感染宿主的遗传上不同的寄生虫菌株的数量,一个关键的流行病学参数。在宿主通常携带恶性疟原虫的多种合并感染的高传播区域,MOI 估计仍然具有挑战性。真正的McCOIL和var编码是两种具有成本效益的方法,依赖于寄生虫基因组的不同部分,分别处于中立和选择之下。最近的var编码方法依赖于编码主要血期抗原的var多基因家族,并有助于寄生虫的复杂免疫逃避策略。我们通过模拟不同传播强度下的疾病动力学来比较这两种方法的性能,该模型跟踪单个宿主中不同寄生虫基因组和免疫记忆的感染,然后对产生的感染进行采样以估计MOI。尽管THE REAL McCOIL为低传播和中等传播提供了合理的估计,但var编码允许更可靠的估计,尤其是在高传播的情况下。无论传输强度如何,THE REAL McCOIL都会生成一个估计的MOI分布,其尾部具有模拟中不存在的高值尾部,而在高传输率下,它产生的分布在某种程度上可能看起来合理,因为错误的原因,来自相互补偿的高估值和低估值。对于超多样化的病原体(如P),强烈建议根据当地传播强度确定最合适的方法来估计MOI。恶性肿瘤。
引文: Labbé F, He Q, Zhan Q, Tiedje KE, Argyropoulos DC, Tan MH, et al. (2023) 恶性疟原虫多克隆感染的中性与非中性遗传足迹。公共科学图书馆计算生物学19(1): e1010816. https://doi.org/10.1371/journal.pcbi.1010816
编辑 器: David S. Khoury,澳大利亚新南威尔士大学柯比研究所
收到: 七月 4, 2022;接受: 12月 14, 2022;发表: 1月 3, 2023
版权所有: ? 2023 拉贝等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 基于代理的疟疾动力学随机模拟器和用于重现所有图形的处理脚本存储在GitHub:https://github.com/pascualgroup/varmodel3 上并进行了注释。用于此分析的SNP数据可在Dryad https://doi.org/10.5061/dryad.jsxksn0bp 获得。用于此分析的DBLα序列可在GenBank中找到,生物项目编号:PRJNA396962。
资金: 这项研究最初得到了美国国立卫生研究院福格蒂国际中心(传染病生态学和进化计划)的支持,向KD和MP授予R01-TW009670。资金由NIH-NSF-NIFA联合生态学和传染病进化奖R01-AI149779提供给KD和MP。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
竞争利益: 提交人声明不存在相互竞争的利益。
介绍
在控制和消除工作之后,2000-2019年期间疟疾死亡人数稳步显著下降[1]。然而,疟疾仍然是一个严重威胁,2019年造成约五十万人死亡,特别是在非洲高传播流行地区的幼儿中。在这些地区,感染的特征是多种遗传上不同的疟原虫基因型同时感染宿主。多重感染(MOI),也称为感染复杂性(COI),定义为同时感染单个宿主的遗传上不同的寄生虫菌株的数量[2]。多克隆感染(即MOI>1)可能是蚊子叮咬传播一种以上遗传寄生虫株或受感染蚊子独立叮咬(也称为重叠感染)的结果。合并感染的数量与传播强度、临床风险、年龄和免疫力有关[3-6]。
鉴于MOI与疟疾监测的潜在相关性,已经开发了各种方法来估计临床样本中的MOI。由于疟原虫在感染人类时以单倍体阶段无性繁殖,因此多态性基因型的特征是多克隆感染的证据。虽然任何高度多态性标志物都适合估计MOI,但在多克隆感染常见的疟疾流行地区准确测量MOI仍然是一个挑战。确定MOI的最常见方法包括大小多态性抗原标志物,例如msp1、msp2、msp3、glurp、ama1和csp,可通过PCR扩增并通过毛细管电泳或琼脂糖凝胶测定[7]。 同样,微卫星,也称为简单序列重复(SSR),是另一种类型的大小多态性标记,可通过PCR扩增,通过确定检测到的等位基因数量来估计MOI[5,8-12]。然而,尽管通过毛细管电泳提高了等位基因检测的分辨率,但这些基于大小多态性的方法通常涉及一定程度的主观解释,无法区分相似大小的等位基因[13],并产生PCR伪影,导致结果不一致,特别是对于MOI > 5[14,15].作为大小多态性标记的替代方法,确定MOI的其他方法侧重于从基因分型或测序数据(例如estMOI、FWS和DEploid)重建单倍型[16-19]。当MOI是研究的主要兴趣时,全基因组测序目前不是一种具有成本效益的方法,并且这些单倍型重建方法计算量大,导致高度复杂感染的MOI可靠性有限[20]。最后,最近开发了两种具有成本效益的分子方法,称为THE REAL McCOIL [21]和var编码[22,23],以使用标准实验室设备识别和跟踪MOI。它们在重要方面有所不同,因为它们依赖于基因组的对比部分,分别在中立性和免疫选择下。
由于几种全基因组单核苷酸多态性(SNP)的组合中存在许多可能的基因型,因此确定MOI的方法侧重于中性SNP数据以区分菌株[24]。加林斯基等.[25]开发了COIL方法,从一组双等位基因SNP数据中估计MOI,但这种方法依赖于单克隆感染(MOI = 1)来估计等位基因频率或需要外部等位基因频率数据。由于外部等位基因频率数据可能仅适用于特定位置,并且在空间和时间上是异质的,因此开发了一种称为THE REAL McCOIL(通过马尔可夫链蒙特卡洛将HEterozygous SNP数据转换为ALelle频率的稳健估计,以及使用可能性的感染复杂性)的分析方法,以同时估计人类宿主内的MOI和基于一组SNP的群体中的等位基因频率[21].使用来自乌干达横断面调查的模拟和105个SNP数据,Chang等人。(2017)表明,REAL McCOIL方法提高了这两个数量的估计性能,尽管这些估计的不确定性随着真实MOI的增加而增加。
最近的var编码方法(也称为var基因分型或var指纹)[22,23],采用高度多态性序列编码PfEMP1(恶性疟原虫红细胞膜蛋白1)的免疫原性DBLα结构域,PfEMP1是感染血期的主要表面抗原[26].在感染期间,PfEMP1分子被寄生虫输出到感染红细胞表面,在那里它们影响疾病的毒力并成为适应性免疫系统的靶标[27]。被称为var的多基因家族编码这种表面抗原的变异,可在地方性人群中达到数万个变异[22,28-33]。每个寄生虫连续表达多达60个var基因(以下简称一组)可导致免疫逃避,延长感染持续时间,并形成慢性感染,从而得以继续传播[34,35]。免疫逃避在高传播区域尤为重要,因为变异库由大体不同的变异基因组成[22,28–31,36]。变异库的这种非随机组成已被证明是由负频率依赖性免疫选择引起的。根据早期通过特异性免疫竞争宿主的寄生虫模型[37]以及最近的本地种群深层分子采样和计算理论[22,30,36],基本上不重叠的var库可提高半免疫宿主的存活率。var种群结构的这一特征允许不同的菌株在人类宿主的血液中积累。var基因家族的广泛多样性以及寄生虫之间共享的var基因百分比非常低,有助于通过扩增,汇集,测序和计数宿主中DBLα类型的数量来测量MOI。var群体遗传学的这一特征是var编码指纹概念的基础。从具有简并引物和扩增子测序的单个PCR中,该方法可对每次感染的独特DBLα类型进行计数。它不是基于分配单倍型,而是基于考虑PCR采样误差的对照数据假设每个基因组有一定数量的类型来计算MOI[22,23]。
由于var编码不需要单倍型构建,我们建议这种方法特别适用于高传输,其中REAL McCOIL由于SNP调用的双等位基因性质而显示出一些局限性[21]。为了评估这两种对比方法在不同传播环境中估计MOI的相对性能,本研究使用基于扩展代理的模型(ABM)模拟了低,中和高传播下的疟疾传播。我们专门扩展了先前开发的随机计算模型,以纳入中性双等位基因SNP,该SNP与var基因一起可用于MOI估计。根据传输强度,我们会询问其中一种方法是否比另一种方法更准确。当大多数感染是多克隆的(即MOI>1)时,我们证明了THE REAL McCOIL和var编码方法倾向于分别高估和低估MOI。此外,虽然var基因家族的高度多样性允许使用var编码方法进行可靠的MOI估计,特别是在高传输环境中,但THE REAL McCOIL在低和中等传输环境中提供了合理的估计,其中var编码可能受到部分重叠var的限制。 曲目。我们讨论了这两种方法的局限性和优势,以确定疟疾寄生虫感染的多重性及其对疟疾监测的影响。
结果
准确估计感染的多重性对于评估目前的疟疾干预战略,从而确定或调整未来的战略非常重要。我们评估了最近开发的两种MOI估计方法,通过使用扩展ABM模拟疟疾传播,并在三种不同的传播环境(即“低”、“中”或“高”)下采样、估计和比较MOI。
对于低、中或高传播强度下的每次模拟,在雨季结束时对2000人进行采样(S1图)。一方面,每个年龄组的抽样个体数量与每个年龄组的年龄分布和大小一致(S1A和S1B图)。另一方面,正如预期的那样,受感染的采样个体的数量与宿主的年龄呈显著负相关(皮尔逊相关检验;高传播:r = -0.377,P值<2.2e-16;中等传播:r = -0.240,P值= <2.2e-16;低传播:r = -0.005,P值= 1.1e-3)。 因此,0至5岁的宿主表现出最少的感染数量,在低、中和高传播模拟中,平均感染±2(平均±SD)、23±5和33±6采样宿主(S1C图)。正如预期的那样,具有高传输设置(1239±22)的模拟的采样主机数量高于具有中等(677±31)和低传输设置(167±24)的模拟(S1C图)。始终如一的是,高透射设置模拟的平均 EIR 和患病率也高于低或中等传播设置(S2 图)。例如,低传播环境模拟平均每个宿主每年有0.25±0.04次感染性叮咬,0.08±0.01个感染病例,而中等传播模拟平均每个宿主每年有5.77±0.22次感染叮咬,0.34±0.02个感染病例,高传播模拟平均每个宿主每年有21.88±0.21次感染叮咬,0.62±0.01个感染病例。 反映了疟疾传播强度的高度对比。我们注意到,在我们的模拟中,“传染性叮咬”被计算为宿主经历的传染性接触事件,并且出于通用目的,我们将传播概率设置为指定这种接触是否导致感染为0.5(S1表)。因此,为了与经验值进行比较,模拟中获得的EIR值应除以该概率。与这些流行病学和遗传多样性统计数据一致,模拟产生的真实MOI分布在三个传播水平之间也存在显着差异(t检验:P值<2.2e-16;低、中±高传播模拟的平均真实MOI分别为1.05±0.21、1.500.82和3.81±3.29)(图1B).本研究中定义的真实MOI对应于合并感染的数量,无论不同感染中的寄生虫在遗传上是否相似。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
Fig 1. Multiplicity of infection (MOI).
For each category, the horizontal central solid line represents the median, the diamond represents the mean, the box represents the interquartile range (IQR) from the 25th to 75th centiles, the whiskers indicate the most extreme data point, which is no more than 1.5 times the interquartile range from the box, and the dots show the outliers, i.e., the points beyond the whiskers. The upper, middle, and lower row panels show correspond to simulations under low-, moderate-, and high-transmission settings, respectively (S1 and S2 Tables). A) Accuracy of MOI estimates, defined as the difference between estimated and true MOI per host. While null values highlight accurate MOI estimates (indicated by a dashed black horizontal line), the positive and negative values highlight over- and under-estimation, respectively. Estimates with the neutral SNP-based approach (THE REAL McCOIL) are indicated in green, and those with the var gene-based approach (varcoding) are indicated in blue. The dark and light green or blue colors indicate respectively MOI estimations made without and with a measurement model (Fig 2). The column panels show differences for specific true MOI values. B) Population distribution of the estimated and true MOI per host from the simulated “true” values and those estimated with the methods indicated by the colors similar to panel A. For high transmission, the distribution obtained with THE REAL McCOIL shows a more pronounced tail than that from the simulated infections, with a secondary peak around MOI = 14. Note that the method considerably over-estimates individual MOI below that value but then under-estimates above it (panel A). Thus, these opposite trends compensate each other to some extent in the population distribution, producing nevertheless a deviation at high values. The varcoding method provides a good representation of the “true” distribution from the simulations, and of the individual values in general, with a consistent tendency to underestimate when sampling error is taken into account.
https://doi.org/10.1371/journal.pcbi.1010816.g001
Estimates with THE REAL McCOIL approach
THE REAL McCOIL approach based on neutral SNP data tends to overestimate MOI when true values range from 3 to 14 (Fig 1A). In contrast, this approach tends to underestimate MOI for true MOI above ~14, values only found in hosts without any single minor allele calls (Figs 2A and 3). Underestimated MOI can differ from the true MOI by up to 1, 3, and 9 co-infections for the low-, moderate-, and high-transmission simulations, respectively. Interestingly, while most hosts with MOI < 3 show accurate MOI estimates, some can differ from the true MOI by up to 18, 12, and 12 co-infections for the low-, moderate-, and high-transmission simulations, respectively. The inaccuracy of the MOI estimates based on THE REAL McCOIL approach, defined as the absolute differences between estimated and true MOI per host, is significantly and positively correlated with the true MOI (P-values < 2.2e-16; r = 0.10, r = 0.57, and r = 0.56 for the low-, moderate-, and high-transmission simulations, respectively). Despite the fact that a high proportion of the 95% credible intervals contained the true MOI for the distinct transmission settings (86% ± 35%, 96% ± 21%, and 97% ± 18% for the low-, moderate-, and high-transmission simulations, respectively), the interval sizes covary with the true MOI (r = 0.80, P-value < 2.2e-16) and transmission intensity (0.3 ± 1.6, 0.7 ± 2.2, and 3.6 ± 5.2 for the low-, moderate-, and high-transmission simulations, respectively; S4 Fig). The size of this 95% credible intervals can reach up to 19, 18, and 17 co-infections for the low-, moderate-, and high-transmission simulations, respectively.
thumbnail Download:
PPTPowerPoint slide
PNGlarger image
TIFForiginal image
Fig 2. Measurement models.
A) and B) Schematic diagrams of the SNP and var measurement models for a host infected by one (MOI = 1) or two (MOI = 2) genetically distinct P. falciparum strains, respectively. To account for potential SNP genotyping failures, we randomly replaced the host genotypes with missing data (X). This replacement was implemented by using the distribution illustrated in panel C. When MOI is high, the frequency of double allele calls (DACs) is also high (Figs 3 and S3). To account for var gene potential sequencing errors, we sub-sampled the number of var genes per repertoire. This sub-sampling was implemented by using the distribution illustrated in panel D. For simplicity, the var repertoire in these two examples only consists of 10 var genes despite each migrant parasite genome consists of a repertoire of 45 var genes in the simulations (S1 Table). C) Histogram of the proportion of missing SNP loci per host haplotype from a panel of 24 bi-allelic SNP loci. The genotypes were previously obtained from monoclonal infections sampled during one cross-sectional survey made in 2015 in the Bongo District, in northern Ghana. The purple curves show the best curves that fit the data using the adjusted R-squared. D) Histogram of the number of non-upsA (i.e., upsB and upsC) DBLα var gene types per repertoire. The molecular sequences were previously sequenced from monoclonal infections, i.e., hosts infected by a single P. falciparum strain (MOI = 1), sampled during six cross-sectional surveys made from 2012 to 2016 in the Bongo District, in northern Ghana.
https://doi.org/10.1371/journal.pcbi.1010816.g002
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 每个宿主SNP单倍型的SNP呼叫(基因型)比例。
A)单个主要等位基因呼叫;B) 双等位基因呼叫 (DAC);C)单个次要等位基因呼叫;D) 等位基因调用缺失。每个SNP呼叫比例都是使用低、中和高传输设置模拟(S1和S2表)计算的。列面板显示特定真实 MOI 值的比例。深绿色和浅绿色分别表示没有和使用测量模型的呼叫比例(图2)。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须以外的点。
https://doi.org/10.1371/journal.pcbi.1010816.g003
由于每个主机的双等位基因调用(DAC)比例与真实MOI显著正相关(P值<2.2e-16,r = 0.82)(图3和S3),不准确性也与每个主机的DAC比例显著正相关(P值<2.2e-16,r = 0.59)。始终,不准确性与每个主机SNP单倍型的单个等位基因调用(次要和主要等位基因)的比例显着且负相关(P值<2.2e-16,r = -0.59)(图3和S3)。不准确性与SNP的数量呈显著负相关(P值<2.2e-16,r = -0.15),但具有最高SNP数量(105个SNP)的估计MOI仍可能与真实MOI相差多达18(S5A图)。令人惊讶的是,MOI估计显示具有不同初始SNP等位基因频率的模拟精度更高,但似乎不受链接SNP位点存在的影响(S6图)。总体而言,尽管包括的低MOI主机略少,而具有高MOI的主机明显更多(图1B),但平均估计MOI与真实MOI非常相似(P值<2.2e-16;低、中和高透射率模拟的平均估计MOI分别为1.36±2.05、1.70±1.50和4.72±4.57)。然而,由于高估和低估的MOI值的组合,分布在MOI为15左右显示出第二个高密度峰值,这在真正的MOI分布中不存在。在某些模拟中,此峰值最多可以对应于 ~200 个主机。
考虑SNP测量模型,通过随机替换一些SNP基因型来解释潜在的基因分型失败,相对于没有测量模型的MOI估计,仅略微降低基于REAL McCOIL方法的MOI估计的准确性(图1A和2)。
从2000年到500年的个体进行子抽样并没有降低有或没有测量模型的估计MOI的准确性(S7图)。然而,对200个个体的子抽样显着增加了MAF<10%的SNP位点数量,特别是对于低(8±11个位点)和中等传播设置模拟(4±5个位点)。因此,由于在REAL McCOIL分析中无法考虑大量SNP位点,从而无法考虑个体,因此当应用200个个体的子抽样时,无法估计大多数低透射设置模拟的MOI(30%;S8 图)。此外,虽然REAL McCOIL方法可以为中高透射率设置模拟的子样本提供MOI估计值,但对200个人的子抽样显着降低了使用或不使用测量模型进行的这些MOI估计的准确性。相反,在疟疾季节通过几个时间点进行采样并不影响REAL McCOIL方法(S9和S10图)的性能。有趣的是,由于未明确建模的过程而导致背景清除的模拟显示,估计MOI的准确性降低,特别是对于最低的真实MOI值(S9和S11图)。此外,对于中度和高传输设置,涉及临时干预的模拟的MOI估计的准确性仍然相似。然而,由于干预显著降低了患病率(0.004±0.003),并且SNP要求至少考虑20个宿主,因此当干预应用于低传播环境时,REAL McCOIL方法永远无法估计MOI(S12图)。
低透射率和中透射率设置下的仿真比高透射率设置下的仿真显示更准确的MOI估计值(图1A)。调用双等位基因位点单等位基因位点(e2)的估计概率高于实际错误率(低和中等传播设置分别为0.06±0.006和0.06±0.007)。对于低传输设置,不太准确的MOI估计对应于真实MOI为1的主机(即DAC的比例= 0%;图 1 和 3),属于 9 个模拟(即运行 12 的两个重复和运行 6、10、15、18、20、21 和 22 的一个重复;图1A;S2 表)。这些宿主表现出高比例的漏诊呼叫(例如,当MOI估计值与真实MOI相差13次合并感染时为37.7%±12.0%)和/或单个次要等位基因呼叫的比例更高(例如,当MOI估计值与真实MOI相差18次合并感染时为54.7%±2.5%)(例如,当MOI估计值与真实MOI相差18次合并感染时,为32.9%±7.4%), 因此,尽管没有DAC,但可能导致高度不准确的估计。这些结果也可以用高度不准确的估计MAF来解释。事实上,估计MOI的不准确性与每次模拟的估计MAF的不准确性显着且正相关,定义为每个SNP位点的估计MAF和真实MAF之间的绝对差异之和(P值<2.2e-16;r = 0.21和r = 0.214,分别用于有或没有测量模型的估计)。有趣的是,尽管REAL McCOIL方法为一些低传输模拟生成了非常不准确的MAF估计,但无论传输设置如何,它通常都会产生非常准确的MAF估计(S13图)。与MOI结果一致,每次模拟的MAF估计的准确性也随着SNP位点的数量而增加。THE REAL McCOIL MAF 估计每个位点的不准确性,定义为每个位点估计和真实 MAF 之间的绝对差异,与真正的 MAF、DAC 的比例以及每个位点的单个次要等位基因调用的比例显着呈负相关(S3 表)。此外,MAF估计的这种不准确性也与每个位点缺失等位基因呼叫和单个主要等位基因呼叫的比例显着但正相关(S3表)。当仅保持每次模拟的估计 MAF 不准确性最低(不准确性 < 0.39 = 1圣分位数),当真实值范围为 3 到 14 时,真正的 McCOIL 仍然倾向于高估 MOI,而对于高于 ~14 的真实 MOI,则低估 MOI(S14 图),这表明其他来源是估计的 MOI 不准确的起源。
使用 var编码方法进行估计
随着MOI高于1的宿主的var库重叠的可能性不断增加,使用var基因的数量来估计MOI的var编码方法往往略微低估了MOI(图1A)。它的不准确性定义为每个主机的估计MOI和真实MOI之间的绝对差异,与真实MOI显着且正相关(P值<分别为2.2e-16;对于低,中和高透射率模拟,分别为r = 0.36,r = 0.29和r = 0.59)。因此,对于具有最高真实 MOI 的宿主(即,低、中和高传播模拟分别为 4、9 和 20 次混合感染)估计的 MOI 值与真实 MOI 在低、中和高传播模拟中分别相差多达 1、1 和 6 次。总体而言,尽管表现出轻微的偏差,低MOI的主机较多,高MOI的宿主较少,但基于var编码方法的估计MOI的分布与真实MOI的分布非常相似(P值= 0.8,平均估计MOI为1.04±0.20;P 值 = 9.8e-3, 1.50 ± 0.79;低、中和高透射率仿真的 P 值<分别为 2.2e-16、3.70 ± 3.08)(图 1B)。
正如预期的那样,var基因测量模型通过对每个菌株的var基因数量进行子采样来解释潜在的采样误差,减少了每个宿主可用的不同var基因的数量并增加了不准确性(图1A和2)。对于低、中和高传播模拟,模拟数据的 MOI 估计值现在可以分别与真实 MOI 相差多达 2、4 和 12 次合并感染。总体而言,估计MOI的分布与真实MOI的分布非常相似(P值= 2.5e-10;平均估计MOI为1.02±0.14;P 值< 2.2e-16、1.25 ± 0.48;低、中和高透射率仿真的P值<分别为2.2e-16、2.51±1.75),尽管它强调了我们在没有测量误差的情况下描述的一些小偏差,即具有低MOI的主机更多,具有高MOI的主机更少(图1B)。
由于var编码方法使用单个主机级信息估计MOI,因此无论考虑测量误差,对数据集进行子采样(从2000到500或200个个体)都不会降低准确性(S7和S8图)。在整个疟疾季节而不是一个时间点进行采样不会影响var编码方法的性能(S9和S10图)。同样,由于与通过var基因记忆的免疫逃逸无关的过程,考虑短暂干预后的样本或添加感染的背景清除,并没有改变估计的准确性(S9,S11和S12图)。
高透射率设置仿真比低透射率和中透射率仿真产生更准确的MOI估计(图1A)。这与在低透射率和中等透射率设置下表现出较低平均PTS(4.7e-4±1.8e-4)的模拟的var库一致,即重叠较少,与在低和中等透射率设置下模拟的var库(分别为0.164±0.043和0.049±0.004)(图4C、S15和S16)。寄生虫种群的遗传结构也可以使用节点为var库的网络进行分析,加权边缘对应于这些库之间的重叠程度(图4A)[36]。与平均PTS一致,高透射率设置下模拟的相似性网络没有将var库分组到定义明确的模块中,而低透射率和中等透射率设置下模拟的相似性网络则分组。这一发现也是使用var recomtoire相似性网络中的三节点基序捕获的,该网络显示高透射率下的模拟(2.4%±6.4%)的倒数基序(即A B ? C ? A ?)的比例低于低和中等透射设置下的模拟(分别为11.8%±7.0%和30.0%±3.2%)(图4A,4B和S8)。总之,作为模拟的P。与低或中传播设置下的恶性疟原虫菌株相比,高传播设置下的恶性疟原虫菌株共享的VaR库较少,VaR编码方法在高传播设置下比在低传播环境中产生更准确的MOI估计(图2A,4和S15)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. 使用网络属性的人口结构。
在低、中和高传输设置下从一次性点生成的 150 个随机采样的寄生虫变量库的库相似性网络的比较(即,分别为运行 1、25 和 49 的一次重复;S1 和 S2 表)。在分析中仅绘制和使用前 1% 的边。A)相似性网络,其中节点是var recomtoir,加权边缘编码这些库中包含的var基因之间的重叠程度,边缘的方向表示曲目之间的不对称竞争。B)三节点图基序在曲目相似性网络中出现的平均比例分布。C) 变量库之间平均成对类型共享 (PTS) 的分布。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须以外的点。
https://doi.org/10.1371/journal.pcbi.1010816.g004
REAL McCOIL 和 var编码方法的比较
如上所述,每种方法在特定条件下(例如传输设置和采样大小)表现更好。然而,对于任何给定的仿真,REAL McCOIL方法从未达到var编码的准确性水平(图1)。首先,对于低传播和中等传播设置下的模拟,REAL McCOIL 方法可能会产生高度不准确的 MAF,因为从参与者中采样的受感染宿主比例很小,这可能导致比使用变量编码生成的 MOI 估计更不准确。其次,在高传播设置下,REAL McTCOIL方法显示MOI高估和低估了低于或高于~14个合并感染的真实MOI的组合(图1)。这引入了相反方向的偏差,可以在一定程度上补偿并人为地提供合理的整体人口分布。相比之下,var编码方法显示,随着菌株之间变异库重叠的增加,对增加真实MOI的MOI的持续低估,第三,对于相似的样本量(即2000、500或200个个体),var编码方法总是提供比REAL McCOIL方法更准确的MOI估计(S7和S8 图)。对于较小的样本量(即200个样本),这尤其明显,这些样本非常常用于疟疾监测。一方面,依赖于种群水平信息的THE REAL McCOIL无法提供MOI估计值,因为分析中可以考虑的SNP位点数量有限,或者可以提供不太准确的MAF和MOI估计值。另一方面,仅依靠个体水平的信息来估计MOI的var编码始终如一地提供独立于样本量的可比较MOI估计值。总之,估计的MOI的准确性取决于传播环境、用于表征疟疾寄生虫感染多重性的方法以及样本量。
讨论
当P.恶性疟原虫传播率很高,这在世界疟疾流行地区很常见,模拟表明,REAL McCOIL 方法提供的 MOI 估计不如 var编码方法可靠。前一种方法倾向于高估具有低和中度真实MOI(低于~14次合并感染)的宿主的MOI,而低估具有高真实MOI(高于~14次合并感染)的宿主的MOI。宿主SNP单倍型(条形码)中DAC的高比例和单个主要和次要等位基因呼叫的比例低似乎是高传输模拟中这种不准确性的根源。有趣的是,低估和高估的MOI值的组合允许THE REAL McCOIL方法产生相当准确的平均估计MOI,但出于错误的原因。因此,当疟疾传播为中度至高度时,应谨慎使用这种方法。特别是,总体中的大量高估导致分布出现次级峰值。相比之下,由于var基因的高度多样性和减少库重叠的选择,高传输时的低PTS值能够通过扩增,汇集,测序和计数宿主中DBLα类型的数量,通过var编码实现准确的MOI估计。尽管拥有高比例的不同var基因,但库仍然可以部分重叠,共享相似的var基因。这种有限的重叠可能导致根据其DBLα类型鉴定的var基因数量减少,这导致MOI的潜在低估。由于寄生虫基因组的这些区域有时难以访问,因此由此产生的采样误差会降低方法的可靠性,从而导致对MOI的持续低估,如模拟所示,其中包括基于经验数据的实际测量误差。模拟包括基于每个 3D7 实验室分离株的非 upsA DBLα var 基因类型分布的测量误差,显着提高了 var 编码 MOI 估计的准确性,突出了高密度分离株在估计 MOI 时的重要性(S17 图)。此外,初始仿真的扩展支持了该方法估计的鲁棒性。也就是说,考虑瞬态动力学与稳态动力学,在临时干预后进行采样,并没有改变我们的结果;既没有在整个传播季节进行采样,也没有扩展模型以考虑通过一般背景感染清除的其他过程。因此,var编码方法为在高传输条件下评估MOI提供了一种具有成本效益的方法,但是由于var基因采样的测量误差而引入了低估偏差。这个误差可以用当前正在进行的估计方法本身的贝叶斯扩展来考虑。
在低或中度疟疾传播地区,THE REAL McCOIL和var编码方法都可以提供合理的MOI估计值。由于双等位基因SNP数据相对便宜且易于获得,因此REAL McCOIL方法可应用于任何多克隆感染寄生虫分离株[21],该方法在评估MOI方面似乎具有成本效益,但仍然可能因低估干预措施的有效性而在确定疟疾消除状态时引入偏倚。然而,该方法需要最少数量的采样主机来合理估计MOI,而var编码并非如此。因此,在定义最合适的样本量时应谨慎行事,同时保持该方法的成本效益。鉴于在未纳入测量误差时var编码方法的高精度,未来的工作将解决单个主机内var库重叠的校正问题,以改善MOI估计。
与Chang等人一致。2017年,尽管REAL McCOIL方法假设基因分型的SNP位点没有表现出显着的LD,但使用链接的SNP位点进行的模拟并没有显示出不太可靠的MOI估计。链接的SNP位点可能需要比这里考虑的更长的模拟(数千代),以显示MOI估计的实质性偏差。THE REAL McCOIL方法的分类方法对控制MOI上限(maxCOI)的参数非常敏感。虽然在仿真中应用了最大MOI为20,但将低透射和中透射仿真的上限降低到在这些设置下观察到的最高真实MOI值(低透射和中透射仿真分别为4和9)显着提高了估计MOI的准确性(S18图)。因此,在采用这种方法时,从以前的报告中确定最合适的MOI上限可能有助于提供更准确的未来估计。但是,此解决方案可能是循环的,因此不切实际。
REAL McCoil方法为低传输强度提供了高度准确的MAF估计,并在中度和高传输强度下提供了相当准确的估计。虽然MAF估计只有24个SNPs是稳健的,但通过增加基因分型的SNP数量,它们的准确性得到了提高。疟疾寄生虫的大多数人群遗传分析依赖于单克隆感染,这减少了数据量并产生了可能不具有代表性的MAF估计,从而引入了潜在的偏差。因此,尽管经常严重高估MOI,但真正的McCOIL方法也可以通过正确估计MAF和其他相关统计数据(包括有效种群规模(Ne)、F圣和 FWS [38-40]。
我们的模拟未考虑的另一个测量误差来源涉及由于寄生虫血症(宿主血液中的寄生虫负荷)低而同时感染特定宿主的所有菌株的困难。事实上,多克隆感染可能导致特定菌株的寄生虫血症减少[41]。因此,具有低寄生虫血症的菌株可以在临床样品中被高度稀释,因此具有较低的可能性被正确测序和/或基因分型。此外,PCR检测方法(可识别低至1个/μL寄生虫的感染)和常用的显微镜检测方法(无法检测低于4-10个/μL的寄生虫)的感染,前者可能会漏诊总寄生虫血症低的感染(单克隆或多克隆)[42,43]。在隔天的48小时生命周期中,克隆的同步性也会导致MOI的低估,除非重复每日采样[44]或每三天进行一次[45]。因此,与本研究报告中强调的问题相比,这些问题可能导致对MOI的严重低估。
我们的ABM的另一个简化是缺乏SNP突变。寄生虫基因组中性部分的进化可能会影响较长时间尺度的MOI估计,但在与流行病学相关的较短时间段内应起次要作用,除非与选择性扫描有关。最后,我们的模型没有将var基因的不同序列分组纳入,可以根据它们的染色体位置和半保守的上游启动子序列(ups)将其分类为不同的组,即upsA和非upsA[46-48]。病例对照研究报道,虽然upsA var基因在脑和/或重症疟疾患儿中优先表达,但非upsA var基因与无症状感染和临床疟疾病例相关[49-57]。我们的ABM中没有var类型,这可能解释了模拟中较年轻年龄组(即0-5岁)的患病率较高,而经验数据中观察到的6-10岁和11-20岁年龄组的患病率较高[58]。
我们的ABM涉及寄生虫有性生殖阶段的另一种简化,假设供体寄生虫的来源始终是单个宿主。由于遗传多样性和传播强度是高度相互关联的,我们预计寄生虫有性生殖阶段的这种实施不会影响高传播环境的结果,因为变异库重叠极其有限。此外,由于可以发生中断喂养,即来自同一蚊子的单个基因型接种到两个人身上,但不经常发生[59],我们也不认为我们对这一过程的不考虑会改变我们在低传播和中度传播环境中的结果。
来自同一蚊子的重组菌株之间的相关性应影响MOI估计。随着相关性的增加,区分相关的单独菌株应该更加困难。虽然我们的模型没有明确表示蚊子,但它从减数分裂重组、传播强度、MOI 分布和宿主免疫选择之间的复杂相互作用中自然产生具有不同程度相关性的菌株。然而,我们并不认为相关性会成为我们在低传播下的方法的问题,因为重组并不发挥重要作用,而且MOI足够低,以至于传播事件主要涉及单个宿主的供体感染。在高透射率下,我们也不认为重组产生的相关性是误差的重要来源,因为重组的实际实现(如材料和方法中所述)。
虽然MOI是评估疟疾干预工作有效性的有用流行病学标志物,但正确表征多克隆感染仍然是一个挑战,特别是对于高传播率。这项工作表明,THE REAL McCOIL和var编码方法提供了互补的方法,以确定不同传输环境中的MOI。特别是,var基因家族的高度多样性和寄生虫之间var基因库的低重叠,特别是在高传播强度下,允许使用var编码方法进行可靠的MOI估计,尽管低估的趋势主要源于采样误差。THE REAL McCOIL对双等位基因中性SNP的依赖限制了高传播的应用,在种群分布的尾部引入了次级峰值,对单个MOI的显着高估,以及偏差中的相反符号,对于不同真实值范围内的低估和高估。该方法在低传播和中等传播环境中提供了合理的估计值,在这些环境中,var编码方法可能会受到部分重叠的var库的限制。因此,强烈建议在确定最合适的标志物和/或MOI估计方法以评估疟疾控制和消除运动的影响时考虑当地传播强度。免疫选择下高度多样化的多基因var家族为高传播感染的复杂性提供了处理方法。
材料和方法
基于代理的模型 (ABM)
疟疾传播是通过在连续时间内扩展实施基于代理的离散事件随机模型来建模的[36,60]。在这里,我们简要描述了在Julia(varmodel3)中实现的基于代理的模型(ABM),该模型基于以前的C++实现(即varmodel和varmodel2)[36,60]。虽然之前随机ABM的实现是从优化吉莱斯皮第一反应方法的下一个反应方法改编而来的,但该实现使用更简单的吉莱斯皮算法[61,62]。ABM跟踪每个宿主的感染史和免疫记忆,其参数和符号汇总在S1表中。我们模拟了10000人的本地种群,以及一个全球var基因库,其规模是区域寄生虫多样性的代表。模拟以来自该区域池的20名移民感染初始化,以播种当地人口传播并将当地基因多样性增长到平稳平衡。每个迁移寄生虫基因组由45个var基因的特定组合(即库)组成。库的大小基于我们的3D7实验室分离株中鉴定的非upsA DBLα序列的中位数[22,23]。这种var基因的分组是根据其半保守的上游启动子序列(ups)(即upsA和非upsA(upsB和upsC))来定义的[46-48]。尽管每种寄生虫以相当恒定的比例携带两种类型的var基因[26,63],但我们在这里考虑的MOI估计方法侧重于非upsA DBLα序列,因为它们比upsA DBLα序列更多样化~20倍,并且在库中更不保守。因此,为了简单起见,我们的模型只考虑了这些类型。每个var基因本身表示为两个表位的线性组合,即分子中作为抗原并被免疫系统靶向的部分[26,36,64]。库中的var基因依次表达,当整个库耗尽时,感染结束。var基因的活跃期以及感染的持续时间由看不见的表位的数量决定。当var基因失活时,宿主将失活的var基因表位添加到其免疫记忆中。对给定表位的特异性免疫会经历宿主免疫记忆的损失率,因此需要重新暴露以维持它。当地居民对来自区域池的移民开放。
我们的模型扩展允许我们通过在定义数量的中性双等位基因SNP中的每一个采样两个可能的等位基因(标记为0或1)之一来跟踪每个移民寄生虫基因组的中性部分(S1表)。虽然扩展模型可以通过从区域池中以相同的概率(即 0.5)对移民等位基因进行采样来生成均匀的初始 SNP 等位基因频率,但它也可以通过从区域池中采样具有不同初始概率的移民等位基因来生成不同的初始 SNP 等位基因频率,这些概率加起来为 1(例如,0.2 和 0.8),并且从定义的范围内随机和均匀地选择(例如, [0.1–0.9];S1 表)。
在传播速率参数中实施季节性,以表示蚊虫叮咬的月度变异性[60,65]。该模型没有明确纳入蚊子媒介,而是考虑了有效接触率(以下简称传播率),它决定了局部传播事件的时间(指数分布)。此时,将随机选择捐赠者和接受者主机。我们不直接模拟卵囊四联体,但我们假设在传播事件中,在受体宿主的血液阶段存活的菌株数量等于从供体宿主中拾取的菌株数量,例如Ns.由于减数分裂重组发生在寄生虫的性阶段,因此在传播事件发生时在模型中实现。具体地,产生每个子菌株的过程如下:1)随机选择两个亲本菌株(这些可能是相同的菌株),2)产生两个重组子菌株,随机选择一个进行传播。因此,在传递事件期间选择的菌株的概率为 Pr= 1–1 / Ns成为重组菌株,因为假设蚊子中存在的所有菌株的频率相似,并且与包括自身在内的任何菌株形成受精卵的机会相同[36]。这个过程模仿卵囊的形成和孢子体在蚊子中产生的,类似于Wong等人所考虑的。(2018) [66].虽然建立了var基因的物理位置和主要群体的关联,但两个菌株之间的直系同源基因对通常是未知的或在不同的染色体上。因此,为了生成重组var rekutoi,从包含来自原始基因组的两组var基因的池中随机采样一组var基因。由于不同物理位置的var基因之间不断发生有丝分裂重组或基因转换,var基因的物理位置可以移动,因此该假设是对减数分裂重组过程的合理简化。类似地,为了产生重组寄生虫的中性部分,对每个双等位基因SNP进行随机等位基因采样。此外,为了允许跨基因组中性部分的连接不平衡(LD),中性双等位基因SNP可以是非随机关联的,并且按照LD系数矩阵中的定义进行共分离,表明成对连接的SNP在减数分裂重组期间共分离的概率(S2表)。
试验设计
我们探讨了不同的传输设置如何影响两种不同的方法的MOI估计。具体而言,我们比较了3种传播强度,分别对应于“低”(患病率为1-10%)、“中”(患病率为10-35%)和“高”(患病率≥35%),以不同的传播率(分别为5.0e-05、7.5e-05和1.0e-04)和初始基因库大小(分别为500、2000和10000)(S1和S2表)实施[67]。随着基于SNP的方法的灵敏度随着SNP位点数量的增加而增加,并且如Chang等人。(2017)保留了105个SNP位点来测试REAL McCOIL方法,我们对三种传输设置(S1和S2表)使用24、48、96和105个SNP位点进行了这些模拟[21,24,25]。由于REAL McCOIL方法假设多克隆感染中不同的寄生虫谱系无关,并且基因型SNP位点不表现出显着的LD,因此我们使用同质的初始SNP等位基因频率和未连接的双等位基因SNP位点(S1和S2表)进行了模拟。然而,由于等位基因频率在空间和时间上可能是异质的,我们还进行了具有不同初始等位基因频率的模拟,并且将8%和16%的链接SNP位点分别聚集成一组或两组。为了避免可能包含太多固定SNP位点的模拟,从定义的范围内随机均匀地选择不同的初始等位基因频率,只允许频率大于10%或低于90%(S1表)。然而,虽然所有位点的初始MAF≥10%,但它们的SNP等位基因频率可以随着时间的推移而变化,这是P的传输动力学的函数。恶性肿瘤。该设计产生72种不同的参数组合(即运行),我们为每个组合运行10次重复,最大MOI为20(S1和S2表)。模拟运行了85年,以超越建立var基因多样性和寄生虫种群结构的初始瞬态动力学。对于每次模拟,我们计算了流行病学汇总统计数据,包括宿主数量、患病率和昆虫接种率 (EIR)。此外,随机抽样2000人,分析真正的MOI以及寄生虫遗传和等位基因多样性模式。模拟数据是在去年300天(即11月)收集的,相当于加纳北部疟疾流行地区邦戈区的雨季(高传播季节)结束。有关该地区和种群的详细信息已在前文描述[23,58]。
MOI 估算
虽然每个主机的“真实”MOI是直接从模拟中提取的,但使用两种不同的方法获得了每个主机的估计MOI。首先,使用THE REAL McCOIL方法v.2提供的平均MOI从模拟的中性SNP数据估计每个主机的MOI[21]。我们执行了THE REAL McCOIL的分类方法,考虑SNP的次要等位基因频率(MAF)为10%,MOI的上限为20,将所有其他参数保持为默认值(老化期为103迭代,共 10 次4马尔可夫链蒙特卡洛(MCMC)迭代,要考虑的个体最少20个基因型,要考虑的SNP的最小样本数为20个,初始MOI为15,以及调用单等位基因位点双等位基因位点和调用双等位基因位点的初始概率为0.05,这是用MOI和等位基因频率估计的)[21,68]. MAF<10%的位点从分析中删除,因为它们表明位点不具有代表性,等位基因在人群中趋向固定,并且无法区分种群中的分离株。其次,每个宿主的MOI也是通过计算每个宿主内不同var基因的总数并将其除以一个库的大小来估计的,这里45个,这是对照数据估计的45,使用var编码协议对3D7的var基因进行重复采样[23]。
为了解决两种方法中的测量误差,实施了测量模型。首先,为了解释潜在的SNP基因分型失败,我们应用了一个测量模型,该模型用缺失的数据随机替换宿主基因型,减少了THE REAL McCOIL方法的可用数据数量(图2)。这种替代是通过2015年雨季结束时在加纳邦戈区进行的一项横断面调查中获得的一组24个双等位基因SNP位点的缺失基因型比例分布来实现的[24,69](图1C)。对于每个宿主,根据反映缺失基因型计数密度函数比例的权重,将一些SNP位点替换为缺失基因型。其次,为了考虑var基因的潜在采样误差,我们应用了一个测量模型,对每个菌株的var基因数量进行子采样,从而减少了每个宿主的var基因总数(图2)。该子采样是通过探索每个单克隆感染的非upsA DBLα var基因类型数量的分布来实现的,这些单克隆感染的分子序列先前在2012年至2016年期间在雨季结束时在加纳邦戈区进行了六次横断面调查[22,23,36,60](图1D)。对于每种菌株,根据反映var基因计数密度函数的权重对var基因的数量进行子采样。
MOI估计是在有和没有测量误差的情况下进行的。为了更好地反映疟疾监测的通常工作,我们还在对模拟数据集进行子采样(从2000年到500或200人)和在疟疾季节的五个时间点(180、210、240、270和300天;每个时间点400个抽样个体)而不是一个时间点收集总共2000人后,估计了MOI。此外,由于这些方法用于估计传播强度最近发生变化的地区(例如,由于干预成功或干预后反弹[70]),我们探讨了每种方法在应用临时干预后的表现,在采样年之前的两年(特别是83年和84年之间)将咬合率降低了50%。最后,为了考虑感染在var基因库耗尽之前随机解决的可能性(例如,由于感染控制的其他机制),我们还探讨了由于未明确建模的过程引起的背景清除如何影响估计MOI的性能(“background_clearance_rate” = 0.001;S1 表)。通过对三种传输设置具有48个具有同质初始等位基因频率的未连接的SNP位点进行模拟,并行研究了背景清除过程的影响和传输强度的最新变化,从而产生了三种不同的组合,每种组合重复10次。T 检验用于比较真实和估计的 MOI 分布。当 P 值≤ 0.05 时,所有 t 检验比较均被认为具有统计学意义。
曲目相似性网络
为了评估种群中寄生虫的相似性,在所有库对(无论它们遇到的宿主)之间计算成对类型共享(PTS)作为PTSij = 2nij / (n我 + nj),其中 n我和 nj是每个库 i 和 j 和 n 中唯一 VaR 基因的数量ij是库I和J之间共享的VaR基因总数[28]。此外,P的遗传结构.还使用基于VaR组成的相似性网络分析了恶性疟原虫种群。建立了相似性网络,其中节点是var库,加权边缘编码这些库中包含的var基因之间的重叠程度,边缘的方向表示曲目之间的不对称竞争,即一个库是否可以胜过另一个库[36,71]。为了引入方向边,我们计算了曲目 i 与曲目 j 的遗传相似性为 Sij = (N我∩ Nj) / Ni,其中 N我和 Nj分别是库 i 和 j 中唯一 VaR 基因的数量。要关注重叠度最强的变量库,只需绘制前 1% 的边并将其用于网络分析。
支持信息
宿主年龄分布,以及每个年龄组的抽样个体和宿主数量。
显示 1/21: pcbi.1010816.s001.eps
跳到无花果共享导航
抱歉,我们无法预览此文件
1 / 21
下载
无花果分享
S1 图 宿主年龄分布,以及每个年龄组的抽样个体和宿主数量。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。A)抽样个体的年龄分布。B) 每个年龄组的抽样个体数。 C) 每个年龄组的抽样宿主数。上(黄色)、中(橙色)和下(紫色)面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。数值分为五个年龄组,即0-5岁,6-10岁,11-20岁,21-39岁和≥40岁。
https://doi.org/10.1371/journal.pcbi.1010816.s001
(每股收益)
S2 图 每个传播强度的患病率和昆虫学接种率 (EIR)。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。a) 患病率;B) EIR。在低、中和高透射率设置下为模拟计算的统计数据分别以黄色、橙色和紫色表示(S1 和 S2 表)。
https://doi.org/10.1371/journal.pcbi.1010816.s002
(每股收益)
S3 图 每个宿主SNP单倍型和每个传播强度的SNP呼叫(基因型)比例。
A)单个主要等位基因呼叫;B) 双等位基因呼叫 (DAC);C)单个次要等位基因呼叫;D) 等位基因调用缺失。每个SNP呼叫比例都是使用低、中和高传输设置模拟(S1和S2表)计算的。列面板显示特定真实 MOI 值的比例。深绿色和浅绿色分别表示没有和使用测量模型的呼叫比例(图2)。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须以外的点。
https://doi.org/10.1371/journal.pcbi.1010816.s003
(每股收益)
S4 图 估计 MOI 的真实 McCOIL 95% 可信区间。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须以外的点。在低、中和高透射率设置下为模拟计算的统计数据分别以黄色、橙色和紫色表示(S1 和 S2 表)。
https://doi.org/10.1371/journal.pcbi.1010816.s004
(每股收益)
S5 图 SNP的初始数量和感染多重性(MOI)估计的准确性,使用真正的McTCOIL方法确定。
MOI 估计的准确性定义为每个主机的估计 MOI 与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。深绿色和浅绿色分别表示在没有测量模型和使用测量模型的情况下进行的MOI估计(图2)。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。A) 每个真实 MOI 的 MOI 估计的准确性。B) 每个传输强度的MOI估计的准确性(S1和S2表)。
https://doi.org/10.1371/journal.pcbi.1010816.s005
(每股收益)
S6 图 使用REAL McTCOIL方法确定的感染多重性(MOI)估计的SNP属性和准确性。
MOI 估计的准确性定义为每个主机的估计 MOI 与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。深绿色和浅绿色分别表示在没有测量模型和使用测量模型的情况下进行的MOI估计(图2)。
https://doi.org/10.1371/journal.pcbi.1010816.s006
(每股收益)
S7 图 对25%的被抽样个体(即500人)进行子抽样时,感染多重性(MOI)估计的可靠性。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深绿色和浅绿色或蓝色分别表示在没有测量模型和没有测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s007
(每股收益)
S8 图 对10%的被抽样个体(即200人)进行子抽样时,感染多重性(MOI)估计的可靠性。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深绿色和浅绿色或蓝色分别表示在没有测量模型和没有测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s008
(每股收益)
S9 图 感染多重性 (MOI) 估计的可靠性,每个传播强度仅有一个参数组合(即运行)(即低、中和高传播强度分别为运行 12、36 和 60)。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深绿色和浅绿色或蓝色分别表示在没有测量模型和没有测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s009
(每股收益)
S10 图 在疟疾季节通过几个时间点对宿主进行采样时,感染多重性 (MOI) 估计的可靠性。
每个传输强度仅说明了一种参数组合(即运行)(即低、中和高传输强度分别为运行 12、36 和 60)。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深绿色和浅绿色或蓝色分别表示在没有测量模型和没有测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s010
(每股收益)
S11 图 当感染可以通过未明确建模的过程清除时,感染多重性 (MOI) 估计的可靠性。
每个传输强度仅说明了一种参数组合(即运行)(即低、中和高传输强度分别为运行 12、36 和 60)。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深绿色和浅绿色或蓝色分别表示在没有测量模型和没有测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s011
(每股收益)
S12 图 干预改变近期传播强度时感染多重性(MOI)估计的可靠性。
每个传输强度仅说明了一种参数组合(即运行)(即低、中和高传输强度分别为运行 12、36 和 60)。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深绿色和浅绿色或蓝色分别表示在没有测量模型和没有测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s012
(每股收益)
S13 图 使用REAL McCOIL方法确定的每个位点的次要等位基因频率(MAF)估计的准确性。
每个位点的MAF估计的准确性定义为每个位点的估计和真实MAF之间的差异。虽然空值突出显示每个轨迹的准确 MAF 估计值(由黑色水平虚线表示),但正值和负值分别突出显示高估和低估。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。深绿色和浅绿色分别表示在没有测量模型和有测量模型的情况下进行的MAF估计(图2)。上、中和下面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。
https://doi.org/10.1371/journal.pcbi.1010816.s013
(每股收益)
S14 图 MOI 估计的准确性,定义为每个主机的估计和真实 MOI 之间的差异,当仅保持每个模拟具有最低估计 MAF 不准确性的模拟(不准确性 < 0.39 = 第一分位数)时,定义为使用 THE REAL McCOIL 估计的 MAF 与每个 SNP 位点的真实 MAF 之间的绝对差异之和。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深蓝色和浅蓝色或绿色分别表示在没有测量模型和使用测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。
https://doi.org/10.1371/journal.pcbi.1010816.s014
(每股收益)
S15 图 使用库相似性网络属性的种群结构。
比较在低、中和高传播设置下从一次性点生成的 150 个随机采样的寄生虫变异库的库相似性网络(S1 和 S2 表)。在分析中仅绘制和使用前 1% 的边。上方面板显示每次运行的平均成对类型共享 (PTS) 的分布。对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。下图显示了三节点图基序在曲目相似性网络中出现的比例分布。
https://doi.org/10.1371/journal.pcbi.1010816.s015
(每股收益)
S16 图 成对类型共享 (PTS)。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点。A) 每个传输强度的 PTS 分布。B) 每次运行的 PTS 分布。
https://doi.org/10.1371/journal.pcbi.1010816.s016
(每股收益)
S17 图 当模拟包括基于每个 3D7 实验室分离株的非 upsA DBLα var 基因类型分布的测量误差时,感染多重性 (MOI) 估计的可靠性。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于中性SNP的方法(THE REAL McCOIL)的估计值以绿色表示,使用基于var基因的方法(var编码)的估计值以蓝色表示。深蓝色和浅蓝色或绿色分别表示在没有测量模型和使用测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s017
(每股收益)
S18 图 当THE REAL McCOIL方法分别使用MOI的上限为4、9和20进行低、中和高传播模拟时,感染多重性(MOI)估计的可靠性。
对于每个类别,水平中心实线表示中位数,菱形表示平均值,框表示从第 25 个百分位数到 75 个百分位数的四分位距 (IQR),晶须表示最极端的数据点,不超过框内四分位数范围的 1.5 倍,点表示异常值, 即胡须之外的点。上排、中排和下排面板分别对应于低、中和高透射率设置下的模拟(S1 和 S2 表)。A) MOI 估计值的准确性,定义为每个主机的估计值与真实 MOI 之间的差异。虽然空值突出显示准确的 MOI 估计值(由黑色虚线指示),但正值和负值分别突出显示高估和低估。使用基于变量基因的方法(即var编码)的估计MOI以蓝色表示,使用基于中性SNP的方法(即THE REAL McCOIL)的估计MOI以绿色表示。深蓝色和浅蓝色或绿色分别表示在没有测量模型和使用测量模型的情况下进行的MOI估计(图2)。列面板显示特定真实 MOI 值的差异。B) 每个主机的估计和真实 MOI 的种群分布,来自模拟的“真实”值以及使用与图 A 相似的颜色指示的方法估计的那些。
https://doi.org/10.1371/journal.pcbi.1010816.s018
(每股收益)
S1 表。 随机模拟中使用的流行病学和遗传学参数。
https://doi.org/10.1371/journal.pcbi.1010816.s019
(三十)
S2 表。 每次运行的流行病学和遗传学不同参数。
https://doi.org/10.1371/journal.pcbi.1010816.s020
(三十)
S3 表。 使用 REAL McCOIL 方法估计的每个位点的次要等位基因频率 (MAF) 的不准确性(定义为每个位点估计和真实 MAF 之间的绝对差异)与轨迹属性之间的皮尔逊相关系数。
https://doi.org/10.1371/journal.pcbi.1010816.s021
(三十)
确认
我们感谢参与者、社区和加纳BD的加纳卫生服务部门愿意参与这项研究。我们要感谢Edward B. Baskerville的编程协助。我们感谢芝加哥大学研究计算中心通过中途岛集群的计算资源提供的支持。
引用
1米世界卫生组织。《2021年世界疟疾报告》。世界卫生组织;2021.
2米Kolakovich KA, Ssengoba A, Wojcik K, Tsuboi T, Al-Yaman F, Alpers M, et al. 间日疟原虫:有利于裂殖子表面蛋白-1的基因频率和疟疾流行地区的感染多样性。实验寄生虫学。1996;83: 11–18.密码:8654539
查看文章PubMed/NCBI谷歌学术搜索
3米Conway DJ, Roper C, Oduola AMJ, Arnot DE, Kremsner PG, Grobusch MP, et al.恶性疟原虫自然种群重组率高。美国国家科学院院刊.1999;96: 4506–4511.pmid:10200292
查看文章PubMed/NCBI谷歌学术搜索
4米科纳特 L, 兹韦琴加 J, 罗吉尔 C, 比肖夫 E, 丰特尼尔 D, 高 A, 等. 5.恶性疟原虫msp1阻断2和msp2等位基因患病率的变化以及两个具有不同传播条件的塞内加尔邻近村庄的感染复杂性。皇家热带医学和卫生学会学报。1999;93: 21–28.
查看文章谷歌学术搜索
5米安德森 TJC, 豪博尔德 B, 威廉姆斯 JT, 埃斯特拉达-弗朗哥§ JG, 理查森 L, 莫林多 R, 等.微卫星标记揭示了疟疾寄生虫恶性疟原虫的种群结构谱。分子生物学与进化。2000;17: 1467–1482.密码:11018154
查看文章PubMed/NCBI谷歌学术搜索
6米康威DJ。疟疾的分子流行病学。临床微生物学评论。2007;20: 188–204.密码:17223628
查看文章PubMed/NCBI谷歌学术搜索
7米Felger I, Tavul L, Kabintik S, Marshall V, Genton B, Alpers M, et al. 恶性疟原虫:巴布亚新几内亚疟疾流行地区裂殖子表面抗原 2 等位基因的广泛多态性。实验寄生虫学。1994;79: 106–116.密码:7914494
查看文章PubMed/NCBI谷歌学术搜索
8米Morlais I, Nsango SE, Toussile W, Abate L, Annan Z, Tchioffo MT, et al. 恶性疟原虫交配模式和配子细胞天然分离株的蚊子感染性。公共图书馆一号。2015;10: e0123777.密码:25875840
查看文章PubMed/NCBI谷歌学术搜索
9米姆旺吉JM,奥马尔SA,兰福德-卡特赖特LC。用于区分肯尼亚恶性疟原虫复发感染与再感染的微卫星和抗原编码位点的比较。国际寄生虫学杂志。2006;36: 329–336.密码:16442537
查看文章PubMed/NCBI谷歌学术搜索
10米苏旭, 韦勒姆斯·迈向高分辨率恶性疟原虫连锁图:来自数百个简单序列重复的多态性标记。基因组学。1996;33: 430–444.密码:8661002
查看文章PubMed/NCBI谷歌学术搜索
11米萨顿PL,托雷斯LP,分支OH。性重组是秘鲁疟疾持续流行的标志。疟疾杂志。2011;10: 329.密码:22039962
查看文章PubMed/NCBI谷歌学术搜索
12米钟丹, 阿弗兰妮 Y, 吉特科 A, 杨 Z, 崔 L, 门格, 等. 肯尼亚西部高地恶性疟原虫遗传多样性.Am J Trop Med Hyg.2007;77: 1043–1050.
查看文章谷歌学术搜索
13米Brody JR, Calhoun ES, Gallmeier E, Creavalle TD, Kern SE. 使用低摩尔浓度导电介质对 DNA 和 RNA 进行超快速高分辨率琼脂糖电泳。生物技术。2004;37: 598–602.pmid:15517972
查看文章PubMed/NCBI谷歌学术搜索
14米Contamin H, Fandeur T, Bonnefoy S, Skouri F, Ntoumi F, Mercereau-Puijalon O. 恶性疟原虫现场分离株的PCR分型。临床微生物学杂志。1995;33: 944–951.
查看文章谷歌学术搜索
15米Gupta V,Dorsey G,Hubbard AE,Rosenthal PJ,Greenhouse B.凝胶与毛细管电泳基因分型在乌干达的两项抗疟疾试验中对治疗结果进行分类。马拉尔杂志 2010;9: 19.密码:20074380
查看文章PubMed/NCBI谷歌学术搜索
16米阿塞法,普雷斯顿,坎皮诺S,奥霍拉H,萨瑟兰CJ,克拉克TG。estMOI:使用寄生虫深度测序数据估计感染的多重性。生物信息学。2014;30: 1292–1294.pmid:24443379
查看文章PubMed/NCBI谷歌学术搜索
17米希尔WG,巴比克哈。估计血液样本中疟疾克隆的数量。伦敦皇家学会会刊B辑:生物科学。1995;262: 249–257.pmid:8587883
查看文章PubMed/NCBI谷歌学术搜索
18米O'Brien JD,Amenga-Etego L,Li R.从基因组序列数据估计恶性疟原虫临床分离株近亲繁殖系数的方法。疟疾杂志。2016;15: 473.pmid:27634595
查看文章PubMed/NCBI谷歌学术搜索
19米Zhu SJ, Almagro-Garcia J, McVean G. 来自高通量测序数据的恶性疟原虫中多种感染的反卷积。生物信息学。2018;34: 9–15.pmid:28961721
查看文章PubMed/NCBI谷歌学术搜索
20米勒奇 A, 科普夫利 C, 霍夫曼 NE, 梅塞利 C, 威尔科克斯 S, 卡滕贝格 JH, 等.开发扩增子深度测序标记物和数据分析管道,用于多克隆疟疾感染的基因分型。BMC 基因组学。2017;18: 864.pmid:29132317
查看文章PubMed/NCBI谷歌学术搜索
21米Chang H-H, Worby CJ, Yeka A, Nankabirwa J, Kamya MR, Staedke SG, et al. THE REAL McCOIL:一种同时估计疟疾寄生虫感染复杂性和SNP等位基因频率的方法。公共科学图书馆计算生物学。2017;13: e1005348.密码:28125584
查看文章PubMed/NCBI谷歌学术搜索
22米Ruybal-Pesántez S, Tiedje KE, Pilosof S, Tonkin-Hill G, He Q, Rask TS, et al.DBLα var多样性的年龄特异性模式可以解释为什么疟疾高传播地区的居民终生都容易受到恶性疟原虫血期感染。国际寄生虫学杂志。2022 [引用日期:2022-05-11]。密码:35093396
查看文章PubMed/NCBI谷歌学术搜索
23米Tiedje KE, Oduro AR, Bangre O, Amenga-Etego L, Dadzie SK, Appawu MA, et al.使用非拟除虫菊酯杀虫剂进行室内滞留喷洒可减少加纳北部高传播地区的恶性疟原虫的储存库。公共科学图书馆全球公共卫生。2022. pmid:35600674
查看文章PubMed/NCBI谷歌学术搜索
24米丹尼尔斯 R, 沃尔克曼 SK, 米尔纳 DA, 马赫什 N, 尼夫西德, 公园 DJ, 等.一种通用的基于SNP的分子条形码,用于恶性疟原虫的识别和跟踪。马拉尔杂志 2008;7: 223.密码:18959790
查看文章PubMed/NCBI谷歌学术搜索
25米Galinsky K, Valim C, Salmier A, de Thoisy B, Musset L, Legrand E, et al. COIL:一种使用单核苷酸多态性数据的可能性评估疟疾感染复杂性的方法。疟疾杂志。2015;14: 4.密码:25599890
查看文章PubMed/NCBI谷歌学术搜索
26米Rask TS,Hansen DA,Theander TG,Pedersen AG,Lavstsen T.恶性疟原虫红细胞膜蛋白1七个基因组中的多样性 - 分裂和征服。公共科学图书馆计算生物学。2010;6: e1000933.pmid:20862303
查看文章PubMed/NCBI谷歌学术搜索
27米Bull PC,Lowe BS,Kortok M,Molyneux CS,Newbold CI,Marsh K.受感染红细胞表面的寄生虫抗原是自然获得性疟疾免疫力的靶标。国家医学 1998;4: 358–360.密码:9500614
查看文章PubMed/NCBI谷歌学术搜索
28米Barry AE, Leliwa-Sytek A, Tavul L, Imrie H, Migot-Nabias F, Brown SM, et al.恶性疟原虫免疫逃逸(var)基因的群体基因组学。公共科学图书馆病原体。2007;3: e34.密码:17367208
查看文章PubMed/NCBI谷歌学术搜索
29米Chen DS, Barry AE, Leliwa-Sytek A, Smith T-A, Peterson I, Brown SM, et al.对var基因多样性的分子流行病学研究,以表征非洲人类恶性疟原虫的宿主。公共图书馆一号。2011;6: e16629.密码:21347415
查看文章PubMed/NCBI谷歌学术搜索
30米Day KP, Artzy-Randrup Y, Tiedje KE, Rougeron V, Chen DS, Rask TS, et al.西非加蓬儿童恶性疟原虫变异基因库中菌株结构的证据。美国国家科学院院士。2017;114: E4103–E4111.密码:28461509
查看文章PubMed/NCBI谷歌学术搜索
31米鲁伊巴尔-佩桑特斯 S, 铁杰 KE, 东京-希尔 G, 拉斯克 TS, 卡米亚 MR, 温室 B, 等.乌干达临床分离株中恶性疟原虫毒力基因的群体基因组学。科学代表 2017;7: 11810.密码:28924231
查看文章PubMed/NCBI谷歌学术搜索
32米泰瑟玛 SK, 中岛 R, 贾辛斯卡斯 A, 蒙克 SL, 莱基弗雷 L, 林 E, 等.儿童对重症疟疾的保护性免疫与保守的PfEMP1变异体抗体库有限有关。细胞宿主和微生物。2019;26: 579–590.e5.密码:31726028
查看文章PubMed/NCBI谷歌学术搜索
33米Tonkin-Hill G, Ruybal-Pesántez S, Tiedje KE, Rougeron V, Duffy MF, Zakeri S, et al.对主要变异表面抗原编码基因的进化分析揭示了大陆内部和大陆之间的恶性疟原虫种群结构。公共科学图书馆遗传学。2021;17: e1009269.pmid:33630855
查看文章PubMed/NCBI谷歌学术搜索
34米谢尔夫 A, 埃尔南德斯-里瓦斯 R, 巴菲特 P, 博蒂乌斯 E, 贝纳塔尔 C, 普维尔 B, 等.疟疾的抗原变异:恶性疟原虫红细胞内发育过程中VaR基因的原位转换,松弛和相互排斥的转录。EMBO J. 1998;17: 5418–5426.pmid:9736619
查看文章PubMed/NCBI谷歌学术搜索
35米Su X, Heatwole VM, Wertheimer SP, Guinet F, Herrfeldt JA, Peterson DS, et al.大型多样化基因家族var编码参与恶性疟原虫感染红细胞的细胞粘附和抗原变异的蛋白质。细胞。1995;82: 89–100.
查看文章谷歌学术搜索
36米He Q, Pilosof S, Tiedje KE, Ruybal-Pesántez S, Artzy-Randrup Y, Baskerville EB, et al.遗传相似性网络揭示了恶性疟原虫中非中性过程的应变结构。纳特公社。2018;9: 1817.密码:29739937
查看文章PubMed/NCBI谷歌学术搜索
37米Gupta S,Ferguson N,Anderson R. 抗原多样性感染因子中菌株结构的混乱,持久性和进化。科学。1998;280: 912–915.密码:9572737
查看文章PubMed/NCBI谷歌学术搜索
38米Auburn S, Campino S, Miotto O, Djimde AA, Zongo I, Manske M, et al.使用下一代序列数据表征宿主内恶性疟原虫多样性。公共图书馆一号。2012;7: e32891.密码:22393456
查看文章PubMed/NCBI谷歌学术搜索
39米帕米洛 P, 瓦尔维奥-阿霍 S-L.关于从等位基因频率变化估计种群规模。遗传学。1980;95: 1055–1057.密码:17249052
查看文章PubMed/NCBI谷歌学术搜索
40米Weir BS, Cockerham CC. 估计用于分析人口结构的 F 统计量。演化。1984;38: 1358–1370.密码:28563791
查看文章PubMed/NCBI谷歌学术搜索
41米Peyerl-Hoffmann G, Jelinek T, Kilian A, Kabagambe G, Metzger WG, Von Sonnenburg F. 恶性疟原虫的遗传多样性及其与乌干达西部不同疟疾流行地区的寄生虫密度的关系。热带医学与国际健康。2001;6: 607–613.pmid:11555426
查看文章PubMed/NCBI谷歌学术搜索
42米Chen I, Clarke SE, Gosling R, Hamainza B, Killeen G, Magill A, et al. “无症状”疟疾:一种慢性和衰弱的感染,应该治疗。公共科学图书馆医学。2016;13: e1001942.邮编:26783752
查看文章PubMed/NCBI谷歌学术搜索
43米奥凯尔 LC, 布塞马 T, 格里芬 JT, 韦德拉奥果 AL, 加尼 AC, 德雷克利 CJ.决定亚微观疟疾感染发生的因素及其与控制的相关性。纳特公社。2012;3: 1237.密码:23212366
查看文章PubMed/NCBI谷歌学术搜索
44米Farnert A, Snounou G, Rooth I, Bjorkman A. 全流行地区无症状儿童恶性疟原虫亚群的每日动态。Am J Trop Med Hyg.1997;56: 538–547.密码:9180605
查看文章PubMed/NCBI谷歌学术搜索
45米Bruce MC, Donnelly CA, Packer M, Lagog M, Gibson N, Narara A, et al.巴布亚新几内亚无症状疟疾感染的年龄和物种特异性感染持续时间。寄生虫学。2000;121 (Pt 3): 247–256.密码:11085245
查看文章PubMed/NCBI谷歌学术搜索
46米Gardner MJ, Hall N, Fung E, White O, Berriman M, Hyman RW, et al.人类疟疾寄生虫恶性疟原虫的基因组序列。自然界。2002;419: 498–511.pmid:12368864
查看文章PubMed/NCBI谷歌学术搜索
47米拉夫斯特森 T, 萨兰蒂 A, 詹森 AT, 阿诺特德, 西安德 TG.基于编码区和非编码区序列分析的恶性疟原虫3D7 var基因亚群。马拉尔杂志 2003;2: 27.密码:14565852
查看文章PubMed/NCBI谷歌学术搜索
48米Kraemer SM, Kyes SA, Aggarwal G, Springer AL, Nelson SO, Christodoulou Z, et al.恶性疟原虫中基因重组模式塑造var基因库:地理上多样化的分离株的比较。BMC 基因组学。2007;8: 45.密码:17286864
查看文章PubMed/NCBI谷歌学术搜索
49米Falk N, Kaestli M, Qi W, Ott M, Baea K, Corteés A, et al.巴布亚新几内亚儿童中表达的恶性疟原虫变异基因分析。传染病杂志。2009;200: 347–356.pmid:19552523
查看文章PubMed/NCBI谷歌学术搜索
50米Jensen ATR, Magistrado P, Sharp S, Joergensen L, Lavstsen T, Chiucchiuini A, et al. 与严重儿童疟疾相关的恶性疟原虫优先表达由A组var基因编码的PfEMP1。实验医学杂志。2004;199: 1179–1190.密码:15123742
查看文章PubMed/NCBI谷歌学术搜索
51米凯斯特利 M, 科克本 IA, 科尔特斯 A, 贝亚 K, 罗 JA, 贝克 H-P.在一项病例对照研究中,疟疾的毒力与恶性疟原虫变异基因亚群的差异表达有关。传染病杂志。2006;193: 1567–1574.密码:16652286
查看文章PubMed/NCBI谷歌学术搜索
52米卡尔姆巴赫 Y, 罗特曼 M, 康比拉 M, 克雷姆斯纳 PG, 贝克 H-P, 昆 JFJ.疟疾患儿差异变异基因表达及其对宿主基因表达的抗潜伏作用。传染病杂志。2010;202: 313–317.密码:20540611
查看文章PubMed/NCBI谷歌学术搜索
53米Kyriacou HM, Stone GN, Challis RJ, Raza A, Lyke KE, Thera MA, et al.与高寄生虫血症相比,脑疟疾患者恶性疟原虫分离株中的差异 var 基因转录。分子和生化寄生虫学。2006;150: 211–218.密码:16996149
查看文章PubMed/NCBI谷歌学术搜索
54米Normark J, Nilsson D, Ribacke U, Winter G, Moll K, Wheelock CE, et al.PfEMP1-DBL1α氨基酸基序在恶性疟原虫疟疾严重疾病状态中的基序。美国国家科学院院士。2007;104: 15835–15840.密码:17895392
查看文章PubMed/NCBI谷歌学术搜索
55米Rottmann M, Lavstsen T, Mugasa JP, Kaestli M, Jensen ATR, Müller D, et al.var基因群的差异表达与坦桑尼亚儿童恶性疟原虫感染引起的发病率有关。感染和免疫。2006 [引用日期2022-01-20]。pmid:16790763
查看文章PubMed/NCBI谷歌学术搜索
56米Warimwe GM, Fegan G, Musyoki JN, Newton CRJC, Opiyo M, Githinji G, et al.危及生命的疟疾的预后指标与不同的寄生虫变异抗原谱相关。科学转化医学。2012 [引用日期2022-01-20]。密码:22496547
查看文章PubMed/NCBI谷歌学术搜索
67米Warimwe GM, Keane TM, Fegan G, Musyoki JN, Newton CRJC, Pain A, et al. 恶性疟原虫var基因表达由宿主免疫修饰。美国国家科学院院士。2009;106: 21801–21806.密码:20018734
查看文章PubMed/NCBI谷歌学术搜索
68米铁杰 KE, 奥杜罗 AR, 阿贡戈 G, 安约里吉亚 T, 阿宗戈 D, 阿瓦恩 T, 等.加纳邦戈区两个集水区的无症状恶性疟原虫感染流行病学的季节性变化。美国热带医学和卫生杂志。2017;97: 199–212.密码:28719306
查看文章PubMed/NCBI谷歌学术搜索
69米康威DJ,麦克布莱德·蚊子中断进食在疟疾传播中的重要性的遗传证据。皇家热带医学和卫生学会学报。1991;85: 454–456.密码:1755049
查看文章PubMed/NCBI谷歌学术搜索
50米Pilosof S, He Q, Tiedje KE, Ruybal-Pesántez S, Day KP, Pascual M. 宿主的竞争调节了巨大的抗原多样性,以在恶性疟原虫中产生持久的应变结构。公共科学图书馆生物学。2019;17: e3000336.pmid:31233490
查看文章PubMed/NCBI谷歌学术搜索
61.Gibson MA, Bruck J. 具有多种物种和许多通道的化学系统的高效精确随机模拟.物理学杂志 化学 A. 2000;104: 1876–1889.
查看文章谷歌学术搜索
52米吉莱斯皮·数值模拟偶联化学反应随机时间演变的通用方法。计算物理学报.1976;22: 403–434.
查看文章谷歌学术搜索
53米Buckee CO,Recker M.人类疟疾寄生虫恶性疟原虫中毒力基因的多域结构的进化。公共科学图书馆计算生物学。2012;8: e1002451.密码:22511852
查看文章PubMed/NCBI谷歌学术搜索
64.Bull PC, Buckee CO, Kyes S, Kortok MM, Thathy V, Guyah B, et al. 恶性疟原虫抗原变异。将镶嵌变量基因序列映射到共享的、高度多态性的序列块网络上。分子微生物学。2008;68: 1519–1534.密码:18433451
查看文章PubMed/NCBI谷歌学术搜索
55米怀特MT,格里芬JT,丘奇尔TS,弗格森NM,巴萨涅斯M-G,加尼AC.模拟病媒控制干预措施对冈比亚按蚊种群动态的影响。寄生虫媒介。2011;4: 153.pmid:21798055
查看文章PubMed/NCBI谷歌学术搜索
56米黄伟, 温格, 哈特尔, 沃斯.模拟恶性疟原虫在减数分裂重组和共同传播后的遗传相关性。公共科学图书馆计算生物学。2018;14: e1005923.密码:29315306
查看文章PubMed/NCBI谷歌学术搜索
57米组织 WH.消除疟疾框架。世界卫生组织;2017.
58米R 核心团队。R:统计计算的语言和环境。奥地利维也纳:R统计计算基金会;2019. 可用: https://www.R-project.org.
69.Argyropoulos DC, Tiedje KE, Ruybal-Pesántez S, Tonkin-Hill G, He Q, Tan MH, et al. SNP 数据:比较分子监测方法以评估恶性疟原虫在高传播中的群体遗传学变化。精;2022. 可用: https://datadryad.org/stash/dataset/doi:10.5061/dryad.jsxksn0bp.
40米Cohen JM, Smith DL, Cotter C, Ward A, Yamey G, Sabot OJ, et al.疟疾死灰复燃:对其原因的系统审查和评估。疟疾杂志。2012;11: 1–17.
查看文章谷歌学术搜索
41米He Q, Pilosof S, Tiedje KE, Day KP, Pascual M. 菌株之间的频率依赖性竞争在恶性疟原虫疟疾传播模型中赋予了扰动的持久性。前生态埃沃尔。2021;9.密码:35433714
查看文章PubMed/NCBI谷歌学术搜索