《对来自大量不同初治HIV感染者的病毒基因组进行深度测序,显示宿主内遗传多样性与病毒载量之间存在》期刊简介
对来自大量不同初治HIV感染者的病毒基因组进行深度测序,显示宿主内遗传多样性与病毒载量之间存在关联
米格尔·加布里埃莱特 ,马克·本内德拜克 ,马尔特·塞布罗·拉斯穆森,弗吉尼亚·坎,汉斯雅各布·弗勒,罗伯特·弗利西亚克,马塞洛·洛索,延斯·伦德格伦,洞察开始研究小组,拉斯穆斯·马维格
发布时间:2023 年 1 月 3 日
抽象
背景
人类免疫缺陷病毒 1 型 (HIV) 感染通常是由少量且遗传均匀的病毒群体传播引起的。在传播之后,由于通过遗传漂变和选择进行的重组和获得性突变,病毒种群变得更加多样化。病毒宿主内遗传多样性仍然是治愈艾滋病毒的主要障碍;然而,宿主内多样性与疾病进展标志物之间的关联尚未在大部分基因组已深度测序的大型多样化队列中进行研究。病毒载量(VL)是一个关键的进展标志物,了解其与病毒宿主内遗传多样性的关系有助于设计未来的HIV监测和治疗策略。
方法
我们分析了来自 2,650 名初治 HIV 感染者的深度测序病毒基因组,以测量由香农熵计算的 2,447 个基因组密码子位置的宿主内遗传多样性。我们测试了VL和氨基酸(AA)熵之间的关联,考虑了性别,年龄,种族,感染持续时间和HIV人群结构。
结果
我们确认了env基因的宿主内遗传多样性最高。此外,我们发现平均香农熵与VL显着相关,特别是在持续时间>24个月的感染中。我们确定了VL(p值<2.0x10之间的16个显着关联。-5)和AA位置的香农熵,在我们的关联分析中解释了VL方差的13%。最后,基于HIV共识序列变异的等效分析仅解释了2%的VL方差。
结论
我们的研究结果阐明了病毒宿主内遗传多样性与VL相关,可以用作比HIV共识序列变异更好的疾病进展标志物,特别是在持续时间较长的感染中。我们强调,在研究病毒基因组和感染结果时应考虑病毒宿主内多样性。
试用注册
本研究中包含的样本来自同意临床试验START(NCT00867048)(23)的参与者,该试验由全球艾滋病毒试验战略计划国际网络(INSIGHT)运行。此处列出了所有参与者站点:http://www.insight-trials.org/start/my_phpscript/participating.php?by=site
作者摘要
病毒宿主内遗传多样性使HIV的治愈复杂化;然而,缺乏基于近乎完整和深度测序的HIV基因组的大型和多样化的队列研究。在这里,我们分析了来自 2,650 名人口统计学多样性和初治 HIV 感染者的深度测序病毒基因组,以测量由香农熵计算的 2,447 个基因组密码子位置的宿主内遗传多样性。首先,我们验证了env基因的宿主内遗传多样性最高。然后,我们发现香农熵均值与病毒载量呈正相关,主要是在持续>24个月的感染中。最后,我们发现16个HIV基因组位置的宿主内多样性与病毒载量显着相关,并解释了病毒载量的13%方差,而基于HIV共识序列变异的等效分析仅解释了2%的VL方差。总体而言,我们的研究表明,较高的病毒宿主内遗传多样性与病毒载量呈正相关,并且是比HIV共识序列变异更好的疾病进展标志物。我们的研究结果进一步表明,需要更好地了解病原体基因组学,以更好地应对传染病。
引文: Gabrielaite M, Bennedb?k M, Rasmussen MS, Kan V, Furrer H, Flisiak R, et al. (2023) 对来自大量不同初治HIV感染者的病毒基因组进行深度测序,显示宿主内遗传多样性与病毒载量之间存在关联。公共科学图书馆计算生物学19(1): e1010756. https://doi.org/10.1371/journal.pcbi.1010756
编辑 器: Nicola Segata,意大利特伦托大学
收到: 12月 10, 2021;接受: 11月 23, 2022;发表: 1月 3, 2023
版权所有: ? 2023 加布里埃莱特等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 所有非个人身份数据,例如来自Virvarseq的所有输出,以及相关代码都存储在Dryad存储库:https://doi.org/10.5061/dryad.6djh9w13s。个人身份数据可以通过与INSIGHT START研究组(http://www.insight-trials.org/research_proposal)的协议来访问,以尊重START研究参与者的捐赠者同意。个人身份数据包括个人级别的元数据。
资金: 这项工作得到了丹麦国家研究基金会(赠款126)的支持。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
竞争利益: 提交人声明不存在相互竞争的利益。
介绍
HIV型人类免疫缺陷病毒(HIV)在人类宿主之间和宿主内部表现出高度的遗传多样性[1,2]。虽然宿主内病毒多样性最初受到传播瓶颈的限制,但由于高病毒复制率和高复制错误率,HIV基因组迅速多样化[3]。如此高的遗传多样性使病毒能够避免宿主的免疫反应,并可能导致治疗期间耐药性的发展[1]。HIV-1设定点病毒载量(spVL)是在HIV感染早期慢性期通过血浆HIV-RNA测量的近似稳定的病毒载量(VL)与HIV感染的临床进展有关[4]。SpVL已被证明与人类遗传学有关,甚至更明显地与病毒遗传学有关[5]。
宿主内病毒遗传多样性在适应宿主环境和维持复制能力之间取得平衡,并允许在横断面数据集中探索宿主内HIV进化。尽管纵向收集的数据集是宿主内HIV进化的首选,但横断面数据集更容易收集和扩大规模[6,7]。在宿主内遗传多样性定量的各种方法中,香农熵是常用且易于解释的方法[8-10]。香农熵反映了当前变体的数量及其频率[9]。当所有可能的编码氨基酸(AA)以相同的频率存在时,香农熵在基因组位置最高[11]。较高的HIV宿主内多样性可能是HIV逃逸突变体进化更快的结果,也可能是宿主对HIV更强烈的免疫应答的结果[12]。
迄今为止,宿主内遗传多样性与疾病进展标志物(例如病毒载量(VL))之间的关系已在相对高度选择和较小的队列中进行了研究(Hightower等人,2012年[10]中多达187个个体),并且通常基于仅允许对HIV基因组一小部分变异进行低深度采样的技术[10,12-21]。需要对来自大型和多样化队列的HIV基因组进行近乎完整和深度的基因组测序,以进一步阐明宿主内遗传多样性与疾病进展之间的关系,并推广先前来自较小和更同质队列的发现。
在抗逆转录病毒治疗战略时机(START)临床试验中,来自35个国家的受试者代表了人群统计学上多样化的初治HIV阳性者队列,他们感染了一系列不同的HIV亚型,并且已经对近乎完整的病毒基因组进行了深度测序[22-25]。因此,通过使用来自START队列的基因组数据,我们旨在确定AA位置的香农熵作为宿主内多样性的衡量标准在整个HIV基因组中如何变化,以及它与VL的关系。我们进一步旨在确定香农熵与VL最相关的AA位置,最后,我们比较了宿主间或宿主内HIV遗传变异是否更好地解释了VL的方差。
方法
道德声明
本研究纳入的样本来自同意临床试验START(NCT00867048)[23]的参与者,该试验由全球HIV试验战略计划国际网络(INSIGHT)运行。该研究得到了每个贡献中心的机构审查委员会或伦理委员会的批准,并获得了所有参与者的书面知情同意。所有知情同意书均由参与者场地伦理审查委员会审查和批准。此处列出了所有参与站点:http://www.insight-trials.org/start/my_phpscript/participating.php?by=site。
研究人群
本研究纳入的样本来自START试验的受试者,其中包括4,685名符合以下标准的受试者:1)CD4细胞计数>基线时为500个细胞/μl,2)没有艾滋病病史,3)既往没有抗逆转录病毒治疗史,4)研究开始时年龄在18岁以上[23,26].在这项研究中,我们纳入了基线血浆样本VL≥测量值为1,000拷贝/mL的受试者,以及通过二代测序测序的病毒基因组(N = 3,785)。+
HIV 测序、比对、变异识别和亚型
详细的实验室程序在Bennedb?k等人,2021中有所描述[25]。简而言之,从血浆中提取病毒RNA,并使用跨越9,719 nt(74%)HIV基因组中7,125 nt(HIV-1 HXB2基因组区域1,485-5,058和5,967-9,517)的两个扩增子进行扩增,并通过下一代测序进行测序(S1图)。首先使用Bowtie2 v2.2.8对GRXh37.p13人类参考基因组进行读段对齐,并且仅保留与人类基因组未对齐的读对。Virvarseq [27]用于将清洁的读段和AA变体调用与HXB2 HIV参考基因组(GenBank入藏号K03455.1)与默认参数进行比对。Virvarseq比对,重新比对和AA变异调用按基因基础进行(rev和tat基因被分成每个阅读框的单独分析)。排除引物区域的两个扩增子不能完全覆盖基因gag,pol,rev和tat,因此,从HXB2参考基因组密码子位置240考虑编码Gag蛋白的基因的变体调用,对于Pol直到AA位置980,对于Rev从位置7,对于Tat从位置52。没有可用于Vpr和Vif的测序(S1图)。所有称为密码子的最低Phred质量得分为>20。仅对具有至少10%的基因被对齐读段覆盖且至少10倍测序深度的样本进行变异鉴定。如果至少有500倍的测序深度,并且至少有1%的对齐读段支持该变体,则调用变体。具有≤500个密码子位置和≥500倍测序深度的样品被排除在分析之外(N = 1,135)。如果至少有10倍的测序深度和至少50%的对齐读段支持该变体,则称为共识变体。
进行了额外的分析以测试结果的稳健性,最小测序深度阈值分别设置为300倍和1,000倍(而不是500倍阈值)。在这些分析中,分别从分析中排除了1,002和1,379个具有≤500个密码子位置和≥500倍测序深度的样本(而不是1,135个样本)。
详细的亚型描述见其他出版物[22,25]。简而言之,共识序列用于使用REGA版本3.0的子类型[28],并通过手动检查确认子类型。具有三个以上预测亚型的样本被标记为“混合”。如果少于100名受试者被分配了特定的亚型,则在本研究中将该亚型分组为“其他”。
香农熵
香农熵被用作宿主内多样性的度量,并计算每个样本中的每个AA位置。香农熵H我在位置 i,其中和 f
a,i是氨基酸 (AA) a 在位置 i 的频率。AA位置的平均香农熵用于鉴定变化最大的HIV-1基因组位置。定义最大可变位置的阈值被任意选择为 0.3。样本的平均香农熵用于与对数的相关性10(VL)和回归分析。
统计分析
使用R进行关联分析[29]。拟合多元线性回归模型来评估VL与样本均值香农熵的关联。VL测量是记录的10在分析之前转换。年龄、出生时分配的性别、种族、感染持续时间、HIV 遗传数据的前四个主要组成部分、亚型和具有 ≥500 倍测序深度的位置的平均测序深度(以下简称平均测序深度)被视为协变量,以考虑种群结构。Bonferroni校正用于解释AA位置VL和香农熵之间关联的多次测试。
主成分分析(PCA)使用EIGENSOFT软件v6.1.4的共识AA调用进行[30]。此外,仅使用等位基因频率为≥5%和≤95%的AA变体。PCA分析基于2,180个AA变异,前4个主成分(PC)用于回归模型构建,以解释如前所述的种群结构[24]。R软件[29]用于解释方差分析和可视化。通过将变量的平方和与方差分析 (ANOVA) 分析的总平方和进行比较来计算解释方差。模型选择期间的最终模型是根据方差分析与以前的模型进行比较时选择的。参考了HIV分子免疫学数据库中定义最明确的CTL表位的2,447个HIV AA位置的香农熵的显著关联[31]。使用300倍和1000倍测序深度阈值进行了额外的稳健性重新分析,分别考虑了2,542和2,085个HIV AA位置。
通过将数据集随机分成 5 个相等的部分来执行 5 倍交叉验证,使用一部分作为测试数据集,其余部分作为训练数据来计算回归模型的参数。在测试和训练数据集上拟合模型后,通过计算均方根偏差 (RMSE) 和 R2 参数来评估模型。
感染持续时间变量基于Sharma等人的一项研究。2019 [32] 根据多检测算法 (MAA) 近期感染的血清学和非血清学标志物或自我报告的感染日期,将感染持续时间确定为 ≤6 个月。确定6-24个月的感染持续时间1)如果MAA未能确认最近的感染,感染日期未知,诊断日期为<随机化前6个月或2)如果HIV诊断为随机化前6-24个月。如果参与者的HIV诊断在随机分组前>24个月,则认为他们的感染时间为>24个月。
树妖数字对象标识符
https://doi.org/10.5061/dryad.6djh9w13s [26]
结果
研究参与者和基因组测序
共有3,785例START临床试验受试者对HIV基因组进行了测序[22,24,25]。在读取与 HXB2 参考基因组进行读取比对后,1,135 个基因组具有 500 个或更少(共 2,549 个)密码子位置,≥500 个读取覆盖。这些基因组从进一步分析中删除,在研究中留下了2,650个HIV基因组(S1表)。应该注意的是,排除基因组的样本VL明显低于纳入的HIV基因组(Wilcoxon符号秩检验,p值<2.2x10-16).纳入的基因组平均具有5,521倍(范围214-40,501倍)的测序深度,对于本分析中包含的位置(即具有≥500倍测序深度的位置),平均测序深度为11,638倍(范围667-163,667倍)。纳入样本的VL与测序深度的相关性较弱(皮尔逊相关系数-0.12)。
香农熵计算
虽然我们计算了目标基因组区域内所有2,549个HIV基因组密码子位置的香农熵(图1),但在≤800个样本中具有足够测序深度的102个位置被排除在进一步分析之外,因为这些位置显示出具有足够测序深度的异常数量的样本(可能是由于读取未成功映射到高度可变的基因组区域)并且与高熵相吻合。排除的位置都在Env内或靠近扩增子的开始或结束(图1和S2表)。因此,总共包括2,447个位置,在HIV基因组上的分布如下:Gag-262个位置,Pol-979个位置,Env-799个位置,Vpu-78个位置,Tat-47个位置,Rev-107个位置,Nef-207个位置。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1.
HIV基因组上的平均香农熵(顶部)和基因组上基因组测序深度至少为500倍的样本数量(底部)。x轴上总共显示了2,447个HIV AA位置。Gag 位置 1-239、Pol 位置 981–1004、Rev 位置 1-6 和 Tat 位置 1-51 未显示,因为它们未被扩增子覆盖。上图中的红色水平线显示了使用的香农熵阈值。顶部图的灰点标记了从分析中排除的HIV基因组位置(≤800个样本)。底部图中的灰色水平线显示最小样本数的阈值。
https://doi.org/10.1371/journal.pcbi.1010756.g001
采样HIV基因组中变化最大的位置
总共考虑了2,447个AA职位作为最可变的位置识别。总体而言,36个位置的平均香农熵≥0.3(S3表和图1):5个高熵位置在Gag,2个在Pol,29个在Env。平均香农熵显著更高(威尔科克森符号秩检验,p值<2.2x10-16) 在 Env 可变环路区域内比其他 Env 位置。不同种族和亚型之间变化最大的位置的熵分布相似(S1表以及S2和S3图)。
如果我们使用更严格的 1,000 倍要求对包含位置的测序深度进行分析(而不是主要分析中的 500 倍要求),我们确定了相同的位置以显示高熵;除非由于对测序深度的要求增加而将位置排除在分析之外(S4表)。如果我们对测序深度使用不那么严格的 300 倍要求,我们还确定了相同的位置以显示高熵;然而,我们还确定了另外22个高熵位置,这些位置没有足够的测序深度来包含在更严格的分析中(S4表)。
宿主内多样性与病毒载量的相关性
研究样本均值香农熵与对数之间的线性依赖关系10VL和感染持续时间,我们分别对log进行了单变量线性回归10VL和样本的平均香农熵,并根据感染持续时间探索了它们的差异(图2)。我们观察到,无论感染持续时间如何,熵都会随着VL的增加而增加。仅样本的平均香农熵,如方差分析得出的,就解释了观察到的VL方差的4.14%。相反,单变量的对数模型10VL与平均测序深度的关联解释了VL中0.68%的方差(S5表)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 样本的平均香农熵、病毒载量(VL)和感染持续时间之间的关系。
https://doi.org/10.1371/journal.pcbi.1010756.g002
感染的中位VL最低,持续时间>24个月,而样本平均香农熵的中位数在该组中最高。对于 <6 个月、6–24 个月和 >24 个月的感染持续时间,VL 与样本平均香农熵之间的皮尔逊相关系数分别为 0.20、0.19 和 0.33。通过方差分析推导的样本平均香农熵分别解释了 3.91%、3.56% 和 10.70% 的 VL 在感染持续时间为 <6 个月、6–24 个月和 >24 个月时方差。分别使用 300 倍和 1000 倍测序深度阈值的解释方差与主要分析相当(S4 表)。方差分析显示所有三个变量:样本的平均香农熵(p值<2.2x10-16)、感染持续时间(p 值 = 3.5x10-9) 及其相互作用(p 值 = 2.0x10-2) 对 VL 有显著影响。
平均宿主内多样性与病毒载量相关
接下来,我们构建了一个多元线性回归模型,以进一步探索日志之间的关系10VL和香农熵(S5表)。最终模型包括参与者的年龄,出生时分配的性别,种族,感染持续时间和前四个PC(用于解释病毒遗传群体结构)作为协变量(S5表)。总的来说,最终回归模型(即样本的平均香农熵和所有协变量)解释了VL方差的10.3%。分别使用300倍和1000倍测序深度阈值进行重新分析的VL方差与主要分析中使用的500倍阈值相当(S4表)。最终模型仅包括感染>24个月的参与者,解释了VL方差的13.0%。如果我们将平均测序深度作为协变量与其他协变量一起添加到多元线性回归模型中,则模型解释了 10.7% 而不是 10.3% 的方差(S5 表)。为了确认我们的发现不受过度拟合的影响,我们进行了5倍交叉验证分析。训练和测试数据集的平均RMSE分别为0.574(0.571-0.577)和0.578(0.565-0.587)。测试数据集的解释方差为 9.3%,训练数据集的解释方差为 10.4%。在最终多元线性回归模型(S5表中的模型6)中,每个样本每个基因的香农熵平均值与VL没有显着关联(Gag的p值= 0.31,Pol的p值= 0.24,Env的p值= 0.48,Vpu的p值= 0.48,Rev的p值= 0.33,Tat的p值= 0.34,Nef的p值= 0.21)。
HIV宿主内位置熵与病毒载量的关系
解开特定HIV基因组位置的宿主内多样性对日志的影响10VL,我们使用与先前回归分析中相同的协变量(即参与者的年龄,出生时分配的性别,种族,感染持续时间和前四个PC)对2,447个HIV AA位置的香农熵进行了多重线性关联分析。在16个案例中(Pol的6个职位,Env的9个职位和Nef的1个职位;图3)在特定 HIV AA 位置,VL 与香农熵的关联低于邦弗朗尼校正的 p 值阈值 (p 值<2.0x10-5).在所有16个位置中,关联都是由总体趋势驱动的,而不是少数异常值(表1和S4图)。来自 16 个相关 AA 位置的香农熵值共同解释了 VL 方差的 12.6%。完整模型解释了VL(S6表)中21.9%的方差。在5倍交叉验证分析中,训练和测试数据的平均RMSE值相似(S7表)。包括所有16个位置的联合模型显示,当一起考虑时,只有一半的变异与VL显着相关(S5表),这可能是不同HIV基因组位置香农熵之间的多重共线性的结果(S5图)。具有相同协变量的共识AA变体的回归模型显示,13个显着相关的共识AA变体解释了VL中0.01?0.65%的方差,而具有协变量的完整模型解释了VL中6.2%的方差(S8表)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 投影在HIV基因组上的AA位置的病毒载量(VL)和香农熵之间关联的曼哈顿图。
红色水平线标记邦弗朗尼 p 值阈值 (p = 2.0×10?5).x 轴表示基因 AA 位置。x轴上总共显示了2,447个HIV AA位置。Gag 位置 1-239、Pol 位置 981–1004、Rev 位置 1-6 和 Tat 位置 1-51 未显示,因为它们未被扩增子覆盖。
https://doi.org/10.1371/journal.pcbi.1010756.g003
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 1. 香农熵与病毒载量(VL)显著相关的16个HIV氨基酸(AA)位置。
https://doi.org/10.1371/journal.pcbi.1010756.t001
根据HIV突变浏览器的数据,只有3个相关的AA位置(Pol34、Env453和Env812)没有突变条目[33],即是保守位置。16个相关AA位位中有7个与一个或多个定义最佳的CTL表位重叠(表1)。我们没有发现相关的AA位置与CTL表位位置的重叠与偶然预期的显着不同(Fisher精确检验;p值= 1)[31]。
讨论
虽然我们和其他人在涉及>1,000人的研究中将HIV-1准物种的共识序列与疾病进展标志物的变异相关联[5,24,34],但对宿主内病毒多样性的等效分析尽管显示出很强的关联,但对仅对多达187个个体的队列进行了[10],并且通常基于仅HIV基因组一小部分遗传变异的低深度采样[10,12–21]。因此,我们的研究解决了宿主内多样性与疾病进展标志物之间关联的需求,该队列具有近乎完整的深度测序HIV基因组的大型人口统计学多样性队列。此外,我们比较了VL和宿主内多样性与VL和共识HIV AA变体之间的关联强度(表2)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 2. 病毒载量(VL)的方差由不同模型的线性回归分析解释。
PC1-PC4表示对共识AA变体进行主成分分析的第一个主成分,以解释病毒种群结构。当分别使用位置香农熵或共识变体来解释VL时,16和13个HIV AA位置都是与VL显着相关的位置。
https://doi.org/10.1371/journal.pcbi.1010756.t002
我们首先确定了HIV基因组中变化最大的位置。然后,我们建立了一个多元回归模型,将VL的差异与样本的平均宿主内多样性相关联,最后,我们确定了16个HIV基因组位置,其中位置的宿主内多样性与VL相关,VL是HIV疾病进展的既定标志[4]。请注意,虽然VL是一种有用的指标,但VL往往会随着时间的推移而增加,并且在不同的个体中增加不同程度,这种增加可能是进展的重要组成部分[35]。
我们变化最大的HIV基因组位置分析证实,宿主内多样性在整个HIV基因组中的分布并不均匀,在Env中更高,在Gag和Pol中有几个更高的熵位置[36,37]。此外,我们找不到HIV宿主多样性与HIV亚型或参与者种族的关联。重要的是要强调,我们确定了最可变的HIV基因组位置作为整个基因组的绝对衡量标准,而不是相对于给定基因组区域的背景变异性,即,我们对整个基因组的基因组变异性使用相同的阈值,而不考虑特定基因的整体更高或更低的变异性。此外,我们对每个样本每个基因平均的香农熵的分析表明,香农熵和VL之间的关系不是由一个特定基因的宿主内多样性驱动的。
VL与样本均香农熵之间的关系揭示了这些参数之间的正相关关系,其中持续时间较短的感染与VL呈中度相关,这可以通过最初的传播瓶颈和病毒多样化来解释[38-40].根据既定知识,spVL作为预后标志物只能用于慢性感染[41]。这些发现与Kafandro等人的一项研究一致。2017年,作者表明香农熵可以自信地区分近期感染和慢性感染[42]。此外,慢性感染的VL低于近期感染可能是由于队列的性质,即感染持续时间较长但CD4细胞计数仍然较高的受试者可能更好地控制感染[7]。最后,我们的结果表明,样本的平均香农熵,特别是在持续时间较长的感染中,在解释患者之间的VL变异时是有益的,因为我们模型中的其他协变量解释了VL总方差的>10%。我们的发现与Bello等人的一项较小的研究一致。2007年发现病毒遗传变化与长期非进展者(LTNP)的VL之间存在显着的正相关[15],尽管我们的研究不仅限于LTNP。请注意,观察到的结果不能用在更高的测序深度中观察到更多的变异性来解释。此外,虽然VL与宿主内多样性之间关系的方向性无法从我们的研究中确定,但Bello等人的工作。2007年表明,宿主内多样性的增加直接导致VL的增加[15]。+
我们主要分析中的回归模型不包括HIV亚型,因为亚型分配没有显着改善模型;相反,基因组共识序列的前四个主要组成部分足以解释基因组种群结构。我们还测试了我们的结果对包括位置(以及样本)所需的测序深度变化以及将平均测序深度作为协变量添加到模型中的鲁棒性。结果对两种测试都是稳健的,虽然纳入样本的VL与测序深度的相关性较弱,但我们发现仅平均测序深度就无法解释VL的方差。最后,当我们应用5倍交叉验证时,我们在分析中获得了类似的结果,这表明该模型没有过度拟合。
我们的分析表明,VL与16个HIV AA位置的宿主内多样性显著相关,如联合多元回归模型所示,这些HIV AA位置的宿主内多样性彼此不独立,具有共线关系。VL在这些HIV AA位置与香农熵关联的一种解释可能是这些位置不太保守并且更快地获得突变。我们假设这些过程与其他适应性突变的获得相关,因此VL更高[6]。另一方面,在相关位置中较高的香农熵可以在避免免疫反应时为病毒提供优势,因此较高的VL将是熵增加的直接结果,因为一些相关位置是最佳定义的CTL表位的一部分。[31,36,37]。虽然这两种解释都是合理的,但我们没有发现支持这些位置的香农熵增加会导致VL的直接增加。此外,通过使用具有HIV共识序列和与本工作相同的协变量的多元回归模型,我们确认VL与HIV共识序列的关联性较差[21]。因此,我们得出结论,HIV基因组位置熵是VL的标志物,比从共识序列中鉴定出的HIV突变要好得多[24,34]。然而,VL与香农熵在16个已确定的HIV AA位置的关联应该在其他研究中进一步测试,并且需要更多的工作来确定早期时间点的宿主内基因组多样性如何预测CD4 +细胞计数,VL或其他标志物的后期变化。
我们的研究有几个局限性。我们基于完整的数据集进行分析,以获得最大的统计功效,而不是将数据集的一部分留给验证。虽然我们的分析仅包括每个参与者的单个分离株(即单个时间点),但来自多个时间点的样本可以提供有关已确定关联,病毒基因组多样化和疾病进展标志物之间时间依赖关系的进一步信息。此外,在香农熵和VL之间的关联分析中纳入宿主遗传学可以进一步加深我们对特定位置的宿主内多样性与宿主免疫型之间关系的理解。此外,测序的成功率在样本和基因组位置上各不相同,这限制了可以分析的样本数量和基因组位置,我们只包括至少1%的测序读数呈现的变异,这可能会使我们忽略变异。此外,测序基于两个扩增子,覆盖了HIV基因组的大部分但不是全长,这使我们无法识别测序扩增子之外的关联。序列读段与属于亚型B的HXB2参考基因组进行比对,因此,来自其他亚型的一些读段可能没有在最可变的基因组区域进行比对。最后,由于队列的性质,低VL的受试者没有被纳入分析,因此,我们的分析未能确定依赖于纳入这些受试者的关联。
总之,通过使用大量人口统计学上多样化的HIV感染初治受试者队列,我们确认了Env地区积累的宿主内多样性最高。此外,我们发现样本的平均宿主内遗传多样性和16个HIV基因组位置的宿主内遗传多样性与VL呈正相关关系,并且宿主内遗传多样性比从共识序列中鉴定的HIV变异更能反映疾病进展。因此,在分析HIV基因组和临床结果时,应考虑HIV宿主内遗传多样性。
支持信息
本分析包括来自START试验的2,650名参与者的特征。
显示 1/13: pcbi.1010756.s001.docx
跳到无花果共享导航
1 / 13
下载
无花果分享
S1 表。 本分析包括来自START试验的2,650名参与者的特征。
IQR(四分位距)。
https://doi.org/10.1371/journal.pcbi.1010756.s001
(文档)
S2 表。 HIV 基因组位置,其中 ≤800 个样本在位置处具有至少 500 倍的基因组测序深度。
https://doi.org/10.1371/journal.pcbi.1010756.s002
(文档)
S3 表。 HIV基因组的平均香农熵处于最可变的位置。
https://doi.org/10.1371/journal.pcbi.1010756.s003
(文档)
S4 表。 当将要包含的位置的测序深度要求分别从 500 倍更改为 300 倍和 1,000 倍时,结果稳健性分析中基于感染持续时间的总考虑位置、解释方差和 Pearson 相关系数的汇总。
https://doi.org/10.1371/journal.pcbi.1010756.s004
(文档)
S5 表。 病毒载量(VL)预测因子的线性回归分析。
https://doi.org/10.1371/journal.pcbi.1010756.s005
(文档)
S6 表。 联合多元线性回归模型与来自显着相关 AA 位置的香农熵值。
低于 0.05 阈值的 P 值以粗体标记。
https://doi.org/10.1371/journal.pcbi.1010756.s006
(文档)
S7 表。 来自与VL相关的16个香农熵HIV AA位置的5倍交叉验证分析的训练和测试数据集的平均RMSE值。
https://doi.org/10.1371/journal.pcbi.1010756.s007
(文档)
S8 表。 多元线性回归与共识AA变异的联合模型与病毒载量显著相关。低于 0.05 阈值的 P 值以粗体标记。
https://doi.org/10.1371/journal.pcbi.1010756.s008
(文档)
S1 图 HIV基因组的图示以及本研究中测序的两个扩增子所覆盖的位置。
https://doi.org/10.1371/journal.pcbi.1010756.s009
(文档)
S2 图 平均香农熵在 36 个最可变位置的不同种族中的密度图。
https://doi.org/10.1371/journal.pcbi.1010756.s010
(文档)
S3 图 36个变化最大的位置的不同子类型中香农AA熵的平均密度图。
https://doi.org/10.1371/journal.pcbi.1010756.s011
(文档)
S4 图 log10病毒载量与香农熵在16个最显着相关的HIV氨基酸位置之间的关系。蓝线标记平滑的条件均值。
https://doi.org/10.1371/journal.pcbi.1010756.s012
(文档)
S5 图 协变量之间的成对相关矩阵(底部三角形)。
https://doi.org/10.1371/journal.pcbi.1010756.s013
(文档)
确认
我们要感谢START试验的所有参与者和所有试验研究者(参见N Engl J Med 2015; 373:795-807,了解START研究者的完整列表)。START试验得到了美国国家过敏和传染病研究所艾滋病司(美国)的支持(NIH拨款UM1-AI068641,UM1-AI120197和1U01-AI36780),美国国立卫生研究院临床中心,国家癌症研究所,国家心脏,肺和血液研究所,Eunice Kennedy Shriver国家儿童健康与人类发展研究所,国家心理健康研究所, 国家神经疾病和中风研究所、国家关节炎、肌肉骨骼和皮肤病研究所、国家卫生和医学研究委员会(澳大利亚)、国家研究基金会(丹麦)、德国联邦新闻和研究部(德国)、欧洲艾滋病治疗网络、医学研究理事会(联合王国)、国家卫生研究所、 国家卫生服务(英国)和明尼苏达大学。抗逆转录病毒药物由AbbVie,Bristol-Myers Squibb,Gilead Sciences,GlaxoSmithKline / ViiV Healthcare,Janssen Scientific Affairs和Merck捐赠给中央药物库。
引用
1.Cuevas JM, Geller R, Garijo R, López-Aldeguer J, Sanjuán R. HIV-1 在体内的极高突变率。公共科学图书馆生物学. 2015 9月 16;13(9):e1002251.
查看文章谷歌学术搜索
2.Abram ME,Ferris AL,Shao W,Alvord WG,Hughes SH.HIV-1复制单周期中突变的性质,位置和频率。J 维罗尔。2010 华侨城;84(19):9864–78.密码:20660205
查看文章PubMed/NCBI谷歌学术搜索
3.Lee HY,Perelson AS,Park S-C,Leitner T.宿主内HIV-1准物种进化与疾病进展之间的动态相关性。公共科学图书馆计算生物学. 2008 12 月 12;4(12):e1000240.密码:19079613
查看文章PubMed/NCBI谷歌学术搜索
4.梅勒斯 JW、里纳尔多 CR、古普塔 P、怀特 RM、托德 JA、金斯利洛杉矶。HIV-1 感染的预后由血浆中的病毒数量预测。科学。1996 5 月 24;272(5265):1167–70.密码:8638160
查看文章PubMed/NCBI谷歌学术搜索
5.Blanquart F, Wymant C, Cornelissen M, Gall A, Bakker M, Bezemer D, et al.病毒遗传变异占欧洲HIV-1设定点病毒载量变异性的三分之一。公共科学图书馆生物学. 2017 6月 12;15(6):e2001855.密码:28604782
查看文章PubMed/NCBI谷歌学术搜索
6.扎尼尼 F, 布罗丁 J, 特博 L, 兰兹 C, 布拉特 G, 阿尔伯特 J, 等.患者体内HIV-1进化的群体基因组学。电子生活。2015 12 月 11;4.邮编:26652000
查看文章PubMed/NCBI谷歌学术搜索
7.萨莱米·人类免疫缺陷病毒1型的宿主内进化和种群动态:系统发育视角。感染代表 2013 6 月 6;5(增刊 1):e3.密码:24470967
查看文章PubMed/NCBI谷歌学术搜索
8.赵 L, 伊林沃思 CJR.宿主内病毒多样性的测量需要一个无偏的多样性指标。病毒埃沃尔。2019 1 月 30;5(1):vey041.pmid:30723551
查看文章PubMed/NCBI谷歌学术搜索
9.劳林·宿主内病毒多样性:病毒进化的窗口。安努·维罗尔。2020 9 月 29;7(1):63–81.密码:32511081
查看文章PubMed/NCBI谷歌学术搜索
10.Hightower GK, Wong JK, Letendre SL, Umlauf AA, Ellis RJ, Ignacio CC, et al.较高的HIV-1遗传多样性与艾滋病和神经心理损伤有关。病毒学。2012 11 月 25;433(2):498–505.密码:22999095
查看文章PubMed/NCBI谷歌学术搜索
11.Jost L. 熵和多样性。奥伊科斯。2006 5 月;113(2):363–75.
查看文章谷歌学术搜索
12.Palumbo PJ, Wilson EA, Piwowar-Manning E, McCauley M, Gamble T, Kumwenda N, et al.早期抗逆转录病毒治疗中HIV多样性与病毒学结果的关联:HPTN 052。公共图书馆一号。2017 5 月 8;12(5):e0177281.密码:28481902
查看文章PubMed/NCBI谷歌学术搜索
13.Lemey P, Kosakovsky Pond SL, Drummond AJ, Pybus OG, Shapiro B, Barroso H, et al.同义替代率预测HIV疾病的进展,这是潜在复制动态的结果。公共科学图书馆计算生物学. 2007 2 月 16;3(2):e29.pmid:17305421
查看文章PubMed/NCBI谷歌学术搜索
14.Silver N, Paynter M, McAllister G, Atchley M, Sayir C, Short J, et al.在验证基于深度测序的 HIV-1 基因分型和嗜性测定后,英国少数 HIV-1 耐药变异的表征。艾滋病研究2018 11 月 8;15(1):18.密码:30409215
查看文章PubMed/NCBI谷歌学术搜索
15.贝洛 G, 卡萨多 C, 桑多尼斯五世, 阿尔瓦罗-西富恩特斯 T, 多斯桑托斯 CAR, 加西亚 S, 等.维持宿主内 HIV 1 型进化的血浆病毒载量阈值。艾滋病研究嗡逆转录病毒。2007 华侨城;23(10):1242–50.密码:17961111
查看文章PubMed/NCBI谷歌学术搜索
16.Wolinsky SM, Korber BT, Neumann AU, Daniels M, Kunstman KJ, Whetsell AJ, et al.人类免疫缺陷病毒1型在感染自然过程中的适应性进化。科学。1996 4 月 26;272(5261):537–42.密码:8614801
查看文章PubMed/NCBI谷歌学术搜索
17.Esbj?rnsson J, M?nsson F, Kvist A, Isberg P-E, Nowroozalizadeh S, Biague AJ, et al.通过同时期HIV-2感染抑制HIV-1疾病进展。工程医学杂志 2012 7 月 19;367(3):224–32.密码:22808957
查看文章PubMed/NCBI谷歌学术搜索
18.Shankarappa R, Margolick JB, Gange SJ, Rodrigo AG, Upchurch D, Farzadegan H, et al.与人类免疫缺陷病毒 1 型感染进展相关的一致病毒进化变化。J 维罗尔。1999 12 月;73(12):10489–502.密码:10559367
查看文章PubMed/NCBI谷歌学术搜索
19.诺瓦克马,安德森RM,麦克莱恩AR,沃尔夫斯TF,古德斯密特J,梅RM.抗原多样性阈值和艾滋病的发展。科学。1991 11 月 15;254(5034):963–9.pmid:1683006
查看文章PubMed/NCBI谷歌学术搜索
20.特洛耶 RM, 柯林斯 KR, 阿布拉哈 A, 弗劳伦多夫 E, 摩尔 DM, 克里赞 RW, 等.疾病进展过程中人类免疫缺陷病毒1型适应性和遗传多样性的变化。J 维罗尔。2005;79(14):9006–18.密码:15994794
查看文章PubMed/NCBI谷歌学术搜索
21.Markham RB, Wang WC, Weisstein AE, Wang Z, Munoz A, Templeton A, et al.具有不同CD4 T细胞下降速率的个体的HIV-1进化模式。美国国家科学院院刊。1998 华侨城 13;95(21):12568–73.密码:9770526
查看文章PubMed/NCBI谷歌学术搜索
22.Baxter JD, Dunn D, Tostevin A, Marvig RL, Bennedbaek M, Cozzi-Lepri A, et al.使用二代测序的大型国际队列中传播的HIV-1耐药性:抗逆转录病毒治疗战略时机(START)研究的结果。艾滋病医学 2020 12月 25;
查看文章谷歌学术搜索
23.INSIGHT START Study Group, Lundgren JD, Babiker AG, Gordin F, Emery S, Grund B, et al.在早期无症状HIV感染中开始抗逆转录病毒治疗。工程医学杂志 2015 8 月 27;373(9):795–807.pmid:26192873
查看文章PubMed/NCBI谷歌学术搜索
24.Gabrielaite M, Bennedb?k M, Zucco AG, Ekenberg C, Murray DD, Kan VL, et al.人类免疫型通过病毒表位特异性对病毒基因型进行选择。J 感染 2021 年 5 月 11 日;密码:33974707
查看文章PubMed/NCBI谷歌学术搜索
25.Bennedb?k M, Zhukova A, Tang M-He, Bennet J, Munderi P, Ruxrungtham K, et al.HIV-1的系统发育分析显示频繁的跨国传播和当地人口扩张。病毒埃沃尔。2021 6月 9;密码:34532059
查看文章PubMed/NCBI谷歌学术搜索
26.Gabrielaite M, Bennedb?k M, Rasmussen MS, Kan V, Furrer H, Flisiak R, et al.Dryad 数据集 2022 https://doi.org/10.5061/dryad.6djh9w13s 对初治 HIV 感染者的病毒基因组进行深度测序显示宿主内遗传多样性与病毒载量呈正相关
查看文章谷歌学术搜索
27.Verbist BMP, Thys K, Reumers J, Wetzels Y, Van der Borght K, Talloen W, et al.VirVarSeq:一种低频病毒变异检测管道,用于使用自适应碱基调用精度过滤的 Illumina 测序。生物信息学。2015 1 月 1;31(1):94–101.密码:25178459
查看文章PubMed/NCBI谷歌学术搜索
28.Pineda-Pe?a A-C, Faria NR, Imbrechts S, Libin P, Abecasis AB, Deforche K, et al.用于临床和监测目的的HIV-1基因序列的自动分型:新REGA版本3和其他七种工具的性能评估。感染基因埃沃尔。2013 10 月;19:337–48.密码:23660484
查看文章PubMed/NCBI谷歌学术搜索
29.R:统计计算的R项目[互联网]。[引用日期2020年2月10日]。可用: https://www.r-project.org/
30.Patterson N, Price AL, Reich D. 人口结构和特征分析。公共科学图书馆热内特。2006 12 月;2(12):e190.密码:17194218
查看文章PubMed/NCBI谷歌学术搜索
31.最佳定义的CTL/CD8+表位摘要[互联网]。[引用日期2021-3月8日]。可用: https://www.hiv.lanl.gov/content/immunology/tables/optimal_ctl_summary.html
32.Sharma S, Schlusser KE, de la Torre P, Tambussi G, Draenert R, Pinto AN, et al.与延迟抗逆转录病毒治疗相比,立即抗逆转录病毒治疗对早期 HIV 感染中 CD4+ 细胞计数恢复的益处。艾滋病。2019 7 月 1;33(8):1335–44.密码:31157663
查看文章PubMed/NCBI谷歌学术搜索
33.HIV突变数据库[互联网]。[引用日期2021年3月4日]。可用: https://hivmut.org/index.php?page=structure&uniprot=P04585
34.Bartha I, Carlson JM, Brumme CJ, McLaren PJ, Brumme ZL, John M, et al.人类遗传变异、HIV-1 序列多样性和病毒控制之间关联的基因组到基因组分析。电子生活。2013 10 月 29;2:e01123.密码:24171102
查看文章PubMed/NCBI谷歌学术搜索
35.Touloumi G, Pantazis N, Babiker AG, Walker SA, Katsarou O, Karafoulidou A, et al.1864 名已知 HIV-1 血清转换日期的个体在开始抗逆转录病毒治疗前 HIV RNA 水平的差异。艾滋病。2004 8 月 20;18(12):1697–705.密码:15280781
查看文章PubMed/NCBI谷歌学术搜索
36.Liu MKP, Hawkins N, Ritchie AJ, Ganusov VV, Whale V, Brackenridge S, et al. 垂直T细胞免疫优势和表位熵决定了HIV-1逃逸。J 临床投资。2013 1 月;123(1):380–93.pmid:23221345
查看文章PubMed/NCBI谷歌学术搜索
37.Shriner D, Liu Y, Nickle DC, Mullins JI.慢性感染期间宿主内HIV-1遗传多样性的进化。演化。2006 6 月;60(6):1165–76.密码:16892967
查看文章PubMed/NCBI谷歌学术搜索
38.Fischer W, Ganusov VV, Giorgi EE, Hraber PT, Keele BF, Leitner T, et al.通过超深度测序揭示的单个HIV-1基因组的传播和早期免疫逃逸的动力学。公共图书馆一号。2010 8 月 20;5(8):e12303.密码:20808830
查看文章PubMed/NCBI谷歌学术搜索
39.卡里乌基 SM, 塞尔霍斯特 P, 阿里恩 KK, 多尔夫曼 小HIV-1传播瓶颈。逆转录病毒学。2017 12 月;14(1):22.密码:28335782
查看文章PubMed/NCBI谷歌学术搜索
40.Joseph SB,Swanstrom R,Kashuba ADM,Cohen MS.HIV-1传播的瓶颈:创始人病毒研究的见解。国家微生物学。2015 7 月;13(7):414–25.密码:26052661
查看文章PubMed/NCBI谷歌学术搜索
41.Geskus RB, Prins M, Hubert J-B, Miedema F, Berkhout B, Rouzioux C, et al.重新审视了HIV RNA设定点理论。逆转录病毒学。2007 9 月 21;4:65.密码:17888148
查看文章PubMed/NCBI谷歌学术搜索
42.Kafando A, Fournier E, Serhir B, Martineau C, Doualla-Bell F, Sangaré MN, et al. 基于HIV-1包膜序列的多样性措施,用于识别最近的感染。公共图书馆一号。2017 12 月 28;12(12):e0189999.密码:29284009
查看文章PubMed/NCBI谷歌学术搜索