《电力电子技术》核心期刊杂志-厦门论文发表
系统基因组学方法揭示了RSV严重程度的分子关联
马修·麦考尔,楚金一 ,王璐,劳伦·贝努德,茱莉·塔卡尔,安东尼?科贝特,珍妮·霍尔登-威尔茨,克里斯托弗·斯劳恩怀特,亚历克斯·格里尔,史蒂文·吉尔,安·R·福利,大卫?托普汉姆,玛丽·卡塞塔,[ ... ],托马斯·马里亚尼[ 查看全部 ]
出版日期: 2021年12月28日
目录
抽象
呼吸道合胞病毒(RSV)感染每年导致数百万人住院治疗和数千人死亡。适应性和先天免疫应答的变化似乎与RSV的严重程度有关。为了研究宿主对婴儿RSV感染的反应,我们进行了RSV病理生理学的系统级研究,结合了外周先天性和适应性免疫系统以及气道上皮和微生物群的高通量测量。我们实现了一种基于多层主成分分析,惩罚回归和特征权重反向传播的新型多组学数据集成方法,这使我们能够识别与RSV严重程度相关的细胞途径。在气道和免疫细胞中,我们发现RSV严重程度与控制Th17和急性期反应信号传导的途径的激活以及B细胞受体信号传导的抑制之间存在关联。体液和粘膜对 RSV 的反应失调可能在确定疾病严重程度方面起关键作用。
作者简介
本文提出了一种了解对呼吸道合胞病毒(RSV)的局部分子反应以及临床结果的系统级相关性的新方法。为此,我们开发了一种新颖的统计方法,能够整合表征宿主气道微博塔的高维分子数据以及免疫和鼻腔基因表达。我们表明,与任何单一数据类型相比,这种综合方法有助于在估计临床结果方面具有卓越的性能。使用这种方法,我们确定了与RSV严重程度相关的细胞类型特异性和共享生物标志物以及调节途径。具体而言,我们确定了RSV严重程度,控制Th17的途径的激活以及B细胞受体信号传导的抑制之间的关联,这些信号传导存在于感染气道的部位和外周免疫细胞中。这些结果可以指导未来的努力,以确定生物标志物,以识别或预测婴儿RSV感染后的疾病严重程度。它们也可能作为生物标志物,为未来干预措施(例如,治疗)的疗效提供信息,或采取预防措施来抑制严重疾病的发生率(例如,疫苗)。
数字
Fig 4Fig 5Fig 6Fig 1Fig 2Fig 3Fig 4Fig 5Fig 6Fig 1Fig 2Fig 3
引文:McCall MN,Chu C-Y,Wang L,Benoodt L,Thakar J,Corbett A等人(2021)系统基因组学方法揭示了RSV严重程度的分子关联。PLoS Comput Biol 17(12):e1009617。https://doi.org/10.1371/journal.pcbi.1009617
编辑 器:Anders Wallqvist,美国陆军医学研究和物资司令部:美国陆军医学研究与发展司令部,美国
收到:三月 25, 2021;接受:十一月5,2021;发表:十二月 28, 2021
版权所有:? 2021 McCall et al.这是一篇根据知识共享署名许可协议条款分发的开放获取文章,该许可证允许在任何媒体上不受限制地使用,分发和复制,前提是注明原始作者和来源。
数据可用性:这些研究的完整分子和微生物群数据可在dbGaP(phs001201.v2.p1)中找到。所有代码和辅助数据都可以在GitHub上找到:https://github.com/mccallm/aspires。
资金:该项目由国家过敏和传染病研究所,美国国立卫生研究院,卫生与公众服务部根据合同号资助。HHSN272201200005C (DJT),罗切斯特大学医学院和牙科科学咨询委员会孵化器赠款(TJM,XQ,EEW)和罗切斯特大学临床与转化科学研究所中心授予号UL1 TR002001(Zand / Bennet)。资助者在研究设计,数据收集和分析,出版决定或手稿准备方面没有任何作用。
相互竞争的利益:我已经阅读了该期刊的政策,本手稿的作者有以下相互竞争的利益:ARF目前从默克夏普和多姆,辉瑞,杨森,阿斯特拉泽内卡和BioFire获得资金,并从Novavax获得DSMB的个人费用。其他作者没有任何竞争利益可报告。
介绍
呼吸道合胞病毒(RSV)是肺病毒科的一种阴性链RNA病毒,是影响所有年龄段人群,尤其是新生儿的呼吸道疾病的主要原因[1-3]。虽然大多数感染相对较轻,但RSV仍然是发达国家和发展中国家婴幼儿肺炎和重症肺炎住院的最常见原因[4–6]。在美国,一半的新生儿在第一个冬天被感染,其中1-3%住院,4-7%在急诊室就诊,10-16%在医生办公室就诊[7]。
许多明确定义的宿主因素使婴儿易患重症,包括早产、先天性心脏病和神经肌肉疾病以及母源性中和抗体水平低[3,8]。最近的研究还发现细胞因子和趋化因子基因的遗传多态性,呼吸道先天干扰素反应的改变,有利于Th2和Th17偏倚的T细胞反应,以及鼻微生物群的组成与更严重的疾病有关[8–15]。虽然这些因素中的每一个都提供了对幼儿RSV感染的复杂性质的见解,但它们通常已被独立分析;因此,很难评估它们的相互作用和对疾病结果的相对重要性。
我们小组和其他人之前对RSV的多组学分析证明了综合分析的潜力,以进一步了解RSV疾病进展和严重程度背后的生物学机制。为了解决先前研究的局限性,我们设计了一项系统级研究,研究RSV病理生理学,该研究针对精确定义的低风险新生儿群体,具有全谱疾病严重程度[16]。我们研究了CD4 +,CD8 +和CD19 +细胞的纯化群体,因为混合PBMC已被广泛用于呼吸道感染疾病严重程度的研究[9,11,17–19]。我们推断,局部气道反应将是定义疾病严重程度的关键组成部分,有助于宿主控制或定位感染的能力[20]。我们还纳入了来自鼻微生物群的数据,因为最近的研究表明,病毒感染时的定植可能会显着影响疾病的严重程度[9]。
本研究建立在这些数据范围和为分析这些数据而开发的方法的这些先前研究的基础上。通过对这些高通量数据与临床RSV严重程度之间的联系进行建模,我们能够重建不同数据类型之间的复杂关系,并展示综合分析的潜力,以确定与RSV严重程度相关的共享和细胞类型特定的细胞途径。
结果
本手稿中提供的数据是作为评估预测婴儿呼吸道合胞病毒影响和严重程度(AsPIRES)研究的一部分而生成的,该研究旨在确定与RSV疾病严重程度相关的宿主,病毒和环境因素[21]。共招募了139名RT-PCR确诊RSV疾病的婴儿,其中134名婴儿的组学数据质量足以进行分析(该队列的人口统计信息显示在S1文本的表A中)。收集静脉血,鼻微生物群和鼻上皮细胞样本进行高通量分子分析(图1)。使用全球呼吸系统严重程度评分(GRSS)[22]测量疾病严重程度,该评分使用加权评分中的九个临床变量量化了原发性RSV疾病严重程度的全谱。我们采用一种新颖的方法来整合和分析五种高维组学数据模式:鼻上皮转录组,来自外周血的CD4,CD8和CD19细胞的转录组以及鼻微生物组。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 1.研究设计概述。
鼻上皮细胞转录组和鼻微生物组的测量是从婴儿的鼻拭子中产生的。从血液样本中获得外周免疫细胞(CD4,CD8和CD19)的测量结果。这些测量结果随后被整合并与RSV疾病严重程度(GRSS)相关联。
https://doi.org/10.1371/journal.pcbi.1009617.g001
集成方法开发
对单个数据类型的初步探索性分析发现,大多数个体特征(例如在CD4细胞中测量的单个基因)与GRSS的相关性相对较弱(中位数绝对相关性0.08-0.11)。此外,我们观察到数据类型内的特征之间存在很强的相关性,这是转录组学数据的典型特征。这两个观察结果促使我们使用主成分分析(PCA)来聚合许多"弱特征",以期确定每种数据类型的几个关键潜在因素。对每种数据类型执行PCA的扫描图显示,少量主成分(PC)解释了每种数据类型的绝大多数变化(S1图)。这进一步支持了我们对每种数据类型中特征之间强相关性的观察。此外,我们在每种数据类型生成的PC上应用了辅助PCA,并发现了数据类型之间的共享差异。具体而言,辅助 PC 包含来自不同数据类型的主 PC,辅助 PC 的数量远远少于主 PC 的数量。这些初步分析激发了我们在本文中描述的数据集成方法。
由于实际限制,只有一小部分受试者(106个中的23个)具有所有五种高维数据类型(S2图)。因此,我们决定对组学数据的几种组合进行综合分析。选择第一组数据模式来询问RSV严重程度的三种不同推定决定因素,鼻上皮转录组(NT),鼻微生物组(NM)和在外周血CD4细胞(CD4)中测量的适应性免疫应答。这些数据适用于61名受试者。第二个数据整合侧重于适应性和先天免疫反应在RSV严重程度中的集体作用,在从外周血中分离的CD4,CD8和CD19细胞中测量。这些数据适用于35名受试者。这些子队列的人口统计信息显示在S1 文本中的表 B 和 C 中。
我们提出了五种基于多层PCA和基于正则化回归的变量选择的相关综合分析方法(图2),详见材料与方法。基于广泛的交叉验证(CV)实验,我们发现转录组学数据的PCA,随后是转录组学PC和鼻微生物组数据的单个操作分类单元(OTO)的整合弹性网回归模型(图2,方法1)实现了比其他方法更好的GRSS预测准确性(S1文本中的表D)。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 2.多组学数据集成的五种潜在方法。
方法在处理鼻微生物组数据(OTU),PCA水平的数量以及整合发生的阶段方面有所不同。这里浅紫色圆圈代表鼻腔基因表达谱(NT),浅蓝色圆圈代表CD4基因表达,金色圆圈代表鼻微生物组丰度数据(OTU)。深蓝色是从原始要素计算的主要组件 (PC)。大的白色圆圈代表GRSS,这是本研究感兴趣的临床变量。在我们的评估中,最左边的模型在交叉验证误差方面优于其他模型。
https://doi.org/10.1371/journal.pcbi.1009617.g002
我们还对单个数据类型应用了类似的方法,即初始基于PCA的降维,然后进行正则化回归,并发现积分模型在交叉验证的预测准确性方面明显优于单数据类型模型(图3)。具体而言,虽然集成和单数据类型模型都是近似无偏的,但集成模型的均方误差(MSE)要小得多。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 3.不同数据模式的集成改进了GRSS的预测。
左侧的面板显示了集成鼻上皮转录组、外周血 CD4 转录组和鼻微生物组的模型的预测和观察到的 GRSS 之间的差异,以及仅使用其中一种数据类型的模型。同样,右侧的面板将一个模型与仅使用其中一种数据类型的模型进行了比较,该模型将外周血中测量的3种免疫细胞类型的转录组与模型进行了比较。在这两种情况下,集成都会提高 GRSS 预测的精度。
模型应用和解释
我们之前报道了RSV感染婴儿临床疾病严重程度的基因表达相关性[11,23]。为了获得进一步的见解,我们通过整合来自体液和粘膜区室的无偏倚,全面的基因表达数据,如上所述,生成了多个"模型"。我们假设"系统级"分析方法将为疾病病理生理学提供独特的生物学见解。我们首先关注从急性疾病期间收集的外周血中分选的CD4 T细胞中特异性表征的体液反应,在包含来自这些细胞的基因表达数据的两个模型中(图4)。数据整合后,使用RSV相关疾病严重程度作为结果,单个基因表达的建模权重(参见S1文本中的"特征权重计算"以获取更多详细信息)显示在词云中(左上角),未加权的基因表达值显示在热图中(左下角)。从单词云中可以明显看出,两个模型之间单个基因的权重明显不同,并且由于每个模型中包含的队列子集不同,因此可以预期。有趣的是,CD101是两种模型中权重最高(绝对值0.0048)的基因之一,作为CD3诱导的T细胞增殖的抑制剂发挥作用。此外,这些综合模型中的未加权基因表达在轻度和重度受试者之间没有根本区别。这些观察结果支持了我们新的综合建模方法所衍生的新颖而独特的见解,该方法用于识别疾病严重程度的基因表达相关性。
thumbnail Download:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 5.整合模型中与临床严重程度相关的鼻上皮基因权重、表达、通路、转录因子和上游调节因子。
显示CD4,鼻上皮细胞和微生物群(CM)的整合模型。集成模型生成的权重显示在世界云中。字的大小代表基因权重的绝对值。M1字云由绝对权重大于0.0003的基因组成。基因表达是通过单变量分析选择的993个基因的归一化表达水平;行表示基因,列表示样本。红色表示较高的表情,蓝色表示低/无表达,绿色表示全局RSV严重程度评分(GRSS),软橙色表示轻度表型,石灰绿色表示严重表型,紫色表示负重,橄榄色表示正重。使用超几何测试鉴定与鼻上皮细胞严重程度相关的转录因子。显示四个转录因子,其中p值小于0.05。独创性通路分析(IPA)用于鉴定与鼻上皮细胞严重程度相关的基因所代表的规范通路和上游调节因子。显示了30条途径和上游调节器,其中Fisher的精确测试p值小于0.05。红色和蓝色分别表示预测的通路激活增加或减少(激活 z 评分)。
https://doi.org/10.1371/journal.pcbi.1009617.g005
接下来,我们完成了综合模型(CM)鼻腔基因表达权重的通路水平分析(图5,中心和S3–S12)。分析发现,由视黄酸相关(例如,LXR / RXR和PPAR / RXR信号传导)和p53相关(例如,NF-kappaB)信号传导驱动的多种途径的减少与严重疾病相关。对这些基因和途径的进一步分析确定了RXR和REL / A转录因子调控变化的重要证据(p值<0.05)(图5,右上)。有趣的是,该分析表明,专注于免疫系统调节的途径激活增加也与严重疾病有关;特别是那些与Th2和Th17 CD4 T细胞相关的细胞。值得注意的是,上游调节器分析表明这可能是由于IL4和IL17A的表达增加(图5,右下角)。同样,对于CD4 T细胞数据,我们使用这种综合建模方法来识别粘膜和体液反应之间病理生理学相关相互作用的证据的能力支持其方法学有效性。
最后,我们评估了粘膜和体液隔室中独特而一致的反应,如我们的综合模型(CM和LM)所示。对来自CD8 T细胞的重量的基于途径的分析表明,细胞毒性反应的独特激活,包括与经典CD8 T细胞功能相关的反应与严重疾病有关。CD8 T细胞在重症疾病中也表现出TGFb和TNFR信号传导的独特激活。相反,对来自CD19 B细胞的权重的分析表明调节了多种交替途径。CD19 B细胞显示出PLC独特激活和PI3K / AKT信号传导独特抑制等的证据。基于通路的权重分析还确定了许多在所有淋巴细胞(例如CD4,CD8,CD19)中保守且与疾病严重程度相关的反应。一致激活的途径表明氧化磷酸化,核苷酸挽救和相扑作用的广泛增加。显著抑制的通路表明淋巴细胞增殖、活化(例如 iCOS 和 NFAT)和 surtuin 信号传导的广泛减少。最后,我们寻找不仅在淋巴细胞中,而且在所有体液和粘膜数据集中一致鉴定的途径(图6)。该分析表明,控制Th17和急性期反应信号传导的途径的激活,以及对B细胞受体信号传导的一致抑制,与所研究的所有细胞类型的疾病严重程度一致相关。
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 6.淋巴细胞和鼻上皮细胞整合模型中常见和独特的途径。
Sankey图显示了CD4整合模型,鼻上皮细胞和微生物群(M1)以及淋巴细胞模型(M4)的淋巴细胞和鼻上皮细胞之间的常见和独特途径。独创性途径分析(IPA)用于鉴定由淋巴细胞和鼻上皮细胞中严重程度相关的基因代表的规范途径。路径显示费舍尔的确切测试p值小于0.05。红色和蓝色分别表示预测的通路激活增加或减少(激活 z 评分)。流条的宽度与激活 z 评分的绝对值成正比。
https://doi.org/10.1371/journal.pcbi.1009617.g006
在我们的研究中还考虑了两种替代整合模型:一种整合CD4和CD19淋巴细胞(S13-S16无花果),另一种整合鼻上皮细胞与CD4和CD19淋巴细胞(S17-S22无花果)。这些额外的模型为每种转录组学数据类型产生了相似的通路水平结果,这表明我们的数据集成和分析方法具有一定程度的稳健性,并支持我们决定专注于鼻上皮细胞,鼻微生物群和CD4淋巴细胞(CM)的综合模型以及专注于三种淋巴细胞类型(LM)的模型。
讨论
总之,我们对婴儿RSV感染进行了一项多组学研究。我们证明,多层统计学习框架比可比较的单层方法更擅长预测疾病严重程度;并整合多个组学数据集为我们提供了比从任何单个数据集构建的预测因子更好的疾病严重程度预测准确性。此外,基于训练有素的稀疏线性预测因子,我们能够通过定量权重评估单个基因/微生物的贡献,这有助于对这些预测模型的生物学解释。
以前的研究,包括我们自己的研究,利用对单一样本类型(如全血,纯化的T细胞或鼻腔分泌物)的转录组学分析来研究RSV疾病的发病机制。这些分析发现疾病严重程度增加与T和B细胞抑制,全身性Th2偏斜T细胞反应的证据,全身和局部干扰素反应的改变以及局部微生物组对这些反应的潜在影响之间存在关联。在目前的工作中,通过将来自外周血和呼吸上皮的多种细胞类型的基因表达数据与上呼吸道的复杂微生物组相结合,我们证实了与RSV疾病严重程度相关的免疫谱的失调。具体而言,结果表明Th2和Th17的活化以及对Th1途径的抑制主导了T细胞的反应。此外,有证据表明严重RSV婴儿的气道中存在B细胞抑制。结果还表明,纳入微生物组,特别是流感嗜血杆菌,对于了解幼儿RSV疾病发病机制的完整情况提供了信息。因为我们的微生物组分析没有发现肺炎链球菌,我们无法确认它的影响。如结果所述,我们的分析确定了许多在感染期间被激活或抑制的严重程度相关途径,特别是那些表明免疫抑制的途径。如图5所示,气道细胞对这种抑制有重要贡献。气道上皮细胞表达鉴定BTN2A2是一种有影响力的基因,在抑制CD4和CD8细胞以及干扰素抑制方面具有重要意义。
这项研究有几个值得注意的局限性。首先,由于研究的复杂性,招募RSV婴儿的挑战以及需要多次访问以获得样本,样本量受到限制。在通路和转录因子分析中,我们使用p值阈值0.05评估统计学意义,而无需对多次测试进行调整;因此,不应将这些结果视为确定性结果。导致样本量小的相同因素也导致了第二个限制:某些参与者的某些组学数据类型的潜在非随机缺失。然而,我们认为后一个限制代表了未来多组学数据集成方法开发的机会。其次,临床基因组研究的一个共同局限性是样本是随着时间的推移而收集的,这有可能引入技术变异。第三,在特定时间点采集样本;因此,有可能没有捕获一些不是时间近端的细胞功能变化。
由于组学数据的高通量特性,可能存在数千个可能与生物终点相关的特征。此外,这些组学数据之间存在着天文数字般的大量可能的相互依存关系。因此,我们认为,像我们这样的多组学研究中最根本的挑战是以合理的方式降低统计模型的复杂性,从而消除大多数虚假的相关性,同时保留信息关系的主要模式。
最后但并非最不重要的一点是,我们相信我们提出的方法比那些基于深度神经网络的机器学习算法具有更好的可解释性。事实上,这两种方法在架构上有一个共同点,即两者都是多层前馈系统(见图2)。由于有意识地选择使用线性激活函数(通过PCA)和线性输出函数(通过glmnet回归),我们能够设计一种多层反向传播算法,将输出层的权重(即GRSS的训练预测器中的线性系数)转换为输入层的数学等效权重,即单个基因和微生物。从某种意义上说,特定重量的绝对值代表了该基因/微生物在预测GRSS方面的贡献。我们根据这些权重进行了基因集富集分析,发现了细胞类型特异性和共同的严重程度相关生物学途径。相比之下,在具有非线性激活函数的前馈神经网络中,通常不可能获得输出层和输入层之间的这种直接关系,这就是为什么这些算法有时被称为"黑匣子方法"的原因。
可以说,我们的综合分析管道中的几个组件可能会被其他更专业的方法所取代。例如,我们可以考虑概率PCA[25]或稀疏PCA[26],而不是使用标准PCA。由于使用了类似脊的正则化项,前者对异常值和缺失值更强;而后者不仅比标准PCA更一致,"大p,小n"数据,而且具有更好的可解释性,因为它可以产生稀疏加载分数。此外,还有许多最近开发的PCA变体在各种情况下都是有利的,如[27]中总结的那样。
尽管具有优点,但这些先进的降维方法具有以下特点:(a) 计算要求更高;(b) 降低尺寸;(c) 降低尺寸;(b)取决于可能必须通过交叉验证选择的调优参数,这增加了更多的计算成本和分析中的不确定性。未来,我们计划系统地评估不同降维策略对第二阶段综合分析的影响,并在必要时进行算法调整,以提高其在高通量数据分析中的计算效率。
另一个潜在的未来研究方向是设计更好的统计方法,针对像我们这样的"完全匹配"数据进行优化,其中所有受试者都没有所有类型的数据。事实上,如S2图所示,只有23个受试者拥有所有五种类型的高通量数据,因此我们决定分别为几种数据组合构建积分模型。未来开发高效、公正的高维插补方法,可以让我们充分整合所有可用数据,提高预测模型的准确性。
我们在本文中提出的是一种整体方法,用于了解婴儿期对RSV感染的反应,以及临床结果的系统级相关性。这些数据为准确和灵敏地识别与疾病严重程度相关的分子变化提供了更好的解决方案,并且还揭示了使用不同的生物标本(例如气道,T细胞,B细胞等)可以轻松检测到的特定和稳健的变化。这些新数据可以指导未来的努力,以确定敏感和特异性生物标志物,以识别或预测婴儿RSV感染后的结果。它们也可能作为生物标志物,为未来干预措施(例如,治疗)的疗效提供信息,或采取预防措施来抑制严重疾病的发生率(例如,疫苗)。例如,我们的方法可能用于量化对新型RSV疫苗的反应,无论是减毒活疫苗还是亚单位疫苗,以确保它们不会模仿可能导致病理状态的反应[28,29]。
材料和方法
道德声明
罗切斯特大学和罗切斯特总医院的研究对象审查委员会批准了这项研究(IRB#42632),所有父母都提供了书面知情同意书。
研究总体和样本收集
AsPIRES研究的完整描述已经发表[21]。研究对象审查委员会批准了这项研究,所有家庭都提供了知情同意。简而言之,在2012年至2015年的三个冬季,在纽约州罗切斯特市对三组以前健康的患有原发性RSV感染的足月婴儿进行了评估。在住院婴儿中发现了RSV感染,在急诊科或初级保健办公室因呼吸道症状而就诊的门诊患者,以及出生队列中的婴儿在家中前瞻性随访RSV感染。从这三组中,包括具有一系列RSV疾病严重程度的婴儿。
在三个时间点对婴儿进行评估:诊断时进行急性疾病访问,发病后约14天进行第二次访问,以及发病后28天恢复期访问。每次就诊时都记录症状,并进行体格检查。在第一次和第三次访问中,使用植绒拭子(Copan)从一个鼻孔中获取鼻腔标本进行微生物测试,对侧鼻孔进行洗鼻以去除粘液和碎片,然后使用第二个植绒拭子通过刷下鼻甲水平的粘膜来获得上皮细胞。每次就诊时收集静脉血(约2-3毫升)。RSV感染在诊断时通过定量逆转录聚合酶链反应(qRT-PCR)测定得到确认。
RSV疾病的严重程度使用全球呼吸严重程度评分(GRSS)进行测量,该评分使用9个加权临床变量(一般表现;存在喘息,啰音,退缩,发绀,嗜睡或空气流动不良;最大年龄调整呼吸频率;和最差房间 - 空气氧饱和度)计算,得分为1至10[22]。
核糖核酸加工
本研究使用了四种类型的RNA-seq数据:NT(鼻转录组),CD4,CD8和CD19。恢复鼻腔RNA的技术细节可以在[30]中找到。简而言之,在用盐水冲洗鼻孔以去除粘液和细胞碎片后,使用植绒拭子在鼻甲水平上恢复细胞。将拭子立即置于RNA稳定剂(RNAprotect,Qiagen,Germantown,MD)中并储存在4°C下。 通过0.45 uM膜过滤器过滤细胞。根据制造商的说明,使用AbsoluteRNA Miniprep试剂盒(安捷伦,圣克拉拉,CA)裂解和匀浆回收的细胞。
如前所述,CD4,CD8和CD19是从外周血中纯化的相应细胞群的mRNA表达谱[11,31]。具体地,将肝素化血液在室温下维持长达2小时,通过Ficoll-hypaque梯度分离外周血单核细胞,将流动分选为这三个细胞亚群,并储存在?20°C的RNA裂解缓冲液中。
对于所有四种类型的RNA-seq数据,使用NexteraXT文库试剂盒(Illumina,San Diego,CA)构建测序文库,然后在Illumina HiSeq2500平台上进行测序。使用STARv2.5将序列与hg19的人类基因组版本对齐,用HTSeq计数,并通过每百万次映射读取(FPKM)每千碱基转录本的片段进行归一化。在随后的分析中,从产量非常低或与其他样品的相关性非常低的一小部分样品中移除(S1文本中的表E),我们应用了基于平均表达值和四分位数间范围(IQR)的非特异性过滤来鉴定基因子集以进行进一步研究。我们在基因水平上对潜在的异常值进行了筛选,然后通过Pearson相关检验测试了基因表达与GRSS之间的相关性。对于每种类型的转录组学数据,我们能够选择数百个0.05显著性水平的潜在信息特征,如S1文本中的表F所示。有关数据预处理的其他技术详细信息,请参阅S1 文本。
微生物组加工
从鼻拭子标本中提取,扩增和测序细菌16 S rRNA,并使用所得数据确定分类组成,即现有操作分类单元(OTU)的相对丰度。简而言之,V3-V4超可变区域被靶向扩增,并根据配对的末端2×300 bp读取协议使用Illumina MiSeq平台进行测序。使用微生物生态学定量洞察(QIIME)软件包[32,33]进行了初步读取处理和质量控制,并使用USEARCH和GreenGenes参考数据库[34]完成了封闭参考OTU采摘。最初的微生物组数据包含104个样本中148个不同OTU在属级的信息。其中,只有15属的半数以上(n=52)的受试者具有非零丰度水平。这些特征被选择用于综合分析。它们的完整列表在S1文本中的表G中提供。
数据集成方法
我们考虑了五种数据集成方法,所有这些方法都有三个共同的组成部分:单层或多层降维,从各种类型的数据中选择一组可管理的特征,以及弹性网络正则化回归,将这些特征整合到一个加权分数中,以预测我们的主要结果变量GRSS。弹性网络正则化回归同时使用 L1(LASSO) 和 L2(脊)惩罚产生稀疏线性预测模型,并且已知对于高维数据具有数值稳定性。它由 R 包 glmnet [35] 实现。正则化参数是通过初始的十倍交叉验证选择的。获得稀疏回归模型后,通过基于 OLS 的过程重新估计线性系数,以提高建模拟合的准确性。该参数细化策略可以提高预测准确性,并广泛用于高通量数据分析[36]。
方法1分别对每个转录组学数据集进行主成分分析(PCA),然后将所得PC与GRSS惩罚回归模型中代表鼻微生物群的OTU一起使用。方法 2 对所有数据类型共同执行 PCA,然后在 GRSS 的惩罚回归模型中使用生成的 PC。方法3与方法1相同,只是在GRSS的惩罚回归模型之前添加了第二层PCA。方法4与方法1相同,只是鼻微生物群OTU也通过PCA进行降维。最后,方法5结合了方法3和4的添加,产生了完整的两层PCA。我们评估了这些方法产生的模型通过"剩一个"交叉验证来预测GRSS的能力。
权重分配和转录因子分析
根据设计,我们的积分模型中估计的线性系数是代表主成分重要性的权重,而不是原始数据中的特征,如基因和微生物。为了增强这些积分模型的可解释性,我们基于反向传播算法计算了每个原始特征的权重。有关此计算的详细信息,请参阅S1 文本中的"特征权重计算"。然后将这些权重用于转录因子分析。如前所述,鉴定了来自JASPER的hg19,mm10和rn6的保守结合位点,并将其映射到转录起始位点(TSS)周围的2 kb区域进行转录因子分析[37]。进行超几何测试以鉴定富集的结合位点[38,39]。在p值阈值0.05下评估统计学意义,而不对多次测试进行调整。
通路分析
被鉴定为与GRSS显着相关的基因随后被用于规范途径鉴定和使用独创性途径分析(QIAGEN硅谷,红木城,CAQiagen)进行上游调节因子分析。在通路分析中使用组合特征权重来增强结果,并与没有这些权重的结果进行比较。在p值阈值0.05下评估统计学意义,而不对多次测试进行调整。
支持信息
S1 文本 -
显示 1/24: pcbi.1009617.s001.docx
跳到无花果共享导航
下载
无花果共享
S1 文本。
补充材料和方法及表A-G。文本和表格描述了数据预处理和分析的详细信息以及研究队列的人口统计数据。
https://doi.org/10.1371/journal.pcbi.1009617.s001
(文档)
S1 图每个转录组数据集的螺旋体:CD4 细胞、CD8 细胞、CD19 细胞和鼻上皮细胞。
垂直线表示解释 70% 变异(虚线)或 80% 变异(实线)的主成分数。
https://doi.org/10.1371/journal.pcbi.1009617.s002
(TIFF)
S2 图不规则图显示了获得每种数据模态的受试者数量、这些集合之间的重叠以及GRSS在每个子集中的分布。
https://doi.org/10.1371/journal.pcbi.1009617.s003
(TIFF)
S3 图与综合模型(CM)的鼻上皮细胞临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和993个基因(IV)基因集定义的规范途径,这些基因的表达与临床严重程度相关。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s004
(TIFF)
S4 图与综合模型(CM)的CD4淋巴细胞的临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和一组具有与临床严重程度相关的表达的454个基因(IV)基因的子集定义的规范途径。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s005
(TIFF)
S5 图调节剂与鼻上皮细胞的临床严重程度相关的综合模型(CM)。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和993个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了使用 Fisher 精确检验的 p 值最低的 15 个调节器。
https://doi.org/10.1371/journal.pcbi.1009617.s006
(TIFF)
S6 图与CD4淋巴细胞临床严重程度相关的调节剂为综合模型(CM)。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和454个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s007
(TIFF)
S7 图与淋巴细胞模型(LM)的CD4淋巴细胞的临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和一组具有与临床严重程度相关的表达的454个基因(IV)基因的子集定义的规范途径。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s008
(TIFF)
S8 图与淋巴细胞模型(LM)的CD8细胞的临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和333个基因(IV)基因集定义的规范途径,这些基因与临床严重程度相关的表达。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s009
(TIFF)
S9 图与淋巴细胞模型(LM)的CD19细胞的临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和一组662个基因(IV)基因的子集定义的规范途径,这些基因的表达与临床严重程度相关。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s010
(TIFF)
S10 图调节因子与淋巴细胞模型(LM)的CD4细胞的临床严重程度相关。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和454个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s011
(TIFF)
S11 图与淋巴细胞模型(LM)的CD8细胞的临床严重程度相关的调节剂。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和333个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s012
(TIFF)
S12 图调节剂与淋巴细胞模型(LM)的CD19细胞的临床严重程度相关。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和662个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s013
(TIFF)
S13 图与CD4细胞中含有CD4和CD19淋巴细胞的整合模型的临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和一组具有与临床严重程度相关的表达的454个基因(IV)基因的子集定义的规范途径。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s014
(TIFF)
S14 图与CD19细胞中含有CD4和CD19淋巴细胞的整合模型的临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和一组662个基因(IV)基因的子集定义的规范途径,这些基因的表达与临床严重程度相关。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s015
(TIFF)
S15 图与CD4细胞中临床严重程度相关的调节剂是含有CD4和CD19淋巴细胞的整合模型。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和454个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s016
(TIFF)
S16 图与CD19细胞中临床严重程度相关的调节剂是含有CD4和CD19淋巴细胞的整合模型。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和662个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s017
(TIFF)
S17 图与含有NT,CD4和CD19细胞加鼻微生物群的整合模型的鼻上皮细胞的临床严重程度相关的生物学途径。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和993个基因(IV)基因集定义的规范途径,这些基因的表达与临床严重程度相关。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s018
(TIFF)
S18 图与CD4淋巴细胞的临床严重程度相关的生物学途径,包括NT,CD4和CD19细胞加鼻微生物群的整合模型。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和一组具有与临床严重程度相关的表达的454个基因(IV)基因的子集定义的规范途径。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s019
(TIFF)
S19 图与CD19淋巴细胞中临床严重程度相关的生物学途径,包括NT,CD4和CD19细胞加鼻微生物群的整合模型。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和一组662个基因(IV)基因的子集定义的规范途径,这些基因的表达与临床严重程度相关。显示的是使用Fisher精确检验的15个有效p值最低的途径。
https://doi.org/10.1371/journal.pcbi.1009617.s020
(TIFF)
S20 图与含有NT,CD4和CD19细胞加鼻微生物群的整合模型的鼻上皮细胞的临床严重程度相关的调节剂。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和993个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了使用 Fisher 精确检验的 p 值最低的 15 个调节器。
https://doi.org/10.1371/journal.pcbi.1009617.s021
(TIFF)
S21 图与CD4淋巴细胞中临床严重程度相关的调节因子,包含NT,CD4和CD19细胞加鼻微生物群的整合模型。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和454个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s022
(TIFF)
S22 图与CD19淋巴细胞中临床严重程度相关的调节因子,包含NT,CD4和CD19细胞加鼻微生物群的整合模型。
使用Ingenuity Pathway Analysis(IPA)鉴定由前200(I),第1四分位数(II),第2四分位数(III)和662个基因(IV)基因集定义的上游调节因子,这些基因的表达与临床严重程度相关。图中显示了 p 值最低的 15 个稳压器。
https://doi.org/10.1371/journal.pcbi.1009617.s023
(TIFF)
S23 图库准备中映射读取总数、注册年限和批次之间的关系。
映射读取的总数(以百万为单位)显示在y轴上,由文库制备批号分层;彩色框表示与每批对应的注册年份。
https://doi.org/10.1371/journal.pcbi.1009617.s024
(TIFF)
确认
作者要感谢AsPIRES团队在受试者招募和样本收集方面的重要帮助,以及UR基因组研究中心处理基因组样本。最后,我们感谢同意参加这些研究的患者和家属。
引用
1.Falsey AR, Hennessey PA, Formica MA, Cox C, Walsh EE.老年人和高危成人的呼吸道合胞病毒感染。2005;352(17):1749–59.Epub 格式 2005/04/29.pmid:15858184.
查看文章PubMed/NCBI谷歌学术搜索
2.Hall CB, Weinberg GA, Iwane MK, Blumkin AK, Edwards KM, Staat MA, et al.幼儿呼吸道合胞病毒感染的负担。新英格兰医学杂志。2009;360(6):588–98.pmid:19196675.
查看文章PubMed/NCBI谷歌学术搜索
3.迈斯纳HC。儿童病毒性毛细支气管炎。2016;374(1):62–72.Epub 格式 2016/01/07.下午:26735994。
查看文章PubMed/NCBI谷歌学术搜索
4.来自非洲和亚洲的未感染艾滋病毒的儿童需要住院的严重肺炎的原因:PERCH多国病例对照研究。柳叶 刀。2019;394(10200):757–79.Epub 格式 2019/07/02.pmid:31257127;PubMed Central PMCID: PMC6727070.
查看文章PubMed/NCBI谷歌学术搜索
5.Jain S,Finelli L.美国儿童社区获得性肺炎。2015;372(22):2167–8.Epub 格式 2015/05/29.pmid:26017833.
查看文章PubMed/NCBI谷歌学术搜索
6.Shi T, McAllister DA, O'Brien KL, Simoes EAF, Madhi SA, Gessner BD, et al.2015年幼儿呼吸道合胞病毒急性下呼吸道感染的全球、区域和国家疾病负担估计数:系统回顾和建模研究。柳叶 刀。2017;390(10098):946–58.Epub 格式 2017/07/12.pmid:28689664;PubMed Central PMCID: PMC5592248.
查看文章PubMed/NCBI谷歌学术搜索
7.Hall CB, Weinberg GA, Blumkin AK, Edwards KM, Staat MA, Schultz AF, et al.24 个月以下儿童中与呼吸道合胞病毒相关的住院治疗。小儿科。2013;132(2):e341–8.Epub 格式 2013/07/24.下午:23878043。
查看文章PubMed/NCBI谷歌学术搜索
8.Capella C, Chaiwatpongsakorn S, Gorrell E, Risch ZA, Ye F, Mertz SE, et al. 急性呼吸道合胞病毒感染婴幼儿的预融合F、后融合F、G抗体和疾病严重程度。感染感染 2017;216(11):1398–406.Epub 格式 2017/10/14.pmid:29029312;PubMed Central PMCID: PMC5853469.
查看文章PubMed/NCBI谷歌学术搜索
9.de Steenhuijsen Piters WA,Heinonen S,Hasrat R,Bunsow E,Smith B,Suarez-Arrabal MC等人呼吸道合胞病毒感染儿童的鼻咽微生物群,宿主转录组和疾病严重程度。Am J Respir Crit Care Med. 2016;194(9):1104–15.Epub 格式 2016/11/01.pmid:27135599;PubMed Central PMCID: PMC5114450.
查看文章PubMed/NCBI谷歌学术搜索
10.Glezen WP,Paredes A,Allison JE,Taber LH,Frank AL.低收入家庭婴儿呼吸道合胞病毒感染的风险与年龄,性别,种族群体和母体抗体水平有关。J·佩托特。1981;98(5):708–15.Epub 格式 1981/05/01.pmid:7229749
查看文章PubMed/NCBI谷歌学术搜索
11.Mariani TJ, 邱晓, 楚超, 王磊, 塔卡尔 J, 霍尔登-威尔茨 J, 等.CD4 T细胞转录组的动态变化与幼儿原发性呼吸道合胞病毒感染期间疾病严重程度的关系。感染感染学报 2017;216(8):1027–37.Epub 格式 2017/09/30.pmid:28962005;PubMed Central PMCID: PMC5853440.
查看文章PubMed/NCBI谷歌学术搜索
12.宫里一世,德文森佐JP。人类遗传因素和呼吸道合胞病毒病的严重程度。克林微生物学修订版 2008;21(4):686–703.Epub 格式 2008/10/16.pmid:18854487;PubMed Central PMCID: PMC2570150.
查看文章PubMed/NCBI谷歌学术搜索
13.Sonawane AR, Tian L, Chu CY, Qiu X, Wang L, Holden-Wiltse J, 等. 微生物组-转录组相互作用与呼吸道合胞病毒感染严重程度的关系.科学代表 2019;9(1):13824.Epub 格式 2019/09/27.pmid:31554845;PubMed Central PMCID: PMC6761288.
查看文章PubMed/NCBI谷歌学术搜索
14.Thwaites RS,Coates M,Ito K,Ghazaly M,Feather C,Abdulla F等人,减少呼吸道合胞病毒毛细支气管炎和呼吸衰竭婴儿的鼻腔病毒载量和IFN反应。Am J Respir Crit Care Med. 2018;198(8):1074–84.Epub 格式 2018/04/25.pmid:29688024;PubMed Central PMCID: PMC6221568.
查看文章PubMed/NCBI谷歌学术搜索
15.Walsh EE, Wang L, Falsey AR, Qiu X, Corbett A, Holden-Wiltse J, et al. 呼吸道合胞病毒感染中的病毒特异性抗体、病毒载量和疾病严重程度.感染感染学报 2018;218(2):208–17.Epub 格式 2018/03/17.pmid:29546402;PubMed Central PMCID: PMC6009588.
查看文章PubMed/NCBI谷歌学术搜索
16.[10] Chu C-Y, Qiu X, McCall MN, Wang L, Corbett A, Holden-Wiltse J, 等. 气道基因表达与婴儿呼吸道合胞病毒病严重程度和微生物组组成的相关性.传染病杂志。2020;223(9):1639–49.下午:32926149
查看文章PubMed/NCBI谷歌学术搜索
17.Bhattacharya S,Rosenberg AF,Peterson DR,Grzesik K,Baran AM,Ashton JM等人转录组学生物标志物,用于区分患有呼吸道疾病的成人住院患者的细菌和非细菌感染。科学代表 2017;7(1):6548.Epub 格式 2017/07/28.pmid:28747714;PubMed Central PMCID: PMC5529430.
查看文章PubMed/NCBI谷歌学术搜索
18.Bucasas KL, Mian AI, Demmler-Harrison GJ, Caviness AC, Piedra PA, Franco LM, et al.急性呼吸道合胞病毒性支气管炎婴儿的全局基因表达谱显示干扰素信号网络的系统性激活。小儿感染病 J. 2013;32(2):e68–76.Epub 格式 2012/11/30.pmid:23190772.
查看文章PubMed/NCBI谷歌学术搜索
19.Mejias A, Dimo B, Suarez NM, Garcia C, Suarez-Arrabal MC, Jartti T, et al.全血基因表达谱,用于评估呼吸道合胞病毒感染婴儿的发病机制和疾病严重程度。PLoS Med. 2013;10(11):e1001549.Epub 格式 2013/11/23.pmid:24265599;PubMed Central PMCID: PMC3825655.
查看文章PubMed/NCBI谷歌学术搜索
20.Do LAH, Pellet J, van Doorn HR, Tran AT, Nguyen BH, Tran TTL, et al. 2岁以下患有呼吸道合胞病毒感染的住院儿童鼻上皮和全血中的宿主转录谱。感染感染源 2017;217(1):134–46.Epub 格式 2017/10/14.pmid:29029245;PubMed Central PMCID: PMC5853303.
查看文章PubMed/NCBI谷歌学术搜索
21.Walsh EE, Mariani TJ, Chu C, Grier A, Gill SR, Qiu X, et al. 来自评估婴儿呼吸道合胞病毒影响和严重程度预测因子研究的目的、研究设计和招募结果。JMIR Res Protoc.2019;8(6):e12907.Epub 格式 2019/06/15.pmid:31199303;PubMed Central PMCID: PMC6595944.
查看文章PubMed/NCBI谷歌学术搜索
22.卡塞塔,邱晓,特西尼B,王磊,墨菲A,科贝特A,等。制定婴儿呼吸道合胞病毒感染的全球呼吸道严重程度评分。感染感染学报 2017;215(5):750–6.Epub 格式 2016/12/25.pmid:28011907;PubMed Central PMCID: PMC5388274.
查看文章PubMed/NCBI谷歌学术搜索
23.王磊, 楚春燕, 麦考尔, 斯劳恩怀特 C, 霍尔登-威尔茨 J, 科贝特 A, 等.气道基因表达分类器用于婴儿呼吸道合胞病毒(RSV)疾病的严重程度。BMC 医学基因组学。2021;14(1):57.pmid:33632195
查看文章PubMed/NCBI谷歌学术搜索
24.Chu CY, Qiu X, McCall MN, Wang L, Corbett A, Holden-Wiltse J, et al.气道基因表达与婴儿RSV疾病严重程度和微生物组组成相关。J 感染 Dis. 2020.Epub 格式 2020/09/15.下午:32926149
查看文章PubMed/NCBI谷歌学术搜索
25.Tipping ME, Bishop CM. 概率主成分分析。皇家统计学会杂志:B系列(统计方法)。1999;61(3):611–22.
查看文章谷歌学术搜索
26.约翰斯通,卢AY。关于高维主成分分析的一致性和稀疏性。统计协会 2009;104(486):682–93.Epub 格式 2010/07/10.pmid:20617121;PubMed Central PMCID: PMC2898454.
查看文章PubMed/NCBI谷歌学术搜索
27.Jolliffe IT,Cadima J.主成分分析:回顾和最新发展。哲学变性 A 数学 物理 工程 科学 2016;374(2065):20150202.Epub 格式 2016/03/10.pmid:26953178;PubMed Central PMCID: PMC4792409.
查看文章PubMed/NCBI谷歌学术搜索
28.Mejias A, Rodríguez-Fernández R, Oliva S, Peeples ME, Ramilo O.呼吸道合胞病毒疫苗之旅。安过敏性哮喘免疫。2020;125(1):36–46.Epub 格式 2020/03/29.pmid:32217187;PubMed Central PMCID: PMC7311299.
查看文章PubMed/NCBI谷歌学术搜索
29.Vekemans J, Moorthy V, Giersing B, Friede M, Hombach J, Arora N, et al.呼吸道合胞病毒疫苗的研发:世界卫生组织技术路线图和首选产品特性。疫苗。2019;37(50):7394–5.Epub 格式 2018/02/06.pmid:29395536.
查看文章PubMed/NCBI谷歌学术搜索
30.Chu CY, Qiu X, Wang L, Bhattacharya S, Lofthus G, Corbett A, et al.健康的婴儿鼻转录组:一项基准研究。科学代表 2016;6:33994.Epub 格式 2016/09/24.pmid:27658638;PubMed Central PMCID: PMC5034274.
查看文章PubMed/NCBI谷歌学术搜索
31.Misra RS, Bhattacharya S, Huyck HL, Wang JC, Slaunwhite CG, Slaunwhite SL, et al.基于流量的新生儿淋巴细胞群体分选,用于转录组学分析。J 免疫方法。2016;437:13–20.Epub 格式 2016/07/21.pmid:27438473;PubMed Central PMCID: PMC5247270.
查看文章PubMed/NCBI谷歌学术搜索
32.Bolyen E, Rideout JR, Dillon MR, Bokulich NA, Abnet CC, Al-Ghalith GA, et al.使用QIIME 2的可重复,交互式,可扩展和可扩展的微生物组数据科学。纳特生物技术。2019;37(8):852–7.Epub 格式 2019/07/26.pmid:31341288;PubMed Central PMCID: PMC7015180.
查看文章PubMed/NCBI谷歌学术搜索
33.Caporaso JG, Kuczynski J, Stombaugh J, Bittinger K, Bushman FD, Costello EK, et al. QIIME允许分析高通量群落测序数据。Nat 方法。2010;7(5):335–6.Epub 格式 2010/04/13.pmid:20383131;PubMed Central PMCID: PMC3156573.
查看文章PubMed/NCBI谷歌学术搜索
34.DeSantis TZ, Hugenholtz P, Larsen N, Rojas M, Brodie EL, Keller K, et al.Greengenes,一个嵌合体检查的16S rRNA基因数据库和工作台,与ARB兼容。Appl Environ Microbiol.2006;72(7):5069–72.Epub 格式 2006/07/06.pmid:16820507;PubMed Central PMCID: PMC1489311.
查看文章PubMed/NCBI谷歌学术搜索
35.Friedman J, Hastie T, Tibshirani R. 通过坐标下降实现广义线性模型的正则化路径。J 统计软件。2010;33(1):1–22.Epub 格式 2010/09/03.pmid:20808728;PubMed Central PMCID: PMC2929880.
查看文章PubMed/NCBI谷歌学术搜索
36.Belloni A, Chernozhukov V. 高维稀疏模型中模型选择后的最小二乘法。伯努利。2013;19(2):521–47.
查看文章谷歌学术搜索
37.Van Twisk D,Murphy SP,Thakar J.优化的逻辑规则揭示了由组蛋白去乙酰化酶和蛋白质酪氨酸磷酸酶调节的干扰素γ诱导模式。免疫学。2017;151(1):71–80.Epub 格式 2017/01/06.pmid:28054346;PubMed Central PMCID: PMC5382347.
查看文章PubMed/NCBI谷歌学术搜索
38.Thakar J,Hartmann BM,Marjanovic N,Sealfon SC,Kleinstein SH.抗病毒转录组学的比较分析揭示了流感免疫拮抗作用的新作用。BMC Immunol.2015;16:46.Epub 格式 2015/08/15.pmid:26272204;PubMed Central PMCID: PMC4536893.
查看文章PubMed/NCBI谷歌学术搜索
39.Zaslavsky E, Nudelman G, Marquez S, Hershberg U, Hartmann BM, Thakar J, et al.通过时间富集分析重建监管网络及其在H1N1流感病毒感染中的应用。BMC 生物信息学。2013;14 增刊 6(增刊 6):S1.Epub 格式 2013/06/14.pmid:23734902;PubMed Central PMCID: PMC3633009.
查看文章PubMed/NCBI谷歌学术搜索