染色体邻位允许识别器官在基因表达中的具体变化-医学论文发表
· 里希·达斯·罗伊
· 外哈莉卡斯,
· 莫娜·克里斯滕森
· 伊洛迪·伦沃伊
· 朱卡·杰恩瓦尔
· 发布时间: 2021年9月10日
抽象
虽然大多数基因与其他基因共享染色体邻点,但在单个器官发育的背景下,尚未探索基因的分布:发育生物学研究的共同重点。由于发育过程通常与基因表达的最初细微变化有关,因此我们在这里探讨了相邻基因在识别微分表达基因方面是否具有信息性。首先,我们量化了在哺乳动物基因组中具有相关功能作用的基因的染色体邻点模式。虽然大多数蛋白质编码基因在每个基因周围1Mb窗口内至少有5个邻点,但这些邻点很少能调节同一器官的发育。对小鼠摩尔牙转录体的分析表明,虽然调节牙齿发育的基因表达发生变化,但其邻近基因没有明显变化,无论其表达水平如何。最后,我们测试在微分表达分析中加入基因邻点是否能提供额外的益处。在分析中,我们开发了一种名为DELocal的算法,通过比较其表达变化与染色体区域相邻基因的变化来识别微分表达的基因。我们的结果表明,DELocal 消除了对表达方式大变化的检测偏差,从而能够识别开发中的细微变化。未来的研究,包括检测微分表达,可能受益于基因-基因邻里关系的重要性,并进一步描述其重要性。
作者摘要
器官的发育通常与小而难以检测基因表达的变化有关。在这里,我们检查了调节特定器官的基因在基因组中彼此相邻的频率,以及这个基因邻点是否有助于检测基因表达的变化。我们发现,在小鼠和人类基因组中,调节单个器官发育的基因很少相互接近。我们构建了一种名为 DELocal 的算法,以检测基因表达的变化,该变化包含了有关邻近基因的信息。使用含有数千个基因基因表达特征的发育小鼠摩尔牙的转录体,我们展示了调节牙齿发育的基因如何被DELocal排高,即使它们的表达水平变化是微妙的。我们建议,发育生物学研究可以受益于基因邻点分析,在检测微分表达和器官特定基因的识别。
引文:达斯罗伊R,哈利卡斯O,克里斯滕森MM,伦沃伊斯E,杰恩瓦尔J(2021)染色体邻位允许识别器官在基因表达的具体变化。PLoS 计算生物 17 (9): e1008947.https://doi.org/10.1371/journal.pcbi.1008947
编辑:亚历山大·莫罗佐夫,美国罗格斯大学
接收:2021年4月14日:已接受:2021年8月26日:已发布:2021 年 9 月 10 日
版权所有:2021年?达斯·罗伊等人。这是根据《知识共享归因许可证》条款分发的开放访问文章,该条款允许在任何媒介中不受限制地使用、分发和复制,前提是原始作者和来源被记入贷记。
数据可用性:作为 R 包,这里可免费获得 deLocal 算法https://github.com/dasroy/DELocal。微阵列和 RNAseq 数据存放在 NCBI 基因表达综合中,并附有加入代码 GSE141907 和 GSE142199。
资金:ER 和 JJ 由芬兰学院资助。JJ由简和阿托斯·埃克科基金会、约翰·邓普顿基金会和西格丽德·朱塞利叶斯基金会资助。资助者在研究设计、数据收集和分析、决定出版或准备手稿方面没有作用。
竞争利益:作者宣称不存在相互竞争的利益。
介绍
基因表达的时空调节在发育和分化中很重要。在发育过程中,基因以高度动态的方式表达,表达动力学的扰动是许多疾病和发展缺陷的基础。可以通过在两个或两个以上时间点量化基因表达水平来检查发育时间对基因表达的调节。然而,由于发育通常是一个渐进的过程,检测微分基因表达可能具有挑战性,因为变化最初是微妙的。这一挑战突出表明,继续需要不同的战略来识别基因表达中生物学上有意义的变化。-医学论文发表
基因表达与基因组组织的关系是引起人们相当研究兴趣的一个方面。在前列蛋白中,基因组结构与基因表达的调控在操作上是联系在一起的。这是因为同一过程所涉及的基因通常位于相同的操作孔中,形成最初被解读为单个脚本的多基因簇[1]。在真核生物中,控制多个基因的手术者很少见,尽管在C的20,000个基因中,有近15%是罕见的。埃莱根斯基因组位于奥伯龙[2,3] 。然而,大多数真核基因分散在整个基因组中,没有与表达或功能相关的明显顺序[4]。尽管真核基因的分布似乎没有任何简单的逻辑,但它并不完全是随机的,因为大多数基因在基因组中不能在不严重干扰其功能的情况下四处移动[5]。一些非随机分布被发现在小尺度,有关有限的基因数量,并在大规模,有关大染色体区域[5,6]。在共同表达的基因(如家政基因)中也发现了聚类,例如功能组内部的相互作用对蛋白质或包含数千个基因的生物过程[7,8]。总的来说,促成基因组组织的因素至少包括进化史和当前的进化力量、重组机制、基因表达调控机制和染色质成分控制。哺乳动物基因组中非随机基因顺序的主要来源被认为是串联重复[9]。
真核的另一个因素是基因组的三维组织[10,11]。在元子发育过程中,增强剂通过动态三维中心调节不同细胞和组织类型的基因活性,增强剂和促进剂在物理接近处聚集以激活基因表达。对染色质空间组织进行全基因组分析,发现了多个拓扑关联域(TADs),这些域(TADs)在很大程度上形成了调节元素和促进者的自我相互作用区域[12,13]。虽然有些情况下,基因表达在TAD中共同表达,[14,15]目前的证据表明基因共同调控和TAD之间关系更为复杂[16,17]。此外,TAD似乎具有多个等级[16],并且对于跨物种的 TAD 保护程度仍然存在疑问[18]。
在这项研究中,我们从单个器官发育的角度考察基因组组织:发育生物学和再生研究的共同重点。我们首先回顾了哺乳动物基因组中蛋白质编码基因的空间分布,并量化了参与同一器官发育的邻近基因。其次,我们针对基因邻点和基因表达进行深入分析的特定器官系统是哺乳动物牙齿。特别是小鼠摩尔牙的发育提供了许多特征良好的基因来检查基因邻点和表达([19]及其参考)之间的联系。我们的起点是每个器官特定基因周围的1Mb染色体邻点,因为这些基因包括大多数调控区域和在保护大型或非常有序的基因簇时看到的受约束的结构。1Mb 窗口的选择显然有些武断,但它应该为各种分类和数据提供一个易于适用的框架。邻里的定义应该与TAD相当兼容,因为它们恰好在鼠标中大约是1Mb(迪克森等人,自然,485,2012年;他们说880kb)[12]。然而,我们也测试我们的推论使用TAD计算每个邻里。1Mb窗口包括众所周知的基因簇,如霍克斯基因和免疫球蛋白基因,其染色体上的空间组织对其调节和功能至关重要。然而,这种严格的共同调控基因的共定位并不是哺乳动物基因组的一般模式[9],与基因功能相关的基因聚类模式是微妙而复杂的。
最后,为了检测器官发育中表达的微分基因,我们开发了一种叫做DELocal的新方法。这种方法并不仅仅取决于转录体测序的读数,而是在分析中包括了相邻基因的表达数据。这种方法消除了对折叠变化的强调,这是常见的其他方法,并允许DELocal识别相对微妙的基因表达变化在发展过程中。使用用微阵列和RNASeq获得的胚胎小鼠牙科转录体,我们展示了DELocal如何提供不同表达基因的替代排名。
结果
大多数蛋白质编码基因在 1 Mb 窗口内具有相邻基因
由于我们关注的焦点是发育调节,我们首先通过计算基因在基因组中的距离,获得了发育基因的整体分布模式。例如,人类基因组(GRCH38.p13)是4.5*10 9碱基对长,有20,449个蛋白质编码基因,这意味着,平均每220,060个碱基一个基因(Ensembl释放99)。同样,对于小鼠基因组,这个数字是154,290(GRCm38.p6)。因此,平均而言,5到6个基因应该存在于小鼠基因组中每个1Mb窗口。为了作为邻里来表达这些统计数据,我们可以指出每个基因在 1 Mb 窗口内有 4 到 5 个相邻基因。这一观察显然是一个广泛的概括,但它确实表明,基因往往有一些邻居在1Mb内。为了更详细地检查邻点模式,我们检查了小鼠基因组蛋白质编码基因的1Mb邻点。对于每个基因,1Mb 窗口内的相邻基因数量被计算在内(图1A和S1)。这个简单的计算表明,在所有蛋白质编码基因的水平,大多数基因在小鼠基因组有超过4个邻邦,中位数的邻居是15(S2图)。此表表明,真核基因组中有一定程度的基因聚类,这种模式在文献中已经确立[20]。
下载:
·
图1。虽然蛋白质编码基因通常有邻点,但牙齿基因在每个基因周围的 1 Mb 窗口内没有其他牙齿基因邻点。
(A) 从小鼠基因组中列出所有蛋白质编码基因和(B)参与牙齿发育的基因,每个基因周围 1 Mb 窗口内的相邻基因数量。在21,971个蛋白质编码基因中,大多数至少有5个邻邦,而302个牙齿发育基因中的大多数没有牙齿基因作为邻邦。这种模式表明,具有特定功能的基因分布稀疏。
https://doi.org/10.1371/journal.pcbi.1008947.g001
大多数蛋白质编码基因缺乏调节同一器官的邻邦
为了对比基因邻域的全基因组模式和单个器官系统的模式,我们首先列出了与小鼠牙齿发育相关的基因邻域。这个特定的器官焦点基本上说明了参与同一器官调节的基因是否也位于彼此之间(这是意料之中的)。在这里,小鼠摩尔的发育提供了一个很好的例子,因为它的基因调控是比较清楚的,因为牙齿发育本身是一个相对自主的过程[19,21]。我们分析了牙齿发育基因(S1表)的1Mb邻点和共享同一邻点的牙齿基因数量。结果表明,牙齿基因大多位于彼此相距很远的地方,这表明调节这一特定发育过程的基因不是同位化(图1B),这种模式与真核基因组的组织是一致的[10,11]。综合起来,虽然大多数蛋白质编码基因在某种程度上聚集在小鼠基因组中,但牙齿基因往往位于彼此相距很远的地方(图1)。
接下来,我们研究了正在发育的老鼠牙(图1B)与其他发育系统有何代表性。我们使用基因本体论 (GO) 术语来提供同一发育过程中所涉及的基因的近似度。在这里,我们专注于属于小鼠GO苗条(一个简明扼要的术语列表)的基因的"生物过程"[22,23]。对于属于这些术语的每一个基因,对1Mb邻点进行了调查,以列出属于同一术语的基因。制表显示,属于某个GO术语的大多数基因在染色体(图2)中分布稀疏,这与先前的研究相一致[5,24]。只有很少的基因从更广泛的,或高水平的GO术语是密集的位置(超过3个基因从同一GO术语在1MB附近)。然而,这几个GO术语代表了对生物功能的非常广泛的描述。用更精确的GO术语(图2,下排),基因往往没有属于同一GO术语的邻居。一般来说,我们检查了人类基因组中的这些模式,它们基本上保持不变(S3图)。-医学论文发表
图2。GO 术语越具体,其基因在 1 Mb 以内来自同一 GO 术语的邻居就越少。
每个馅饼代表根GO术语"生物过程"下一个GO术语的基因。前三行表示 GO 细小的术语。框中的 GO 术语是 GO 术语"系统开发"的子项。颜色编码表示基因从同一 GO 术语中产生的邻距数。GO 术语中的基因数在 GO 术语下指示。对小鼠基因组进行了分析。请参阅S2 表,查看 GO ID。
https://doi.org/10.1371/journal.pcbi.1008947.g002
考虑到每个类别的基因数量有限,精确的GO术语类别中邻近基因的稀缺性并不奇怪。为了测试这些模式是否是组大小的简单函数,我们进行了模拟,其中基因被随机分配到包含不同数量基因的人工 GO 术语中。对于每个组大小,进行了 10,000 次模拟,并计算了 1 Mb 邻点中每个人工 GO 术语的基因密度。显示缺乏邻邦的基因百分比的图示显示,随着人工 GO 术语(图 3)中基因数量的增加,预期会减少。经验模式主要遵循随机化,尽管一些具有少量基因(300 及更少)的实名制 GO 术语显示的百分比略低,表明属于相同 GO 术语的基因的空间聚类比模拟中略有趋势。这可能是由于GO术语有参数基因,有时位于基因组中彼此相近。然而,高达包含1000个基因的GO术语类别,80%的基因没有属于相同的GO术语的邻居。这些模式表明,对共享同一基因组邻点(图1A)的基因的总体期望是它们参与不同系统和器官的调节。就基因组组织的一般规则而言,它为新的计算方法提供了机会。下面我们开发一种方法,使用来自邻近基因的其他信息来检测微分表达,并使用我们关于正在发育中的老鼠牙齿的数据进行测试。
·
图3。与具有相同基因数的人工 GO 术语相比,基因数量较低的实际 GO 术语在基因组中所聚类略多。
用随机选择的基因制作了不同数量的人工GO术语,并测量了它们在整个基因组中的分布。对于每个组大小,执行了 10,000 个模拟,对于每个模拟,计算具有相同人工 GO 术语的 1Mb 邻居内零的基因百分比(黑点)。真正的 GO 术语标有蓝点。请参阅S2 表,查看 GO ID。蓝线为中位数,阴影显示第一和第三四分位数之间的观测值。
https://doi.org/10.1371/journal.pcbi.1008947.g003
相邻基因在表达上不显示器官特异性变化
由于与牙齿发育相关的基因似乎不是在基因组(图1B)中共同定位的,我们检查了这些基因的表达动力学是否与它们附近的其他基因不同。我们检查了牙冠形成时基因的差异表达,在小鼠胚胎日13.5(E13)和14.5(E14)之间,当许多牙齿基因已知被调高[19,25]。例如,在视觉检查Ctnna1,Sh,Foxi3和Sostdc1,所有正常牙齿发育所需的基因[26],显示 E13 和 E14 之间的调节 (图 4)。 相比之下,他们附近的其他基因显示E13和E14之间没有显著的变化,无论它们的表达水平(图4)。因此,参与牙齿调节的基因分布(图1和4)也表现在微分表达的水平上。基于这一观察,我们开发了一种新的算法DELocal,根据邻居的表达动态(材料和方法)来识别不同表达的基因。为了评估其潜在性能,我们使用了来自微阵列和RNAseq产生的胚胎小鼠牙科组织的基因表达数据。
·
图4。只有牙齿发育基因在发育中的鼠摩尔的1Mb窗口内有差异性表达。
牙齿发育基因Ctnna1、Sh、Foxi3和Sostdc1及其邻近基因在发育阶段E13和E14的表达水平中位数。 无论它们的表达水平如何,周围的基因在两个阶段之间几乎没有变化,而牙齿基因则受到调节。Ctnna1 1 Mb 窗口中的Egr1也是一个牙齿发育基因。
https://doi.org/10.1371/journal.pcbi.1008947.g004
邻居的数量对于检测差异表达并不重要
我们关于相邻基因在检测微分表达方面信息丰富的假设取决于"邻里"的定义。因此,通过 DELocal 算法确定在分析中包括的邻居数量是很重要的。为了定义最优的邻点数,我们测试了围绕感兴趣基因的固定窗口 (1 Mb) 中最接近的基因的不同数字 (1/14)。我们评估了DELocal在识别牙齿发育中涉及的基因方面与不同数量的近邻的性能。我们再次对比了E13和E14摩尔牙(302个牙齿基因)之间的表达水平,或所谓的芽阶段,以盖齿发育阶段过渡,当许多牙齿基因已知是活的[19]。Matthews 相关系数 (MCC) 分数是针对不同数量的邻居测量的,以检查 DELocal 识别牙齿基因的强度(真实阳性;TP)以及非牙齿基因(真正的阴性:TN)。由于 TP 很少或数据集不平衡,因此选择 MCC 分数来优化模型。结果表明,尽管 RNAseq 数据产生的 MCC 分数略高于微阵列(图 5),但 DELocal 在微阵列和 RNAseq 数据集上都会产生相似且稳定的 MCC 分数。我们注意到,只有一个最近的基因足以获得接近最高MCC分数。但是,对于 RNAseq 而言,最佳 MCC 分数对应于 5 个最近的邻居。由于与 RNAseq 相比,微阵列分析中可用的基因较少,因此在其余分析中,我们使用 DELocal 与 5 个邻居一起用于 RNAseq 和微阵列数据。还应当指出,这5个邻居的距离因每个基因而异,因此最后的邻里窗口大小不一致。除了 1 Mb 窗口之外,还使用中位数 TAD 边界来定义邻里和评估德本地。虽然,每个基因的TAD边界是不同的,但与1Mb邻距(S4图)相比,结果没有显著差异。
·
图5。DELocal 性能并不强烈地取决于分析中使用的基因邻点数。
每个基因都与其相邻的基因进行评估。在邻居数量没有任何"黄金标准"的情况下,使用不同数量的近亲基因(在1Mb窗口内)来识别不同表达的基因。使用 MCC 测量整体性能。使用 RNAseq 数据的 DeLocal 性能略好于微阵列数据。
https://doi.org/10.1371/journal.pcbi.1008947.g005
与其他方法相比,DELocal 显示精度提高
Microarray 是最早成功测量大量基因表达的高通量技术之一,因此有许多统计方法可以识别来自该平台生成的数据集中的不同表达基因。因此,可以通过使用微阵列数据集与这些方法进行比较来评估 DELocal 的性能。然而,微阵菌仅限于微阵菌探针所针对的基因。因此,无法访问所有基因的表达,导致取样的相邻基因减少。为了更全面地读取微分表达的基因,RNAseq 还用于评估德本地性能。所有这些方法的性能是通过它们识别不同表达的牙齿基因的能力来衡量的。
为了分析性能,我们使用接收器操作曲线 (ROC)[27]来描述与微分表达基因的假阳性率对比的真实阳性率。分析表明,DELocal在识别牙齿基因时,使用微阵列和RNASeq(图6)的表现优于其他方法。性能与利马/德米(微阵列)和利马/德塞克(RNAseq)最相似。我们还使用其他指标,如特异性、召回(敏感性)、精度和 MCC 来评估和比较不同的方法。与其他微阵列数据方法(S5 图)相比,DELocal 显示出较高的特异性和准确性。
图 6.与其他方法相比,DELocal 在检测不同表达的基因方面至少同样强大。
接收器操作特征 (ROC) 曲线和曲线下方区域(括号内)显示,在微阵列和 RNAseq 数据上,DELocal 优于其他方法。
https://doi.org/10.1371/journal.pcbi.1008947.g006
在 RNAseq 数据中,除召回(敏感性)(图 7)外,DELocal 优于其他方法。MCC 分数仍然等于彼此。由于大量的非牙齿基因(真正的底片)阻碍了对准确性的评估,但并不影响F1或MCC,牙齿基因数据集不平衡。考虑到许多实验的目标是找到真正的积极因素,F1得分,这是一个复合术语的精度和召回,是一个重要的指标。F1 得分范围从零(坏)到一(好),所有方法的 F1 分数仍然不理想。然而,使用RNAseq的DELocal在F1得分方面也优于其他方法。下面我们仅讨论 RNAseq 的结果。
·
图7。将 DELocal 与早期识别差分表达的方法进行比较。
评估矩阵显示,除召回(敏感性)外,DELocal 等于或优于早期方法。然而,由于大量的真正的负面因素,精度、F1 和 MCC 的重要性得分仍然微不足道。评估矩阵在材料和方法部分进行解释。分析是使用 RNAseq 数据完成的。有关微阵菌数据,请参阅S5 图。
https://doi.org/10.1371/journal.pcbi.1008947.g007
DELocal 通过消除对表达方式大变化的偏见,提供基因的替代排名
由于DELocal量化了新基因背景下的表达变化,因此在表达变化一般较大的染色体区域,基因的排名不应像其他方法那样高。我们检查了所有方法预测的不同表达基因中牙齿基因的排名和表达变化。与其他三种方法(S6图)相比,DELocal预测的牙齿基因在顶级位置上被丰富。在实验研究中,基因排名通常是在生物验证结果时要检查的第一个值,实际上,在选择候选基因进行新的下游分析时,高排名非常有影响力。结果表明,虽然Deseq,边缘R和伽马强调在他们的排名基因,显示他们的表达方式的巨大变化,这种偏见不存在在DELocal排名(图8A)。这些结果还表明,高等级牙齿基因的识别在DELocal和其他方法(图8B)之间是不同的。因此,DELocal 与其他方法的差异比仅基于不同性能指标(图6和7)更为明显。
·
图8。DELocal 提供了不同表达基因的替代排名。
(A) 与其他方法不同,差异表达的 DELocal 排名不偏向具有较大日志折叠变化的基因(1 表示最高排名)。(B) 对牙齿发育基因等级顺序的主要成分分析表明,DELocal的排列与其他三种方法(使用前500个牙齿基因的相关基质)提供的顺序不同。
https://doi.org/10.1371/journal.pcbi.1008947.g008
DELocal 错过的不同表达基因往往具有局部参数
DELocal 算法似乎可以有效地识别不同表达的基因(具有高精度),并过滤掉非牙齿基因(具有高特异性)。尽管如此,DELocal 还是错过了 60 个不同表达的牙齿基因,这些基因由 RNAseq 数据集中的所有其他方法识别。DELocal 基于这样一种假设,即每个真正不同表达的基因都应该有邻邦,而它们都不应被不同程度地表达。因此,DELocal 可能无法识别那些异化表达的基因,这些基因的邻家也表达差异。例如,Bmp7的 5 个最接近的邻居中有 2 个是不同表达的基因,这可能是 DELocal 检测Bmp7失败的原因(图 9)。此外,附近存在寄生基因可能会使差异表达的检测复杂化。最值得注意的是,11号染色体中的Dlx1和Dlx2(图9)、6号染色体中的Dlx5和Dlx6,以及2号染色体中的Dlx1和Dlx2作为对联进行共同调控,可以补偿彼此的删除[28] 31]。此外,我们一组牙齿基因中的其他相邻参数是Cyp26c1与Cyp26a1,和 Cdh1与Cdh3 [32]。因此,至少通过将有关基因参数的信息纳入算法来检测 DELocal 错过的一些基因。-医学论文发表
下载:
·
图9。同一邻区的微分表达基因干扰了DELocal对微分表达基因的检测。
由于邻近基因的微分表达模式(上),DELocal 未能识别Bmp7。Dlx1和Dlx2 是同一邻(下)的 p 阿拉洛格牙齿基因。这里只标记牙齿发育基因。
https://doi.org/10.1371/journal.pcbi.1008947.g009
讨论
恩森布尔小鼠注释中只有7个蛋白质编码基因在其1Mb窗口(图1A)内完全缺乏邻居。因此,绝大多数小鼠基因都有邻居,这种组织模式可能适用于所有哺乳动物,如果不是超越的话。在数千个基因的基因组尺度中,相邻基因可以在真核生物中共同表达[33]。我们的分析,侧重于个别器官的发展,表明邻近的基因很少参与同一器官或组织的调节(图2),这也反映在缺乏共同表达邻居(图4)。缺乏共同表达的邻居部分原因在于与单个器官调节相关的基因数量有限(图2和3)。相比之下,更普遍的过程,如细胞增殖或细胞死亡,与成千上万的基因(图2)有关,增加了邻里共同表达的可能性。事实上,使用包含数千个基因的高级别 GO 术语进行分析后发现,功能相关基因通常位于彼此相近[8]。牙齿等器官的进化可能从多个高层群中选择基因,这或许进一步解释了器官调控中共同表达邻居的罕见性。
共同表达的邻居在器官发育中罕见的一个显著优势是,这些信息可以用来检测基因表达的细微变化。为此,我们开发了 DELocal 算法,通过整合染色体邻点的表达信息来识别不同表达的基因。DELocal对小鼠牙齿发育中的微分表达基因(图6和7)进行了高度精确的检测,表明这种方法可以在发育系统的分析中提供额外的益处。具体来说,DELocal 不同于以前通过不依赖于基因表达中的大折叠变化(图 8A)来确定微分表达基因的方法。DELocal 识别生物学意义重大但更微妙变化的能力基于其特殊性:它可以跟踪染色体位置周围基因中独一无二的基因表达变化。因此,DELocal 可以精确定位在两个发育阶段之间积极和具体调节的基因,无论表达方式的变化是大还是小。综合起来,DELocal可以通过提供潜在兴趣基因的替代排名列表(图8B)来补充其他方法。
更技术上,开发的DELocal算法基于线性模型,这些模型已经成功地在利马、DeSeq2和许多其他方法中实现和使用,以识别不同表达的基因[34,35]。通过线性模型,可以在两种或两种以上的生物条件下模拟基因表达,然后可以找到不同对比的微分表达基因。线性模型与其他方法相比是有利的,因为它们可以模拟具有多种因素的复杂实验条件。在这里,我们使用DELocal来确定发育中的小鼠牙齿中芽和帽阶段之间不同表达的基因。活跃在牙齿发育中的基因列表(19,21] 使我们能够优化和评估 DELocal 的性能。考虑到基因表达的体内芽和帽位差异比较微妙,DELocal的高特异性和准确性是有希望的。显然,优化需要感兴趣的基因列表。然而,DELocal 也可以在不事先了解活跃于特定发育过程的基因的情况下运行。图3显示,就邻居数量而言,DELocal的性能非常稳定,即使只有一个最近的邻居也足以建立模型。这意味着,在没有任何参考/培训基因集的情况下,DELocal 只能与单个邻居对比使用。在这种情况下,测试不同器官的最佳邻居数量是否相同将是有趣的。另一个未来方向是使用 DeLocal 检查不同的 TAD 分类。
例如,调节同一过程的邻近基因的稀有性是否与DNA折叠所需的间距要求有关,或者是否是基因组重新排列的历史过程的结果,还是器官进化过程中基因的共同选择的结果,还有待探讨。无论如何,我们对小鼠牙齿发育的结果表明,缺乏器官特定的邻邦也表现在差异表达的水平上。我们进一步表明,有可能开发计算方法,利用来自邻近基因的其他信息来检测基因表达的细微变化。
材料和方法
道德声明
所有小鼠研究均根据芬兰国家动物实验委员会的指南,根据KEK16-021、ESAVI/2984/04.10.07/2014和ESAV/2363/04.07/2017许可证进行。
基因集和基因邻点分析
2020年2月,使用R包生物母体[36]从Ensembl数据库下载了小鼠和人类基因组每个基因的起始位置、染色体名称和基因生物型(蛋白质编码、lncRNA、ncRNA、伪基因)。进一步分析仅限于蛋白质编码基因。302个与牙齿发育有关的基因被标记为牙齿发育基因(S1表和参考[19,37])。在整个研究中,基因启动坐标被用作基因在染色体中的位置。同样的坐标用于测量基因之间的距离。GO 苗条的条款是从 AmiGO[38]获得的,它们列在S2 表中。对于每个 GO 术语,使用生物母体再次从 Ensembl 下载相应的基因。不同尺寸的模拟人工GO术语是使用自定义的R脚本随机采样基因组中的蛋白质编码基因而创建的。对于每个组大小,进行了 10,000 次模拟,并计算了邻里中同一人工 GO 术语中基因的每个模拟密度。
在大多数分析中,我们使用 1 Mb 窗口作为每个焦点基因的邻里测量,因为这些窗口相对简单,可以确定不同的基因组和基因。此外,我们使用 TAD 分析邻里。虽然TAD被认为是在不同的哺乳动物细胞类型中保存的,但可以划定围绕不同边界的基因的多个TAD [39]。为了在 TAD 边界上达成强有力的共识,我们下载了四个不同的鼠标细胞线和三个不同的算法(具有 10 kb 和 50 kb 分辨率,2021 年 6 月[40])。每个基因的一致 TAD 边界是通过从该基因周围的所有 TAD 中选择一个中位数的起始和结束坐标来定义的。这些共识 TAD 边界的中位数大小为 990kb(在 185kb 到 6Mb 范围内,标准偏差 = 547813.8),这与之前的 880kb =41°报告大致相似。超过1500个基因(大部分来自Y染色体)的TAD边界尚未确定。
RNAseq 图书馆准备
从胚胎天13.5(E13)和14.5(E14)发育小鼠摩尔牙从野生类型C57BL/Ola胚胎解剖。对于 RNASeq,使用了五个生物复制品。样品储存在-75°C的RNA中(德国希尔登的Qiagen GmbH),根据制造商的说明,先用硫酸酸-苯酚-氯仿提取提取两次,然后使用RNeasy Plus微套件(德国希尔登的Qiagen GmbH)进一步纯化。用2100个生物分析仪(安捷伦、圣克拉拉、加利福尼亚州)对代表性样品的RNA质量进行了评估,RIN值为9或更高。RNA浓度由Qubit RNA HS检测套件(热费舍尔科学,沃尔瑟姆,马萨诸塞州)确定。cDNA 库由 Ovation RNAseq 系统 V2(加利福尼亚州欧文的 Nugene)编写,并按 NextSeq500(加利福尼亚州圣地亚哥的伊卢米纳)进行排序。
微阵菌库准备
从野生NMRI胚胎中解剖了小鼠E13和E14牙齿。使用了五个生物复制品。每个样本中可用的RNA量用2100个生物分析仪(加州圣克拉拉的安捷伦特)测量。只有显示RIN值高于 9 的样本用于微阵菌分析。-医学论文发表
基因表达分析
基因表达在微阵列(平台:GPL6096,阿菲梅特里克斯鼠标Exon阵列1.0)和RNASeq(平台GPL19057,Illumina NextSeq 500)中测量。微阵列基因信号使用Brainarray定制CDF(第19版,2014年11月13日发布)[43])与香气正常化。RNAseq 读数 (84 bp) 进行了评估,并且使用 FastQC[44]、后QC[45]和修剪[46]过滤掉不良读数。这导致每个样本平均阅读量达到 6300 万次。然后,良好的读数与STAR[47]对齐,以Mus_musculus。GRCm38.dna.primary_assembly.fa 基因组和每个基因计数由 HTSeq[48]工具使用Mus_musculus执行。GRCm38.90.gtf 注释。平均而言,89%的读数被单独映射到肌肉基因组。此外,使用 DESeq2[34]使 RNAseq 计数值正常化。所有转录数据均可在NCBI基因表达综合中提供,加入编号为GSE142201。
德本地
在DeLocal中,假设不同表达的基因与邻近的基因有不同的表达动力学。具体来说,我们希望找到其表达方式发生变化的基因,而周围基因的表达方式则没有变化。为了计算这一点,我们使用了与ESLiM[49]类似的逻辑,该算法可以检测外在使用的变化。ESLiM 适用于检测替代拼接(外在使用),而 DELocal 则适用于识别染色体邻点中表达的差异基因。请注意,原则上,人们可以在基因组中随机选择相邻的基因或基因,但这将导致每次随机化的结果不同。
在这个算法中,基因的表达被建模为与邻里基因中值表达的线性关系,例如,(i)
在j- th 样本中预期i- th 基因的表达位置, 是 j - th 样本中i- th 基因 1 Mb 窗口内的 N近邻基因的中位表达,b我是基因的基线表达水平g我.斜坡s我每个基因g我取决于其邻近的基因。因此,预期值和观察值之间的差异或残余值,(二)哪里gij是观察值。对于不同表达的基因,这些残值在不同的生物条件下将显著不同。
此外,在残余物的帮助下rij观察gij可按如下规定制定,(三)
值得注意的是,这种关系Eq(iii)是独立于实验条件,只依赖于邻近的基因。因此,使用经验贝叶斯统计,从Limma包[35]中获取,通过所需对比之间的显著偏差的剩余值检测出不同表达的基因。我们测试了使用1至14个相邻基因(Eq(iii)的N)的DELocal性能。日志规范化和规范化计数值分别用于德本地的微阵列和 RNAseq 数据。小鼠基因组中有334个蛋白质编码基因,它们的1Mb邻点中没有任何其他蛋白质编码基因。因此,我们在DELocal分析中还使用了附近可用的非蛋白质编码基因。然而,在加入非蛋白质编码基因后,仍有17个蛋白质编码基因在1Mb内没有任何邻点。
绩效衡量
将 DELocal 与适用于微阵列或 RNAseq 的不同公开可用工具进行了比较:RankProd[50],山姆[51],DEMI[52],利玛[35],边缘[53]和 DESeq2[34]。所有这些程序都是用默认参数执行的。这些工具报告的 p 值< = 0.05 的基因被标记为差分表示,并用于使用以下指标和接收器操作特征 (ROC) 曲线来评估每个工具的性能。
· 敏感度(召回),真实正利率TPR = TP/ (TP = FN)
· 特异性,真实负利率 SPC = TN / (TN = FP)
· 精度、正预测值 PPV = TP/ (TP + FP)
· 精度, Acc = (Tp = Tn) / (Tp = Fp = Fn = Tn)
· F1 成绩, F1 = 2tp / (2tp = Fp = Fn)
· 马修斯相关系数 (MCC) |
其中TP,真正的积极:FP,误报;TN,真正的负面:FN ,假底片。
牙齿发育基因被用来为分析找到真假阳性率(S1表和参考[19,37])。其余的基因(成千上万个)被认为是真正的阴性。由于这些基因数量众多,可以通过预测所有基因以非差分表达来达到非常高的准确性。因此,因为我们的目标是找到真正的牙齿基因,我们专注于召回,精度,F1,MCC和区域下的ROC曲线,而不仅仅是精度评估的方法。中华民国曲线下的区域是用 ROCR[27]包计算的。此外,我们比较了按不同方法排列高基因的排名和日志变化的差异(图8)。-医学论文发表
支持信息
S1 图 -
显示 1/8: pcbi.1008947.s001.tif
跳到无花果共享导航
1 / 8
下载
无花果份额
在每个基因周围1MB窗口内,小鼠染色体(x轴)和"邻接基因"(y轴)数量的基因分布。
https://doi.org/10.1371/journal.pcbi.1008947.s001
(蒂夫)
S2 图。在小鼠基因组中,具有5-9个相邻基因的基因最为常见。
每个点代表在 1 Mb 窗口中具有相同数量的相邻蛋白质编码基因的基因数量。
https://doi.org/10.1371/journal.pcbi.1008947.s002
(蒂夫)
S3 图。GO 术语越具体,其基因的邻居就越少。
每个馅饼代表一个GO术语的基因在根GO术语"生物过程"。GO 术语在接近根词"生物过程"后从上到下排列。颜色编码表示基因从同一 GO 术语中产生的邻家数量。对人类基因组进行了分析。请参阅S2 表,查看 GO ID。
https://doi.org/10.1371/journal.pcbi.1008947.s003
(蒂夫)
S4 图。DELocal 的性能比较使用带 1 Mb 窗口的邻里和 TAD 边界(使用 RNAseq 数据)进行计算。
https://doi.org/10.1371/journal.pcbi.1008947.s004
(蒂夫)
S5 图。将 DELocal 与早期识别差分表达的方法进行比较。
微阵菌数据的评估矩阵。与 RNAseq 数据 (图 7)相比,DELocal 在微阵列数据中的性能较低,这可能是由于微阵列中的基因和邻里数据数量有限。评估矩阵在材料和方法部分进行解释。
https://doi.org/10.1371/journal.pcbi.1008947.s005
(蒂夫)
S6 图。牙齿发育基因等级的分布。
与其他三种方法相比,DELocal 预测的牙齿发育基因显著(威尔科森排名测试;p 值< = 1.0e-06)在排名靠前的位置上丰富。虽然其他方法识别了更多的基因(框图旁边列出的数字),但这种改进的召回正在牺牲特异性。DELocal 平衡也反映在 F1、MCC 和 ROC 曲线(图6和7)中。
https://doi.org/10.1371/journal.pcbi.1008947.s006
(蒂夫)-医学论文发表
https://doi.org/10.1371/journal.pcbi.1008947.s007
(XLSX)
https://doi.org/10.1371/journal.pcbi.1008947.s008
(多克克斯)
确认
我们感谢P.拉斯塔斯和P.奥维宁的讨论。我们感谢DNA测序和基因组学实验室的P.奥维宁、L.保林和P.莱马宁进行批量RNA测序。
引用
00001. 1.雅各布F,单体J.基因调控机制在蛋白质的合成。J 莫尔生物 1961;3:318+56.埃普布 1961/06/01.下午:13718526。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00002. 2.布鲁门塔尔 T, 戴维斯 P, 加里多 - 莱卡 A. 奥佩龙和 C. elegans 基因组中的非奥佩龙基因簇。蠕虫书。2015:1–20.埃普布 2015/05/06.下午:25936768:酒吧中央 PMCID: PMC4781206.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00003. 3.吉拉德 · Lr, 菲德勒 · Tj, 哈里斯 · Tw, 卡瓦略 · F, 安托舍奇金一世, 汉 M 等人。蠕虫书: 卡诺哈布迪炎电子生物学的在线评论。核酸 Res. 2007:35 (数据库问题):D 472+5.埃普布 2006/11/14.下午:17099225:酒吧中央 PMCID: PMC1669767。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00004. 4.Zabidi MA, Stark A. 监管增强器 - 核心促进器通过转录因子和共同制造商进行沟通。遗传学趋势:TIG。2016;32(12):801–14.埃普布 2016/11/07.下午:27816209。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00005. 5.勒彻MJ,乌鲁蒂亚AO,赫斯特LD.家政基因的聚类提供了人类基因组中基因顺序的统一模型。自然遗传学。2002;31(2):180–3.下午:11992122
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00006. 6.沃格尔 Jh, 冯 · 海德布雷克 A, 珀曼 A, 斯珀林 · 斯杰布。人类转录仪的染色体聚类揭示了调控背景。2005;6(1):230.下午:16171528
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00007. 7.特维宁A、艾因-多尔L、奥泽里-弗拉托M、沙米尔R.功能基因组集中在染色体、染色体和人类基因组的核空间中。核酸研究。2014;42(15):9854–61.核酸研究。下午:25056310
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00008. 8.蒂里卡 T, 西尔马拉 M, 维希宁 M. 基因组中基因本体术语的聚类。基因。2014;550(2):155–64.埃普布 2014/07/06.下午:24995610。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00009. 9.莱迈 Dg, 马丁 Wf, 欣里奇斯 As, 里延克尔 M, 德国 Jb, 科尔夫 I, 等等。G-NEST:一种基因邻点评分工具,可识别共同保存、共同表达的基因。2012;13(1):253.下午:23020263
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00010. 10.芙蓉 EEM ,莱文 M. 发育增强剂和染色体拓扑学。科学。2018;361(6409):1341–5.埃普布 2018/09/29.下午:30262496:酒吧中央 PMCID: PMC6986801。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00011. 11.罗布森 MI, 林格尔 AR, 蒙德洛斯 S. 监管景观: 增强器促进器通信是如何雕刻在 3D. 摩尔细胞。2019;74(6):1110–22.埃普布 2019/06/22.下午:31226276。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00012. 12.小迪克森、塞尔瓦拉杰 S 、岳 F 、金 A 、李 Y 、申 Y 等人。通过分析染色质相互作用,确定了哺乳动物基因组中的拓扑领域。自然界。2012;485(7398):376–80.埃普布 2012/04/13.下午:22495300:酒吧中央 PMCID: PMC3356448.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00013. 13.诺拉埃普, 拉乔伊 Br, 舒尔茨 Eg, 乔盖蒂 L, 冈本一世, 仆人 N, 等等。X 失活中心监管格局的空间划分。自然界。2012;485(7398):381–5.埃普布 2012/04/13.下午:22495304:酒吧中央 PMCID: PMC3555144.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00014. 14.弗拉瓦汉 · 瓦、干燥 Y 、利奥 · 布布、吉莱斯皮 · 斯姆、文泰彻 · 阿斯、斯特默 - 拉查米莫夫 · 奥等人。IDH 突变胶质瘤中的绝缘体功能障碍和肿瘤活化。自然界。2016;529(7584):110–4.埃普布 2015/12/25.下午:26700815:酒吧中央 PMCID: PMC4831574.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00015. 15.西蒙斯 O, 乌斯卢 Vv, 筑村 T, 鲁夫 S, 纳萨里 S, 施瓦泽 W 等。哺乳动物监管领域的功能和拓扑特征。基因组 Res. 2014;24 (3):390+400.埃普布 2014/01/09.下午:24398455:酒吧中央 PMCID: PMC3941104。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00016. 16.西科尔斯卡 N, 塞克斯顿 T. 定义功能相关的空间色度域: 这是一个 Tad 复杂。J 摩尔生物 2020;432 (3):653+64.埃普布 2019/12/22.下午:31863747。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00017. 17.索勒 - 奥利瓦 · 梅, 格雷罗 - 马丁内斯 · 贾, 巴切蒂五世, 雷耶斯 Jc 。共同表达域与色度素 3D 组织之间的关系分析。PLoS 计算生物 2017;13 (9):e1005708.埃普布 2017/09/14.下午:28902867:酒吧中央 PMCID: PMC5612749.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00018. 18.埃雷斯 · 伊, 吉拉德 · Y一个 Tad 怀疑论者: 3D 基因组拓扑学是否保存?遗传学趋势:TIG。2021;37(3):216–23.埃普布 2020/11/19.下午:33203573:酒吧中央 PMCID: PMC8120795。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00019. 19.哈利卡斯O,达斯罗伊R,克里斯滕森M,伦沃伊斯E,苏利奇A-M,杰恩瓦尔J.系统级分析哺乳动物牙齿发育所需的基石基因。J Exp 动物园 B 部分莫尔 · 德夫 · 埃沃尔 [在媒体上] 。2020. 下午:33128445
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
20.马丁 W 巷 N.基因组复杂性的能量。自然界。2010;467(7318):929–34.下午:20962839-医学论文发表
00020.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00021. 21.杰恩瓦尔 J, 塞斯莱夫 I. 牙齿形状的形成和牙齿更新: 以相同的信号进化。发展。2012;139(19):3487–97.埃普布 2012/09/06.下午:22949612。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00022. 22.基因本体论C.基因本体论资源:20年,依然强。核酸 Res. 2019;47 (D1):D 330+D8.埃普布 2018/11/06.下午:30395331:酒吧中央 PMCID: PMC6323945。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00023. 23.阿什燃烧器 M, 球卡, 布莱克贾, 博茨坦 D, 巴特勒 H, 樱桃 Jm, 等等。基因本体论:生物学统一的工具。基因本体论联盟。自然遗传学。2000;25(1):25–9.埃普布 2000/05/10.下午:10802651:酒吧中央 PMCID: PMC3037419.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00024. 24.德拉特W,格罗夫尔德F.空间组织基因表达:活性色素中心。染色体研究。2003;11(5):447–59.下午:12971721
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00025. 25.牙齿中的基因表达(WWW数据库),赫尔辛基大学发育生物学方案,[因特网]。赫尔辛基大学1996–2007.可从: http://bite-it.helsinki.fi.
00026. 26.李CY、胡J、陆H、兰J、杜W、加利西亚N等人抑制YAP/TAZ活动,以调节牙齿发育过程中信号中心的形成。自然通信。2016;7:12133.埃普布 2016/07/14.下午:27405641:酒吧中央 PMCID: PMC4947177。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00027. 27.唱 T, 桑德 O, 比伦温克尔 N, 伦高尔 T. Rocr: 可视化分类器性能在 R. 生物信息学 (牛津, 英国) 。2005;21(20):3940–1.生物信息学。下午:16096348
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00028. 28.德比亚斯 - 蒂博 M, 梅特卡夫 Cj, 波拉克 J, 格蒙一世, 埃克 M, 德普 M 等人。下颚脊椎动物中Dlx寄生虫共同表达的异质保护。普洛斯一号2013;8(6):e68182。埃普布 2013/07/11.下午:23840829:酒吧中央 PMCID: PMC3695995。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00029. 29.贝维尔达姆 A、 梅洛 · 格罗、 帕莱利 L 、曼特罗 · S 、格诺瓦 F 、芭比莉 · 奥等人。Dlx5/Dlx6 失活后获得对称性的 Jaw 转换: 过去的镜子?成因。2002;34(4):221–7.埃普布 2002/11/16.下午:12434331。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00030. 30.托马斯 · 布尔、塔克 · 阿斯、奎 M 、弗格森 · 卡、哈德卡斯特 Z 、鲁宾斯坦 · Jl 等人。Dlx-1 和 Dlx-2 基因在穆林凹痕图案中的作用。发展。1997;124(23):4811–8.埃普布 1998/01/15.下午:9428417。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00031. 31.邱 M , 布尔福内 A , 加塔斯一世, 梅内塞斯 Jj , 克里斯滕森 L , 夏普 PT 等。Dlx 家谱盒基因在分支拱门的近现代图案中的作用:Dlx-1、Dlx-2 和 Dlx-1 和 -2 的突变改变了源自第一和第二拱门的近似骨骼和软组织结构的形态。开发生物 1997;185 (2):165+84.埃普布 1997/05/15.下午:9187081。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00032. 32.韦尔塔-塞帕斯J,什克拉奇克D,福斯隆德K,库克H,海勒D,沃尔特MC,等人蛋鸡4.5:一个等级矫形框架,改进真核,益生菌和病毒序列的功能注释。核酸研究。2015;44 (D1):D 2866+D+93.核酸研究。下午:26582926
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00033. 33.福冈 Y , 伊诺卡 H ,科哈内 IS 。真核基因组中相邻基因共同表达的物种间差异。BMC基因组学。2004;5(1):4.下午:14718066
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00034. 34.爱 Mi, 胡伯 W, 安德斯 · 斯杰格布用 DESeq2 对 RNA-seq 数据的折叠变化和分散进行适度估计。2014;15(12):550.下午:25516281
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00035. 35.里奇·梅、菲普森B、吴D、胡Y、劳CW、史W等人对RNA测序和微阵列研究进行微分表达分析。核酸研究。2015;43 (7):e47+e. 核酸研究。下午:25605792
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00036. 36.杜林克 S, 斯派曼 Pt, 伯尼 E, Huber W. 映射标识符, 用于将基因组数据集与 R/ 生物导体包生物母体集成。自然协议。2009;4(8):1184–91.埃普布 2009/07/21.下午:19617889:酒吧中央 PMCID: PMC3159387.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00037. 37.尼米宁 P, 佩卡宁 M, 阿伯格 T, 塞斯莱夫一。关于牙齿基因表达的图形化WWW数据库。Eur J 口述科学 1998;106 Suppl 1:7+ 11.埃普布 1998/04/16.下午:9541196。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00038. 38.碳 S, 爱尔兰 A, 蒙格尔 Cj, 舒 S, 马歇尔 B, 刘易斯 S, 等等。AmiGO:在线访问本体论和注释数据。生物信息学(英国牛津)。2009;25(2):288–9.埃普布 2008/11/27.下午:19033274:酒吧中央 PMCID: PMC2639003。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
39.祖费雷 M, 塔弗纳里 D, 猎户座 E, 西里耶罗 G. 计算方法的比较, 以识别拓扑关联域。基因组生物 2018:19 (1):217.埃普布 2018/12/12.下午:30526631:酒吧中央 PMCID: PMC6288901。-医学论文发表
00039.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00040. 40.刘T、波特J、赵C、朱H、王N、孙Z等人:家庭分类和拓扑相关领域的知识库。BMC基因组学。2019;20(1):217.埃普布 2019/03/16.下午:30871473:酒吧中央 Pmcid: Pmc6419456 。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00041. 41.余 M ,任 B 。哺乳动物基因组的三维组织。安努修订细胞开发生物 2017;33:265+89.埃普布 2017/08/09.下午:28783961:酒吧中央 PMCID: PMC5837811。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00042. 42.本格森 H, 伊里扎里 R, 卡瓦略 B, 速度 Tp. 估计和评估原始副本数字在单一点水平。生物信息学(英国牛津)。2008;24(6):759–67.埃普布 2008/01/22.下午:18204055。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00043. 43.戴 M , 王 P , 博伊德 AD , 科斯托夫 G , 阿泰 B , 琼斯 EG 等。不断演变的基因/脚本定义显著改变了对基因芯片数据的解释。核酸 Res. 2005:33 (20):e175.下午:16284200:酒吧中央 PMCID: PMC1283542。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00044. 44.安德鲁斯 S. FastQC:用于高吞吐量序列数据的质量控制工具。2010年[引用2019年]。可从: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/.
00045. 45.陈 S ,黄 T ,周 Y ,韩 Y ,徐 M ,顾 JJBB 。后QC:快速数据的自动过滤、修剪、错误排除和质量控制。2017;18(3):80.下午:28361673
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00046. 46.博尔格 AM, 洛塞 M, 乌萨德尔 B. 修剪: 一个灵活的修剪器为伊卢米纳序列数据。生物信息学(英国牛津)。2014;30(15):2114–20.埃普布 2014/04/01.下午:24695404。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00047. 47.多宾 A, 戴维斯卡, 施莱辛格 F, 德连考 J, 扎莱斯基 C, Jha S, 等人明星: 超快通用 RNA - seq 对齐器。生物信息学(英国牛津)。2013;29(1):15–21.埃普布 2012/10/25.下午:23104886。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00048. 48.安德斯 S, 皮尔 Pt, 胡伯 W. Htseq - 一个 Python 框架, 以处理高通量测序数据。生物信息学(英国牛津)。2015;31(2):166–9.埃普布 2014/09/25.下午:25260700。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00049. 49.里苏埃诺 A, 罗森 - 布尔戈 B, 多尔尼克 A, 埃尔南德斯 - 里瓦斯 Jm, 布林格 L, 德拉斯里瓦斯 J 。对外在表达的有力估计,以确定应用于人体组织和癌症样本的替代拼接基因。BMC基因组学。2014;15:879.埃普布 2014/10/10.下午:25297679:酒吧中央 PMCID: PMC4298068。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00050. 50.德尔卡拉托雷F,扬凯维奇A,艾辛加R,赫斯克T,洪F,布赖特林R.RankProd 2.0:一个重构生物导体包,用于检测分子分析数据集中不同表达的特征。生物信息学(英国牛津)。2017;33(17):2774–5.埃普布 2017/05/10.下午:28481966:酒吧中央 PMCID: PMC5860065。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00051. 51.Tusher VG,提布希拉尼R,朱G.微阵菌的意义分析应用于电离辐射响应。美利坚合众国国家科学院学报。2001;98(9):5116–21.埃普布 2001/04/20.下午:11309499:酒吧中央 PMCID: PMC33173。
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
00052. 52.伊尔姆约尔夫 S, 洪达尔卡, 雷梅茨 R, 尼苏 M, 科尔德 R, 维洛 J 等。估计多个指标的差分表达。核酸研究。2014;42 (8):e72+e. a.J 核酸研究。下午:24586062
· 查看文章
· 普布梅德/NCBI
· 谷歌学者
53.罗宾逊医学部, 麦卡锡 Dj, 斯密斯 Gk 。edgeR:用于数字基因表达数据微分表达分析的生物导体包。生物信息学(英国牛津)。2009;26(1):139–40.%J 生物信息学。下午:19910308-医学论文发表
00053.
· 查看文章
· 普布梅德/NCBI
· 谷歌学者