免费医学论文发表-一个用于量化网络变化并确定风险基因优先级的
抽象
不同的基因在细胞内形成复杂的网络以执行关键的细胞功能,而在此过程中的网络改变可能会引入下游转录组扰动和表型变异。因此,开发有效且可解释的方法来量化网络变化并查明不同条件下的驱动基因至关重要。我们提出了一种分层图表示学习方法,称为iHerd。给定一组网络,iHerd首先以数据驱动的方式分层生成一系列粗略的子图,表示不同分辨率(例如,信号通路的水平)的网络模块。然后,它通过高效的图嵌入在所有层次结构级别按顺序学习低维节点表示。最后,iHerd在其图比对模块中将单独的基因嵌入投影到同一潜在空间上,以计算驱动基因优先级的重新布线指数。为了证明其有效性,我们使用大脑的单细胞多组数据将iHerd应用于肿瘤到正常的GRN重新布线分析和细胞类型特异性GCN分析。我们表明,iHerd可以有效地查明不同疾病中新的和众所周知的风险基因。与现有模型不同,iHerd的分层学习图粗略化使我们能够成功地将网络驱动基因分类为早期和晚期发散基因(EDG和LDG),强调在信号通路水平之间和信号通路水平内具有广泛网络变化的基因。这种独特的驱动基因分类方法可以为我们提供更深入的分子见解。该代码可在 https://github.com/aicb-ZhangLabs/iHerd 免费获得。所有其他相关数据都在手稿及其支持信息文件中。
作者摘要
在我们的研究中,我们开发了一种名为iHerd的新方法,以更好地了解基因如何在细胞内协同工作,以及这些相互作用的变化如何导致各种疾病。我们的方法使我们能够分析复杂的基因网络,并确定在不同条件下导致网络变化的关键基因。我们将iHerd应用于各种数据集,发现它可以有效地查明与不同疾病相关的基因。我们的方法还有助于根据这些基因引起的网络变化程度对这些基因进行分类,从而更深入地了解所涉及的分子机制。我们的研究旨在提高我们对基因相互作用及其在疾病发展中的作用的理解,最终有助于发现新的治疗靶点。该代码可供研究人员在他们的工作中使用和构建。
数字
Table 5图1图2图3Table 1Table 2Table 3Fig 4Fig 5Table 4Fig 6Fig 7Fig 8Table 5图1图2图3
引文: 段 Z, 戴 Y, 黄 A, 李 C, 谢 K, 肖 C, 等. (2023) iHerd:一个用于量化网络变化并确定风险基因优先级的 i 融合 h ierarchical graph representation 学习框架。公共科学图书馆计算生物学19(9): e1011444. https://doi.org/10.1371/journal.pcbi.1011444
编辑 器: 刘杰,美国密歇根大学
收到: 四月 16, 2023;接受: 19月 2023, 11;发表: 2023月 <>, <>
版权所有: ? 2023 段等这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 该代码可在 https://github.com/aicb-ZhangLabs/iHerd 免费获得。所有其他相关数据都在手稿及其支持信息文件中。
资金: ZD、YD、AH、CL 和 JZ 得到了美国国立卫生研究院 (http://www.nih.gov) K01MH123896、R01HG012572 和 R01NS128523 的资助。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
竞争利益: 提交人声明不存在相互竞争的利益。
介绍
在生物学中,细胞通过精确的时空控制来维持高度协调的基因表达模式,以决定基本的分子功能[1]。许多研究报道,这种动态控制过程中的改变(例如,基因调控或基因共表达关系的变化)可导致表达水平的扰动、表型变化和多种疾病[2]。因此,系统生物学的一个重要目标是使用网络表示分析分别对基因调控网络(GRN)和基因共表达网络(GCN)等调控关系和基因相互作用进行建模[3]。
新型功能基因组学和转录组学分析的最新进展使我们能够在全基因组范围内直接分析基因调控和相互作用,使我们能够在各种生物学条件下构建高置信度的GRN和GCN[4]。此外,单细胞革命,特别是单细胞多组学测序,将我们对这种生物网络的理解扩展到尽可能高的分辨率 - 单个细胞 - 为模拟和解释目标细胞类型的网络异质性和动力学提供了前所未有的机会[5]。最后,科学界的透明数据共享计划进一步为科学家提供了在不同条件下直接访问群体规模功能基因组和单细胞测序数据的机会[6]。综合起来,这些进展为科学家提供了前所未有的机会来研究转录网络动力学,并为预防医学和药物开发突出新的风险基因。
然而,由于三个原因,对网络变化(即重新布线事件)进行建模仍然具有计算挑战性[7]。首先,GRN和GCN通常稀疏且嘈杂,尤其是从单细胞组学数据推断的GRN和GCN[8]。因此,直接的边沿增益和损耗计数方法无法精确地对网络重新布线事件进行建模和量化。其次,多个基因协同工作以执行某些分子功能(例如,同一信号通路中的基因),使它们高度相关并违反了独立且相同分布的假设[9]。已经提出了几种模型来使用潜在狄利克雷分配来解决这种依赖性[10]。虽然有希望,但这些模型仍然缺乏量化特定路径内和跨特定路径的网络重新布线状态的能力。最后,广泛的基因组学数据的可用性为基因提供了丰富的特征,例如表观遗传状态和突变特征[11]。不幸的是,现有方法通常忽略其网络建模中的节点特征,并且无法提供分层信息[12]。迫切需要新的模型来有效地整合额外的节点特征,并以分层方式提供基因通路信息,以促进疾病研究中准确的风险基因优先级。
为了解决这些问题,我们提出了一种新的计算方法iHerd,可以有效地量化不同生物条件下的网络重新布线状态。如图1所示,给定一组网络(例如,GRN和GCN),iHerd首先以数据驱动的方式分层生成一系列粗略的子图,以不同的分辨率表示基因群落以模拟信号通路。然后,它通过高效的图嵌入在所有层次结构级别按顺序学习低维节点表示。最后,iHerd包含一个图比对模块,通过将单独的基因嵌入投影到相同的潜在空间上,以计算每个基因在每个分层子图级别上的重新布线指数。这个过程使得测量网络改变和突出具有广泛网络变化的基因成为可能,并直接解释。与现有方法不同,iHerd可以直接从观察到的网络中提取复杂的基因依赖性,并结合丰富的节点特征(例如,转录组和表观遗传谱)来共同量化不同条件下的网络变化。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. iHerd的整体框架。
它是一个端到端的学习框架,其中包含图粗化模块、图表示学习模块、嵌入细化模块和分层嵌入对齐模块。方法部分介绍了每个组件的详细信息。
https://doi.org/10.1371/journal.pcbi.1011444.g001
为了证明其有效性,我们将iHerd应用于肿瘤到正常的GRN重新布线分析和细胞类型特异性GCN分析,使用死后大脑中的单细胞多组数据。我们发现iHerd可以有效地查明不同疾病模型中新的和众所周知的风险基因。此外,iHerd的分层学习图粗略方案使我们能够成功地将网络驱动基因分类为早期和晚期发散基因(EDG和LDG),代表在信号通路水平之间和信号通路水平内具有广泛网络变化的基因。这种独特的驱动基因分类方法为我们提供了更深入的分子见解。我们通过独立的转录组学分析进一步验证了EDG和LDG,证明了我们方法的强大功能。
总之,iHerd可以在多个层面上可靠地捕获丰富简洁的网络拓扑信息,分层量化网络变化,并通过分子解释精确定位网络重新布线驱动基因。我们已经将iHerd作为一个免费软件包实施,可供社区使用,以量化网络变化并确定疾病风险基因的优先级。随着不同条件下可用的群体规模功能基因组和单细胞测序数据的爆炸式增长,我们相信iHerd将成为未来研究的有力工具。
结果
iHerd 通过整合大规模 ChIP-seq 数据恢复关键的肿瘤到正常的监管层次结构变化
转录通过不同转录因子(TFs)的协同相互作用进行协同调节。证据线表明,TF-TF监管网络(一种特定的GRN)自然形成了一个具有向下信息流倾向的层次结构[13]。在某种程度上,科学家们认为,层次结构而不是连通性更好地反映了调节者的重要性,这种层次结构关系的扰动会导致基因表达水平的级联扰动,从而导致广泛的疾病。因此,我们首先使用iHerd分析了肿瘤发生过程中的TF-TF GRN改变。
与之前的工作类似[10],我们选择了两种广泛使用的Tier-1 ENCODE细胞类型K562和GM12878,以大致代表相似的肿瘤与正常比较。具体来说,我们通过修剪由 ChIP-seq 数据构建的官方 ENCODE TF 网络来编译共享 TF-to-TF GRN(详细信息见方法部分)。因此,我们使用两个正常和肿瘤TF-to-TF GRN作为iHerd的输入,两者都具有来自86个常见TF的40条边缘。
为了更好地捕获TF层次结构信息,我们专门设计了iHerd的图嵌入方法,主要捕获拓扑身份信息(详见方法部分)。在训练过程中,我们首先在K562上分别拟合我们的模型,并GM12878 TF到TF GRNs,以获得每个TF的潜在表示。如图2A-2D所示,iHerd将40个TF组织成三个不同的簇,它们的进/出度比存在明显差异(K0为57.0、92.3和18.562)。这种模式在两种细胞类型中高度一致(GM0为14.0、91.1和78.12878)。根据进/出度比,我们将这三个TF组类比为指挥官(进出<),信使(进出≈)和士兵(进出>)(图2A-2D)。我们的发现与之前关于类似细胞类型中网络层次结构的报告高度一致。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. iHerd 恢复转录因子 (TF) GRN 中的层次结构更改。
(a) GM12878中TF嵌入的UMAP格式。(b) GM12878中三个聚类的箱线图,表示入度和出度的比率。(c) K562中TF嵌入的UMAP格式。(d) K562中三个聚类的入度和出度之比的箱线图。(e) TF2 在 GM12878 和 K562 中嵌入的 UMAP,没有嵌入对齐。(f) 嵌入对齐后的 TF2 在GM12878和 K562 中的嵌入 UMAP。(g) 排序归一化 L2 距离的线图。紫点表示此 TF 存在切换事件。非交换TF和交换TF之间的归一化l2距离的箱线图也表明,l2距离较高的TF有更多的机会将其簇从GM12878切换到K562。(H-J)三个 TF 示例的 UMAP 将其集群从 GM12878 切换到 K562。
https://doi.org/10.1371/journal.pcbi.1011444.g002
接下来,我们旨在量化TF到TF GRN的重新布线,并突出显示在正常到肿瘤过渡中改变网络层次结构的关键TF。已经为此类分析开发了几种方法,例如分层分数最大化[13],广度优先搜索[14]和顶点排序[15]算法。然而,对于只有固定和离散的TF层次结构分配,这些方法无法提供具有足够分辨率的定量测量,以精确测量每个TF在不同条件下的GRN拓扑变化。相比之下,iHerd采用不同的方法,将两个图嵌入对齐到同一个潜在空间上,其中TF通过其拓扑作用(图2F)而不是其细胞类型(图2E)组织成不同的簇。然后,我们可以自然地计算对齐潜在空间中TF嵌入的归一化L2距离()作为TF重接线分数。作为验证,我们将TF分为层次结构改变组和层次结构保留组(图2F中的紫色和灰色点),并比较了它们在肿瘤和正常细胞中的值。正如预期的那样,层次结构变化的TF在K562-GM12878比较中显示出显着更高的值(0.78.对0.42,P值4E-4),验证了我们的iHerd算法的可行性。
最后,我们选择了肿瘤到正常GRN中最大的顶级TF,并直接可视化了它们在均匀流形近似和投影中的拓扑作用变化(UMAP;放大点,图2H-2J)。例如,BCLAF1从GM12878的士兵组跳到K562的指挥官组,在正常到肿瘤的转变中表现出最大的。有趣的是,这一发现与BCLAF1作为促进死亡的TF的众所周知的作用一致,在许多癌症类型中具有显着上调的基因表达[16]。同样,TATA结合蛋白被致癌信号通路上调,被认为是致瘤遗传病变下游发生的信号失调的关键组成部分[17]。如图12878I所示,该TF的角色也从GM562的士兵组转变为K2中的指挥官组。此外,iHerd强调了GABPA,这是一种选择性募集到TERT启动子突变形式的TF,以激活大多数人类癌症中的TERT转录[18]。所有这些TF都显示出从正常状态到疾病状态的分层变化,并且在癌症中具有已知的作用,表明iHerd可以忠实地恢复GRN的变化,并以良好的可解释性量化跨条件的网络重新布线事件。
iHerd 在 TF 优先级任务中优于四种基线方法
a) 模拟实验设置。
由于缺乏基本事实,我们操纵了GM12878和K562 GRN,如图3A所示。对于GM12878 GRN () 中的节点 i,我们通过随机删除其现有边(例如,BCLAF1 到 BHLHE40 和 BCLAF1 到 GABPA,图 3A)并在 K1 GRN 中从边缘添加新边(BCLAF2 到 CHD1 和 BCLAF3 到 FOS,图 562A),模拟了新的 GRN()。 我们不会修改节点 i 的非连接节点中的任何边。因此,当与 进行比较时,节点 i (d我) 应大于任何 dj,j ≠ i,因为节点 j 几乎没有任何更改。同样,我们对 中的每个 TF 重复此过程。请注意,如果此过程产生隔离节点,或者两个 GRN 没有差异,则将丢弃一个模拟。最后,我们有 44 个模拟网络对。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 模拟GRN实验。
(a) GRN的模拟方案。 (b) 假阳性测试的小提琴图。(c) 假阳性测试的节点变化距离的分布。
https://doi.org/10.1371/journal.pcbi.1011444.g003
b) 基线方法。
我们用四种基线方法进行了基准测试(下表1)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 1. 基线方法摘要。
https://doi.org/10.1371/journal.pcbi.1011444.t001
节点度数更改。该基线方法按两个有向GRN中的度数变化对节点进行排名。 度数变化(ΔD)是度数(d在) 和出度 (d外) 更改。给定两个图 G1和 G2,每个节点都有 N 个节点,.
聚类系数变化。聚类系数,Cv,对于具有 k 的节点 vv邻居,反映邻居的亲密关系。它的计算方式为 ,其中 ev是 k 之间的边数v邻居。两个GRN中相同节点之间聚类系数的绝对差异G1和 G2计算公式为 ΔC = |C(G1)?C(G2)|.重大更改意味着网络连接更改。
页面排名更改。节点 v 的 PageRank (PR) 由下式给出,其中 d 是阻尼因子(通常为 0.85),N 是网络中的节点总数,E 是网络中的边集,L(u) 是节点 u 的传出链路数。随机初始化后,PageRank 值会迭代更新,直到收敛。两个 GRN 之间的页面排名变化 G1和 G2,每个节点有 N 个节点,计算公式为 ΔPR = |公关(G1)?PR(G2)|.
对比学习。该方法将鲁汶算法应用于初始聚类并优化节点嵌入 (E∈RN×d,N:节点数,d:嵌入维度),通过调整集群间/集群内距离。来自两个 GRN 的节点嵌入之间的距离 G1和 G2计算公式为 ΔE = ‖(G1)?E(G2)‖2,其中 ‖*‖2代表 L-2 规范。距离越远表示连接发生重大变化。
c) 基准测试结果。
我们使用 R@n(在前 n 个预测 TF 中找到修改后的 TF 的机会)进行基准测试。具体来说,让 x我是更改的节点和 Pi,n表示根据节点距离预测的前n个节点,我们可以定义C我作为二进制指标函数,其中 C我= 1,如果 x我在 P 中i,n否则 0.然后,R@n 定义如下:,其中 |S|是网络对总数。如表2所示,我们发现iHerd在所有不同召回水平上始终优于所有其他方法。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 2. TF 优先级基准测试。
https://doi.org/10.1371/journal.pcbi.1011444.t002
d) 误报率分析。
按照建议,我们进行了假阳性率分析,并检查了两种情况,如表3所示。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 3. 误报率分析。
https://doi.org/10.1371/journal.pcbi.1011444.t003
首先,我们计算了平均节点距离(Δdf,前景)比较不同的GRN(,请参阅“1.1.模拟实验设置“了解详情)。
其次,我们计算了平均节点距离(Δdb,背景)比较相同的GRN()。
这两种方案都已在 的 44 个修改版本中进行了测试。如图3B和3C所示,Δdf明显大于 Δdb(0.21 vs. 0.03,双侧 t 检验的 P = 1e-22,证明了 iHerd 的稳健性。
iHerd从死后大脑中的单细胞RNA测序数据中鉴定不同细胞类型的早期和晚期不同基因
在细胞内,一组分子通过一系列生化反应协同工作,以控制关键的细胞功能,例如细胞分裂或细胞死亡([19])。这种协作活动的改变(即GCN中的“共表达改变”)可能会引入下游转录组扰动、表型变异和细胞命运决定[20]。因此,我们接下来将iHerd应用于源自单细胞数据的细胞类型特异性GCN,以研究不同生物学条件下的基因共表达变化。
为了构建高置信度的GCN,我们从七个死后脑样本中生成了单细胞多组数据。经过统一的预处理和严格的质量控制,保留84,852个细胞,并使用规范标记基因聚集成七种主要细胞类型(图4A,详细信息见方法部分;标记基因的点图如图4B所示)。为了克服单细胞测序数据的稀疏性,我们在每个簇内构建了元细胞,并运行WGCNA[21]以细胞类型特异性的方式构建高置信度的GCN。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. iHerd识别细胞类型之间的不同不同基因。
(a)使用RNA的UMAP中的不同神经元和非神经元组。这里有七个样本和84,852个细胞。(b)不同细胞类型的基因表达着色的点阵图。这些基因在七种细胞类型中差异表达。(c) 发现不同不同基因的例证。g之间的L2距离2和 g'2早期低于阈值,但后期超过阈值。而L2之间的距离g1和 g'1超过所有阶段的阈值。(d)归一化抽象相关性的箱线图,从兴奋性神经元到顶部保守基因之间的大胶质细胞变化。在这里,我们选择5%L2距离最大的基因作为顶部的重新布线基因,5%的L2距离最小的基因作为最保守的基因。EDG在不同阶段的归一化L2距离。我们选择一个示例EDG:PPARG,其基因表达的小提琴图表明PPARG在神经元中高度表达。(f) LDG在不同阶段的归一化L2距离。我们选择一个示例LDG:RUNX2,其基因表达的小提琴图表明RUNX2在小胶质细胞中高度表达。iHerd中的“中间”是指原始网络的第一个粗化阶段。通过“早期”,“中间”和“晚期”代表最粗糙,半粗糙和原始网络,我们可以更深入地了解不同生物学背景下的基因行为。
https://doi.org/10.1371/journal.pcbi.1011444.g004
首先,我们专注于三个正常对照样本,以研究主要脑细胞类型的GCN变化。具体来说,我们在兴奋性神经元和小胶质细胞中保留了435个常见的高度可变基因,并构建了细胞类型特异性GCN作为iHerd的输入。我们在模型中启用了图粗化过程,目的有两个:1)区分途径内和途径之间的基因相互作用模式变化;2)加速大型图的训练过程。如图4C所示,iHerd在每个子图级别分层学习节点(基因)嵌入,然后将来自不同细胞类型的这些嵌入对齐到相同的潜在空间。可以相应地计算每个水平,最粗图(早期,图4C中的浅蓝色)代表不同的通路信息,完整图(晚期,图4C中的深蓝色)捕获本地社区信息。然后,我们根据每个图水平中的模式将重新布线的驱动基因分类为EDG和LDG。具体来说,EDG被定义为在所有图水平上具有持续高值的基因,而LDG是在粗图水平(浅蓝色,图4C)和密集图水平(深蓝色,图4C)具有小值的基因。
然后,我们选择了21个在任何图形水平上兴奋性神经元和小胶质细胞之间L5距离前2%的基因作为驱动不同细胞类型GCN变化的候选基因。为了验证这些基因,我们比较了相关性变化的总和(∑Δ|ρ|)我们具有对照基因的优先组(底部L2距离)。与我们的预测一致,与底部重新布线基因相比,顶部重新布线基因显示出更大的相关性变化(0.72 vs. 0.26,P 值 8E-4,图 4D),验证了我们的优先级方案。
为了进一步研究EDG和LDG,我们在UMAP中绘制了一个示例EDG和LDG进行直接比较(分别为图4E中的PPARG和图2F中的RUNX4)。具体而言,我们强调的EDG PPARG是一种神经元特异性基因,在小胶质细胞中表达低[22]。我们发现PPARG从最粗糙的图到完整的图都显示出很大的值,这反映在其一贯的高重新布线分数上。分层分析表明,PPARG跳出了其原始基因群落(例如,途径),具有明显的共表达模式变化。相反,我们强调的LDG,RUNX2,在小胶质细胞中高度表达,但在兴奋性神经元中略微下调[23]。RUNX2具有增加的值模式,在精炼的密集图中具有更显着的值,这意味着它主要在同一基因群落(例如,途径)内局部改变共表达关系,而不同群落之间没有显着变化。
iHerd强调脑部疾病中的细胞类型特异性风险基因
最后,我们进一步探讨了不同条件下的GCN变化,以确定重度抑郁症(MDD)和创伤后应激障碍(PTSD)的细胞类型特异性风险基因(图5)。我们首先对全基因组关联研究汇总统计的单细胞ATAC测序模式峰进行了连锁不平衡评分回归(LDSC)分析,以突出最相关的细胞类型。与之前的结果一致,兴奋性神经元显示出最高的LDSC评分,表明强烈的疾病关联。因此,我们专注于兴奋性神经元以查明疾病驱动基因。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. iHerd强调了脑部疾病中广泛的细胞类型特异性发散基因。
(A-C)从对照到MDD的兴奋性神经元分析。(a) 早期发散基因的一个例子的UMAP:ENPEP和EDG不同阶段之间的归一化L2距离。(b)晚期发散基因的一个例子的UMAP:INPP5D和LDG不同阶段之间的归一化L2距离。 (c)顶部重新布线基因和顶部保守基因的归一化相关性变化。顶部的重新布线基因“ENPEP”与其他基因的相关性变化较大,而顶部保守基因“ZNF804A”与其他基因几乎没有相关性变化。(d-f)从对照到创伤后应激障碍的兴奋性神经元分析。(d) 早期发散基因的一个例子的UMAP:TGFBR3和ED(e)不同阶段之间的归一化L2距离 晚期发散基因的UMAP:ADARB2和LDG不同阶段之间的归一化L2距离。 (f)顶部重新布线基因和顶部保守基因的归一化相关性变化。顶部连接基因“TGFBR3”与其他基因的相关性变化较大,而顶部保守基因“SLC26A4-AS1”与其他基因几乎没有相关性变化。
https://doi.org/10.1371/journal.pcbi.1011444.g005
iHerd优先考虑兴奋性神经元中的四个基因:用于MDD的ENPEP和INPP5D以及用于PTSD的TGFBR3和ADARB2(图5)。ENPEP是排名最高的EDG,在所有图形级别上得分始终很高(图5A)。报告[24]表明ENPEP与MDD患者的炎症或免疫反应有关。ENPEP参与转录和核酸代谢的负调节,这有助于MDD。我们对匹配的单细胞RNA测序数据进行了差异基因表达分析,发现ENPEP在MDD样品的兴奋性神经元中下调(0.662对数倍变化,P值4.01E-44)。同样,有报道表明,INPP5D是MDD中磷脂酰肌醇信号传导的重要KEGG途径的一部分[25]。iHerd强调INPP5D是在同一基因群落中具有广泛GCN重新布线的最显着的LDG(图5B)。同样,在PTSD对照比较中,顶部EDG是TGFBR3(图5D),它已被确定为压力性生活事件暴露中显着调节的基因[26]。最后,研究人员已经证明ADARB2抑制该基因家族其他成员的活性,这表明它在创伤暴露个体的RNA编辑中起着调节作用[27]。我们一致地强调ADARB2(图5E)是最显着的LDG,PTSD样本中兴奋性神经元中的基因表达模式显着上调(0.809822对数倍变化,P值2.82E-23)。综合起来,结果表明iHerd能够通过分子洞察力突出脑部疾病中广泛的细胞类型特异性差异基因。
为了验证iHerd选择细胞类型特异性风险基因的有效性,我们检查了不同条件下公共空间中的L2距离。图5C列出了兴奋性神经元中对照组对MDD的顶部重新布线基因ENPEP和顶部保守基因ZNF804A;图5F列出了兴奋性神经元中从对照到PTSD的顶部重新连接基因TGFBR3和顶部保守基因SLC26A4-AS1。圆圈周围的箭头指向其他基因,箭头的颜色表示归一化的相关变化。在两个基因之间,红色表示相关性增加,而蓝色表示相关性降低,更深的颜色表示更大的变化。在显示的颜色条中,绿色表示几乎没有相关性变化。iHerd优先处理的顶部变化基因与其他基因的相关性变化较大,而顶部保守基因几乎没有变化,表明iHerd生成的嵌入可靠地保留了网络相关性信息。通过忠实地反映GCN的变化,iHerd提供了具有良好可解释性的细胞类型特异性风险基因。
iHerd 在 LDG/EDG 区分任务中优于四种基线方法
a) 模拟实验设置。
我们使用兴奋性神经元的GCN建立了晚期和早期发散基因(LDG和EDG)的人工基因共表达模式,如图6A所示。
晚期发散基因(LDG)的构建。GCN中的一个基因被指定为“修饰基因”,其“模板基因”来自同一簇。我们匹配修饰基因和模板基因之间的边缘权重,形成具有LDG的修饰GCN。
早期发散基因(EDG)的构建。GCN中的一个基因被指定为“修饰基因”,其“模板基因”是从不同的簇中选择的。我们匹配修饰基因和模板基因之间的边缘权重,形成具有EDG的修饰GCN。
重复。最终,我们生产了 2871 套样品。每组包含一个原始GCN,两个修饰的GCN(LDG和EDG)以及相应的修饰基因。通过鲁汶算法识别为单个簇的基因被排除在此过程之外。
b) 评估指标和结果。
我们比较了LDG和EDG情景中的“修饰基因”变化。EDG变化超过LDG变化的模拟比例被用作最终精度度量。我们发现,iHerd在准确分类91.8%的病例方面始终优于四种基线方法(表4)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 4. 电子数据处理与LDG基准测试。
https://doi.org/10.1371/journal.pcbi.1011444.t004
c) 误报率分析。
我们对GCN数据进行了假阳性率分析,以评估iHerd的稳健性。如第 1.4 节所述,我们在两种情况下计算了网络距离:1) 输入两个不同的 GCN (Δdf),以及 2) 重复输入相同的 GCN (Δdb).我们通过iHerd运行对照GCN100次,将每个结果与不同的GCN进行比较,并计算控制运行之间的平均节点距离。和以前一样,背景距离Δdb(0.41)显著小于前景距离Δdf(1.42,P值= 2e-251),证实了iHerd的稳健性(图6B和6C)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图6. 模拟GCN实验。
(a) GCN的模拟方案。 (b) 假阳性测试的小提琴图。(c) 假阳性测试的节点变化距离的分布。
https://doi.org/10.1371/journal.pcbi.1011444.g006
iHerd展示了其图形粗化模块的稳健性和生物学相关性
我们进行了额外的实验来评估iHerd在同一网络上的稳定性和可重复性(运行100次)。对于每次运行,我们计算了算法检测到的社区的大小(重点关注节点超过 50 个的社区)。我们发现群落大小的分布在不同运行中是一致的(图7A)。接下来,我们重复100次运行来执行Kolmogorov-Smirnov(KS)测试,发现任何运行对之间的群落大小分布相似(平均P = 0.816)。此外,我们通过关注一个社区来计算每对运行中社区之间的重叠。图7B中的热图显示,大多数重叠都在0.9以上,表明高度的一致性。综上所述,这些结果表明,我们的算法在不同运行中表现出很强的一致性和稳定性,从而提供了可靠且可重复的结果。接下来,我们使用已建立的GO分子功能术语进行了富集分析,以评估已鉴定基因群落的生物学相关性。将 P 值转换为“-log10”标度后,我们创建了一个热图(图 7C)以进行视觉比较。热图揭示了每个社区内独特的生物过程,每个过程由不同的丰富GO术语表示。这种多样性证实了iHerd在识别具有生物学意义和多样性的基因群落方面的有效性。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图 7. iHerd中图粗模块的鲁棒性和生物学相关性分析。
(a) 描述每次 iHerd 运行中社区大小(节点计数)分布的箱线图。(b) 在多次iHerd运行中确定的社区之间计算的重叠比率的热图可视化。(c) 来自iHerd确定的社区的GO丰富分析的富集热图。
https://doi.org/10.1371/journal.pcbi.1011444.g007
iHerd 的参数调整
接下来,我们分析了iHerd的参数调优过程。图8A显示了兴奋性神经元和小胶质细胞中不同条件下不同水平的基因数量。通过图粗化模块,iHerd显著减少了节点数量,从而为节点嵌入提供了更丰富的全局信息。图8B记录了兴奋性神经元和小胶质细胞对照中不同基本图学习和细化方法相对于嵌入维度的运行时间。虽然较大的嵌入维度会略微增加运行时间,但 iHerd 可以在 20 秒内生成所有层次结构级别的嵌入,而无需图形处理单元,显示出出色的可扩展性。图8C记录了随着粗化时间的增加而变化的模态。对于兴奋性神经元和小胶质细胞的不同条件,网络模式在两次图粗化操作后几乎没有增长。基于这个结果,我们选择了两个粗化时间作为最终的超参数,以实现更好的分层嵌入。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图8. iHerd 的参数调整。
(a) 兴奋性神经元和小胶质细胞下对照和疾病样本每个水平的节点数的条形图。(b) 具有不同嵌入维度和不同学习框架的运行时间线图,用于兴奋性神经元和小胶质细胞下的对照。(c) 具有不同粗化时间的网络模态线图(零粗化时间表示初始状态)。
https://doi.org/10.1371/journal.pcbi.1011444.g008
讨论
本文提出了一种称为iHerd的计算方法,用于量化网络变化并确定疾病中风险基因的优先级。虽然最近的发展揭示了疾病中的基因优先级,但人们仍然很难量化GRN和GCN的变化。 利用分层图神经网络的优势,iHerd将细粒度输入网络粗化为粗粒度网络,学习每个集群的嵌入,并细化每个节点的嵌入。通过对齐不同网络的嵌入,我们可以定量分析不同基因在不同水平上的变化。为了证明iHerd的有效性,我们分析了GRN和GCN上的网络变化。我们发现iHerd可以忠实地突出不同细胞类型和条件下每个网络中改变的TFs和不同基因。我们在这里介绍了两种发散基因:早期发散基因和晚期发散基因,提供了更有洞察力的基因优先级分析,增强了模型的可解释性。
值得一提的是,iHerd是一个灵活的框架,它可以根据输入网络组合不同的图学习方法(专注于结构信息或局部邻域)。同时,如何将节点特征有效地组合到该框架中,将是未来探索的一个有希望的方向。最后,我们将iHerd实施为一个开源软件,可以免费下载给公众。随着疾病数据的指数级增长,iHerd可以成为社区优先考虑疾病基因并量化其在不同阶段的变化的有用工具。
方法
如图 1 所示,iHerd 有四个主要组件:图粗化模块 (GC)、图表示学习模块 (GRL)、嵌入细化模块 (ER) 和分层嵌入对齐模块 (HEA)。我们将在以下部分中介绍iHerd的数据预处理步骤和每个模块。
数据预处理
基因调控网络数据预处理。
我们获得了两个细胞系GM12878和K562的ENCODE网络,并专注于它们各自的TF调控网络,这是官方ENCODE网络的子网(我们对所有ChIP-seq数据使用了2017年的冻结,详细的实验ID已包含在S1表中)。GM12878的官方ENCODE网络由8,633个基因(包括101个TF)和24,093个边缘组成。同样,对于K562细胞系,官方ENCODE网络由11,250个基因(包括197个TF)和43,253个边缘组成。我们提供了一个详细的表5来描述网络统计信息。为了研究TF的调控,我们从原始网络中提取了这些TF,并专注于它们的相互作用。此过程产生了两个 TF 监管网络,每个网络共享一组共同的 40 个 TF。这些TF-to-TF GRN被用作iHerd中进一步分析的输入。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 5. GRN的统计数据。
https://doi.org/10.1371/journal.pcbi.1011444.t005
scRNA-seq 数据预处理和质量控制
采取了一系列质量控制步骤来降低scRNA-seq数据中高维数、低捕获效率和噪声的影响。首先,使用CellBender消除每个scRNA-seq样品中的技术伪影和背景噪声。然后使用DoubletDetection和Scrublet从每个scRNA-seq样品中去除双峰。所有样本都聚集在Pegasus(v.1.5.0)中,这是一个用于分析单细胞转录组的python工具 然后,根据以下标准进一步过滤细胞:最多10%线粒体基因,最多2%核糖体基因,至少200个基因和至少500个UMI。线粒体、性和核糖体基因被排除在外,只有健壮的基因被包含在最终的数据对象中。完成所有过滤步骤后,在Pegasus中执行降维,使用Harmony进行批量校正,聚类和注释。我们的实验中使用了七个脑PFC样本:三个CON样本(MS000800,MS0184LL,MS0198ZZ),两个PTSD样本(MS0098CC,MS0146ZZ)和两个MDD样本(MS0096AA,MS0204RR)。然后,我们基于以下步骤构建了细胞类型特异性基因共表达网络。在网络中,我们只考虑了前5个高度可变的蛋白质编码基因,这些基因分别在每种细胞类型中分别在至少000%的细胞中表达。首先,为了克服scRNA-seq数据的稀疏性,我们按照scWGCNA这样的程序构建了亚细胞[5]。每个元细胞是 28 个细胞的聚合,这些细胞是 100 个 PCA 维度中的最近邻。我们要求聚集的细胞来自相同的细胞类型,相同的性别组和相同的疾病状况。然后收集来自相同细胞类型的所有代谢细胞,以形成由代谢细胞标准化并由基因缩放的逐个基因表达基质。最后,对于每种条件和每种细胞类型,我们计算了所有基因对的无符号皮尔逊相关性,以构建基因共表达网络(GCN)。然后将具有不同条件和细胞类型的GCN送入iHerd进行进一步分析。scRNA-seq数据由Girgenti实验室生成,可以通过GSE20访问。
图形粗化
给定一个图 G = (V, E, X),V 是一组 n 个节点;E 是一组 m 条边,是节点要素,其中 dx是节点特征的维度。图粗化模块生成一系列从最精细到最粗化的分层属性网络:,其中?表示粗化操作,G我是第 i 个粗层和 k 上的粗图h是预定义的粗层数。在该模块中,使用鲁汶算法[29]来检测非重叠群落并形成粗图的超级节点。该模块包括两个阶段:分区和重建。
分区
分区阶段旨在最大化模块化,这是衡量网络结构内分区质量的指标。对于图中的社区 c,其模块化定义为:
(1)
其中 Aij表示社区 C 中节点 i 和 j 之间的边权重,m 是所有边权重的总和,k我和 kj分别是节点 i 和 j 的边权重之和。给定一个图 G我 = (V我, E我, X我),分区阶段首先将每个节点分配给其自己的社区。对于每个顶点 vx我∈V我,模块化ΔQ的变化通过去除vx我从其当前社区到其邻居 在 v 的所有相邻社区的 ΔQ 之后x我已计算,vx我被重新分配给社区,从而获得最高的模块化增益。分区阶段重复,直到达到本地最大模块化。然而,根据我们的经验,我们发现这个过程的两次迭代通常会导致模块化和计算效率之间的最佳权衡。有关参数调整过程的更详细概述,请参见“iHerd 的参数调整”部分。
重建
重建阶段构建新的粗图 GI+1 = (VI+1, EI+1, XI+1),在这个过程中,图G的每个超级节点(社区)我成为新节点 VI+1∈VI+1.边缘 ePQI+1∈EI+1如果节点 V 创建一个我和 vb我在较粗的水平上,我有一个边缘 E血型我∈E我,其中 v一个我和 vb我分配给超级节点 VpI+1和 vqI+1.边缘重量 ePQI+1更新为这两个社区之间所有边缘权重的总和。然后,新图GI+1具有原始网络 G 的更简洁的拓扑邻近性0存储并再次传递到此模块。此 GC 模块继续使用新的粗图 GI+1并重复该过程,直到 kh倍或没有明显的模块化增益。在这个模块之后,我们得到一系列不同粗糙度级别的网络:这样 |五i?1|>|五我|和 |Ei?1|>|E我|, i = 1,2,3,...,kh.
嵌入到最粗糙的图形上
在 GC 模块之后,将生成最粗粒度的网络嵌入。最粗糙的网络,保持原始网络最简洁的结构信息,被传递到图表示学习模块中,产生原始网络的第一个近似图表示。最粗糙的分层属性网络的嵌入由以下等式生成:,其中 GRL 是图表示学习模块和 。
图粗嵌入细化
嵌入细化模块 (ER) 利用无监督图神经网络 (GNN) 将最粗的嵌入细化为最细粒度的嵌入:。该模块的主要目标是获得一个经过训练的GNN模型,该模型可以产生更细粒度的嵌入Z 我作为等式:Z我 = ER(ZI+1, G我).然后,通过GNN模型,Z0对于 G0然后可以反向传播方式从最粗网络迭代到最细粒度网络,同时保留最粗糙网络的拓扑结构信息。
初始化
在 GNN 模型用于生成 Z 之前我从 (ZI+1, G我)、Z我初始化基于 给出 z 的节点表示jI+1∈ZI+1到 zs我∈Z我,其中 vs我在超级节点(社区)V 内jI+1.
无监督图神经网络
当使用经过训练的GNN模型时,会生成更精细网络的嵌入:Z我 = H(Z我, G我),其中 H(·) 表示逐层线性 GraphSAGE 模型 [30]。单个层定义为 H(l)(·), ?l∈{1,...,L},其中 L 是模型中的层总数。对于给定节点 v我∈V我, H(l)(Z我, G我) 包括以下两个步骤:
(2)
(3)
在这里,{hu(l?1),?u∈N(v)} 表示最后一层 (l?1) 中 v 的邻居和邻域函数 N(v) 中的邻居的表示。骨料k(·)表示将聚合相邻节点的表示形式的函数,例如平均运算符、LSTM、最大池等。CONCAT(·) 是两个嵌入矩阵的连接运算符。W(l)是一个特定于层的可训练权重矩阵,σ(·)是一个非线性激活函数[31]。在最后一层,我们获得每个节点在粗粒度 i: z 的表示v我←小时vL, ?v∈v我.训练此 GNN 模型并获得训练 W(l)对于 L 层,我们定义一个损失函数如下:
(4)
从 GRL 模块生成的基本嵌入扮演着 的“地面实况”嵌入的角色。嵌入和预测嵌入之间的差异是训练损失。模型仅使用最粗略的图进行一次训练。然后,它将用于生成上述所有先前级别的图形表示。该模块中的无监督图神经网络模型也可以是灵活的。
分层嵌入对齐
在图粗化模块中,较粗网络的分层嵌入在更高层次上包含更简洁的全局聚类结构信息,而更精细的网络的层次嵌入包含更局部层次的信息[32]。由于不同级别的嵌入提供了不同的特征,我们需要比较各个级别的嵌入,以全面了解网络的变化。
通过求解正交原型问题来映射矩阵
由于初始化和训练过程的随机性,我们无法直接比较两个不同运行时间的嵌入[33]。我们可以通过解决正交Proscrutes问题[34]并将所有嵌入映射到公共空间来计算嵌入之间的距离。给定两个矩阵 M1∈Rn×d, M2∈Rn×d,我们搜索一个酉矩阵U∈Rd×d最好的地图 M2到 M1,其中‖·‖F是弗罗贝尼乌斯的规范。在HEA模块中,iHerd生成一个映射矩阵U(s 1,s2)对于表示和两个样本 S1 和 S2 之间的最精细粒度级别。然后,它用于对齐不同粗水平的其他嵌入 和 。
距离计算
对于每个级别的任何一对分层嵌入,对齐后所有节点的距离都会被计算出来。在这里,我们定义了两类需要优先考虑的基因:早期发散基因(EDGs)和晚期发散基因(LDG)。EDG在粗粒和细粒水平上保持高距离。它们在早期阶段发散,并在后期阶段始终表现出高度分歧。相比之下,LDG 仅在细粒度水平上显示长距离。对于LDG,显著的拓扑差异仅发生在局部尺度上。
让并表示样本 s 1 和 s2 中节点的嵌入向量分别在最细粒度级别。我们也有 和 ,其中 和 是对应的超级节点(群落),用于最粗粒度的级别 kh分别用于样本 S1 和 S2。EDG和LDG的滤波器方程如下:
(5)
(6)
其中 D(·) 表示一个嵌套函数,用于将嵌入映射到公共空间并计算节点之间的距离值。应优先考虑属于这两个类别之一的节点,并将其挑选出来以进行进一步分析。
支持信息
2017年冻结所有ChIP-seq数据的详细信息。
跳到无花果共享导航
一个 B C D E F G H 我 J K L M N O P Q R S T U V W X
1 自由亚洲电台 测定 ASSAY_CAT 样本 目标 治疗 实验室 EXPR_ACC expr_aln_N expr_aln_acc expr_aln_href ctrl_aln_N ctrl_aln_acc ctrl_aln_href peak_N peak_acc peak_href signal_pval_N signal_pval_acc signal_pval_href signal_fc_N signal_fc_acc signal_fc_href GENE_NAME
2 ENCODE2 ChIP-seq TF GM12878 ATF2 海布 ENCSR000BQK 2 ENCFF221PEC;ENCFF957MQC; /files/ENCFF221PEC/@@download/ENCFF221PEC.bam;/files/ENCFF957MQC/@@download/ENCFF957MQC.bam; 3 ENCFF508HCX;ENCFF777FIV;ENCFF513ZBH; /files/ENCFF508HCX/@@download/ENCFF508HCX.bam;/files/ENCFF777FIV/@@download/ENCFF777FIV.bam;/files/ENCFF513ZBH/@@download/ENCFF513ZBH.bam; 1 ENCFF002CGO; /files/ENCFF002CGO/@@download/ENCFF002CGO.bed.gz; 0 0 ATF2
3 ENCODE2 ChIP-seq TF GM12878 ATF3 海布 ENCSR000BJY 2 ENCFF807PEN;ENCFF938UKB; /files/ENCFF807PEN/@@download/ENCFF807PEN.bam;/files/ENCFF938UKB/@@download/ENCFF938UKB.bam; 1 ENCFF963CVB; /files/ENCFF963CVB/@@download/ENCFF963CVB.bam; 1 ENCFF002CGP; /files/ENCFF002CGP/@@download/ENCFF002CGP.bed.gz; 0 0 ATF3
4 ENCODE2 ChIP-seq TF GM12878 巴特夫 海布 ENCSR000BGT 2 ENCFF558RVJ;ENCFF850VBC; /files/ENCFF558RVJ/@@download/ENCFF558RVJ.bam;/files/ENCFF850VBC/@@download/ENCFF850VBC.bam; 4 ENCFF000OCL;ENCFF000OCM;ENCFF000OCN;ENCFF000OCQ; /files/ENCFF000OCL/@@download/ENCFF000OCL.bam;/files/ENCFF000OCM/@@download/ENCFF000OCM.bam;/files/ENCFF000OCN/@@download/ENCFF000OCN.bam;/files/ENCFF000OCQ/@@download/ENCFF000OCQ.bam; 1 ENCFF002CGQ; /files/ENCFF002CGQ/@@download/ENCFF002CGQ.bed.gz; 0 0 巴特夫
5 ENCODE2 ChIP-seq TF GM12878 BCL11A 海布 ENCSR000BHA 2 ENCFF197DUH;ENCFF671MIT; /files/ENCFF197DUH/@@download/ENCFF197DUH.bam;/files/ENCFF671MIT/@@download/ENCFF671MIT.bam; 4 ENCFF000OCL;ENCFF000OCM;ENCFF000OCN;ENCFF000OCQ; /files/ENCFF000OCL/@@download/ENCFF000OCL.bam;/files/ENCFF000OCM/@@download/ENCFF000OCM.bam;/files/ENCFF000OCN/@@download/ENCFF000OCN.bam;/files/ENCFF000OCQ/@@download/ENCFF000OCQ.bam; 1 ENCFF002CGR; /files/ENCFF002CGR/@@download/ENCFF002CGR.bed.gz; 0 0 BCL11A
6 ENCODE2 ChIP-seq TF GM12878 BCL3 海布 ENCSR000BNQ 2 ENCFF288XGA;ENCFF032GHF; /files/ENCFF288XGA/@@download/ENCFF288XGA.bam;/files/ENCFF032GHF/@@download/ENCFF032GHF.bam; 1 ENCFF963CVB; /files/ENCFF963CVB/@@download/ENCFF963CVB.bam; 1 ENCFF002CGS; /files/ENCFF002CGS/@@download/ENCFF002CGS.bed.gz; 0 0 BCL3
7 ENCODE2 ChIP-seq TF GM12878 BCLAF1 海布 ENCSR000BJZ 2 ENCFF276KQJ;ENCFF797QYH; /files/ENCFF276KQJ/@@download/ENCFF276KQJ.bam;/files/ENCFF797QYH/@@download/ENCFF797QYH.bam; 1 ENCFF963CVB; /files/ENCFF963CVB/@@download/ENCFF963CVB.bam; 1 ENCFF002CGT; /files/ENCFF002CGT/@@download/ENCFF002CGT.bed.gz; 0 0 BCLAF1
8 ENCODE2 ChIP-seq TF GM12878 BHLHE40 斯坦福 ENCSR000DZJ 2 ENCFF000VSB;ENCFF000VSI; /files/ENCFF000VSB/@@download/ENCFF000VSB.bam;/files/ENCFF000VSI/@@download/ENCFF000VSI.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COK; /files/ENCFF002COK/@@download/ENCFF002COK.bed.gz; 0 0 BHLHE40
9 ENCODE2 ChIP-seq TF GM12878 BRCA1 斯坦福 ENCSR000DZS 2 ENCFF000VSJ;ENCFF000VSK; /files/ENCFF000VSJ/@@download/ENCFF000VSJ.bam;/files/ENCFF000VSK/@@download/ENCFF000VSK.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COL; /files/ENCFF002COL/@@download/ENCFF002COL.bed.gz; 0 0 BRCA1
10 ENCODE2 ChIP-seq TF GM12878 中欧和太平洋 海布 ENCSR000BRX 2 ENCFF701NYT;ENCFF596KMX; /files/ENCFF701NYT/@@download/ENCFF701NYT.bam;/files/ENCFF596KMX/@@download/ENCFF596KMX.bam; 3 ENCFF508HCX;ENCFF777FIV;ENCFF513ZBH; /files/ENCFF508HCX/@@download/ENCFF508HCX.bam;/files/ENCFF777FIV/@@download/ENCFF777FIV.bam;/files/ENCFF513ZBH/@@download/ENCFF513ZBH.bam; 1 ENCFF002CGU; /files/ENCFF002CGU/@@download/ENCFF002CGU.bed.gz; 0 0 中欧和太平洋
11 ENCODE2 ChIP-seq TF GM12878 CHD1 斯坦福 ENCSR000DZE 2 ENCFF000VTE;ENCFF000VTQ; /files/ENCFF000VTE/@@download/ENCFF000VTE.bam;/files/ENCFF000VTQ/@@download/ENCFF000VTQ.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002CON; /files/ENCFF002CON/@@download/ENCFF002CON.bed.gz; 0 0 CHD1
12 ENCODE2 ChIP-seq TF GM12878 CHD2 斯坦福 ENCSR000DZR 2 ENCFF000VTR;ENCFF000VTS; /files/ENCFF000VTR/@@download/ENCFF000VTR.bam;/files/ENCFF000VTS/@@download/ENCFF000VTS.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COO; /files/ENCFF002COO/@@download/ENCFF002COO.bed.gz; 0 0 CHD2
13 ENCODE2 ChIP-seq TF GM12878 中央贸易委员会 乌塔 ENCSR000DKV 3 ENCFF000ROM;ENCFF000RON;ENCFF000ROQ; /files/ENCFF000ROM/@@download/ENCFF000ROM.bam;/files/ENCFF000RON/@@download/ENCFF000RON.bam;/files/ENCFF000ROQ/@@download/ENCFF000ROQ.bam; 1 ENCFF000ROW; /files/ENCFF000ROW/@@download/ENCFF000ROW.bam; 1 ENCFF002DAJ; /files/ENCFF002DAJ/@@download/ENCFF002DAJ.bed.gz; 0 0 中央贸易委员会
14 ENCODE2 ChIP-seq TF GM12878 中央贸易委员会 广泛 ENCSR000AKB 1 ENCFF343LTM; /files/ENCFF343LTM/@@download/ENCFF343LTM.bam; 4 ENCFF339YTX;ENCFF430BAQ;ENCFF624TPS;ENCFF232FPZ; /files/ENCFF339YTX/@@download/ENCFF339YTX.bam;/files/ENCFF430BAQ/@@download/ENCFF430BAQ.bam;/files/ENCFF624TPS/@@download/ENCFF624TPS.bam;/files/ENCFF232FPZ/@@download/ENCFF232FPZ.bam; 1 ENCFF002CDP; /files/ENCFF002CDP/@@download/ENCFF002CDP.bed.gz; 0 0 中央贸易委员会
15 ENCODE2 ChIP-seq TF GM12878 中央贸易委员会 微波 ENCSR000DRZ 2 ENCFF607GOG;ENCFF412PHP; /files/ENCFF607GOG/@@download/ENCFF607GOG.bam;/files/ENCFF412PHP/@@download/ENCFF412PHP.bam; 1 ENCFF892TNJ; /files/ENCFF892TNJ/@@download/ENCFF892TNJ.bam; 1 ENCFF473RXY; /files/ENCFF473RXY/@@download/ENCFF473RXY.bed.gz; 1 ENCFF913SOI; /files/ENCFF913SOI/@@download/ENCFF913SOI.bigWig; 1 ENCFF886KRA; /files/ENCFF886KRA/@@download/ENCFF886KRA.bigWig; 中央贸易委员会
16 ENCODE2 ChIP-seq TF GM12878 中央贸易委员会 斯坦福 ENCSR000DZN 2 ENCFF000VUC;ENCFF000VUE; /files/ENCFF000VUC/@@download/ENCFF000VUC.bam;/files/ENCFF000VUE/@@download/ENCFF000VUE.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002COQ; /files/ENCFF002COQ/@@download/ENCFF002COQ.bed.gz; 0 0 中央贸易委员会
17 ENCODE2 ChIP-seq TF GM12878 E2F4 斯坦福 ENCSR000DYY 2 ENCFF000VUG;ENCFF000VUH; /files/ENCFF000VUG/@@download/ENCFF000VUG.bam;/files/ENCFF000VUH/@@download/ENCFF000VUH.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COR; /files/ENCFF002COR/@@download/ENCFF002COR.bed.gz; 0 0 E2F4
18 ENCODE2 ChIP-seq TF GM12878 EBF1 海布 ENCSR000BGU 2 ENCFF336DPP;ENCFF069CYJ; /files/ENCFF336DPP/@@download/ENCFF336DPP.bam;/files/ENCFF069CYJ/@@download/ENCFF069CYJ.bam; 4 ENCFF000OCL;ENCFF000OCM;ENCFF000OCN;ENCFF000OCQ; /files/ENCFF000OCL/@@download/ENCFF000OCL.bam;/files/ENCFF000OCM/@@download/ENCFF000OCM.bam;/files/ENCFF000OCN/@@download/ENCFF000OCN.bam;/files/ENCFF000OCQ/@@download/ENCFF000OCQ.bam; 1 ENCFF002CGV; /files/ENCFF002CGV/@@download/ENCFF002CGV.bed.gz; 0 0 EBF1
19 ENCODE2 ChIP-seq TF GM12878 EBF1 斯坦福 ENCSR000DZQ 2 ENCFF000VUQ;ENCFF000VUS; /files/ENCFF000VUQ/@@download/ENCFF000VUQ.bam;/files/ENCFF000VUS/@@download/ENCFF000VUS.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002COS; /files/ENCFF002COS/@@download/ENCFF002COS.bed.gz; 0 0 EBF1
20 ENCODE2 ChIP-seq TF GM12878 EGR1 海布 ENCSR000BRG 1 ENCFF000NUO; /files/ENCFF000NUO/@@download/ENCFF000NUO.bam; 2 ENCFF416BIN;ENCFF818ZLY; /files/ENCFF416BIN/@@download/ENCFF416BIN.bam;/files/ENCFF818ZLY/@@download/ENCFF818ZLY.bam; 1 ENCFF002CGW; /files/ENCFF002CGW/@@download/ENCFF002CGW.bed.gz; 0 0 EGR1
21 ENCODE2 ChIP-seq TF GM12878 ELF1 海布 ENCSR000BMB 2 ENCFF658MQE;ENCFF386ILI; /files/ENCFF658MQE/@@download/ENCFF658MQE.bam;/files/ENCFF386ILI/@@download/ENCFF386ILI.bam; 1 ENCFF963CVB; /files/ENCFF963CVB/@@download/ENCFF963CVB.bam; 1 ENCFF002CGX; /files/ENCFF002CGX/@@download/ENCFF002CGX.bed.gz; 0 0 ELF1
22 ENCODE2 ChIP-seq TF GM12878 麋鹿1 斯坦福 ENCSR000DZB 2 ENCFF000VUV;ENCFF000VVD; /files/ENCFF000VUV/@@download/ENCFF000VUV.bam;/files/ENCFF000VVD/@@download/ENCFF000VVD.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COT; /files/ENCFF002COT/@@download/ENCFF002COT.bed.gz; 0 0 麋鹿1
23 ENCODE2 ChIP-seq TF GM12878 第300集 斯坦福 ENCSR000DZD 2 ENCFF000WAJ;ENCFF000WAR; /files/ENCFF000WAJ/@@download/ENCFF000WAJ.bam;/files/ENCFF000WAR/@@download/ENCFF000WAR.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002CPE; /files/ENCFF002CPE/@@download/ENCFF002CPE.bed.gz; 0 0 第300集
24 ENCODE2 ChIP-seq TF GM12878 第300集 海布 ENCSR000BHB 2 ENCFF187YDX;ENCFF234DXO; /files/ENCFF187YDX/@@download/ENCFF187YDX.bam;/files/ENCFF234DXO/@@download/ENCFF234DXO.bam; 4 ENCFF000OCL;ENCFF000OCM;ENCFF000OCN;ENCFF000OCQ; /files/ENCFF000OCL/@@download/ENCFF000OCL.bam;/files/ENCFF000OCM/@@download/ENCFF000OCM.bam;/files/ENCFF000OCN/@@download/ENCFF000OCN.bam;/files/ENCFF000OCQ/@@download/ENCFF000OCQ.bam; 1 ENCFF002CHI; /files/ENCFF002CHI/@@download/ENCFF002CHI.bed.gz; 0 0 第300集
25 ENCODE2 ChIP-seq TF GM12878 第300集 斯坦福 ENCSR000DZG 2 ENCFF000WAS;ENCFF000WAT; /files/ENCFF000WAS/@@download/ENCFF000WAS.bam;/files/ENCFF000WAT/@@download/ENCFF000WAT.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002CPF; /files/ENCFF002CPF/@@download/ENCFF002CPF.bed.gz; 0 0 第300集
26 ENCODE2 ChIP-seq TF GM12878 ETS1 海布 ENCSR000BKA 2 ENCFF371ZBY;ENCFF477EHC; /files/ENCFF371ZBY/@@download/ENCFF371ZBY.bam;/files/ENCFF477EHC/@@download/ENCFF477EHC.bam; 1 ENCFF963CVB; /files/ENCFF963CVB/@@download/ENCFF963CVB.bam; 1 ENCFF002CGY; /files/ENCFF002CGY/@@download/ENCFF002CGY.bed.gz; 0 0 ETS1
27 ENCODE2 ChIP-seq TF GM12878 EZH2 广泛 ENCSR000ARD 2 ENCFF000ARL;ENCFF000ARN; /files/ENCFF000ARL/@@download/ENCFF000ARL.bam;/files/ENCFF000ARN/@@download/ENCFF000ARN.bam; 4 ENCFF339YTX;ENCFF430BAQ;ENCFF624TPS;ENCFF232FPZ; /files/ENCFF339YTX/@@download/ENCFF339YTX.bam;/files/ENCFF430BAQ/@@download/ENCFF430BAQ.bam;/files/ENCFF624TPS/@@download/ENCFF624TPS.bam;/files/ENCFF232FPZ/@@download/ENCFF232FPZ.bam; 1 ENCFF002CDQ; /files/ENCFF002CDQ/@@download/ENCFF002CDQ.bed.gz; 0 0 EZH2
28 ENCODE2 ChIP-seq TF GM12878 低聚糖 耶鲁 ENCSR000EYZ 3 ENCFF000VSZ;ENCFF000VTA;ENCFF000VTB; /files/ENCFF000VSZ/@@download/ENCFF000VSZ.bam;/files/ENCFF000VTA/@@download/ENCFF000VTA.bam;/files/ENCFF000VTB/@@download/ENCFF000VTB.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002COM; /files/ENCFF002COM/@@download/ENCFF002COM.bed.gz; 0 0 低聚糖
29 ENCODE2 ChIP-seq TF GM12878 狐狸M1 海布 ENCSR000BRU 2 ENCFF287NFR;ENCFF766UTH; /files/ENCFF287NFR/@@download/ENCFF287NFR.bam;/files/ENCFF766UTH/@@download/ENCFF766UTH.bam; 3 ENCFF508HCX;ENCFF777FIV;ENCFF513ZBH; /files/ENCFF508HCX/@@download/ENCFF508HCX.bam;/files/ENCFF777FIV/@@download/ENCFF777FIV.bam;/files/ENCFF513ZBH/@@download/ENCFF513ZBH.bam; 1 ENCFF002CGZ; /files/ENCFF002CGZ/@@download/ENCFF002CGZ.bed.gz; 0 0 狐狸M1
30 ENCODE2 ChIP-seq TF GM12878 嘎巴 海布 ENCSR000BGC 2 ENCFF868BIX;ENCFF664IUQ; /files/ENCFF868BIX/@@download/ENCFF868BIX.bam;/files/ENCFF664IUQ/@@download/ENCFF664IUQ.bam; 2 ENCFF416BIN;ENCFF818ZLY; /files/ENCFF416BIN/@@download/ENCFF416BIN.bam;/files/ENCFF818ZLY/@@download/ENCFF818ZLY.bam; 1 ENCFF617GBZ; /files/ENCFF617GBZ/@@download/ENCFF617GBZ.bed.gz; 1 ENCFF012NRC; /files/ENCFF012NRC/@@download/ENCFF012NRC.bigWig; 1 ENCFF538ZWY; /files/ENCFF538ZWY/@@download/ENCFF538ZWY.bigWig; 嘎巴
31 ENCODE2 ChIP-seq TF GM12878 IKZF1 南加州大学 ENCSR000EUJ 2 ENCFF000VVS;ENCFF000VVT; /files/ENCFF000VVS/@@download/ENCFF000VVS.bam;/files/ENCFF000VVT/@@download/ENCFF000VVT.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002COU; /files/ENCFF002COU/@@download/ENCFF002COU.bed.gz; 0 0 IKZF1
32 ENCODE2 ChIP-seq TF GM12878 IRF4 海布 ENCSR000BGY 2 ENCFF356JEO;ENCFF732SBB; /files/ENCFF356JEO/@@download/ENCFF356JEO.bam;/files/ENCFF732SBB/@@download/ENCFF732SBB.bam; 4 ENCFF000OCL;ENCFF000OCM;ENCFF000OCN;ENCFF000OCQ; /files/ENCFF000OCL/@@download/ENCFF000OCL.bam;/files/ENCFF000OCM/@@download/ENCFF000OCM.bam;/files/ENCFF000OCN/@@download/ENCFF000OCN.bam;/files/ENCFF000OCQ/@@download/ENCFF000OCQ.bam; 1 ENCFF002CHB; /files/ENCFF002CHB/@@download/ENCFF002CHB.bed.gz; 0 0 IRF4
33 ENCODE2 ChIP-seq TF GM12878 君德 耶鲁 ENCSR000EYV 2 ENCFF000VXL;ENCFF000VXM; /files/ENCFF000VXL/@@download/ENCFF000VXL.bam;/files/ENCFF000VXM/@@download/ENCFF000VXM.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002COV; /files/ENCFF002COV/@@download/ENCFF002COV.bed.gz; 0 0 君德
34 ENCODE2 ChIP-seq TF GM12878 马夫克 斯坦福 ENCSR000DYV 2 ENCFF051OWS;ENCFF950RDW; /files/ENCFF051OWS/@@download/ENCFF051OWS.bam;/files/ENCFF950RDW/@@download/ENCFF950RDW.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF689AXJ; /files/ENCFF689AXJ/@@download/ENCFF689AXJ.bed.gz; 1 ENCFF801VTB; /files/ENCFF801VTB/@@download/ENCFF801VTB.bigWig; 1 ENCFF600DHH; /files/ENCFF600DHH/@@download/ENCFF600DHH.bigWig; 马夫克
35 ENCODE2 ChIP-seq TF GM12878 .MAX 斯坦福 ENCSR000DZF 2 ENCFF000VXV;ENCFF000VXW; /files/ENCFF000VXV/@@download/ENCFF000VXV.bam;/files/ENCFF000VXW/@@download/ENCFF000VXW.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COW; /files/ENCFF002COW/@@download/ENCFF002COW.bed.gz; 0 0 .MAX
36 ENCODE2 ChIP-seq TF GM12878 马兹 斯坦福 ENCSR000DZA 2 ENCFF000VYJ;ENCFF000VYK; /files/ENCFF000VYJ/@@download/ENCFF000VYJ.bam;/files/ENCFF000VYK/@@download/ENCFF000VYK.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COX; /files/ENCFF002COX/@@download/ENCFF002COX.bed.gz; 0 0 马兹
37 ENCODE2 ChIP-seq TF GM12878 MEF2A 海布 ENCSR000BKB 2 ENCFF651UZJ;ENCFF659SUJ; /files/ENCFF651UZJ/@@download/ENCFF651UZJ.bam;/files/ENCFF659SUJ/@@download/ENCFF659SUJ.bam; 1 ENCFF963CVB; /files/ENCFF963CVB/@@download/ENCFF963CVB.bam; 1 ENCFF002CHC; /files/ENCFF002CHC/@@download/ENCFF002CHC.bed.gz; 0 0 MEF2A
38 ENCODE2 ChIP-seq TF GM12878 MEF2C 海布 ENCSR000BNG 2 ENCFF195HFC;ENCFF840QLL; /files/ENCFF195HFC/@@download/ENCFF195HFC.bam;/files/ENCFF840QLL/@@download/ENCFF840QLL.bam; 1 ENCFF963CVB; /files/ENCFF963CVB/@@download/ENCFF963CVB.bam; 1 ENCFF002CHD; /files/ENCFF002CHD/@@download/ENCFF002CHD.bed.gz; 0 0 MEF2C
39 ENCODE2 ChIP-seq TF GM12878 MTA3 海布 ENCSR000BRH 2 ENCFF420JTZ;ENCFF441NFC; /files/ENCFF420JTZ/@@download/ENCFF420JTZ.bam;/files/ENCFF441NFC/@@download/ENCFF441NFC.bam; 3 ENCFF508HCX;ENCFF777FIV;ENCFF513ZBH; /files/ENCFF508HCX/@@download/ENCFF508HCX.bam;/files/ENCFF777FIV/@@download/ENCFF777FIV.bam;/files/ENCFF513ZBH/@@download/ENCFF513ZBH.bam; 1 ENCFF002CHE; /files/ENCFF002CHE/@@download/ENCFF002CHE.bed.gz; 0 0 MTA3
40 ENCODE2 ChIP-seq TF GM12878 MXI1 斯坦福 ENCSR000DZI 2 ENCFF000VYR;ENCFF000VYY; /files/ENCFF000VYR/@@download/ENCFF000VYR.bam;/files/ENCFF000VYY/@@download/ENCFF000VYY.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002COY; /files/ENCFF002COY/@@download/ENCFF002COY.bed.gz; 0 0 MXI1
41 ENCODE2 ChIP-seq TF GM12878 迈克 乌塔 ENCSR000DKU 2 ENCFF000ROE;ENCFF000ROF; /files/ENCFF000ROE/@@download/ENCFF000ROE.bam;/files/ENCFF000ROF/@@download/ENCFF000ROF.bam; 1 ENCFF000ROW; /files/ENCFF000ROW/@@download/ENCFF000ROW.bam; 1 ENCFF002DAI; /files/ENCFF002DAI/@@download/ENCFF002DAI.bed.gz; 0 0 迈克
42 ENCODE2 ChIP-seq TF GM12878 NFATC1 海布 ENCSR000BQL 2 ENCFF214RUL;ENCFF867LOD; /files/ENCFF214RUL/@@download/ENCFF214RUL.bam;/files/ENCFF867LOD/@@download/ENCFF867LOD.bam; 3 ENCFF508HCX;ENCFF777FIV;ENCFF513ZBH; /files/ENCFF508HCX/@@download/ENCFF508HCX.bam;/files/ENCFF777FIV/@@download/ENCFF777FIV.bam;/files/ENCFF513ZBH/@@download/ENCFF513ZBH.bam; 1 ENCFF002CHF; /files/ENCFF002CHF/@@download/ENCFF002CHF.bed.gz; 0 0 NFATC1
43 ENCODE2 ChIP-seq TF GM12878 非专利药品监督员2 斯坦福 ENCSR000DZY 2 ENCFF000VYZ;ENCFF000VZB; /files/ENCFF000VYZ/@@download/ENCFF000VYZ.bam;/files/ENCFF000VZB/@@download/ENCFF000VZB.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002COZ; /files/ENCFF002COZ/@@download/ENCFF002COZ.bed.gz; 0 0 非专利药品监督员2
44 ENCODE2 ChIP-seq TF GM12878 非金融投资 海布 ENCSR000BRN 2 ENCFF617HLC;ENCFF930KIJ; /files/ENCFF617HLC/@@download/ENCFF617HLC.bam;/files/ENCFF930KIJ/@@download/ENCFF930KIJ.bam; 3 ENCFF508HCX;ENCFF777FIV;ENCFF513ZBH; /files/ENCFF508HCX/@@download/ENCFF508HCX.bam;/files/ENCFF777FIV/@@download/ENCFF777FIV.bam;/files/ENCFF513ZBH/@@download/ENCFF513ZBH.bam; 1 ENCFF002CHG; /files/ENCFF002CHG/@@download/ENCFF002CHG.bed.gz; 0 0 非金融投资
45 ENCODE2 ChIP-seq TF GM12878 恩雅 HMS ENCSR000DNN 2 ENCFF000VZO;ENCFF000VZP; /files/ENCFF000VZO/@@download/ENCFF000VZO.bam;/files/ENCFF000VZP/@@download/ENCFF000VZP.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002CPB; /files/ENCFF002CPB/@@download/ENCFF002CPB.bed.gz; 0 0 恩雅
46 ENCODE2 ChIP-seq TF GM12878 非青年网 HMS ENCSR000DNM 2 ENCFF000VZX;ENCFF000WAC; /files/ENCFF000VZX/@@download/ENCFF000VZX.bam;/files/ENCFF000WAC/@@download/ENCFF000WAC.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002CPC; /files/ENCFF002CPC/@@download/ENCFF002CPC.bed.gz; 0 0 非青年网
47 ENCODE2 ChIP-seq TF GM12878 NR2C2 南加州大学 ENCSR000EUL 2 ENCFF000WFL;ENCFF000WFM; /files/ENCFF000WFL/@@download/ENCFF000WFL.bam;/files/ENCFF000WFM/@@download/ENCFF000WFM.bam; 1 ENCFF000VWO; /files/ENCFF000VWO/@@download/ENCFF000VWO.bam; 1 ENCFF002CPS; /files/ENCFF002CPS/@@download/ENCFF002CPS.bed.gz; 0 0 NR2C2
48 ENCODE2 ChIP-seq TF GM12878 NRF1 斯坦福 ENCSR000DZO 2 ENCFF000WAF;ENCFF000WAH; /files/ENCFF000WAF/@@download/ENCFF000WAF.bam;/files/ENCFF000WAH/@@download/ENCFF000WAH.bam; 2 ENCFF545DZO;ENCFF110OHA; /files/ENCFF545DZO/@@download/ENCFF545DZO.bam;/files/ENCFF110OHA/@@download/ENCFF110OHA.bam; 1 ENCFF002CPD; /files/ENCFF002CPD/@@download/ENCFF002CPD.bed.gz; 0 0 NRF1
49 ENCODE2 ChIP-seq TF GM12878 帕克斯5 海布 ENCSR000BHD 2 ENCFF917NZU;ENCFF512AMK; /files/ENCFF917NZU/@@download/ENCFF917NZU.bam;/files/ENCFF512AMK/@@download/ENCFF512AMK.bam; 4 ENCFF000OCL;ENCFF000OCM;ENCFF000OCN;ENCFF000OCQ; /files/ENCFF000OCL/@@download/ENCFF000OCL.bam;/files/ENCFF000OCM/@@download/ENCFF000OCM.bam;/files/ENCFF000OCN/@@download/ENCFF000OCN.bam;/files/ENCFF000OCQ/@@download/ENCFF000OCQ.bam; 1 ENCFF002CHJ; /files/ENCFF002CHJ/@@download/ENCFF002CHJ.bed.gz; 0 0 帕克斯5
50 ENCODE2 ChIP-seq TF GM12878 帕克斯5 海布 ENCSR000BHJ 2 ENCFF228QWW;ENCFF216EUF; /files/ENCFF228QWW/@@download/ENCFF228QWW.bam;/files/ENCFF216EUF/@@download/ENCFF216EUF.bam; 4 ENCFF000OCL;ENCFF000OCM;ENCFF000OCN;ENCFF000OCQ; /files/ENCFF000OCL/@@download/ENCFF000OCL.bam;/files/ENCFF000OCM/@@download/ENCFF000OCM.bam;/files/ENCFF000OCN/@@download/ENCFF000OCN.bam;/files/ENCFF000OCQ/@@download/ENCFF000OCQ.bam; 1 ENCFF002CHK; /files/ENCFF002CHK/@@download/ENCFF002CHK.bed.gz; 0 0 帕克斯5
42315872.csv
下载
无花果分享
S1 表。 2017年冻结所有ChIP-seq数据的详细信息。
https://doi.org/10.1371/journal.pcbi.1011444.s001
(中新社)
确认
我们感谢UCI ICS部门的OIT支持计算资源。
引用
1.戈利亚股份公司,托特彻·光明的未来:光遗传学剖析细胞行为的时空控制。化学生物学. 2019;48:106–13.密码:30529586
查看文章PubMed/NCBI谷歌学术搜索
2.布蕾恩一世, 奥嫩古特-古姆斯库 S, 陈 RX, 曼尼查库尔 AW, 里奇 SS, 陈 WM, 等.免疫基因共表达网络的动态变化可预测1型糖尿病的发展。科学代表-英国。2021;11(1).密码:34811390
查看文章PubMed/NCBI谷歌学术搜索
3.AbuQamar SF,El-Tarabily KA,Sham A.预测转录基因调控中的共表达网络。方法分子生物学. 2021;2328:1–11.密码:34251616
查看文章PubMed/NCBI谷歌学术搜索
4.Kartha VK, Duarte FM, Hu Y, Ma S, Chew JG, Lareau CA, et al.使用单细胞多组学进行基因调控的功能推断。细胞基因。2022;2(9).密码:36204155
查看文章PubMed/NCBI谷歌学术搜索
5.直接网络:一种从单细胞多组学数据发现顺式调控元件并构建调控网络的有效方法。科学进展 2022;8(22):eabl7393。密码:35648859
查看文章PubMed/NCBI谷歌学术搜索
6.熊玲, 田珂, 李玉忠, 宁文兴, 高霞, 张稽.通过将异构数据集投影到公共细胞嵌入空间中进行在线单细胞数据集成。自然通讯.2022;13(1).密码:36253379
查看文章PubMed/NCBI谷歌学术搜索
7.Hollander M,Do T,Will T,Helms V.基于转录组学数据检测蛋白质 - 蛋白质相互作用网络中的重新布线事件。前生物信息。2021;1:724297.pmid:36303788
查看文章PubMed/NCBI谷歌学术搜索
8.班夫M,李承晚。基因调控网络的计算推理:方法、局限性和机遇。Bba基因调节机械. 2017;1860(1):41–52.密码:27641093
查看文章PubMed/NCBI谷歌学术搜索
9.宋鑫, 金平, 秦思, 陈玲, 马芳.网络级分子进化分析揭示了动物Toll样受体信号通路的进化和起源。公共图书馆一号。2012;7(12):e51657.密码:23236523
查看文章PubMed/NCBI谷歌学术搜索
10.张杰, 李丹, 迪曼 V, 姜平, 徐军, 麦吉利夫雷, 等.癌症基因组学的综合ENCODE资源。纳特公社。2020;11(1):3696.密码:32728046
查看文章PubMed/NCBI谷歌学术搜索
11.迈凯轮 W, 吉尔 L, 亨特 SE, 里亚特 HS, 里奇 GRS, 索曼 A, 等.集成变体效应预测器。基因组生物学. 2016;17.
查看文章谷歌学术搜索
12.Ying R, You JX, Morris C, Ren X, Hamilton WL, Leskovec J. 具有可微分池的分层图表示学习。神经信息处理系统进展31(Nips 2018)。2018;31.
查看文章谷歌学术搜索
13.程 C, 安德鲁斯 E, 严 KK, 翁 M, 王 DF, 格斯坦 M.一种用于确定和测量网络层次结构的方法,用于比较磷酸组和调节组。基因组生物学. 2015;16.
查看文章谷歌学术搜索
14.Yu HY, Gerstein M. 调控网络层次结构的基因组分析.美国国家科学院。2006;103(40):14724–31.密码:17003135
查看文章PubMed/NCBI谷歌学术搜索
15.Jothi R, Balaji S, Wuster A, Grochow JA, Gsponer J, Przytycka TM, et al.基因组分析揭示了转录因子动力学与调控网络结构之间的紧密联系。分子系统生物学. 2009;5.密码:19690563
查看文章PubMed/NCBI谷歌学术搜索
16.刘杰, 李建英, 孙忠, 段永明, 王福庆, 魏国, 等.Bcl-2相关转录因子1 Ser290磷酸化介导胃癌的DNA损伤反应并调节放射敏感性。翻译医学杂志 2021;19(1).密码:34372878
查看文章PubMed/NCBI谷歌学术搜索
17.Johnson SAS, Dubeau L, Kawalek M, Dervan A, Schonthal AH, Dang CV, et al.中枢转录因子TATA结合蛋白的表达增加可促进肿瘤发生。分子细胞生物学. 2003;23(9):3043–51.pmid:12697807
查看文章PubMed/NCBI谷歌学术搜索
18.Bell RJA, Rube HT, Kreig A, Mancini A, Fouse SD, Nagarajan RP, et al.转录因子GABP选择性结合并激活癌症中的突变TERT启动子。科学。2015;348(6238):1036–9.
查看文章谷歌学术搜索
19.张斋, 霍瓦特·加权基因共表达网络分析的一般框架。统计应用基因分子. 2005;4.密码:16646834
查看文章PubMed/NCBI谷歌学术搜索
20.陈春, 程玲, 格伦南, 皮比里, 张春, 巴德纳, 等.两个基因共表达模块可区分精神病患者和对照组。摩尔精神病学家。2013;18(12):1308–14.pmid:23147385
查看文章PubMed/NCBI谷歌学术搜索
21.Langfelder P,Horvath S. WGCNA:用于加权相关网络分析的R包。BMC生物信息学。2008;9.
查看文章谷歌学术搜索
22.古普塔, 徐杰, 金涛, 库拉尔, 刘旭, 阿拉特卡尔, 等.单细胞网络生物学表征了阿尔茨海默病中药物再利用和表型预测的细胞类型基因调控。计算机生物学报. 2022;18(7):e1010287.密码:35849618
查看文章PubMed/NCBI谷歌学术搜索
23.Gosselin D, Skola D, Coufal NG, Holtman IR, Schlachetzki JCM, Sajti E, et al.环境依赖性转录网络指定人类小胶质细胞身份。科学。2017;356(6344).pmid:28546318
查看文章PubMed/NCBI谷歌学术搜索
24.宋国, 金振华, 李永华.重度抑郁症的全基因组通路分析。J 摩尔神经科学。2013;51(2):428–36.密码:23794217
查看文章PubMed/NCBI谷歌学术搜索
25.Kuan PF, Waszczuk MA, Kotov R, Marsit CJ, Guffanti G, Gonzalez A, et al.世界贸易中心响应者中创伤后应激障碍和抑郁症的表观基因组全DNA甲基化研究。翻译精神病学。2017;7.pmid:28654093
查看文章PubMed/NCBI谷歌学术搜索
26.洛皮佐 N, 土里 S, 贝格尼 V, 托马西 S, 卡塔内 N, 巴塞拉 M, 等.转录组学分析和白细胞端粒长度测量在暴露于近期严重压力生活事件的受试者中。翻译精神病学。2017;7.密码:28221367
查看文章PubMed/NCBI谷歌学术搜索
27.Morey RA, Garrett ME, Stevens JS, Clarke EK, Haswell CC, van Rooij SJH, et al.创伤后应激障碍病例和创伤暴露对照中海马亚场体积的遗传预测因子。欧洲J心理创伤。2020;11(1).密码:33029326
查看文章PubMed/NCBI谷歌学术搜索
28.莫拉比托 S, 三好 E, 迈克尔 N, 沙欣 S, 马提尼 AC, 海德 E, 等.阿尔茨海默病的单核染色质可及性和转录组学表征。纳特热内。2021;53(8):1143–+.pmid:34239132
查看文章PubMed/NCBI谷歌学术搜索
29.Blondel VD,Guillaume JL,Lambiotte R,Lefebvre E.大型网络中社区的快速展开。J 统计机械理论 E. 2008.
查看文章谷歌学术搜索
30.Hamilton WL, Ying R, Leskovec J. 大图上的归纳表示学习.高级神经在。2017;30.
查看文章谷歌学术搜索
31.王玉, 段志, 廖斌, 吴峰, 庄玉彤.使用图卷积网络的异构属性网络嵌入。Aaai Conf Artif Inte.2019:10061–2.
查看文章谷歌学术搜索
32.段志, 徐华, 王茹, 黄茹, 任阿, 徐志, 等.具有分层变分图池的多变量时间序列分类。神经网络。2022;154:481–90.邮编:35970026
查看文章PubMed/NCBI谷歌学术搜索
33.杜玲, 王毅, 宋国杰, 卢志强, 王建.动态网络嵌入:基于跳克的网络嵌入的扩展方法。第二十七届人工智能国际联合会议论文集.2018:2086–92.
查看文章谷歌学术搜索
34.H SP.正交过程问题的广义解。心理测量。1966;31(1):1–10.
查看文章谷歌学术搜索