脂肪细胞分化过程中染色质可及性和基因表达的研究-医学论文发表
· 汉娜·佩林,
· 凯文·库林,
· Swarooparani Vadlamudi
· 高塔姆·K·潘迪
· 吴荣奎(Kenneth K.Ng)
· 马丁·瓦比奇
· 马库·拉克索
· 迈克尔我爱你
· 卡伦·莫尔克
· 发表日期:2021年10月26日
摘要
染色质的可及性和基因在相关细胞环境中的表达可以指导全基因组关联研究(GWAS)位点的调控元素和机制的识别。为了鉴定在脂肪细胞分化过程中表现出差异活性的调节元件,我们在人前脂肪细胞和脂肪细胞分化的第4天和第14天进行了ATAC-seq和RNA-seq。为了进行比较,我们在11个人体皮下脂肪组织样本中建立了ATAC-seq峰的一致图。我们在所有时间点比较(log2倍变化>1,FDR<5%)和15,919个脂肪细胞和18,244个前脂肪细胞依赖峰之间,发现了58,387个上下文依赖性染色质可及性峰和3,090个相关基因。与前脂肪细胞依赖峰(11.5%)相比,与Roadmap表基因组学脂肪细胞核增强剂相比,脂肪细胞依赖性峰的重叠率增加(60.1%)。我们根据脂肪细胞启动子捕获Hi-C数据,与脂肪eQTL变异体重叠,以及上下文相关基因表达,将上下文相关峰与基因联系起来。在16,167个与基因相关的上下文相关峰中,有5,145条与1,670个基因通过两种或更多的策略相关联。在心脏代谢性状的GWAS位点中,脂肪细胞依赖性峰值,而非前脂肪细胞依赖性峰值,腰臀比显著增加(LD评分回归P<0.005),HDL-C轻度富集(P<0.005)。我们通过两种或两种以上的方法发现了659个与503个基因相关的峰值,并重叠了一个GWAS信号,提示了这些基因的调控机制。为了找出可能改变染色质在时间点之间的可达性的变异,我们在454个上下文相关的峰值中发现了582个变体,它们在可达性方面表现出等位基因失衡(fdr<5%),其中55个峰也与gWAS变体重叠在一个GWAS的棕榈酸位点,rs 603424位于一个脂肪细胞依赖的高峰,与之相连,在脂肪细胞中转录活性存在等位基因差异(P=0.003),而不存在前脂肪细胞(P=0.003.0 9)的等位基因差异(P=0.0 9)。这些结果表明,上下文依赖的峰和基因可以指导GWAS位点上的调节变异的发现,并有助于识别调控机制。
作者摘要
心血管和代谢性疾病很普遍,对这些疾病背后的遗传机制有更多的了解可以改善治疗。染色质的可及性和基因在相关细胞环境中的表达可以指导疾病性状的调控元件和遗传机制的识别。心血管和代谢疾病特征的一个相关背景是脂肪细胞的分化。为了鉴定在脂肪细胞分化过程中表现出不同活性的调节元件和基因,我们分析了前脂肪细胞和脂肪细胞模型中染色质的可及性和基因的表达。我们发现染色质区域在分化过程中改变了可达性,并预测了它们可能影响的基因。我们还将这些染色质区域与疾病风险相关的基因变异联系起来。在一个与脂肪酸相关的基因组区,一个染色质区在脂肪细胞中更容易接触到脂肪酸合成基因,并且在脂肪细胞转录活性上表现出等位基因差异,但不存在前脂肪细胞。这些结果表明染色质区域和基因在细胞环境中的变化可以指导调控变异的发现和疾病机制的鉴定。
引用:Perrin HJ,Currin KW,Vadlamudi S,Pandey GK,Ng KK,Wabitsch M,等。(2021)在脂肪细胞分化过程中染色质的可及性和基因表达在心脏代谢型GWAS位点上确定了相关的效应。PLOS Genet 17(10):e1009865。Https://doi.org/10.1371/journal.pgen.1009865
编者:Chris Cotsapas,耶鲁医学院,美国
收到:2021年6月25日;接受:(二0二二一年十月七日)出版:2021年10月26日
版权:2021年Perrin等人这是一篇以CreativeCommonsAttribution许可证,允许在任何介质中不受限制地使用、分发和复制,只要原始作者和源被记入帐户。
数据可得性:所有ATAC-seq和RNA-seq数据可从GEO数据库获得(登录号:GSE 178796)。
供资:本研究由国家卫生研究院资助的T32HL069768(H.J.P.)、F31HL146121(K.W.C.)、R25GM055336(K.W.C.)、T32GM67553(K.W.C.)、R01HG009937(M.I.L.)、U01KD105561(K.L.M.)、R01DK093757(K.L.M.)、UM1DK126185(K.L.M.)、芬兰科学院77299、124243、141226(M.L.)、芬兰基金会(M.L.);欧洲共同体委员会给予保健-F2-2007-201681(M.L.)。资助者在研究设计、数据收集和分析、决定出版或编写手稿方面没有任何作用。
相互竞争的利益:提交人宣布,不存在任何相互竞争的利益。
导言
全基因组关联研究(GWAS)已鉴定出数千个与心脏代谢性状相关的位点,但由于功能变异、基因、细胞类型和相关背景的未知,大多数机制仍不清楚,特别是在大量的非编码位点上[1]。非编码基因座可以以细胞型和上下文依赖的方式调控基因的表达。2]。部分GWAS基因座与基因表达量性状位点(EQTL)在性状相关组织中共定位[3–8],虽然其他GWAS基因座与eQTL共定位仅在一种情况下发现,例如受刺激的免疫细胞,而不是天真的免疫细胞[9]。因此,在疾病相关环境中定位转录调控元件和基因表达可以用来描述gWAS基因座的分子机制。通过识别染色质可达性区域,可以检测到促进剂和其他调节元件[10]使用测序方法,例如转座酶可访问染色质(ATAC-seq)测定法[11]。在心脏代谢相关细胞类型和背景中,染色质的可达性可以与GWAS和eQTL数据整合,以识别改变基因表达以影响心脏代谢性状的调节元件和变异。
脂肪组织通过其在脂质储存和激素分泌中的作用,影响心脏代谢特征,如体脂分布、胰岛素敏感性、血胆固醇水平和炎症。12,13]。数以百计的心脏代谢性状的GWAS位点与脂肪组织中的eQTL共定位[3–5],某些心脏代谢特征的GWAS位点变异,如根据体重指数(BMI)和高密度脂蛋白(HDL)胆固醇调整的腰臀比,在脂肪组织转录调节元件中的表达量过高。14,15]。在GWAS-eQTL信号的一个子集上,脂肪组织基因的表达可能介导遗传变异对GWAS性状的影响[5]。脂肪是一种异质组织,含有多种细胞类型,包括脂肪细胞、前脂肪细胞、免疫细胞和血管细胞。16]。脂肪组织通过增生来储存脂质,在此过程中,前脂肪细胞分化为成熟脂肪细胞以储存多余的能量,或肥大,在此期间,现有的脂肪细胞膨胀以储存过剩的能量。17]。因此,在脂肪细胞分化的特定阶段识别具有调节作用的变异,可能会揭示GWAS基因座对心脏代谢特性的额外机制。
个体间的遗传和环境差异可能导致染色质可达性的差异[18]。从多个个体生成的染色质无障碍地图可以捕捉反映遗传效应和不同环境背景的可访问区域。现有的人体脂肪组织染色质可及性图由一至六人的数据组成,并根据组织供体特征(如BMI、年龄、性别)、脂肪库、组织提取地点和储存条件而有所不同[14,18,19]。考虑到组织样本的细胞类型异质性,在受控环境中描述组分细胞类型也是非常有用的。在小鼠3T3-L1细胞等模型中,研究了成脂过程中染色质的可及性。20然而,对人类模型的额外研究可以改善对人类非编码基因变异的解释。Simpson Golabi-Behmel综合征(SGBs)细胞是一种特征良好的二倍体前脂肪细胞模型,可分化为成熟的脂肪细胞,对研究脂肪细胞的分化具有重要意义。21,22].
在本研究中,我们确定了前脂肪细胞、未成熟脂肪细胞和成熟脂肪细胞在染色质可及性和基因表达上的差异。此外,我们还利用从男性代谢综合征(METSIM)参与者中获得的11份样本,制作了一份关于皮下脂肪组织染色质可及性的共识地图[23]。我们使用三种方法将差异可达的调节元件与候选基因连接起来,并在心脏代谢型GWAS基因座上识别出位于更易进入前脂肪细胞或脂肪细胞中的变异。最后,我们在SCD和EYA 2表明上下文依赖和/或等位基因对转录活性有影响的位点,检测特定变异体改变基因表达以影响心脏代谢性状的潜在机制。
结果
染色质可达性在脂肪细胞分化时间点上的变化确定了上下文相关的调节元素。
我们用ATAC-seq分析了SGBs细胞在脂肪细胞分化过程中染色质的可及性。11,24]。我们最后分析了10个前脂肪细胞(D0)、10个未成熟脂肪细胞分化4天(D4)和5个成熟脂肪细胞分化14天(D14)的复制。图1A和S1表)。我们的文库有33-1.56亿次过滤阅读,显示出高质量,平均转录起始点(TSS)富集6.8,平均部分读峰(FRIP)为48.5%。为了测试不同时间点之间染色质可达性的差异,我们在任何时间点生成了一组147,587个可访问的染色质区(ATAC峰)(S2表)通过合并每个时间点的前100,000个共识峰值(按每个复制的峰值p值的中位数排列,请参见方法)。主成分分析(PCA)显示,复制按分化时间点聚在一起,前脂肪细胞和脂肪细胞由第一主成分分离,解释了74%的变异。S1图和S1表).
图1.脂肪细胞分化的三个时间点染色质可及性和基因表达的全基因组图谱。
(A)实验设计原理图。SGBs细胞分为前脂肪细胞(D0)、未成熟脂肪细胞(D4)和脂肪细胞(D14)。在每个时间点的复制上产生染色质可及性(蓝色)和基因表达(绿色)谱。上下文相关的峰值显示为黑条。17只个体的皮下脂肪组织(紫色)也产生染色质可达性图谱,并从11个个体的子集中开发出一个最优的一致CA图谱。(B)与上下文相关的前10,000个峰值的热图(来自S4表)用z-得分着色的。中的质量指标对应于库号。S1表。(C)所有3,090个上下文相关基因的表达热图(来自S9表)用z-得分着色的。中的质量指标对应于库号。S8表。(d-E)S9表。(D)脂肪峰与路线图表观基因组计划中的染色质状态重叠,为三组一致的脂肪峰提供脂肪核。(E)前脂肪细胞和脂肪细胞依赖的峰与路线图脂肪核染色质状态重叠。
Https://doi.org/10.1371/journal.pgen.1009865.g001
为了预测脂肪细胞分化过程中所涉及的调控因素,我们在三个时间点的两两比较(Log)之间找出了差异可达的峰(以下称为“上下文依赖的峰”)。2折叠改变(LFC)>1,假发现率(FDR)<5%;S3和S4表和图S2)。根据与上下文相关的10,000个峰值(在任何比较中差异最大),热图显示按时间点(图1B)。D0和D14之间染色质可达性的变化大部分(86%)