厦门论文发表-40种人类脑部疾病的解剖学和细胞转录组结构比较
抽象
与脑部疾病风险相关的基因表现出反映解剖学和细胞类型关系的特征表达模式。疾病风险基因的全脑转录组模式提供了基于差异共表达的基于分子的特征,这通常是该疾病所独有的。脑部疾病可以根据其特征的相似性进行比较和汇总,这通常将来自不同表型类别的疾病联系起来。对 40 种常见人类脑部疾病的分析确定了 5 种主要转录模式,代表肿瘤相关、神经退行性、精神和物质滥用,以及影响基底神经节和下丘脑的 2 组混合疾病。此外,对于皮层中表达丰富的疾病,中颞回(MTG)中的单核数据表现出分离神经退行性,精神和药物滥用疾病的细胞类型表达梯度,具有独特的兴奋性细胞类型表达区分精神疾病。通过绘制小鼠和人类之间的同源细胞类型,发现大多数疾病风险基因在常见的细胞类型中起作用,同时在这些类型中具有物种特异性表达,并在物种内保持相似的表型分类。这些结果描述了成人大脑中疾病风险基因的结构和细胞转录组关系,并为分类和比较疾病提供了一种基于分子的策略,从而可能识别新的疾病关系。
数字
Fig 4Fig 5图1图2图3Fig 4Fig 5图1图2图3
引文: Zeighami Y, Bakken TE, Nickl-Jockschat T, Peterson Z, Jegga AG, Miller JA, et al. (2023) 40种人类脑部疾病的解剖学和细胞转录组结构的比较。公共科学图书馆生物学21(4): e3002058. https://doi.org/10.1371/journal.pbio.3002058
学术编辑: 妮可·索兰佐,英国惠康信托桑格研究所
收到: 30月 2022, 2;接受: 2023 年 20 月 2023 日;发表: <>月 <>, <>
版权所有: ? 2023 泽加米等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 本手稿中使用的所有数据均为公开数据。基因疾病关联数据可以从 https://www.disgenet.org/ 下载。可以从 http://human.brain-map.org/ 下载大规模的解剖转录模式,细胞类型数据可在 http://celltypes.brain-map.org/ 获得。脚本(Jupyter notebook)和用于生成图形的数据文件在 https://doi.org/10.5281/zenodo.7709525 提供。
资金: 这项工作部分得到了加拿大第一研究卓越基金的资助,该基金授予麦吉尔大学健康大脑,健康生活(HBHL)倡议新招募启动补充计划,以及魁北克生物图像网络(RBIQ / QBIN)。MH还得到了R01MH123220(PI)的支持 08/01/2020-07/31/2022 (NIH):数据驱动的脑转录组细胞类型定义、本体和命名学授权的社区框架。“资助者在研究设计,数据收集和分析,发表决定或手稿准备方面没有任何作用。
竞争利益: 提交人声明不存在相互竞争的利益。
缩写: 助理总干事, 解剖疾病组;阿巴, 艾伦人脑图谱;ALM, 前外侧运动;比肯, 脑倡议细胞图谱网络;BICCN, 脑倡议细胞普查网络;CGS, 中央神经胶质物质;快递 之 家 小脑核;无害环境管理 差分稳定性;等 电休克治疗;哗啦啦, 表达加权细胞类型富集;罗斯福 错误发现率;命令行界面 额叶;GBD, 全球疾病负担;GDA, 基因-疾病关联;全科医生, 苍白球;遗传资源, 骨核;IHME, 健康计量研究所;LSM 多发性硬化症;MTG, 中颞回;强迫 症 强迫症;奥米姆, 人类在线孟德尔遗传
介绍
脑部疾病日益被认为是全世界死亡和残疾的主要原因[1-3]。这些多样的多因素疾病可能主要分为脑血管,神经退行性,运动相关,精神疾病,发育和先天性疾病,药物滥用障碍,脑肿瘤和一系列其他与大脑相关的疾病(健康计量研究所(IHME),healthdata.org)。脑部疾病的经济影响也有很大差异,这反映在全面和每年更新的全球疾病负担研究中[4](S1文本中的图A)。脑相关疾病的病因及其遗传学很复杂,研究广泛[5-7]。然而,脑部疾病的表型分类具有挑战性,并且不能唯一划分遗传风险、疾病表现和治疗的特征。除了由单基因突变引起的孟德尔疾病外,大多数脑部疾病通过脑转录组及其调控网络的相互作用表现为遗传学和环境之间的复杂相互作用。通过对组织、细胞的剖析以及最近在单核分辨率下对脑部疾病的遗传分析[8]为群体规模采样提供了解开基本分子关系的方法[9,10]。
表征脑部疾病主要转录组关系的神经解剖学及其与细胞类型的关系为疾病比较和分类提供了一种新的方法。本研究的前提是假设疾病基因的空间和时间共表达表明这些基因之间存在潜在的相互作用[11,12],并且基于这些模式的疾病聚集是有益的。研究来自供体群体的大脑样本,这些样本在神经典型和患病大脑中以及在多个尺度上表现出疾病相关基因的连贯转录组学和解剖学关系,有望为开发进一步研究脑部疾病病理生理学的方法提供重要的见解,特别是随着全脑细胞数据变得越来越可用。人脑的大规模转录组分析已经为探索神经典型和疾病状态的遗传学[13-16]以及描述脑部疾病与转录组模式的神经解剖学的更大规模关系提供了有用的资源[13,17]。
中尺度的转录组关系,介于较大的大脑结构(例如,皮质、下丘脑)和细胞分辨率的大脑结构之间,为与常见表型分组相比,对广泛的疾病关联进行分类提供了一个框架和起点。从艾伦人脑图谱(human.brain-map.org)开始[13,14],我们研究了40种脑相关疾病的成人神经典型大脑基因的解剖模式和转录模式的差异表达,这些基因涉及皮层、海马、杏仁核、基底神经节、上丘脑、丘脑、腹丘脑、下丘脑、中脑、小脑、脑桥、脑脑和白质等104种结构。 使用来自人类中颞回(MTG)的单核数据,我们通过比较24种抑制性,45种兴奋性,24种非神经元类型的细胞类型的表达,进一步表征了6种在皮层中主要表达的疾病子集,并特别关注精神疾病。这种结合了基于组织和单核数据的多分辨率方法将中尺度解剖学分析与皮层的细胞类型联系起来,是从基于组织的采样中提取信息的公认方法[18,19]。最后,将这些结果与小鼠的单细胞数据并列[15,20]可以识别潜在的重要的人类特异性细胞类型差异,并深入了解脑部疾病动物模型中的重叠机制。
脑部疾病和相关基因
选择的疾病代表了全球疾病负担研究中的7个表型类别(在本研究中称为GBD类别)。由于数据源中代表性的内皮细胞和周细胞类型以及相关血细胞的局限性,排除了重要的脑血管疾病组。为了确定基因-疾病关联(GDA),我们使用了DisGeNET数据库(www.disgenet.org)[21-23],这是一个从多个来源聚合的平台,包括精选存储库,GWAS目录,动物模型和科学文献。根据对人类在线孟德尔遗传(OMIM)(www.omim.org)存储库的初步调查,我们之前确定了549种潜在的大脑相关疾病[13],这些疾病现在与DisGeNET存储库相交。我们要求报告的GDA至少存在于1个已确认的策划来源中(见 https://www.disgenet.org/dbinfo),并且每种疾病至少有10个基因。对于每种疾病,选择疾病的主要变体,不包括罕见的家族和遗传形式。这种保守的选择导致了40种主要的脑部疾病,具有1,646个独特的相关基因。S1表包含定义,基因集和识别每种疾病的元数据(方法)。
与脑部疾病相关的基因集在大小和共享基因比例上差异很大,根据临床表现,疾病可能通过表型相似性而相关[24,25]。本研究中的基因集大小范围广泛,从额颞叶变性(g = 11)到精神分裂症(g = 733),并广泛分布在GBD类别中,如(数量,GBD类独有的%)精神病(1,107,0.723),神经退行性(257,0.513),物质滥用(212,0.320),脑肿瘤(168,0.667),发育障碍(139,0.676),运动相关(136,0.272)和其他大脑相关(123, 0.414)(S1文本中的图B)。精神和物质滥用GBD类别之间的基因集交叉较大(g=132),其中62%的物质滥用基因也与精神疾病相关,反映了这些疾病的合并症[26]。运动障碍在神经退行性疾病中也很常见[27],神经退行性疾病共享30%(g = 41)的运动相关基因,而基于GBD的肿瘤和发育与其他类别的份额最少(分别为2.5%和2.6%)。根据相对成对基因集交叉(Jaccard)对40种疾病和病症进行聚类,显示出与GBD表型分组的适度一致性(S1文本中的图B),精神疾病中共享基因的百分比最高,为7.64%(p = 1.55 × 10?4),其次是药物滥用6.33%(p = 2.82 × 10?4),脑肿瘤 5.43%(p = 8.35 × 10?3).(显著性是针对 GBD 班级规模校正的观察到的百分比的可能性。每个GBD特有的基因的功能富集分析(https:// toppgene.cchmc.org)描述了这些群体的主要生物学过程和途径(S1文本和S2表中的图C)。
脑部疾病的神经解剖学和转录组学谱
来自 6 个神经典型供体大脑的艾伦人脑图谱 (AHBA, https://human.brain-map.org) 的表达谱用于总结与 40 种疾病相关的基因的主要神经解剖学关系。使用来自皮层(CTX,104个亚结构)、海马体(HIP,3)、杏仁核(AMG,8)、基底神经节(BG,7)、上丘脑(ET,6)、丘脑(TH,12)、下丘脑(HY,3)、中脑(MES,12)、小脑和小脑核(CB,16)、脑桥和脑桥核(P,11)、髓脑(MY,4)、心室(V,10)和白质(WM, 12),我们通过平均1个结构中与2种疾病中每种疾病相关的基因的表达和z评分归一化来获得平均转录组疾病谱(图40和S104表)。使用皮尔逊相关(方法)进行具有病房连锁的分层聚类,在 1 个原发性解剖疾病组 (ADG 4–ADG 5) 中呈现全脑转录组关联,根据 GBD 分类(图 1A,左侧色条)可解释为肿瘤相关 (ADG 5)、神经退行性 (ADG 1)、精神、药物滥用和运动障碍 (ADG 1),一组没有与下丘脑功能相关的发育、精神或肿瘤疾病(ADG 2)和一组与基底神经节相关的疾病(ADG 3)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 主要脑部疾病的转录组模式。
(A) 来自 40 个主要区域皮层 (CTX)、海马 (HIP)、杏仁核 (AMG)、基底神经节 (BG)、上丘脑 (ET)、丘脑 (TH)、腹侧丘脑 (VT)、下丘脑 (HY)、中脑 (MES)、小脑 (CB)、脑桥 (P)、脑桥 (PN)、髓脑 (MY)、心室 (V), 白质。基于 z 评分平均谱的分层聚类产生 104 个原发性解剖疾病组 ADG 3–ADG 15。行注释(左栏)显示带有颜色代码的表型 GBD 成员资格。柱形图注释是 5 组方差分析,用于固定结构下的 ADG 表达变异性。行注释(右栏):与疾病相关的基因数量(对数刻度)。(B)说明ADG 1-5类解剖模式的大脑图形。(C) 助理总干事曲线的可重复性。(实心)在其他受试者中,ADG 疾病转录组特征与来自同一 ADG 的特征最密切相关的频率。(开放)在其他受试者中发现确切疾病的频率。(D)表型GBD群体对疾病的类似分析。(实心)相同的GBD类,(开放)确切的疾病协议。图 5 的基础数据可以在 S1 和 S5 表中找到,数据来自 S1 数据 HBA 疾病文件。原始数据可在 http://human.brain-map.org/ 获得。代码在 https://github.com/yasharz/human-brain-disease-transcriptomics 上作为笔记本提供。助理总干事,解剖疾病组;GBD,全球疾病负担。
https://doi.org/10.1371/journal.pbio.3002058.g001
每个 ADG 组中转录组模式的解剖学表现描述为 ADG 1:丘脑、脑干、心室壁、白质;ADG 2:皮质丘脑、脑干、白质;ADG 3:(端脑)皮质、丘脑、海马、杏仁核、基底神经节;ADG 4:基底神经节、下丘脑、脑干;和 ADG 5:丘脑、下丘脑、脑干。图1说明了疾病基因表达的复杂解剖结构,值得注意的是,在去除疾病对之间的共同基因后,ADG基团的分裂和结构在很大程度上得以保留(67%)(S1文本中的图D),表明不同的共表达基因驱动主要的ADG基团。聚类也保持稳定的子采样具有非常大的基因集的疾病(S1文本中的图E)。ADG转录组特征在受试者之间也是一致的,因为个体大脑保留分析(S1文本,方法中的图F和G)发现,跨结构表达的相关性和固定结构的ADG组之间的差异关系都保留在受试者内。
疾病基因负担可能差异很大(从高负担到风险因素),支持每个基因的证据强度各不相同,其中一些基因得到了多个大型队列研究的一致支持,而另一些基因的数据可能相互矛盾。为了解释这些影响,我们使用了DisGeNET数据集通过GDA评分(方法)提供的基于文献的GDA权重。尽管基因疾病权重的准确性可能存在差异,但加权分析的结果(S1文本中的图H)以1%的一致性证实了图85的疾病关联。此外,所呈现的疾病具有非常不同的时间遗传特征,这可能会混淆关联。然而,我们观察到,即使是可能主要在发育中起作用以引起病理的基因也可能继续导致成年期的疾病状态,并且神经发育障碍的症状在一生中持续存在。虽然我们的分析没有考虑时间动态,但使用60天至39岁的供体检查BrainSpan(https://www.brainspan.org)数据(S1文本中的图I)突出了预期的时间模式和表达的开始,聚类保留了在成人中发现的许多关联。
图1中反映的基因表达的复杂解剖组织将疾病与GBD研究的常见表型分类相关联,但具有文献支持的重要分歧(图1A,左侧边栏)。ADG 1 由间脑、髓脑和白质中的共表达驱动,包括偏头痛疾病和多发性硬化症 (MS) 相关的肿瘤性疾病。MS与脑肿瘤的并发已被广泛报道[28-30],MS患者的总体癌症风险降低,但脑肿瘤风险增加[31],一种假设是,再髓化过程与CNS免疫功能下降相吻合。脑肿瘤患者既往诊断偏头痛的风险也增加[32]。ADG 2包括大多数神经退行性疾病,与Williams综合征和遗传性痉挛性截瘫有关,早期衰老、痴呆、自身免疫和慢性炎症是氧化应激相关疾病的特征[33]。肌萎缩侧索硬化症与阿尔茨海默病([34]以及额颞叶痴呆有关[35]。除了在痴呆和帕金森病中表达强烈的黑质SNC外,该组在皮质和下丘脑体中的表达更强,在神经变性中观察到异常[36]。ADG 3 中所有精神疾病、大多数运动和物质障碍的共同关联是由强烈的端脑模式驱动的。癫痫发生后的精神表现常有目共睹,但尚不完全清楚[35,37]。众所周知,癫痫发作是精神症状的极其有效的调节剂,电休克疗法(ECT)至今仍被用作最有效的抗抑郁药和抗精神病药治疗之一。ADG 4包括混合表型类的疾病,具有一致的下丘脑特征(图1C),其中健忘症和发作性睡病可能与下丘脑病变有关[38,39],以及发作性睡病伴过量使用大麻[40,41]。最后,ADG 5主要表现为影响基底神经节的疾病 亨廷顿病中运动迟缓的帕金森病征通常随时间推移而显现[42]。
为了了解ADG组之间表达的变异性,我们将方差分析应用于每个结构的平均表达差异(BH校正p值,顶部注释,图1)。图1A中特别引人注目的是肿瘤和神经退行性疾病常见的白质特征(ADG 1-2),在精神疾病和成瘾性疾病(ADG 3-4)中实际上不存在[43],ADG 3中端脑表达(CTX、髋关节、AMG和BG)显著富集[44,45].成人大脑中疾病基因最显着的转录组变异发生在下脑结构的不同细胞核中:在下丘脑(例如,楔形核(Cu,p < 3.35 × 10?8), 结节浑浑性核 (TM, p < 1.3 × 10?6), 浑上核 (SuM, p < 2.07 × 10?6),在髓脑(鞘核(GR,p < 1.48 × 10?8)、中央神经胶质物质(CGS,p < 3.86 × 10?6),在基底神经节(苍白球(GP,p < 5.01 × 10?7))和小脑核(CN和白质,特别是胼胝体(cc,p < 5.01×10?7)).随着皮层的变化,ADG 1 和 ADG 2 之间的区别更加微妙(额叶,FL,p < 2.82 × 10?3)、上脑(外侧单核,(HI,p < 2.85 × 5))和中脑(前保护区,(PTec,p < 6.24 × 10?5)),并将使用基于模块的分析进一步检查(图2)。有关详细信息,请参阅 S1 文本中的图 J。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 人类脑部疾病中可重复的转录模式。
(A)基因GRIA2的表达谱,误差线显示在56个结构上(S3表,human.brain-map.org)。DS测量AHBA的可重现表达模式[13]。(B)M1端脑(语言发育,癫痫)和M12黑质(帕金森病,痴呆)的典型特征基因,具有代表性基因的模块相关性。(C)将疾病映射到解剖模式的典型表达模块M1-M32的图谱。疾病基因与每个模块独立相关并归一化(方法),疾病顺序与图1相同。模块M1-M32根据其衍生的神经元,星形胶质细胞,少突胶质细胞类型内容进行排序[13]。箭头和方框表示M1和M12中代表性过高的疾病。其他疾病代表性模块在S1文本的图M中描述。图 2 的基础数据可以在 S1 和 S5 表以及 S1 数据疾病模块文件中的数据中找到。原始数据可在 http://human.brain-map.org/ 获得。规范表达模块的信息可在 https://www.nature.com/articles/nn.6 的 S4171 表中获得。代码在 https://github.com/yasharz/human-brain-disease-transcriptomics 作为笔记本提供。AHBA,艾伦人脑图谱;DS,差分稳定性。
https://doi.org/10.1371/journal.pbio.3002058.g002
虽然疾病基因在人群中的表达可能差异很大[46,47],但单个大脑中每种疾病的解剖表达特征通常与其他大脑中同一ADG组中的疾病密切相关(图1C)(ADG 1-5:96.7%,77.0%,96.1%,100.0%和92.5%),并且通常识别其他受试者的确切疾病(S1文本中的图1C和1G, 方法)。从表达特征识别疾病的能力提供了通过神经解剖学表征该疾病的能力。令人惊讶的是,与ADG 3组疾病共济失调,语言发育障碍,颞叶癫痫,强迫症和可卡因相关障碍相关的表达签名与每个受试者中的这些相同疾病最密切相关。同样,在ADG 4和5中,与帕金森病、亨廷顿病、健忘症、发作性睡病、神经痛和烟草使用障碍相关的基因由于基底神经节、下丘脑和髓脑中一致的分化表达,在受试者中表现出独特的特征。相反,ADG 2 阿尔茨海默病和肌萎缩侧索硬化症以及 ADG 3 双相情感障碍、自闭症和精神分裂症的中尺度转录组谱对这些疾病来说不太独特,这表明它们与同一 ADG 组中的其他疾病之间可能存在细胞、解剖学和表型重叠。在表型上,GBD运动障碍和物质滥用具有最一致的解剖特征(94.0%,89.5%)(图1D),而精神和发育疾病最少(64.0%,55.0%)。
脑部疾病的典型表达模式
疾病风险基因转录模式的神经解剖学可以通过直接识别成人中保守的差异表达关系和可重复模式来进一步表征。通过将疾病基因映射到这些典型表达模式[13],我们描述了脑部疾病的共表达模式和主要组成细胞类型。[13]中引入的差分稳定性(DS)被量化为一组固定解剖区域上成对标本之间表达的平均皮尔逊相关ρ,并测量一组受试者的解剖区域之间保存的差分关系的比例。例如,具有显着高DS的基因GRIA2(ρ = 0.918)(图2A)与双相情感障碍[48],精神分裂症[49]和物质戒断综合征[50]有关,并且在AHBA受试者中具有高度可重复的全脑表达谱,在海马体和杏仁核中表达最高。
尽管与非疾病相关基因相比,疾病基因的表达水平略有显著(p < 0.031)差异(S1文本中图K的A组),但疾病基因具有差异稳定基因的百分比显着更高,特别是对于药物滥用,(平均DS = 0.702,p < 4.7 × 10?21)、精神病学(DS = 0.675,p < 3.17 × 10?17)和运动障碍(DS = 0.635,p < 1.21 × 10?17) (S1文本中图K的面板B)。DS优先考虑具有强结构标志物的神经元细胞类型,而不是神经胶质细胞中常见的非神经元广泛非区域表达(S1文本中的图L)。高 DS 疾病基因也大大富集用于细胞类型过程,例如顺行跨突触信号传导,(低 DS 1.8 × 10?4, 高 2.9 × 10?12)和突触前膜(低DS 0.049,高4.62×10?7),表明高 DS 选择细胞类型特异性。值得注意的是,ADG 3中基因的稳定性(中位数0.625,p < 4.1 × 10?70), ADG 4 (0.642, 1.24 × 10?6)和日推 5 (0.644, 2.95 × 10?14) 明显高于 ADG 1 (0.592 × 10?6, 1.02) 和日升 2 (0.582, 7.70 × 10?7),表明这些组中神经元细胞类型和结构标志物的百分比较高。S1文本中图K的图C显示了每种疾病的DS基因分布,证实了DS较高的疾病是具有更多解剖结构标志物的疾病。
之前使用DS基因的上半部分(DS > 13.0,g = 5284,8)对Allen人脑图谱中可重复基因共表达模式[674]的表征确定了32种主要转录模式或模块,每种模式或模块由跨大脑结构的特征表达模式(即特征基因)表示,并按细胞类型内容排序。图2B说明了某些疾病风险基因对2个代表性模块M1和M12模块的成员关系。模块M1在海马体中具有较强的端脑表达,特别是齿状回,代表性基因包括GRIA2(与特征基因相关,ρ = 0.907)和DLG3(ρ = 0.896)。
已知谷氨酸能神经传递的改变与精神和神经发育障碍有关,GRIA2突变与这些疾病有关[46-48]。M12是黑质致密部、网状部和腹侧被盖区的独特神经元标志物,为这些合并症提供了肌张力障碍、帕金森病和痴呆的更清晰的联系(图2C)。多巴胺转运蛋白基因SLC6A3(ρ = 0.967)是多巴胺神经元中多巴胺或其他毒素的候选风险基因[51,52]和醛脱氢酶-1(ALDH1A1,ρ = 0.949),其多态性与酒精使用障碍有关,映射到模块M12(ρ = 0.949)[53].表达模块谱的全脑关联可能用于牵连先前与给定疾病无关的基因,特别是当该谱在供体之间高度保守时。
通过为每个基因找到最接近的相关模块特征基因,可以将一组疾病风险基因映射到规范模块,从而提供与疾病相关的表达模式的分布(S5表)。图2C显示了40个疾病相关基因集与按ADG排序的模块M1-M32特征基因的归一化平均相关性,如图1(方法)所示。AHBA组织样本的神经元,少突胶质细胞,星形胶质细胞的基本细胞类别组成是从早期的单细胞研究中确定的[13],并且模块M1-M32按神经元富集细胞比例的降低排序。有趣的是,图2C阐明了图1的ADG组之间的区别,显示了主要的细胞类型含量,并说明了脑部疾病的主要解剖共表达模式。
主要基于肿瘤的ADG 1映射到具有富集神经胶质含量的模块M21-M32(p < 2.413 × 10?15),而ADG 3精神和药物滥用相关疾病映射到神经元富集图案模块M1-M10(p < 2.2×10?16).重要的是,ADG 2的神经退行性疾病包括阿尔茨海默氏症,帕金森氏症,ALS和额颞叶变性在模块中显示出更均匀的分布,现在重要的是将该组与ADG 1分开(p < 1.55×10?15).ADG 4 和 5 均富含特定的解剖标志物,例如 M10(纹状体)、发作性睡病、大麻、M14(下丘脑)、神经痛、健忘症、M11(丘脑)、帕金森病和烟草使用障碍、M12(黑质)、帕金森病和酒精中毒,但在神经元模块 M1-12 中的表达低于 ADG 3(单面, p < 1.3 × 84 ?13).图2C的分布验证了图1的聚类,阐明了ADG之间的区别,并通过常见的转录模式和主要组成细胞类型提供了疾病的分类(S1文本中的图N和O)。
中颞回疾病基因及细胞类型
原发性端脑表达模式常见于ADG 3疾病,虽然中尺度系统水平分析描述了全脑解剖学关系,但其将特定细胞类型与疾病联系起来的能力有限[12,54]。为了更精细地检查这些疾病,我们现在仅限于图24和1所示的全脑分析中皮质表达高于中位数的2种疾病,基本上是ADG 3的全部和ADG 2的几种神经退行性疾病。我们使用了来自MTG的8个供体大脑(15,928个细胞核)的人单核(snRNA-seq)数据[15],其中先前鉴定了75种转录组不同的细胞类型,包括45种抑制性神经元类型和24种兴奋性类型以及6种非神经元细胞类型。一组142个标记基因用于差异区分[15]中的MTG细胞类型。这些基因形成一个高度差异稳定的基团(DS = 0.734,p < 8.66 × 10?7),表明细胞类型特异性强,疾病基因中有30个,有几个与疾病唯一相关(S6表)。
我们使用[55](方法)中定义的Tau评分(τ)测量疾病基因共表达在特定细胞类型中富集的趋势。对于基因g,0≤τ(g)≤1测量表达范围从不同细胞类型均匀到集中在特定细胞类型的趋势。对代表给定疾病的基因集求平均值τ,我们获得了MTG中每种疾病的细胞类型特异性的测量(S1文本中图P的C组)。脑和非脑疾病基因之间的表达水平差异虽然存在(p = 0.005),但不如这些组之间τ特异性的显着差异那么大 p < 2.2 × 10 ?16 (S1文本中图P的面板A和B)确认与脑部疾病相关基因的特殊细胞类型参与。汇集到7个GBD类别(图3B),来自精神病学的基因(p < 2.52 × 10?74), 运动 (p < 1.71 × 10?11)和药物滥用障碍(P < 3.58 × 10?11)显示出最高的细胞类型特异性,而肿瘤,发育障碍和神经退行性疾病较少。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 中颞回的疾病基因和细胞类型。
来自含有MTG区域的AHBA(http://human.brain-map.org)的冠状参考板。(A)24种皮层相关脑部疾病(方法)的平均细胞类型表达(CPM),15,928个MTG细胞核超过[75]中鉴定的15种细胞类型。对疾病和细胞类型进行聚类,并根据细胞类型表达富集鉴定 4 个细胞类型组 CTG 1-4。左注:ADG组成员由图1确定,GBD表型分类。顶部注释:主要细胞类型类别(兴奋性,抑制性,非神经元)和亚类水平抑制(Lamp5,Sncg,Vip,Sst Chodl,Sst,Pvalb),兴奋性(L2 / 3 IT,L4 IT,5 IT,L6 IT,L6 IT Car3,L5 ET,L5 / 6 NP,L6 CT,L6b )和非神经元(OPC,星形胶质细胞,少突胶质细胞,内皮,微胶质细胞/血管周围巨噬细胞)。颜色编码是按类(例如,兴奋性)和子类类型进行的。箭头表示细胞类型表达梯度的增加和减少。(B)合并到表型GBD类别的细胞类型特异性τ测量显示精神和运动类别作为大多数细胞类型特异性。条形:所有细胞的平均特异性,每个表型组的p值显示显著性。(C)UMAP结合中尺度和细胞类型疾病关系,按表型编码(方法)。数字显示具有原代细胞类型注释和兴奋性梯度的原始ADG成员。图 3 的基础数据可以在 S1 和 S6 表中找到,数据来自 S1 数据疾病细胞类型集群级别和相关矩阵。原始数据可在MTG SMART-seq(2018)下的 https://portal.brain-map.org/atlases-and-data/rnaseq 获得。代码在 https://github.com/yasharz/human-brain-disease-transcriptomics 上作为笔记本提供。助理总干事,解剖疾病组;AHBA,艾伦人脑图谱;GBD,全球疾病负担;MTG,中颞回。
https://doi.org/10.1371/journal.pbio.3002058.g003
图3A显示了24种皮质脑疾病的平均表达谱聚类。疾病按细胞类型特异性表达聚集,并带有显示主要亚类水平类型的注释(抑制:Lamp5,Pvalb,Sst,Sst Chodl,Vip; 兴奋性:IT,NP,ET,CT,L6b;和5种非神经元类型。图3中的细胞类型分析确定了这些皮质疾病的4个主要细胞类型组(CTG 1-4)。在这里,CTG 1代表几种运动和药物滥用障碍,其特征在于神经元兴奋性IT比抑制性Vip细胞类型强富集(p < 5.53 × 10?12)和非神经元类型的低表达。CTG 2以精神疾病[56]为主,表现出更平衡的泛神经元表达,并且在非神经元类型中较低。CTG 3代表非神经元富集肿瘤的疾病,具有明显的非神经元表达,并从全脑分析中捕获ADG 1疾病。最后,与神经退行性疾病相关的CTG 4在Vip抑制神经元中比兴奋性和专门的非神经元类型具有主要的富集。图3的主要细胞类型(抑制性、兴奋性、非神经元)区分了图1的主要疾病组,并证实了图2C对这些疾病的基于模块的分析。图3顶部注释条的颜色一致性显示,数据簇在子类类型级别为Vip、Sst、Pvalb、IT、L6b和非神经元类型。此外,固定细胞类型的方差分析(S1文本中的图Q)表明,兴奋性和非神经元类型在疾病之间的变异最高。有趣的是,图3显示了CTG 1-4兴奋性细胞类型中表达增加的梯度(CTG 3-4,p < 0.0623;CTG 2–4, 页码 < 3.56 × 10?9;CTG 1–4, 2.93 × 10?18)在CTG的IT,ET和L6b细胞类型中,在语言发育,强迫症(OCD)和癫痫方面富集。虽然一类抑制性变异在细胞类型组之间并不显着,但相比之下,血管活性肠肽表达(Vip)中间神经元显示出从CTG 1-4的表达梯度降低(CTG 1-2,4.09 × 10?10;CTG 1–4, 8.26 × 10?11;CTG 2–4, 0.0006)。在这里,Vip中间神经元的显着富集,调节锥体神经元的反馈抑制[57],可见于阿尔茨海默病[58],额颞叶变性,ALS[59]和威廉姆斯综合征[60]。
结构(图1)和细胞类型分析(图3)及其按表型分类的分组是一致的,尽管数据仅限于来自单个皮质区域的细胞核(S1文本中的图R)。我们结合了中尺度和细胞类型方法,平均了24种皮质疾病的疾病基因表达相关矩阵(方法),并形成了共识UMAP 图3C,该图以图形方式说明了主要皮质表达脑疾病的转录组学景观,以及与表型关联的关键一致性和差异。图3C中的嵌入显示了按原始ADG分组,按表型着色,标记原代细胞类型以及皮质表达中的兴奋性细胞类型梯度。
文献中有证据表明这些疾病风险基因之间的表达梯度一致。滥用药物已被证明会强烈改变第5层锥体细胞类型的神经元兴奋性[61],并且已经发现癫痫中最大的转录组学变化发生在L5-6_Fezf2和GABA能中间神经元Sst amd Pvalb细胞类型不同的神经元亚型中,与这些CTG 1疾病的更高表达一致[62]。此外,确定了颞叶癫痫与强迫症[63]和语言发育[64]的合并症。已知精神疾病(CTG 2)相关基因在皮质中广泛表达[13],精神分裂症和抑郁的GWAS研究表明,易感基因在神经元细胞类型中广泛表达[65,66]。越来越多的证据表明,在许多神经退行性疾病(CTG 4)中,Vip表达被改变[67],神经胶质细胞的作用及其与神经元的相互作用在神经退行性过程中的研究也越来越多[68,69]。共表达关系证实了这些将不同表型疾病群体联系起来的已知关联。
精神疾病中的兴奋性细胞类型变异
原发性精神疾病自闭症、双相情感障碍和精神分裂症表现出大致相似的表达特征(图3A),但其他疾病组的更强变异以及与这3种疾病相关的大量基因掩盖了详细的变异。这些疾病的遗传率至少为0.8,是遗传性最强的精神疾病之一,其风险基因库有显著重叠[56]。我们为自闭症、双相情感障碍和精神分裂症等疾病形成了 3 个矩阵,其中每个基质测量 MTG 细胞类型之间细胞类型表达的协变性(使用该疾病特有的基因),并独立阈值显著性(方法)。使用这些基质,我们研究了自闭症,双相情感障碍和精神分裂症特有的显着协变细胞类型(Aut,Bip和Scz),以及针对成对疾病(Aut-Bip,Aut-Scz和Bip-Scz)特有的细胞类型(图4A和插图)。 有趣的是,兴奋性变异大大超过了这些疾病的抑制性和非神经元变异[70],占显着细胞类型相互作用的70.7%。特别是,我们发现Aut-Scz(绿色)与表层细胞类型(Linc00507 Glp2r,Linc00507 Frem3,Rorb Carm1p1)的相互作用,中间层类型(Rorb Filip1,Rorb C1r)中的Bip-Scz,以及Rorb C1r中双极风险基因表达的独特富集。 值得注意的是,尽管在给定细胞类型中富集的基因在3种疾病之间有所不同(S1文本中的图S),但疾病之间共享特定的神经元回路[71,72]。图4C显示了Aut,Bip,Scz(g = 19,20,25)特有的基因的相关生物学过程和途径,这些基因通过了图4B相互作用图中的阈值(S7表)。该图显示了差异表型,其中与自闭症唯一相关的基因与大脑发育相关,精神分裂症相关的富集基因与树突状生长有关,双相相关基因与昼夜节律相关[73]。这些独特基因的表达在相关细胞类型中具有不同的特征,精神分裂症表现出泛兴奋性表达(S1文本中的图S)。对风险基因表达谱的细胞类型特异性询问可以深入了解多基因风险如何影响精神疾病中不同类型的神经元和神经元回路,同时影响重叠的途径和过程。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. 人类 MTG 中自闭症、双相情感障碍和精神分裂症的细胞类型谱。
(A)3种主要精神疾病的MTG基因表达的显着细胞类型特异性协变(方法)。来自 [75] 的所有 15 种细胞类型,放大倍数为 (B) 所示的 24 种兴奋性类型,按疾病组合进行颜色编码。自闭症(Aut,青色),双相情感障碍(Bip,紫色)和精神分裂症(Scz,黄色)显示出这些疾病特有的相互作用,Aut-Bip(蓝色),Aut-Scz(绿色)和Bip-Scz(红色)是成对独有的,Aut-Bip-Scz(黑色)是所有人。 兴奋性细胞类型(IT,ET,NP,CT,L6b)和树状图分类法来自[15]。 (C)来自(B)的兴奋性相互作用(Aut,Bip,Scz)特有的细胞类型特异性基因和代表性的富集生物过程和途径。NN = 非神经元。图 4 的基础数据可以在 S1 和 S7 表中找到,数据来自 S1 数据/Three_psychiatric_disorders。原始数据可在MTG SMART-seq(2018)下的 https://portal.brain-map.org/atlases-and-data/rnaseq 获得。代码在 https://github.com/yasharz/human-brain-disease-transcriptomics 作为笔记本提供。MTG,中颞回。
https://doi.org/10.1371/journal.pbio.3002058.g004
小鼠和人类细胞类型的脑部疾病
单细胞分析允许物种之间细胞类型分类的比对,类似于物种之间基因组的同源比对。为了检查小鼠和人类之间基于疾病的细胞结构的保守性,我们使用从人类MTG的转录组细胞类型与15个不同的小鼠皮层区域的对齐[2]:初级视觉皮层(V1)和前运动区域,前外侧运动(ALM)皮层。这种同源细胞类型分类法基于表达协变,并且比对表明皮质区域和物种之间在很大程度上保守的细胞结构,鉴定了20种神经元间,12种兴奋性和5种非神经元类型(图5A)。我们使用这种比对来研究24个皮层疾病组的物种特异性细胞类型分布,包括广义细胞类型类(N = 7,例如兴奋性)和亚类(N = 20)的分辨率,其中非神经元细胞类型在两个分析水平之间是共同的。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. 小鼠和人类中基于疾病的细胞类型表达。
(A)将[15]在人类MTG中获得的转录组细胞类型与2个不同的小鼠皮质区域,初级视觉皮层(V1)和前运动区域ALM皮层的对齐,每个方块代表映射到同源共识细胞类型的小鼠(橙色)或人类(蓝色)细胞类型簇。(B)小鼠和人类EWCE值[74]在20种对齐细胞类型的亚类水平上的直方图。K-S 拟合优度检验(方法)显示分布略有不同 (D = 0.091,p = 0.035)。(C)使用EWCE疾病特征同时聚集小鼠和人类在亚类水平6抑制,9兴奋性,5非神经元(橙色:小鼠,蓝色:人类)显示物种之间大多数疾病的相似性。(D)使用平均表达水平对小鼠和人类进行类似的聚类,在保留GBD疾病关联的同时显示物种特异性表达谱。注释主要细胞类别,副病GBD表型和ADG成员。图 5 的基础数据可以在 S1 表和 S1 数据中的数据(使用 EWCE_subclass 以及Cell_subclass表达式文件)中找到。原始数据可在MTG SMART-seq (2018)下的 https://portal.brain-map.org/atlases-and-data/rnaseq 获得。可通过 https://github.com/NathanSkene/EWCE 获得的 EWCE 代码。代码在 https://github.com/yasharz/human-brain-disease-transcriptomics 作为笔记本提供。ALM,前侧马达;EWCE,表达加权细胞类型富集;GBD,全球疾病负担;MTG,中颞回。
https://doi.org/10.1371/journal.pbio.3002058.g005
为了鉴定小鼠和人类细胞类型之间脑部疾病的细胞类型差异,我们使用了表达加权细胞类型富集(EWCE)分析[74]。简而言之,EWCE将与给定疾病相关的一组基因的表达水平与具有相似基因集大小的基因组背景进行比较,通过排列分析确定显着性并排除疾病相关基因(方法)。EWCE同时评估疾病中的所有基因,识别该组细胞类型表达的分布,并且可以解释为表征疾病的活性富集细胞类型的特征。小鼠和人类之间对齐的EWCE值的相关性(S1文本中图T的A图A,ρ = 0.633)反映了广泛保守的表达模式[13],全球EWCE分布差异最小(K-S检验:D = 0.0916,p = 0.03)(图5B)。更值得注意的是,EWCE小鼠和人类比对细胞类型的同时聚类(图5C,小鼠(橙色),人类(蓝色))显示了物种之间大多数疾病的配对,并表明亚类水平上高度保守的细胞类型特征。值得注意的是,图5B显示,共济失调,自闭症,癫痫,双相情感障碍,ALS,阿尔茨海默病和精神分裂症以及其他疾病的EWCE富集特征更接近物种之间的同一疾病,而不是物种内的任何其他疾病特征。图5D显示了小鼠和人类每种疾病的标准化表达值的类似共聚类。然而,这里按物种特定概况划分的数据聚类,同时保留了许多表型GBD关联(左注释)。因此,通过小鼠和人类细胞类型的同源性图谱,我们发现小鼠和人类疾病风险基因在同源细胞类型中起作用,同时具有不同的物种特异性表达(例如,精神疾病)。
EWCE的细胞类型特异性富集证实了小鼠和人类中主要细胞类型和亚类的特异性。S1文本中图T的图B显示了小鼠和人类细胞类型中显着的EWCE p值(错误发现率(FDR)校正后),表明精神和物质滥用主导抑制(64%)和兴奋性(70%)富集。虽然在纠正包括星形细胞瘤、神经纤维瘤病 1 和额颞叶变性在内的多种疾病后,这两种物种都没有显着富集,但抑制亚类 Lamp5、Sncg、Vip、Sst Chodl 显示两种物种的富集增加(Sst Chodl、可卡因;Sncg,自闭症,双相)。独特的抑制富集在小鼠(Vip、自闭症、双相、可卡因)中更常见,而独特的人类富集在兴奋性亚类中更为常见(L6 IT Car3,双极;L2/3 IT,L5 ET,抑郁;L6 CT,学习障碍),唯一发现的独特非神经元富集是在阿尔茨海默病的人类小胶质细胞/PVM 中(p < 0.0012)。
讨论
我们从神经解剖结构的角度提出了常见脑部疾病的全脑分子特征,旨在描述主要转录组关系如何随常见表型分类而变化。由于表现、症状严重程度和合并症的差异,疾病的精确表型分类具有挑战性[4,73]。我们使用健康计量与评估研究所(www.healthdata.org)的全球疾病负担(GBD)研究进行高级表型分类,因为这项工作是一种不断更新、全球使用、全面且数据驱动的资源。虽然我们的方法无法精确识别疾病特异性基因表达变化,但我们描述了主要脑部疾病遗传风险的全脑转录组结构。
本研究发现,不同的表型和临床表现具有共同的解剖表达模式,并可能提供对疾病机制和合并症频率的见解。使用解剖学映射的组织来源和细胞类型,我们观察到疾病风险基因显示出收敛的基于生理学的表达模式,这些表达模式以预期和有时不太预期的方式将疾病联系起来。例如,语言发育障碍、强迫症和颞叶癫痫在表型上是多种多样的,但都属于ADG 3,图3A的细胞类型分析表明这些疾病具有相关的细胞类型特征,具有强烈的IT兴奋性亚类表达,以及文献中确定的合并症。这些解剖疾病谱具有可重复的结构,通过差异表达稳定性分析以及小鼠和人类细胞类型谱之间的对应关系来说明(图5C)。虽然疾病的分子基础最终将揭示可能导致治疗选择的更深层次的关联,但我们的研究是朝着生物学驱动的方法迈出的一步,该方法使用转录组学和细胞/途径数据来为脑部疾病分类提供信息。
对于疾病相关基因,DisGeNet是整合人类疾病基因和来自精选存储库的变异的最大资源之一,并为研究选择基因提供了一种标准方法。确定疾病状态中的相关基因存在相当大的不确定性,任何研究都可能错过重要的关联。值得注意的是,我们的分析中没有脑血管疾病,这些疾病是全球最大的残疾负担[4],这种限制是由于艾伦人脑图谱中罕见血管细胞类型的采样相对不足。此外,在支持每个基因的证据强度不同的情况下,每个基因携带的疾病负担可能会有很大差异,并且导致每种疾病的突变的性质或遗传方式对于表征至关重要。然而,变异的来源是微妙的,在文献中没有很好地阐明,确定有意义的关联和权重是转化研究的主要挑战。DisGeNET优先级的方法依赖于统计观点,其中可以识别受影响的大脑结构,神经通路和细胞类型基于每个基因的规范表达谱。当涉及到所涉及的单个基因的影响时,这个假设的效用可能意义不大,为了解决这些问题,我们进行了进一步的分析,以评估文献中反映的基因重要性的影响。我们使用DisGeNET数据集提供的基于文献的基因疾病关联权重来允许基因优先级。主要疾病类别在大脑区域显示出非常相似的模式,证实了原始分类在疾病类别分配之间的85%一致性。
本研究中包含的脑部疾病具有非常不同的发病年龄,可能是由在生命周期的不同阶段活跃的致病机制引起的。虽然目前的研究是在不考虑发育表达的情况下使用成人大脑转录组数据进行的,但在发育期起作用导致病理的基因可能会继续导致成年期的疾病状态,并且神经发育障碍的症状在整个生命周期中持续存在。虽然我们并不声称用我们的方法捕捉到疾病的发育方面,但它仍将提供有关成人病理生理学的信息,并且与其他脑部疾病相比,阐明成人的这些模式仍然有用。我们使用60天至39岁的供体检查了BrainSpan(https://www.brainspan.org)数据中呈现的一组疾病,确认了表达模式的已知发育轨迹及其与成人模式的收敛。
表达谱的全脑关联可能与先前与给定疾病无关的基因有关,特别是当该谱在供体之间高度保守时。规范转录模块已被证明作为成人的默认表达模式具有高度可重复性[13]。通过规范表达模式关联基因的能力量化了与疾病风险基因相关的表达的全局细胞类型分布。这有可能识别以前与疾病风险无关的新候选风险基因。同样,在患者中具有与规范表达不同的全脑或区域表达数据集可能为疾病特异性改变提供线索。我们为疾病基因与模块和其他密切相关基因的映射提供补充。
虽然先前的工作已经表明小鼠和人类之间神经元富集表达是保守的[13,16],但最近MTG中小鼠和人类细胞类型的新比对现在能够进行更具体的分析。例如,小胶质细胞参与阿尔茨海默病已经确立,如图3所示,并发现了独特的人类富集(图5B和S1文本中图T的图B)。在这里,我们在许多疾病的亚类细胞类型中显示出惊人的保守特征,并且小鼠似乎在进化上足够接近以识别潜在的相关细胞类型,这表明我们可以利用跨物种细胞类型图谱来指示疾病风险基因模式[75]。虽然小鼠和人类之间细胞类型的同源性比对可能提供基于物种特异性差异的收敛机制的见解,但需要进一步的人类数据来将疾病基因与细胞功能联系起来。
即使仅限于单个皮质区域(MTG),结构和细胞类型方法的一般对应关系也表明存在共识组织,并放大了细胞类型和基于组织的反卷积方法的价值,特别是在将这些结果外推到多个大脑区域时。一个有趣的发现是与明显的皮质表达相关的疾病是如何沿着兴奋性细胞类型的梯度组织的。该组织也与专门的亚类中间神经元的抑制梯度反相关,可能为对皮质脑疾病进行分类的新方法提供见解。基因表达的皮质空间梯度最早是在早期基于组织的研究中观察到的[14],虽然最初归因于采样分辨率,但现在在细胞分辨率下观察到[20,76]。随着单细胞研究规模的扩大,这可能为解决细胞类型定义及其与疾病的关系提供重要手段。
一个惊人的发现是精神疾病中兴奋性细胞类型的变异性增加(图4)以及精神和药物滥用疾病中某些物种特异性表达差异(图5B)。虽然有几条证据表明抑制细胞类型在精神疾病抑郁症、双相情感障碍和精神分裂症中受损[77,78],但本文的结果表明,兴奋性途径可能同样重要。当然,细胞类型富集方法存在局限性。一些疾病可能涉及细胞之间共享的基因通路,而不是细胞类型或脑区域的亚群的参与,正如其他人所发现的那样,疾病基因的细胞类型富集不一定与疾病与对照组织的表达差异相匹配[75,79]。探索这些疾病的转录组结构是一个尚未得到充分探索的全新领域,这些发现支持了脆弱性的转录组学假设,即在多基因疾病中,在某个大脑区域或细胞类型中共表达的基因比那些不遵循这种模式的基因更有可能相互作用[11,12]。
我们的研究结果描述了成人大脑中常见脑部疾病的结构和细胞转录组学景观,提供了一种在全脑细胞类型研究可用时表征疾病细胞基础的方法。我们提出的方法是灵活的和数据驱动的,通过遵循随附的Jupyter笔记本中的步骤,可以很容易地扩展到多个大脑区域,其他感兴趣的疾病及其相关基因,或者使用丰富或受限的基因集进行更新。由于细胞类型数据现在通过大脑倡议细胞普查网络(BICCN,www.biccn.org)和脑倡议细胞图谱网络(BICAN)在人脑的多个区域生成,这项工作可以很容易地扩展。
方法
疾病基因
为了获得基因疾病关联,我们使用了DisGeNET数据库[21],这是一个发现平台,其中包含来自多个来源的汇总信息,包括策划存储库,GWAS目录,动物模型和科学文献。DisGeNET提供了最大的GDA集合之一。这些数据是从2019年549月的更新中获得的,这是分析时与GDA有关的最新更新。来自OMIM [13]的1种疾病的原始列表与大脑相关的疾病与DisGeNET提供的存储库相交。对于每种疾病,选择主要变异,分析中不包括罕见的家族/遗传形式。在这项研究中,我们纳入了至少在10个确认的策划(即UNIPROT,CTD,ORPHANET,CLINGEN,GENOMICS ENGLAND,CGI和PSYGENET)中报告的GDA基因(有关详细信息,请参阅 https://www.disgenet.org/dbinfo)。由于该研究的目的是调查大脑相关疾病之间的相似性和区别,因此相关疾病少于15种的疾病被排除在分析之外。最后,去除了40种周围神经系统疾病或与大脑的二级关联(例如视网膜变性)。这个过程导致了40种脑部疾病及其相应的相关基因。最后,对于这40种疾病,我们对当前的GWAS研究进行了文献综述,以添加DisGeNET数据集中所有缺失的基因。这1种疾病包括脑肿瘤,物质相关,神经发育,神经退行性,运动和精神疾病(S<>文本中的图A)。
数据
从6个死后大脑中提取基于解剖学的基因表达数据[14]。根据解剖学/组织学提取区域将提取的样本分为132个区域。这132个区域进一步汇集/聚合为104个区域,包括皮层(CTX,8),海马体(HIP,7),杏仁核(AMG,6),基底神经节(BG,12),上丘脑(ET,3),丘脑(TH,10),腹侧丘脑(VT,2),下丘脑(HY,16),中脑(MES,11),小脑(CB,4),脑桥(P,8),脑桥核(PN,2),髓脑(MY,12),脑室(V,1), 和白质(WM,2)(S3表)。按区域基质平均所得基因,按区域基质产生1个代表性基因表达,并在大脑区域进行标准化。细胞类型数据基于MTG的snRNA-seq,主要来自死后大脑[15]。从代表8,15个通过质量控制的细胞核的928个供体大脑中收集细胞核,包括来自10,708个兴奋性神经元,4,297个抑制神经元和923个非神经元细胞的细胞核。来自小鼠的细胞类型数据代表从C23GL/822J小鼠的2个皮质区域(VISp,ALM)分离的57,6个单细胞[20]。
疾病转录组谱的独特性
每个供体跨区域的基因表达谱与其他供体的谱图谱相关(皮尔逊相关性),并进行平均,以确定与ADG和GBD组映射的一致性,并确定图1中供体之间的确切疾病关联。
细胞类型特异性
根据 [55] 中定义的 Tau-分数计算,之前已使用数据集 [15]。细胞类型特异性τ定义为:其中x(i)是给定基因在每种细胞类型中的基因表达水平,由该基因的最大细胞类型表达归一化,并且分析中的总和超过N种细胞类型。
疾病-疾病相似指数
为了计算每对疾病之间的相似性,我们使用了104个大脑结构的基因表达模式。疾病之间的距离度量为 1 – ρ,其中 ρ 是结构或细胞类型谱之间的皮尔逊相关性。使用细胞类型数据的疾病相似性程序使用了从MTG中提取的人类细胞中75种细胞类型(而不是大脑区域)的基因表达模式。对于这两种情况下的聚类,我们使用了带有Ward链接算法的聚集分层聚类(R hclust函数中的Ward.2,R版本3.6.3)。
基因表达差异稳定性 (DS)
计算每个基因的基因表达DS作为其在6个死后大脑中的表达模式的相似性。对于每对大脑,计算了重叠大脑结构之间表达模式的相关性。这15对的平均相关性被用作给定基因的DS(更多细节,见[13])。
疾病模块关联
将每个基因的基因表达映射到规范模块,将6个死后大脑中每个模块的特征基因模式相关联,如[14]中所述。然后使用Fisher r-to-z变换对相关值进行归一化,并在大脑中取平均值。对于每个模块,基因关联然后标准化(μ = 0,σ = 1)。最后,将这些值平均在与每种疾病相关的基因之间,以计算疾病模块关联。
细胞类型内疾病相关基因表达
我们使用EWCE分析(https://bioconductor.riken.jp/packages/3.4/bioc/html/EWCE.html;[74]),以鉴定显示富集基因表达的细胞类型。EWCE通过执行排列分析并定义给定基因集的观察到表达水平与具有相同大小的随机一组基因进行比较,将与给定疾病相关的基因的表达水平与背景基因表达(所有基因,不包括疾病相关基因)进行比较。我们使用N = 100,000作为置换参数,并在2个细胞类型类别水平上进行了分析。2个水平包括广义细胞类型(N = 7)和细胞亚类(N = 20),在2个分析水平之间共有非神经元细胞类型。选择2个水平是由于小鼠和人类细胞数据集中同源细胞类型的可用性。对于每种疾病,我们使用FDR校正对每种疾病的疾病 - 细胞类型关联进行多重比较。
细胞类型特异性相互作用和功能富集
基因表达协变计算为MTG细胞类型间细胞类型表达的余弦距离相似性的绝对值。使用非重叠基因计算3种精神疾病中每一种的基质,然后独立阈值为1.5σ。条目被组合成一个矩阵,如果给定的疾病超过阈值,则用颜色编码。使用ToppGene Suite的ToppFun应用程序进行了功能富集分析,以鉴定独特疾病基因集的显着富集(p值<0.05 FDR Benjamini和Hochberg)本体学术语和途径[80]。代表性的富集术语和基因用于使用Cytoscape应用程序生成网络可视化[81]。
共识表示
共识UMAP是通过平均结构和细胞类型数据的成对基因集相关矩阵并使用R形成2D UMAP来构建的。
统计分析
所有统计分析和可视化均在R(www.r-project.org)中进行,Jupyter笔记本再现所有分析。为了检查ADG组之间平均表达水平的差异,我们进行了方差分析检验,然后使用非配对t检验直接比较ADG对。所有结果均使用控制FDR的Benjamini-Hochberg校正进行多次比较校正。为了检查基因表达谱的稳定性,我们在6个大脑中重复了我们的分析,并在其他受试者中搜索ADG和GBD疾病组中任何给定大脑的匹配模式。图5中使用了柯尔莫哥罗夫-斯米尔诺夫拟合优度检验。
支持信息
Supporting Figures: Fig A in S1 Text.
Showing 1/9: pbio.3002058.s001.docx
Skip to figshare navigation
1 / 9
Download
figshare
S1 文本。 支持数字:S1文本中的图A。
脑相关疾病的分类和全球负担。根据全球疾病负担(GBD)研究[1,2]划分为7大类的主要人类脑部疾病和分类。GBD研究建立了标准的残疾调整生命年(DALY)指标,以量化疾病负担,定义为因过早死亡而损失的年数加上残疾生活年数。根据2019年的研究,DALY分数显示了几个较大类别的误差线,白色误差线表示最小和最大预计生命损失和健康年数。虽然包括脑缺血和梗塞及相关疾病在内的脑血管疾病占主导地位(2017年全球残疾调整生命年55万,未显示),但精神疾病的总死亡人数几乎是残疾调整生命年(1.110亿)的两倍。神经退行性疾病占较少(38万),主要是通过患有阿尔茨海默病和相关痴呆(2万)的老年人口(30万)残疾调整生命年。在整个分析过程中使用这些主要 GBD 类的调色板。S5 文本中的图 B。神经系统疾病和相关基因。(A)本研究中基于GBD类别之间共享基因(以灰度颜色显示)的相对百分比的Jaccard聚类。插图数:交叉的基因数,对角线总唯一数为类。 (B)1种神经系统疾病和紊乱的类似聚类。上图:与每种疾病唯一相关的基因部分。颜色面板:疾病成员GBD类。疾病、基因集和元数据的详细信息在 S40 表中给出。虽然与GBD类精神疾病(1)相关的独特基因数量是神经退行性疾病(801)的6倍,但更精细的分辨率并不能反映这种偏倚,双相情感障碍特有的132个基因(110.28%),而帕金森病特有的6个基因(31.30%),遗传性痉挛性截瘫特有的3个(59.88%)。S0 文本中的图 C。 与主要GBD类别唯一相关的基因的生物学过程和通路本体分析(www.toppgene.org)反映了通过FDR q值测量的这些疾病类别的常见识别注释。在整个分析过程中,使用 GBD 类图例中的颜色代码。感兴趣的特定关联包括众所周知的突触结构和功能的改变(FDR q = 1.9×56?50) [3],以及几种精神和神经系统疾病中细胞外神经递质浓度异常水平[4](q = 1.25×10?22).重性抑郁障碍是与5-羟色胺能活动改变相关的最重要的精神障碍之一[6],在精神分裂症[7]和成瘾[2]中相关性不太明确。最近的研究表明,慢性II型糖尿病(DM)与神经变性密切相关(q = 07.10×<>?5),尤其是公元[8]。胰岛素信号传导中激活的主要信号通路是磷酸肌醇3激酶(PI3K)-蛋白激酶B(Akt)信号流,胰岛素抵抗导致的IGF结合或IRS-1信号传导缺陷导致患者认知能力下降[9]。刺猬(Hh)是为数不多的信号通路之一,在细胞间通讯的发育过程中经常使用,对于哺乳动物几乎所有器官的器官发生以及再生和稳态都很重要。这包括大脑和脊髓以及人类SHH基因突变以及编码其下游细胞内信号通路的基因导致多种临床疾病,包括空脑畸形[10]。脑肿瘤和其他癌症与信号转导蛋白的缺陷密切相关,某些病毒引起的癌症极大地促进了我们对信号转导蛋白和通路的理解[11]。慢性吗啡诱导的cAMP级联反应的分子适应已在许多人中得到证实,并且与阿片类药物依赖和戒断广泛相关[12]。这些独特的GBD类本体注释代表了这些主要类的核心分子功能和途径。S1文本中的图D。40 种脑部疾病的转录组模式,集群去除成对重叠基因,还确定了 5 个解剖组。最引人注目的是助理总干事1和助理总干事2的强力匹配,表明了这些群体的身份和区别。去除常见基因保留了大多数ADG 3精神疾病、物质滥用和运动疾病的关联。ADG 5中的疾病分组在聚类中保留相同,总体上表明与图1的共同结构以及同一ADG类别中包含的疾病对,一致性为67%。S1文本中的图E。基因计数和重叠高的疾病的聚类稳定性分析。为了确保精神疾病的共聚类不是与这些疾病相关的大量基因以及重叠基因的结果(见S1文本中的图B),我们进行了聚类一致性分析,从任何疾病中抽取了200个基因,其中有超过200个基因与之相关,并使用相同的N重复聚类分析。 = 5 个群集大小要求。然后,我们重复此过程1,000次,并计算每对疾病共聚的次数。该图显示了这 1,000 次重复分析中共聚类的频率比,并指示稳定的聚类分配。S1文本中的图F。ADG 聚类的可重复性。进行了维持分析,对图1的完整分析中确定的每个已识别的ADG组中的z分数归一化表达进行了平均,省略了6个大脑数据之一。在右侧注释中,1 ADG 1 表示大脑 1 数据被删除,其余 5 个大脑中 ADG 组中的疾病平均。数据呈现在所有6个大脑共有的57个结构上。作为跨结构的行,表达模式的可重复性在具有平均相关性(ADG 1、ADG 2、ADG 3、ADG 4 和 AD )的保留数据集中高度一致G 5) = (0.983、0.971、0.976、0.988 和 0.977)。作为跨结构的列,图案在 ADG 组之间具有一致的差异表达。热图顶部的注释栏显示了在每个结构中观察到的最大可重复差异签名。签名是精确的(6),所有大脑都支持27个结构,并且除了一个之外,其他19个结构都同意,只有LA,PRF和Arc显示可变性。表达式签名本身的计算和比较如下所示。对于每个结构和每个保持数据集,z 评分表达式值按排名顺序排列,在 ADG 1-5 中从低到高排列 1、2、3、4、5。每个表达式模式通过唯一的素数分解分配一个唯一的整数 n,如 n = 2(1)3(2)5(3)7(4)11(5)这些整数被制成表格,以找到大脑中出现最多的模式。最大出现特征 3-6 显示在注释栏中,表明签名的保存与维持分析相似,其中 6 表示所有大脑中 ADG 组的确切关系。S1文本中的图G。维持分析和助理总干事。(对角线和上部)在 6 个艾伦人脑图谱 (AHBA) 受试者中的每一个中,计算跨结构的 40 种疾病中每种疾病的平均疾病转录谱,并确定其余 5 名受试者中最相似的(欧几里得距离)疾病。上面的对角矩阵显示了已识别疾病的分布,键 0-6 表示给定疾病的数量分配。因此,评分为 6 分的共济失调的转录组学特征更类似于每个大脑的共济失调,而不是其余大脑中的任何其他疾病。由于最近邻是不对称定义的,因此给出了矩阵的平均值及其转置。多数29/40疾病由多数投票唯一确定。ADG 组 3、4 和 5 在受试者中具有很高的可识别性,而 ADG 1 和 2 之间的错误分类较高。如图1C所示的精确百分比是ADG 1–5(0.716, 0.537 0.644, 0.958, 0.875)。颜色条显示全球疾病负担 (GBD) 组。(下对角线)进行更严格的保留分析,首先消除疾病之间的共同基因,如图1所示,并在转录组谱中寻找除给定疾病之外最接近的疾病。在这里,大脑之间疾病映射的分布在ADG映射ADG 1-5(0.361,0.187,0.970,0.175,0.008)内变化更大。S1文本中的图H。脑部疾病的加权基因聚类。为了评估文献中反映的基因重要性的影响,我们使用了DisGeNET数据集提供的基于文献的基因疾病关联权重。每个基因 - 疾病关联(GDA)都有一个基于以下公式的分数:GDA-score = C + M + I + L,其中C基于策划数据源,M基于小鼠和大鼠动物模型报告,I是从人类表型本体推断GDA,GDA是从Clinvar,GWAS目录和GWAS数据库报告的VDA推断的, 最后,L 基于报告给定 GDA 的出版物数量。更具体地说,C(N1)= 0 + 0.3 × (N1= = 1) + 0.5 × (N1= = 2) + 0.6 × (N1>2) 和 N1是策划来源的数量,包括CGI,CLINGEN,GENOMICS ENGLAND,CTD,PSYGENET,ORPHANET和UNIPROT;M(N2)= 0 + 0.2 × (N2> 0), N2是来自 RGD、MGD 和 CTD 的小鼠和大鼠的来源数量;I(N3)= 0 + 0.1 × (N3> 0), N2是来自HPO,CLINVAR,GWASCAT和GWASDB的来源数量;L(N4)= 0 + N4× 0.01 × (N4< = 9) + 0.1 × (N4>9), N4是来源 LHGDN 和 BEFREE 中支持 GDA 的出版物数量(详见 https://www.disgenet.org/dbinfo)。然后,使用每个基因疾病关联的GDA评分,我们计算出代表跨大脑区域的疾病相关全球基因表达模式的加权平均表达,该表达取代了同等加权的基因表达平均值。使用这种方法,我们重做了AHBA数据集的主要分析。结果表明,新方法保留了从肿瘤和神经退行性疾病到精神和运动障碍的主要疾病类别,从皮层下核到皮质表达的大脑区域的表达模式非常相似,如图1A所示。总体成对疾病 ADG 成员与原始聚类一致,为 85%。S1文本中的图I。40种脑部疾病平均基因表达的时间演变。使用BrainSpan数据集(https://www.brainspan.org/)计算每个时间点跨大脑区域的每种疾病的平均疾病相关基因表达,跨越发育和成年年。有趣的是,表达参与调节细胞群增殖的基因的基于肿瘤的疾病(参见S1文本中的图C)具有双相早期生命和晚期表达模式,而发育障碍表现出早期表达,药物滥用和精神疾病表现出较高的表达后期,随后在某些运动相关和神经退行性疾病中表现出后期表达。我们强调,从这些模式中得出确切的结论必须谨慎,因为它们是具有异质基因表达模式的众多基因和大脑结构的平均值,并且该图仅显示了在平均过程中存活的整个生命周期中最主要的表达模式。基于分层聚类中的邻近度,聚类保留了许多基于树状图中邻近性的成虫关联。注释显示,GBD与疾病的关联适度吻合。S1文本中的图J。ADG 的成对比较。ADG 组 0-05 之间的成对 B&H 校正 (BH < 1.5) t 检验。单个t检验突出了ADG 3与其他组之间皮层表达的区别。最显着的结构ADG差异发生在皮层中的ADG 1-3之间(额叶(FL,p<2.71×10?7)),短岛回(SIG 6.2×10?9),长岛回(LIG,5.57×10?8),在杏仁核中,基底外侧核(BLA,1.8×10?9)、基底核(BMA,4.49×10?10),在小脑核中,球状核(Glo,1.18×10?9)和髓脑,前庭核(8Ve,2.34×10?8).ADG 2 和 3 在海马体中区分,(CA1,2.18×10?8), 亚目 (S, 8.31×10?8),在杏仁核(AMG),杏仁核-海马过渡区(ATZ 1.94×10?10, BLA, 1.00×10?10, BMA, 5.63×10?10),以及丘脑前组 3 和丘脑 4 之间(DTA,3.01×10?7), 侧群核, 背支, (DTLv, 6.47×10?9)和下丘脑,下丘脑后部区域(PHA,1.21×10?6).虽然丘脑 (TH, p = 0.338)、髓脑 (0.247) 和小脑 (CB, 0.966) 无显著差异,但通过应用组间配对 t 检验,证明精神、物质滥用和运动组 (ADG 3) 与其他 ADG 之间的端脑表达差异。在这里,ADG 1 和 ADG 3 通过额叶的差异来区分 (FL, p < 2.71 × 10?7), 海马体, 齿状回 (DG, p < 3.46 × 10?6)和杏仁核,基底核(BMA,p < 4,49 × 10?10).最后,ADG 4和5的差异以间脑表达为特征:丘脑,前组核(DTA,p < 3.01 × 10?7)、侧组核、背侧(DTLv 和下丘脑、下丘脑后区 (PHA, p < 1.21 × 10?6)).S1文本中的图K。脑和非脑疾病的表达水平。(A)来自艾伦人脑图谱(AHBA)的基因的表达水平被归类为与本研究相关的脑部疾病(绿色),与OMIM研究相关的非脑部疾病[13](灰色)和AHBA的剩余基因不在这些集中(红色)。脑病基因与非脑相关基因没有显著表达差异,但均与具有边际意义的非疾病相关基因不同。(B) 按主要全球疾病负担类别分列的差异稳定性(DS)分布。水平平均值ρ = 0.521 的 17,348 个基因,p 值显示 GBD 平均值的显著性(根据班级大小校正)与全局平均值不同。(C)按中位DS分类的40种疾病的疾病基因稳定性;颜色是 GBD 分类。显示了每种疾病的最小和最大稳定基因。DS:差分稳定性。与低 DS(左)相比,注释的高 DS 基因集(右)在基因本体生物学过程和途径方面大幅富集。S1文本中的图L。DS基因的解剖标记。对于40种疾病中的每一种,选择最高和最低的差异稳定(DS)基因。这导致低DS有36个独特基因,高DS有32个独特基因,其表达谱显示顶部(低DS)和底部(高DS)。高DS基因选择结构解剖标志物和细胞类型。这种一般的表达一致性、较少的随机性和较小的变异在高DS基因的表达谱中可见一斑。S1 文本中的图 M。疾病相关规范表达模块。规范模块M1-M32表达模式在所有6个AHBA个体中高度一致,使用任何5个大脑识别的模式都可以在第6个个体中重现[13]。这些模块的范围从结构特异性标记到数据中的复杂共表达模式,其中一些模块特定于 ADG 1-5 组。除了手稿中引用的M1、M12外,M2还定义了海马表达基因和M6皮层-海马共表达;在ADG 3中,疾病都以强烈代表。代表性基因及其与模块特征基因的相关性显示,PRKCA、STX1A与精神分裂症有关[14,15],ITGA4、MEF2C与自闭症有关[16,17]。M10定义了纹状体表达基因,在ADG 3和4疾病中很常见。ADORA2A已被研究用于苯丙胺相关[18]、抑郁症和精神分裂症[19],ANO3治疗肌张力障碍[20]、帕金森病、ALDH1A2治疗帕金森病[21]和精神分裂症[22]、SEMA5A、自闭症[23]。模块 M24 和 M25 高度富含胶质细胞,常见于 ADG 1 和 2 疾病,在 ADG 3-5 中有效缺失。FANCG已被研究用于神经纤维瘤病1[24]、PPM1D在神经胶质瘤中的应用[25]、AIF1、帕金森病[26]和阿尔茨海默病[27]、肌萎缩侧索硬化症中的TREM2[28]。S1文本中的图N。规范模块内的 ADG 组比较。校正 ADG 组之间与 32 个典型模块 M1-32 的平均疾病相关性的 t 检验。东风测试中的h组数据由图2C中固定模块处相应ADG组中那些疾病的相关值组成。测试对所有 6 对和每个模块独立执行。所示的-log10 Benjamini-Hochberg校正值进一步验证了图1的聚类,并为ADG基团的细胞模式提供了更多见解。S1 文本中的图 O。规范模块和 ADG 的维持分析。图1和基于规范模数图2的平均剖面的保持分析比较。(A) AHBA平均剖面的维持分析的再现,如S6图(上对角线)所示。在 6 个艾伦人脑图谱 (AHBA) 受试者中的每一个中,计算跨结构的平均疾病转录谱,并确定其余 5 名受试者中最相似(欧几里得距离)的疾病。该矩阵显示已识别疾病的分布,键 0–6 表示给定疾病的数量分配。所有科目的完美协议是6。(B)使用6个AHBA大脑的规范模块分配进行类似的分析。基于模块的分配显示 ADG 1 和 2 的定义更好,ADG 3 的方差更小,主要精神疾病、双相情感障碍、精神分裂症、自闭症和抑郁症的识别更紧密。(中、丁)按助理总干事和GBD类别分类结果。(E) ADG 和 GBD 比较均值和模块分析的性能结果。平均值基于图1,图F在S1文本分析;基于规范模块分配的模块。ADG 或 GBD 标签表示确定了正确的类别,精确表示确定了精确的疾病。模块的平均ADG等级降低了10%,但确切的疾病规格提高了4%,而对于GBD分组,所有类别的平均ADG等级降低了4.5%,确切的疾病识别提高了4%。S1文本中的图P。人类 MTG 细胞数据、表达水平、特异性和疾病。(A)RNA-seq基因表达定量,绝对表达水平估计为百万分之一(CPM)使用[29]的外显子读数。(B)根据[30]中定义的Tau评分(τ)计算细胞类型特异性。该测量以前已使用相同的数据集[29]。脑部疾病相关基因、非脑部疾病和非相关基因的 τ 分布。(C) 24 种表达皮层的疾病的细胞类型特异性条形分布图,按中位数特异性排序,按表型 GBD 类别着色。细胞类型特异性tau评分与中尺度差异稳定性指标之间的相关性为0.445。S1文本中的图Q。比较细胞类型簇 (CTG)。校正配对t检验用于比较固定细胞类型下CTG组对之间的显着表达差异,例如CTG 1 –CTG 2。Overbar:75 种固定细胞类型中的每一种的方差分析,如图 3 所示,在 3 个 CTG 组中聚集。在IT兴奋性和非神经元细胞类型以及亚类水平GABA能Vip细胞类型中观察到最高的变异性,与图3的兴奋性和抑制性梯度一致。S1文本中的图R。(A) 聚类矩阵基于HBA和细胞类型MTG数据的非重叠基因的24种皮质表达疾病之间的相关性。显示了两个矩阵(上对角线MTG,下对角线AHBA)的数据,并根据图3的MTG数据进行聚类。这些矩阵具有一般的结构对应关系,矩阵之间的总体疾病-疾病皮尔逊相关性为 ρ = 0.615。(B)对于这些2D嵌入和每种疾病中的每一种,计算每种疾病与同一GBD组中其他疾病的平均欧氏距离,以及与不属于该GBD组的疾病的平均距离。这些量的比率GBD(d我)是衡量该疾病与同一GBD类别中其他疾病的相对关联的指标。在符号中,如 .然后按其GBD类别对疾病进行分组,显示方法之间的一般一致性,但星形细胞瘤除外,星形细胞瘤是一个显着的异常值,最好使用中尺度HBA数据进行分类。纯色:AHBA脑宽,深灰色:MTG细胞类型,浅灰色:共识。S1文本中的图S。自闭症、双相情感障碍和精神分裂症中独特基因的表达谱。针对自闭症(n = 19)、双相情感障碍(n = 20)和精神分裂症(n = 25)中独特表达基因的基因表达标准化,按24种兴奋性细胞类型的表达水平聚集。这3种疾病在兴奋性类型中表现出不同的表达谱,精神分裂症广泛表达大多数基因。S1文本中的图T。人类和小鼠EWCE分布。(A)将人类MTG中细胞类型的转录组分类与2个不同的小鼠皮质区域,初级视觉皮层(V1)和前运动区域对齐,来自[29]的前外侧运动皮层(ALM)允许比较物种之间的细胞类型富集。CTG 1-4 小鼠和人类的疾病亚类 EWCE 值散点图。饼图插图显示了回归线中前 10% 异常值的 CTG 和 GBD 表型类别的百分比,表示最显着的 EWCE 差异。百分比(CTG 1,0.363;CTG 2, 0.252;CTG 3, 0.220;CTG 4,0.163)。GBD表型(精神病学,0.137;物质,0.180;运动,0.125;神经退行性0.05;脑肿瘤,0.112;发育,0.244;脑相关,0.150)。(B)基于疾病和细胞类型对基于排列的p值的FDR校正的显着物种不同的EWCE。主手稿的图5C显示了EWCE值,而在这里,显示了在任一物种中具有显着p值的值。疾病聚类如图3所示,具有相同的注释和颜色代码(蓝色:人类,橙色:小鼠,黑色:两个物种)。顶部条形图:按物种划分的细胞类型富集数量。
https://doi.org/10.1371/journal.pbio.3002058.s001
(文档)
S1 表。 包括定义、基因集和识别每种疾病的元数据。
第一张表格提供了该疾病的一般描述及其传统的分类信息,并链接到每种疾病的医学主题标题(MeSH)网页。第二张表包括与当前研究中包含的每种疾病相关的所有基因。
https://doi.org/10.1371/journal.pbio.3002058.s002
(三十)
S2 表。 包括每种疾病特有的基因的功能富集分析(https:// toppgene.cchmc.org)的结果,列出主要的富集生物学过程和途径以及每个条目的相应统计指标。
https://doi.org/10.1371/journal.pbio.3002058.s003
(三十)
S3 表。 包括当前研究中包含的艾伦人脑图谱(https://human.brain-map.org)中104个结构中每个结构的所有首字母缩略词,名称,父结构和颜色代码。
https://doi.org/10.1371/journal.pbio.3002058.s004
(三十)
S4 表。 包括每种疾病的汇总转录组疾病概况。
每张表都包括S3表中列出的大脑结构中与给定疾病相关的基因的聚合基因表达。
https://doi.org/10.1371/journal.pbio.3002058.s005
(三十)
S5 表。 包括Hawrylycz及其同事[13]中定义的差分稳定性和相关规范模块,用于当前研究中包含的每个基因,按疾病 - 基因对名称排序。
https://doi.org/10.1371/journal.pbio.3002058.s006
(中新社)
S6 表。 包括当前研究中包含的30个与脑部疾病相关的基因,这些基因与Hodge及其同事用于差异区分MTG细胞类型的142个标记基因重叠[15]。
这些基因形成一个高度差异稳定的组,表明强烈的细胞类型特异性,几个与疾病独特相关。
https://doi.org/10.1371/journal.pbio.3002058.s007
(中新社)
S7 表。 包括自闭症、双相情感障碍和精神分裂症特有的基因列表,它们根据功能富集分析结果(类似于 S2 表)的相应富集生物过程和途径,并为其相应的相互作用网络选择术语。
https://doi.org/10.1371/journal.pbio.3002058.s008
(三十)
S1 数据。 我们的Jupyter笔记本代码随附的数据 在手稿中产生主要和补充图形,数据应复制到称为input的文件夹中,并将路径添加到笔记本文件中。
https://doi.org/10.1371/journal.pbio.3002058.s009
(邮编)
确认
作者感谢Christof Koch,Liane Ong,Stephen J. Smith和Theo Vos的深刻和有益的讨论。
引用
1.卡罗尔·神经系统疾病的全球负担。柳叶刀神经学. 2019:418–419.密码:30879892
查看文章PubMed/NCBI谷歌学术搜索
2.迪卢卡·脑部疾病的代价:负担还是挑战?神经元。2014;82:1205–1208.pmid:24945765
查看文章PubMed/NCBI谷歌学术搜索
3.奥勒森 J, 莱昂纳尔迪 M.欧洲脑部疾病的负担。欧洲神经学杂志. 2003;10:471–477.密码:12940825
查看文章PubMed/NCBI谷歌学术搜索
4.GBD 2016 神经病学合作者。1990-2016年全球、区域和国家神经系统疾病负担:2016年全球疾病负担研究的系统分析。柳叶刀神经学. 2019;18:459–480.密码:30879893
查看文章PubMed/NCBI谷歌学术搜索
5.史密斯 B, 阿什伯纳 M, 罗塞 C, 巴德 J, 布格 W, Ceusters W, 等.OBO Foundry:协调本体的演进,以支持生物医学数据集成。纳特生物技术公司。2007;25:1251–1255.pmid:17989687
查看文章PubMed/NCBI谷歌学术搜索
6.特罗佩亚D,哈金A.社论:脑部疾病的生物学。前细胞神经科学。2017;11:366.密码:29209175
查看文章PubMed/NCBI谷歌学术搜索
7.Glorioso C,Sibille E.命运与疾病之间:人类中枢神经系统衰老的遗传学和分子途径。神经生物学进展。2011;93:165–181.密码:21130140
查看文章PubMed/NCBI谷歌学术搜索
8.丁J, Adiconis X, Simmons SK, Kowalczyk MS, Hession CC, Marjanovic ND, et al.单细胞和单核RNA测序方法的系统比较。纳特生物技术公司。2020;38:737–746.密码:32341560
查看文章PubMed/NCBI谷歌学术搜索
9.McGuire AL, Gabriel S, Tishkoff SA, Wonkam A, Chakravarti A, Furlong EEM, et al.遗传学和基因组学的未来之路。纳特·雷夫·热内。2020;21:581–596.pmid:32839576
查看文章PubMed/NCBI谷歌学术搜索
10.郑国兴, 特里 JM, 贝尔格莱德 P, 里夫金 P, 本特 ZW, 威尔逊 R, 等.单细胞的大规模并行数字转录分析。纳特公社。2017;8:14049.密码:28091601
查看文章PubMed/NCBI谷歌学术搜索
11.Kumar VJ, Grissom NM, McKee SE, Schoch H, Bowman N, Havekes R, et al.将空间基因表达模式与16p11.2半缺失小鼠模型上的性别特异性脑结构变化联系起来。翻译精神病学。2018;8:109.密码:29844452
查看文章PubMed/NCBI谷歌学术搜索
12.塞德利茨 J, 纳迪格 A, 刘 S, 伯利恒 RAI, 韦尔特斯 PE, 摩根 SE, 等.区域大脑对神经遗传性疾病脆弱性的转录组学和细胞解码。纳特公社。2020;11:3358.pmid:32620757
查看文章PubMed/NCBI谷歌学术搜索
13.Hawrylycz M, Miller JA, Menon V, Feng D, Dolbeare T, Guillozet-Bongaarts AL, et al.成人大脑的典型遗传特征。纳特神经科学。2015;18:1832–1844.密码:26571460
查看文章PubMed/NCBI谷歌学术搜索
14.Hawrylycz MJ, Lein ES, Guillozet-Bongaarts AL, Shen EH, Ng L, Miller JA, et al.成人大脑转录组的解剖学综合图谱。自然界。2012;489:391–399.密码:22996553
查看文章PubMed/NCBI谷歌学术搜索
15.Hodge RD, Bakken TE, Miller JA, Smith KA, Barkan ER, Graybuck LT, et al.在人类与小鼠皮层中具有不同特征的保守细胞类型。自然界。2019;573:61–68.密码:31435019
查看文章PubMed/NCBI谷歌学术搜索
16.Miller JA, Ding S-L, Sunkin SM, Smith KA, Ng L, Szafer A, et al.产前人脑的转录景观。自然界。2014;508:199–206.pmid:24695229
查看文章PubMed/NCBI谷歌学术搜索
17.李 M, 桑佩雷 G, 今村川泽 Y, 叶夫格拉福夫 OV, 古尔登 FO, 波查雷迪, 等.人脑发育和神经精神风险的综合功能基因组分析。科学。2018:362. pmid:30545854
查看文章PubMed/NCBI谷歌学术搜索
18.Patrick E, Taga M, Ergun A, Ng B, Casazza W, Cimpean M, et al.去卷积细胞类型异质性对皮质基因表达的贡献。公共科学图书馆计算生物学. 2020;16:e1008120.密码:32804935
查看文章PubMed/NCBI谷歌学术搜索
19.亨特GJ,弗雷塔格S,巴赫洛M,加农-巴奇JA。DTANGLE:准确而强大的细胞类型反卷积。生物信息学。2019;35:2093–2099.pmid:30407492
查看文章PubMed/NCBI谷歌学术搜索
20.Tasic B, Yao Z, Graybuck LT, Smith KA, Nguyen TN, Bertagnolli D, et al.跨新皮质区域的共享和不同的转录组细胞类型。自然界。2018;563:72–78.密码:30382198
查看文章PubMed/NCBI谷歌学术搜索
21.皮涅罗 J, 拉米雷斯-安吉塔 JM, 索赫-皮塔克 J, 龙扎诺 F, 森特诺 E, 桑兹 F, 等.疾病基因组学的DisGeNET知识平台:2019年更新。核酸研究 2020;48:D845–D855.pmid:31680165
查看文章PubMed/NCBI谷歌学术搜索
22.皮涅罗 J, 布拉沃 à, 奎拉特-罗西纳赫 N, 古铁雷斯-萨克里斯坦 A, 德乌庞斯 J, 森特诺 E, 等.DisGeNET:一个综合平台,整合了人类疾病相关基因和变异的信息。核酸研究 2017;45:D833–D839.密码:27924018
查看文章PubMed/NCBI谷歌学术搜索
23.Queralt-Rosinach N, Pi?ero J, Bravo à, Sanz F, Furlong LI. DisGeNET-RDF:利用语义网的创新力量来探索疾病的遗传基础。生物信息学。2016;32:2236–2238.密码:27153650
查看文章PubMed/NCBI谷歌学术搜索
24.基于临床表现的新型疾病表型网络的比较分析.J生物医学信息。2015;53:113–120.密码:25277758
查看文章PubMed/NCBI谷歌学术搜索
25.Qi M, Fan S, Wang Z, Yang X, Xie Z, Chen K, et al. 识别神经系统疾病之间的共同基因、细胞类型和大脑区域。前热内特。2019;10:1202.密码:31850066
查看文章PubMed/NCBI谷歌学术搜索
26.桑图奇K.精神疾病和药物滥用。柯尔·奥平小儿科。2012;24:233–237.密码:22327950
查看文章PubMed/NCBI谷歌学术搜索
27.格兰霍姆A-C,博格H,恩博格我。情绪,记忆和运动:与年龄相关的神经退行性复合体?Curr Aging Sci. 2008;1:133–139.密码:20021382
查看文章PubMed/NCBI谷歌学术搜索
28.Currie S,Urich H. 多发性硬化症和胶质瘤的合并。J 神经外科精神病学。1974;37:598–605.密码:4365433
查看文章PubMed/NCBI谷歌学术搜索
29.Hinnell C,Almekhlafi M,Joseph JT,Bell R,Sharma P,Furtado S.高级别脑干胶质瘤和多发性硬化症的一致性。神经科学杂志 2010;37:512–514.密码:20724261
查看文章PubMed/NCBI谷歌学术搜索
30.Khan SH, Buwembo JE, Li Q. 胶质瘤和多发性硬化症的合并。神经科学杂志 2005;32:349–351.密码:16225178
查看文章PubMed/NCBI谷歌学术搜索
31.阿尔卡比 S, 卡斯特罗德-莫利纳 R, 赫克 KA, 曼德尔 J, 赫顿 GJ.多发性硬化症和胶质母细胞瘤的合并。Mult Scler Relat Disord.2021;50:102877.邮编:33711579
查看文章PubMed/NCBI谷歌学术搜索
32.陈春华, 佘建军, 林永昌, 林海昌.偏头痛与脑肿瘤的关联:一项全国性基于人群的研究。J头痛。2018;19:111.密码:30442087
查看文章PubMed/NCBI谷歌学术搜索
33.卡拉 E, 图奇 A, 曼佐尼 C, 林奇 DS, 埃尔皮多鲁 M, 贝当古 C, 等.复杂遗传性痉挛性截瘫的遗传和表型特征。脑。2016;139:1904–1918.密码:27217339
查看文章PubMed/NCBI谷歌学术搜索
34.Price DL, Wong PC, Borchelt DR, Pardo CA, Thinakaran G, Doan AP, et al.肌萎缩侧索硬化症和阿尔茨海默病。模型系统的经验教训。神经学修订版 1997;153:484–495.密码:9683997
查看文章PubMed/NCBI谷歌学术搜索
35.Ugbode C, West RJH.从CHMP2B中吸取的教训,对额颞叶痴呆和肌萎缩侧索硬化症的影响。神经生物学杂志 2021:105144.密码:33144171
查看文章PubMed/NCBI谷歌学术搜索
36.Vercruysse P,Vieau D,Blum D,Petersén ?,Dupuis L.神经退行性疾病的下丘脑改变及其与异常能量代谢的关系。前摩尔神经科学。2018;11:2.密码:29403354
查看文章PubMed/NCBI谷歌学术搜索
37.张海军, 廖春春, 胡春军, 沈伟, 陈廷林.癫痫诊断后的精神疾病:一项基于人群的回顾性队列研究。公共图书馆一号。2013;8:e59999.密码:23577079
查看文章PubMed/NCBI谷歌学术搜索
38.施瓦茨 S, 庞兹 A, 波里亚佐娃 R, 沃特 E, 博西格 P, 哈塔米 R, 等.人类发作性睡病伴猝倒的幽默处理期间下丘脑和杏仁核的异常活动。脑。2008;131:514–522.密码:18094020
查看文章PubMed/NCBI谷歌学术搜索
39.Ptak R,Birtoli B,Imboden H,Hauser C,Weis J,Schnider A.下丘脑健忘症伴自发性虚构:临床病理学研究。神经学。2001;56:1597–1600.pmid:11402128
查看文章PubMed/NCBI谷歌学术搜索
40.Bolla KI, Lesage SR, Gamaldo CE, Neubauer DN, Funderburk FR, Cadet JL, et al.重度大麻使用者的睡眠障碍。睡。2008;31:901–908.
查看文章谷歌学术搜索
41.Bolla KI, Lesage SR, Gamaldo CE, Neubauer DN, Wang N-Y, Funderburk FR, et al.在先前戒断期间报告睡眠障碍的大麻使用者的多导睡眠图变化。睡眠医学 2010;11:882–889.密码:20685163
查看文章PubMed/NCBI谷歌学术搜索
42.亨廷顿病中的赖尔曼R.帕金森综合征。国际修订版神经生物学。2019;149:299–306.pmid:31779817
查看文章PubMed/NCBI谷歌学术搜索
43.Kelly J, Moyeed R, Carroll C, Albani D, Li X. 帕金森病的基因表达荟萃分析及其与阿尔茨海默病的关系。摩尔脑。2019;12:16.密码:30819229
查看文章PubMed/NCBI谷歌学术搜索
44.佩雷拉 JB, 霍尔 S, 贾拉卡斯 M, 格罗特 MJ, 斯特兰德伯格 O, 斯托姆鲁德 E, 等.基底前脑的纵向变性预示着帕金森病的后续痴呆。神经生物学杂志 2020;139:104831.密码:32145376
查看文章PubMed/NCBI谷歌学术搜索
45.亨德森JM,卡彭特K,卡特赖特H,哈利迪总经理。 进行性核上性麻痹和帕金森病丘脑层内核的丧失:临床和治疗意义。脑。2000;123(Pt 7):1410–1421.pmid:10869053
查看文章PubMed/NCBI谷歌学术搜索
46.Ramaker RC, Bowling KM, Lasseigne BN, Hagenauer MH, Hardigan AA, Davis NS, et al.三种精神疾病的死后分子分析。基因组医学 2017;9:72.pmid:28754123
查看文章PubMed/NCBI谷歌学术搜索
47.布鲁克尔大学,新泽西州肖克。通过重组图谱鉴定人类疾病和复杂表型背后的基因和遗传变异。生理学杂志. 2004:40–45.密码:14678489
查看文章PubMed/NCBI谷歌学术搜索
48.基耶萨 A, 克里斯萨富利 C, 波尔切利 S, 巴尔扎罗 B, 汉 C, 帕特卡尔 AA, 等.双相情感障碍中GRIA1,GRIA2和GRIA4多态性的病例对照关联研究。国际J精神病学临床实践。2012;16:18–26.pmid:22122651
查看文章PubMed/NCBI谷歌学术搜索
49.Alkelai A, Shohat S, Greenbaum L, Schechter T, Draiman B, Chitrit-Raveh E, et al.GRIA2表型表征的扩展:儿童期精神分裂症病例中一种新的新发功能丧失突变。J 哼哼热内。2021;66:339–343.密码:32948840
查看文章PubMed/NCBI谷歌学术搜索
50.Karpyak VM, Geske JR, Colby CL, Mrazek DA, Biernacka JM.NMDA依赖性AMPA贩运级联的遗传变异性与酒精依赖有关。瘾君子生物学. 2012;17:798–806.密码:21762291
查看文章PubMed/NCBI谷歌学术搜索
51.McKinley JW, Shi Z, Kawikova I, Hur M, Bamford IJ, Sudarsana Devi SP, et al. 多巴胺缺乏症降低帕金森病模型中纹状体胆碱能中间神经元功能。神经元。2019;103:1056–1072.e6.密码:31324539
查看文章PubMed/NCBI谷歌学术搜索
52.SLC6A3是帕金森病的危险因素:十六年研究的荟萃分析。神经科学杂志 2014;564:99–104.密码:24211691
查看文章PubMed/NCBI谷歌学术搜索
53.林德PA,埃里克森CJP,威廉森KC。醛脱氢酶-1 (ALDH1A1) 多态性在芬兰人群有害饮酒中的作用。哼哼基因组学。2008;3:24–35.密码:19129088
查看文章PubMed/NCBI谷歌学术搜索
54.李杰, 王国忠.应用计算生物学解码脑转录组。基因蛋白质生物信息。2019;17:367–380.密码:31655213
查看文章PubMed/NCBI谷歌学术搜索
55.柳井一世, 本杰明 H, 什莫什 M, 查利法-卡斯皮五世, 什克拉尔 M, 奥菲尔 R, 等.全基因组中距离转录谱揭示了人体组织规格中的表达水平关系。生物信息学。2005;21:650–659.密码:15388519
查看文章PubMed/NCBI谷歌学术搜索
56.卡罗尔,欧文MJ。自闭症、精神分裂症和双相情感障碍之间的遗传重叠。基因组医学 2009;1:102.密码:19886976
查看文章PubMed/NCBI谷歌学术搜索
57.Millman DJ, Ocker GK, Caldejon S, Kato I, Larkin JD, Lee EK, et al. 小鼠初级视觉皮层中的VIP中间神经元选择性地增强对弱但特异性刺激的反应。生活。2020:9. PMID:33108272
查看文章PubMed/NCBI谷歌学术搜索
58.戈泽斯一世, 巴尔迪亚 A, 雷舍夫 A, 扎莫斯蒂亚诺 R, 茹科夫斯基 S, 鲁宾劳特 S, 等.阿尔茨海默病的神经保护策略:鼻内给予脂肪神经肽。美国国家科学院院刊,1996;93:427–432.密码:8552653
查看文章PubMed/NCBI谷歌学术搜索
59.Gunes ZI,Kan VWY,Ye X,Liebscher S.令人兴奋的复杂性:运动电路元件在ALS病理生理学中的作用。前神经科学。2020;14:573.pmid:32625051
查看文章PubMed/NCBI谷歌学术搜索
60.戈夫·血管活性肠肽表达中间神经元在Dravet综合征的小鼠模型中受损。生活。2019:8. pmid:31282864
查看文章PubMed/NCBI谷歌学术搜索
61.莱勒-杰克逊 JM, 胡德 LE, 奥利弗 MF.滥用药物以差异方式改变前额叶 V 层锥体细胞亚型的神经元兴奋性。前细胞神经科学。2021;15:703655.密码:34421542
查看文章PubMed/NCBI谷歌学术搜索
62.Pfisterer U, Petukhov V, Demharter S, Meichsner J, Thompson JJ, Batiuk MY, et al.癫痫相关神经元亚型的鉴定和癫痫发生的基因表达。纳特公社。2020;11:5038.密码:33028830
查看文章PubMed/NCBI谷歌学术搜索
63.卡普兰·癫痫和强迫症。对话临床神经科学。2010;12:241–248.密码:20623928
查看文章PubMed/NCBI谷歌学术搜索
64.de Ribaupierre S, Wang A, Hayman-Abello S. 儿童颞叶癫痫的语言映射:特殊考虑。癫痫治疗。2012;2012:837036.密码:22957246
查看文章PubMed/NCBI谷歌学术搜索
65.Trubetskoy V, Pardi?as AF, Qi T, Panagiotaropoulou G, Awasthi S, Bigdeli TB, et al.绘制基因组位点与精神分裂症中的基因和突触生物学有关。自然界。2022;604:502–508.密码:35396580
查看文章PubMed/NCBI谷歌学术搜索
66.Levey DF, Stein MB, Wendt FR, Pathak GA, Zhou H, Aslan M, et al.百万退伍军人计划中双祖先抑郁症GWAS和>1万人的荟萃分析突出了新的治疗方向。纳特神经科学。2;2021:24–954.
查看文章谷歌学术搜索
67.White CM,Ji S,Cai H,Maudsley S,Martin B.血管活性肠肽及其受体在神经系统疾病中的治疗潜力。中枢神经系统神经失调药物靶点。2010;9:661–666.密码:20632962
查看文章PubMed/NCBI谷歌学术搜索
68.米勒DW,库克森MR,迪克森DW。神经胶质细胞包涵体和神经退行性疾病的发病机制。神经元胶质生物学. 2004;1:13–21.密码:16614753
查看文章PubMed/NCBI谷歌学术搜索
69.Gleichman AJ, Carmichael St. 神经变性中的神经胶质细胞:疾病的驱动因素还是顺风顺水?神经生物学杂志 2020;142:104957.密码:32512150
查看文章PubMed/NCBI谷歌学术搜索
70.Selten M,van Bokhoven H,Nadif KN.精神疾病中兴奋性/抑制性平衡的抑制控制。F1000Res.2018;7:23.密码:29375819
查看文章PubMed/NCBI谷歌学术搜索
71.McTeague LM, Rosenberg BM, Lopez JW, Carreon DM, Huemer J, Jiang Y, et al.识别精神疾病情绪处理中常见的神经回路中断。Am J 精神病学。2020;177:411–421.密码:31964160
查看文章PubMed/NCBI谷歌学术搜索
72.蔡院长。精神障碍的神经回路和精准药物:它们是否兼容?心理医学 2019;49:1–8.pmid:30409236
查看文章PubMed/NCBI谷歌学术搜索
73.Gold AK,Kinrys G.治疗双相情感障碍的昼夜节律紊乱。Curr Psychiatry Rep. 2019;21:14.pmid:30826893
查看文章PubMed/NCBI谷歌学术搜索
74.斯基恩·吴,格兰特·使用单细胞转录组和表达加权细胞类型富集鉴定主要脑部疾病中的脆弱细胞类型。前神经科学。2016;10:16.密码:26858593
查看文章PubMed/NCBI谷歌学术搜索
75.叶丽, 普雷斯尔, 侯晓, 张志, 张科, 邱胤, 等.成年小鼠大脑中基因调控元件的图谱。自然界。2021;598:129–136.密码:34616068
查看文章PubMed/NCBI谷歌学术搜索
76.姚Z, van Velthoven CTJ, Nguyen TN, Goldy J, Sedeno-Cortes AE, Baftizadeh F, et al.跨等皮层和海马形成的转录组细胞类型的分类。细胞。2021;184:3222–3241.e26.密码:34004146
查看文章PubMed/NCBI谷歌学术搜索
77.Schmidt MJ,Mirnics K.神经发育,GABA系统功能障碍和精神分裂症。神经精神药理学。2015;40:190–206.pmid:24759129
查看文章PubMed/NCBI谷歌学术搜索
78.Jansen PR, Watanabe K, Stringer S, Skene N, Bryois J, Hammerschlag AR, et al.对1,331,010名个体的失眠进行全基因组分析,确定了新的风险位点和功能途径。纳特热内。2019;51:394–403.密码:30804565
查看文章PubMed/NCBI谷歌学术搜索
79.卡诺-加梅兹 E, 特林卡 G.从GWAS到功能:使用功能基因组学来识别复杂疾病背后的机制。前热内特。2020;11:424.密码:32477401
查看文章PubMed/NCBI谷歌学术搜索
80.陈 J, 巴德斯 EE, 阿罗诺 BJ, 杰加 AG.用于基因列表富集分析和候选基因优先级的ToppGene Suite。核酸研究 2009;37:W305–W311.pmid:19465376
查看文章PubMed/NCBI谷歌学术搜索
81.香农 P, 马基尔 A, 奥齐尔 O, 巴利加 NS, 王 JT, 拉马奇 D, 等.Cytoscape:用于生物分子相互作用网络集成模型的软件环境。基因组研究 2003;13:2498–2504.密码:14597658
查看文章PubMed/NCBI谷歌学术搜索