厦门论文发表-新旧世界利什曼原虫两种白血胺沙蝇载体的基因组分析
抽象
静脉沙蝇作为人类疾病的重要载体具有全球意义,传播细菌、病毒和原生动物病原体,包括利什曼原虫属的动质体寄生虫,利什曼原虫是毁灭性疾病的病原体,统称为利什曼病。40多种致病性利什曼原虫物种通过35个国家的约98种沙蝇传播给人类,全世界有数亿人处于危险之中。没有批准的利什曼病有效疫苗,现有的治疗药物要么有毒和/或昂贵,要么寄生虫对最近开发的药物产生耐药性。因此,沙蝇和/或水库控制是目前阻断传播的最有效策略。为了更好地了解沙蝇的生物学,包括其媒介能力、杀虫剂抗性和种群结构所涉及的机制,我们对两种地理上广泛且重要的沙蝇载体物种的基因组进行了测序:Phlebotomus papatasi,一种引起皮肤利什曼病的利什曼原虫寄生虫载体(分布在欧洲、中东和北非)和长睑 Lutzomyia longipalpis,一种引起内脏利什曼病的利什曼原虫寄生虫媒介(分布在中美洲和南美洲)。我们对参与其作为疾病载体作用的重要过程的基因进行分类和策划,包括化学感觉、血液喂养、昼夜节律、免疫和解毒,以及移动遗传元件。我们还定义了基因直系学,并观察了基因组之间的微同源性。最后,我们介绍了这些物种在各自地理区域的遗传多样性和种群结构。这些基因组将成为未来预防利什曼原虫媒介传播的基础。
作者摘要
利什曼原虫是由利什曼原虫属的原生生物寄生虫引起的一组被忽视的热带疾病。不同的利什曼原虫种属具有广泛的临床特征,从可导致保护性免疫的轻度、通常自行消退的皮肤病变,到严重的转移性黏膜疾病,再到最终致命的内脏疾病。利什曼原虫寄生虫通过沙蝇叮咬传播,由于没有批准的人类疫苗,现有药物有毒和/或昂贵,寄生虫对它们的耐药性正在出现,必须制定新的双重控制策略来对抗这些疾病,将人类感染干预措施和沙蝇种群综合管理结合起来。有效的病媒控制需要全面了解沙蝇的生物学。为此,我们对两种沙蝇物种的基因组进行了测序和注释,它们是来自旧世界和新世界的重要利什曼病媒介。这些基因组使我们能够在遗传水平上更好地了解这些物种的媒介生物学中重要的过程,例如寻找宿主,血液喂养,免疫和解毒。这些基因组资源突出了两种主要利什曼原虫媒介进化的驱动力,并为未来如何通过控制沙蝇媒介更好地预防利什曼病的研究提供了基础。
数字
Table 2图1图2表1Fig 3Fig 4Fig 5Table 2图1图2表1
引文: Labbé F, Abdeladhim M, Abrudan J, Araki AS, Araujo RN, Arensburger P, et al. (2023) 来自新旧世界的利什曼原虫的两个静脉沙蝇载体的基因组分析。公共科学图书馆 Negl Trop Dis 17(4): e0010862. https://doi.org/10.1371/journal.pntd.0010862
编辑 器: Geoffrey M. Attardo,加州大学戴维斯分校,美国
收到: 6 年 2022 月 13 日;接受: 2023月 12, 2023;发表: <>月 <>, <>
这是一篇开放获取的文章,没有任何版权,任何人都可以出于任何合法目的自由复制、分发、传输、修改、建立或以其他方式使用。该作品在知识共享CC0公有领域奉献下提供。
数据可用性: 测序读段序列读段存放在NCBI SRA中,生物项目入藏号为PRJNA20279,用于长睑露脊髓蝾螈,PRJNA20293为帕帕塔西静脉。GeneBank Ph. papatasi Ppap_1.0 汇编入藏号为 GCA_000262795.1,Lu.Longipalpis Llon_1.0 汇编入藏号为 GCA_000265325.1。基因组组装和相关注释都托管在VectorBase上。
资金: 这项工作得到了国家人类基因组研究所U54-HG003079对WCW和U54-HG003273给SR的两项资助。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
竞争利益: 提交人声明不存在相互竞争的利益。
介绍
静脉沙蝇是一组以血液为食的双翅目,其地理分布、生态和传播的病原体差异很大。它们是几种已建立的、新兴的和重新出现的传染病的载体,传播原生生物、细菌和病毒病原体。最重要的沙蝇传播病原体属于利什曼原虫属,利什曼原虫在人类中引起一系列疾病,称为利什曼病,估计造成2万残疾调整生命年[4],每年有1,40人死亡[000]。由于许多受影响国家的误诊、漏报和缺乏监测系统,这些统计数据可能被低估。政治不稳定、城市化和气候变化正在扩大利什曼原虫流行地区,并增加全球流行的风险[2]。这些因素加上内脏疾病和HIV合并感染的增加,导致世界卫生组织将利什曼病归类为世界上易流行疾病之一[3]。
利什曼病在世界范围内有发生,分布在五大洲的98个国家,有310.2亿人有感染风险[<>]。利什曼病是一组不同临床表现的统称,从可导致保护性免疫的轻度、通常自我消退的皮肤病变,到不能自愈的播散性病变,到鼻、口和咽粘膜的破坏,再到危及生命的内脏疾病。临床特征取决于多种因素,包括病媒生物学、宿主免疫和寄生虫特征;导致感染的利什曼原虫属是主要决定因素。两种主要的临床形式是皮肤利什曼病(CL)和内脏利什曼病(VL)。引起CL的主要利什曼原虫种属是大利什曼原虫,婴儿利什曼原虫,热带利什曼原虫和旧世界的利什曼原虫和亚马逊利什曼原虫,巴西利什曼原虫,圭亚那利什曼原虫,Le。 婴儿,墨西哥利什曼原虫和新世界的利什曼原虫。VL主要由亚洲和非洲的多诺瓦尼利什曼原虫和Le引起。婴儿分布在中东、中亚、南美洲和中美洲以及地中海盆地。
目前约有35种经证实的利什曼原虫病媒,另有63种疑似载体,至少有40种不同的利什曼原虫种属[5,6]。静脉瘤菌属是旧世界利什曼原虫的主要媒介,而卢佐米亚属负责在整个美洲传播利什曼病[7]。利什曼原虫种属与其特定媒介之间存在密切的生态关联(如果不是共同进化关系的话)[8,9],因此通常单个沙蝇物种在自然条件下传播单个利什曼原虫物种。然而,一些沙蝇可以在实验条件下传播一系列利什曼原虫[10]。这种差异产生了“限制”和“允许”向量的概念[11]。例如,帕帕塔西静脉瘤是一种限制性载体,仅传播Le。主要寄生虫[12]。长睑露佐米亚(s.l.) 在实验室条件下被认为是允许载体,但仅传输 Le。婴儿自然[12]。
这些载体是双翅目的一部分,双翅目是一种物种极其丰富且生态多样化的昆虫目,包含人类及其驯养动物的许多最重要病原体的载体。沙蝇(Psychodidae科)和蚊子(Culicidae)都被指定为线虫亚目内不同下目的成员。虽然线虫类群是副系的,但下目之间的关系仍有待阐明[13]。一些研究以Psychodomorpha(沙蝇)和Culicomorpha(蚊子和黑蝇)作为姐妹群[14]生成拓扑结构,而另一些研究则将沙蝇放置在更靠近麝香蝇(Ephydroidea)的地方[15]。包括Psychodidae在内的组合内部关系也仍然是一个有争议的问题[16]。
据推测,沙蝇属与其传播的利什曼原虫属之间的这种密切进化关系可能对利什曼病具有流行病学意义[17]。例如,Le有三个主要的酶子。主要具有有限的地理分布,使得特定地区流行的酶体与Ph的一个主要种群的分布重叠。帕帕塔西[18]。博士。帕帕塔西的地理分布广泛,从摩洛哥到印度次大陆,从南欧到非洲中部和东部。鉴于Ph的广泛生态和地理分布。Papatasi种群[19],再加上这些沙蝇的低传播能力[12],种群之间的基因流动可能有限,种群之间的遗传结构显着。虽然以前的研究表明Ph之间的遗传分化相对较低。帕帕塔西人群相隔很远的地理距离[9,20],最近的研究发现地理上分离的人群[18,21-24]和局部分化[25]之间存在遗传分化。特别是微卫星分析揭示了Ph的两个不同的遗传簇。papatasi(A和B)在每个种群中具有与地理来源相关的进一步子结构(A1-5和B1和2)[18,23]。
虽然阐明导致生殖隔离和物种形成的驱动因素仍然是一个挑战,但有强有力的证据表明Lu。在巴西,长睑正在经历早期物种形成,复合体的兄弟姐妹之间存在不同程度的分化[26]。卢的巴西人口。根据对它们的主要交配歌曲的分析,Longipalpis可以分为三组,这些交配歌曲在雄性紧紧抓住雌性后立即开始交配。一个群体的雄性产生突发型交配歌曲,第二个,更异质的群体,具有产生不同亚型脉冲型歌曲的种群。第三组,“混合型”具有与其他突发和脉冲类型的特征,但在所有测量特征中具有足够显着的差异,使它们能够与其他类型区分开来[27-29]。昆虫的声学交流主要与交配前求偶期间的吸引力和/或识别有关。在卢.长睑(S.l.),当交配开始并有助于授精成功时,声音产生就开始了,这表明它与繁殖成功直接相关[30]。
陆男.长睑产生性别聚集信息素,这是一种挥发性化学物质,可长距离吸引雌性到雄性选择的交配地点[31]。对这些化学物质的结构和数量的分析表明,至少有5种不同的信息素类型可能代表Lu的神秘物种。南美洲和中美洲国家的长睑[32-34]和化学感觉基因组中分子相关性[单核苷酸多态性(SNPs)和拷贝数变异(CNV)]的分析证实,这些人群具有显着的遗传差异[35]。已阐明的复合体成员的性别聚集信息素的结构分为两类;二萜,分子式为C20H32分子量 (mw) 272 gmol-1和分子式为C的甲基倍半萜16H32和 MW 218 GMOL-1 [[32]其中一种二萜被表征为索布拉烯(SOB)[36],两种甲基倍半萜被表征为3-甲基-α-喜马傉烯(3MαH)和(S)-9-甲基锗烯-B(9MGB)。这些化合物仅在Lu人群中发现。长帕尔皮斯。
虽然卢的性别聚集信息素。长睑(S.l.) 共享生物合成起源 甲基倍半萜来源于15碳前体法呢基二磷酸酯和甲羟戊酸途径的七种酶中的六种,加上参与倍半萜类生物合成的酶,已在产生9MGB的Lu中发现。Longipalpis[37]而二萜是通过20碳前体香叶基香叶基二磷酸酯衍生的[38]。
Lu不同成员的同源和异域种群之间的交叉实验。长睑物种复合体显示,由于交配前和交配机制,导致生殖隔离[39,40]。希克纳等.2020 年为卢氏流行为进化背后的化学感受器基因组库提供了基因组见解。长睑种群,但全基因组分析可以改善与关键性状(如载体容量、宿主偏好和杀虫剂抗性)相关的位点的鉴定[35]。
尽管影响利什曼原虫在肠道中的发展和存活具有潜在重要性,但对沙蝇免疫反应的研究很少。迄今为止,工作主要局限于防御素的研究[41-44]。然而,通过免疫缺陷(IMD)途径卡斯帕的负调节因子RNAi进行的基因耗竭[45]导致Lu肠道中利什曼原虫种群减少。长帕尔皮斯。而敲除津津有味,IMD途径的转录因子,导致利什曼原虫和细菌在Ph中的增加。帕帕塔西[46]。
对噬血的适应给昆虫带来了许多挑战,包括避免宿主干扰获得血粉的生理反应、血液的消化以及排泄血粉中所含的多余水分。沙蝇已经进化出一种药理活性唾液分子的复杂混合物,以促进血液喂养,这已被广泛描述[47]。
沙蝇生物学中的许多重要方面,如噬血和宿主寻找,都由生物钟控制[48]。在卢.长睑,主要的时钟基因及其全天的表达模式,既往已有特征[49,50]。然而,对昼夜节律的分子调控在沙蝇中知之甚少。袁等.2007年提出了基于隐花色素(CRY)蛋白CRY1和CRY2存在的三种时钟模型[51]。在果蝇时钟模型中,仅存在充当蓝光光感受器的CRY1[52]。在蝴蝶模型中,CRY1还充当光感受器和CRY2,CRY2是一种哺乳动物样转录抑制,与PER的二聚体抑制CLK / CYC活性。在蜜蜂模型中,只有CRY1,它似乎与PER和其他一些不是CRY<>的分子一起充当抑制因子,充当光感受器。
进化生物学的一项核心研究是阐明物种形成的驱动因素,然而,定义物种边界和确定导致生殖隔离的遗传结构一直是一个挑战。了解病媒能力、适应不断变化的生态环境和杀虫剂耐药性的机制对沙蝇种群的综合管理具有流行病学影响,而沙蝇种群是利什曼病控制的基石[53]。为了开始探索来自Psychodidae家族(Phlebotominae亚科)的两种重要静脉沙蝇载体的进化驱动力,Ph.帕帕塔西和卢。长睑(S.L.),表现出不同的分布,行为和病原体特异性,我们使用比较基因组学方法对它们的全基因组进行测序和分析。我们手动策划了许多在免疫、血液喂养、化学感觉、解毒和昼夜节律生物学等过程中起关键作用的基因家族,为研究和理解沙蝇作为利什曼原虫媒介提供基础。此外,由于需要更好地了解地理上分离的媒介种群的种群结构,我们还评估了Ph的种群结构。帕帕塔西和卢。Longipalpis通过收集和测序分别在中东和北非以及巴西的大地理范围内采样的单个现场采集标本。我们的研究结果为我们理解种群结构背后的遗传学提供了重大进展,并为这两种医学上重要的载体的未来分子比较研究提供了基础。
方法
道德声明
该研究方案得到了圣母大学机构动物护理和使用委员会的批准(#07-052)。
实验室菌落
帕帕塔西静脉瘤。
为了避免由于遗传多态性引起的混杂效应,我们使用了Ph菌落。用于基因组组装的papatasi(以色列菌株)。该殖民地最初成立于1970年代,并于1983年从耶路撒冷希伯来大学交给沃尔特·里德陆军研究所(WRAIR),并于2006年转移到圣母大学。自实验室建立以来,该菌落的种群规模多次波动,并且从相对较少的文件数量扩大,因此,该菌落可能减少了杂合性。沙蝇是通过Modi和Tesh的方法饲养的[54]。
长睑露佐米亚。
陆.长睑雅各宾菌株用于基因组组装。这个殖民地最初是由理查德·沃德于1988年在利物浦热带医学院建立的,这些苍蝇是在巴西巴伊亚州雅各比纳捕获的苍蝇。自建立以来,这个殖民地也从少量苍蝇扩大了几次。苍蝇在标准化实验室条件下饲养[54],i。e.在受控温度(27±2°C)、湿度(>80%)和光周期(8小时光照/16小时黑暗)下[54]。
字段集合
帕帕塔西静脉瘤。
博士。帕帕塔西是从三个不同的地方收集的:突尼斯、埃及和阿富汗。在突尼斯,2013年从位于突尼斯中部干旱生物地理区(北纬35°16',东经9°26')的费尔塔村采集了样本。30年,在埃及北西奈半岛的Om Shikhan(北纬50°34',东经10°340')采集了样本,该镇位于开罗以东约80公里、地中海沿岸内陆30公里、以色列边境以西2007公里处。在阿富汗,2010年在马扎里沙里夫机场(北纬36°43',东经67°14')附近的德国军营内和周围收集了样本。该地点位于兴都库什山脉以北400米,乌兹别克斯坦边境以南约50公里处。沙蝇在17:00至07:00之间使用CDC式光阱捕获。
长睑露佐米亚。
陆.2014年从巴西的六个不同地点收集了长睑(图1)。样本来自三个异域种群:巴伊亚州雅各比纳(11010年代400西经31'),(3MαH),米纳斯吉拉斯州拉皮尼亚洞穴(19038年代430西经53'(9MGB),帕拉州马拉霍岛(西经0°56'49°38')(SOB),以及来自塞阿拉州索布拉尔的两个同源种群(34041年代40020'W),表示为S1S(9MGB)和S2S(SOB)。为了比较雄配求偶歌曲,还从雅各比纳附近的奥林迪纳(11° 29' S 38° 22' W)和阿拉奇(11° 09' S 39° 01' W)收集了苍蝇。沙蝇使用CDC式光阱捕获,诱饵一氧化碳2在18:00至06:00之间运送到实验室。如前所述,对男配求爱歌曲的分析[27]。这些记录是使用来自实验室菌落的雄性和雌性进行的,这些实验菌落是由来自Lapinha和Sobral以及Araci和Olindina的野生收集的苍蝇建立的。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 长睑露脊髓鹦鹉交配歌曲和信息素类型的地点。
样本来自三个异域种群:马拉霍(帕拉州;0°56'S 49°38'W),雅各比纳(巴伊亚州;11010年代400西经31')和拉皮尼亚洞穴(米纳斯吉拉斯州;19033年代43057'W);和来自索布拉尔(塞阿拉州;3041年代400交配歌曲:脉冲型(B)和脉冲型(P21,P1和P2)。信息素类型:索布拉烯(SOB),(S)-3-甲基吉马烯-B(9MGB)和9-甲基-α-喜马喹烯(3MαH)。对于每个位置,指示每个群体中相对于参考基因组(VectorBase,LlonJ3)鉴定的SNP的数量。在所有人群中总共发现了1,1,937个SNP。主地图来源:世界影像(资料来源:Esri、Maxar、地星地理和 GIS 用户社区;http://goto.arcgisonline.com/maps/World_Imagery)。插图来源:World Dark Gray Canvas Base(Esri、HERE、Garmin、OpenStreetMap 贡献者和 GIS 用户社区;http://goto.arcgisonline.com/maps/Canvas/World_Dark_Gray_Base)。
https://doi.org/10.1371/journal.pntd.0010862.g001
核酸分离
从苍蝇池或单个昆虫中分离出雌性沙蝇的基因组DNA,用于种群遗传学分析。对于混合的昆虫,使用组织DNA分离试剂盒(GE医疗保健生命科学)将DNA悬浮在50μl水合溶液中。
为了产生广泛的RNA-seq覆盖率以实现高质量的基因预测,在出苗后6天,24天和96天,发育过程中,以及成年女性在血液喂养后(Ph为6,24和144小时)从两性中获得RNA。帕帕塔西和卢的81、76和4192小时。隆基帕尔皮斯)关于未感染和利什曼原虫[Le.专业(MHOM/IL/<>/Friedlin)为Ph.帕帕塔西和勒.婴儿 (MHOM/BR/<>/M<>) 为 Lu.隆基帕尔皮斯]感染小鼠血液。使用RNAeasy迷你试剂盒(Qiagen)提取总RNA。
基因组测序和组装
帕帕塔西静脉瘤。
Ph. 的测序和组装papatasi由华盛顿大学医学院基因组研究所进行。该组装是使用 –het 选项构建的,使用 Newbler 汇编程序测试版本 2.6RC02,输入 ~22.5 倍 Sanger 的总序列覆盖率和 454 个读数,包括 15.1 倍的全基因组霰弹枪读取、4.4X 3 kb 克隆插入、3.0X 8 kb 插入和 0.01X BAC 端读取对。将全基因组霰弹枪Illumina配对末端读段(300 bp插入片段)测序至20倍覆盖率以进行间隙闭合。片段和3 kb数据来自全基因组扩增后的单个沙蝇,而8 kb数据来自多只苍蝇。Sanger 0,1个BAC末端序列(3,730个读数)的28.902倍也来自多个苍蝇。
在提交给NCBI之前,通过使用MegaBLAST[55]对细菌和脊椎动物基因组数据库进行如前所述[56]的污染筛查,从而去除了247个重叠群。杂合重叠群被移除或合并,将组装的基因组大小从364 Mb减少到345 Mb。如前所述,使用PyGap共闭合了5,661个间隙,并添加了近6.8 Mb的序列[55,57–59]。PyGap程序利用金字塔汇编器来检测和合并相邻重叠群的重叠,并用Illumina数据缩小非重叠相邻群之间的间隙。将间隙闭合中使用的相同 Illumina 数据与组件对齐,以纠正 89,378 个假定的 454 个插入/删除错误。
长睑露佐米亚。
三种类型的卢。使用longipalpis全基因组霰弹枪(WGS)文库:454钛片段文库和由3 kb和8 kb插入片段生成的成对末端文库。454 个数据(11 万次读取;~5.24 倍覆盖率)来自同一个个体,而配对读取(4 万次 7kb 读取,4.3 倍;9 万次 6kb 读取,3.7 倍)来自一组个体。贝勒医学院人类基因组测序中心 (BCM-HGSC) 使用 Celera CABOG 汇编器(版本 8.4,9/22/6)总共生成了大约 6 万个读数,代表了该沙蝇基因组的 1.2010 倍覆盖率。这些初步结果被用作使用ATLAS-link的较长超级支架的骨干[03]。最后,用ATLAS-gapfill填充了可识别的空白(见[22])。所有重叠群的总长度为 38.9 Mb;但是,在包括间隙后,组件的总跨度为 60.61 Mb。
个体群体测序
为了制备短插入文库,使用了Illumina凝胶切割双端文库方案。简而言之,使用Qiagen DNAeasy血液和组织试剂盒从近交系中提取个体成年雄性或雌性DNA,遵循制造商从昆虫中纯化总DNA的补充方案。使用Covaris S-2系统(Covaris,Inc.Woburn,MA)剪切纯化的DNA。剪切的DNA片段用Agencourt AMPure XP磁珠纯化,末端修复,dA尾,并连接到Illumina通用适配器。接头连接后,使用Illumina P6和索引引物对以及Phusion高保真PCR预混液(新英格兰生物实验室)通过琼脂糖凝胶洗脱和PCR扩增8至1个循环进一步选择DNA片段的大小。使用Agencourt AMPure XP磁珠纯化最终文库,并通过安捷伦生物分析仪2100(DNA 7500试剂盒)评估质量,确定测序前的文库数量和片段大小分布。测序在Illumina HiSeq2000平台上进行,产生100 bp配对的末端读段。测序读取序列读取存储在NCBI SRA中,生物项目入藏号为PRJNA20279。长睑和PRJNA20293用于Ph。帕帕塔西。
核糖核酸测序
进行RNA测序(RNAseq)是为了改善可用于基因预测的资源。RNAseq在Illumina HiSeq 2000平台上按照标准协议执行。为了产生广泛的RNA-seq覆盖率以实现高质量的基因预测,在出苗后6天,24天和96天,发育过程中以及雌性喂养后(Ph为6,24和144小时)从两性获得RNA。帕帕塔西和卢的81、76和4192小时。隆基帕尔皮斯)关于未感染和利什曼原虫[Le.专业(MHOM/IL/1/Friedlin)为Ph.帕帕塔西和勒.婴儿 (MHOM/BR/25/M61002) 为 Lu.隆基帕尔皮斯]感染小鼠血液。简而言之,使用Oligo(dT)94 Dynabeads(Life Technologies,货号3)从3μg总RNA中提取poly-A信使RNA(mRNA),然后通过加热至6°C4分钟[对于RNA完整性数(RNI)= 6-0的样品]或18080分钟(对于RIN为>044.63987的样品)来片段化mRNA。使用Superscript III逆转录酶(Life Technologies,货号10-0280)合成第一链互补DNA(cDNA),并使用Agencourt RNAClean XP珠(Beckman Coulter,货号A13)纯化。在第二链cDNA合成过程中,使用含有三磷酸脱氧尿苷的脱氧核苷(dNTP)混合物引入链特异性。对于Illumina配对端文库构建,所得cDNA通过末端修复和A尾处理,用Illumina PE接头连接,并用0531单位尿嘧啶-DNA糖基化酶消化(新英格兰生物实验室,马萨诸塞州伊普斯威奇;货号M6L)。使用Phusion高保真PCR预混液(新英格兰生物实验室,货号M2100L)对文库进行7500个PCR循环;在此PCR扩增过程中还掺入了5067-bp分子条形码。然后在每次酶促反应后用 Agencourt AMPure XP 磁珠纯化这些文库,并使用安捷伦生物分析仪 1506 DNA 芯片 2000(货号 100–81043)定量后,以等摩尔量汇集文库进行测序。在Illumina HiSeq20293s上进行测序,产生<> bp配对端读数。测序的读数存放在NCBI SRA中,根据BioProject加入PRJNA<>为Lu。长睑和PRJNA<> 帕帕塔西。+
注解
基因组组装最初使用源自VectorBase注释MAKER2 [62]管道[63]的基因模型进行注释。自动分析确定了12,678个Ph基因模型。帕帕塔西和卢的10,429。长帕尔皮斯。专家策展人手动注释了几个感兴趣的基因家族(S1方法),从而产生了11,849和10,796个Ph基因模型。帕帕塔西和卢。分别是长睑。
直立学划定
OrthoDB [64] 直立学描述用于定义直系同源基因组,这些基因来自该物种系统发育的每个最后共同祖先,包括两只沙蝇 - 半翅目:人虱和罗得纽斯;膜翅目:膜翅目:膜翅目和苜蓿属;鞘翅目:鞘翅目;鳞翅目:森蝴蝶和达瑙斯丛翅目;双翅目:陆。隆吉帕尔皮斯博士papatasi和Glossina morsitans,43种果蝇(D.格里姆沙维,D.莫哈文西斯,D.维里利斯,D.威利斯托尼柿子,D.伪暗箱,D.阿纳萨科,D.直立,D。雅库巴·黑腹果螨塞切利亚和D.拟蚊)、两种蚊子(埃及伊蚊和五面库蚊)和12种按蚊(An.达林吉,安。阿尔比马努斯,安。西南西斯,安。阿特罗帕夫斯,安。法劳蒂,安。迪鲁斯,安。富内斯图斯,安。最小,安。妖孽相,安。黄斑,安。斯蒂芬西(SDA-19),安。斯蒂芬西(印度人),安。埃皮罗蒂库斯,安。克里斯蒂,安。梅拉斯,安。四环形,安。阿拉伯人,安。梅鲁斯和安.冈比亚(PEST)。直立学描述是按蚊基因组集群联盟对500只新测序的按蚊进行分析的一部分[16,65]。从完整的物种集中,将两只沙蝇与五只代表性蚊子和五只代表性苍蝇的对称组进行比较,以及代表四个昆虫目66个外群物种。使用自定义 Perl 脚本分析双翅目根部定义的所有直系同源群的物种组成,以计算沙蝇、蚊子和苍蝇之间共享的组和基因的数量。沙蝇中单拷贝和/或多拷贝直系同源物之间的成对氨基酸身份百分比,An。冈比亚和D.黑腹肌是从使用SWIPE [67]进行的全对全蛋白质序列比较中提取的,作为OrthoDB正交学描述程序的一部分。
最大可能性物种系统发育
为了建立物种关系,从两只沙蝇、五只蚊子、五只苍蝇的“automated68”trimAl [1] 设置中,从两只沙蝇、五只蚊子、五只苍蝇、 和四种外群昆虫。这些直系同源物是从总共69,1个直系同源组中选出的,每个组在修剪后需要具有超过627个氨基酸列的排列,并且在RAxML中实现的相对树确定性(见[2])超过160%[50]。级联比对包含70,50,71个氨基酸列和1,065个不同的比对模式,并用于估计RAxML的最大可能性物种系统发育[440],使用PROTGAMMAJTT模型超过627个自举样本并设置Pe。人类作为外群物种。使用自定义Perl脚本和Newick实用程序[808]分析了单个直系同源物组的RAxML系统发育,将系统发育分为三个相关的拓扑结构 - i)沙蝇与蚊子,ii)沙蝇与苍蝇,或iii)沙蝇作为蚊子和苍蝇的外群 - 随后对所有分支长度进行平均。
群体遗传学分析
单核苷酸单核苷酸酯调用。
我们对Ph全基因组样本的原始读数进行了比对和变异调用。从突尼斯(N = 6),埃及(N = 6)和阿富汗(N = 5)收集的papatasi到Ph。帕帕塔西参考基因组(Ppap_1.0)。我们还对齐并将Phlebotomus bergeroti(N = 2)和Phlebotomus duboscqui(N = 1)的变体称为外群。此外,我们调用了Lu全基因组样本原始读数的变体。从巴西[马拉霍(N = 9)、拉皮尼亚(N = 13)、雅各比纳(N = 14)和索布拉尔(9MGB N = 13;SOB N = 16)]和中间尼索米亚(N = 2)和米戈内米亚米戈内(N = 2)作为与Lu对齐的外群。长睑参考基因组(Llon_1.0)。
通过使用Picard(v1.113)去除重复读段来预处理所有基因组读段,并使用bwa-mem将配对端读段与参考基因组对齐[74]。碱基位置差异(SNV)基于两种变体调用软件工具SAMtools[75]和VarScan 2 [76]的独特收敛,使用标准变体调用和过滤参数,这些参数针对中等覆盖率(10X-40X)的全基因组数据进行了优化。这些参数包括 P 值 0.1、地图质量 10、最小覆盖率 500 次读取以及用于按误报过滤的参数。在对齐和变异检测之后,我们实施了一个过滤器来排除每 <> bp 中聚集在五个以上变异的组中的变异。我们最终实现了回填,当覆盖率超过三个读数时,包括每个站点的纯合参考调用,其中在最终的多样本变体调用格式(VCF)文件中为每个个体调用变体。未超过此阈值的位点被列为缺失的二倍体基因型。
单核苷酸单核苷酸过滤。
为了帮助对变异进行质量评估,我们排除了基因型质量(GQ)低于30(即最低准确率为99.9%)的基因型。我们还对变异应用了硬过滤器,排除了平均深度低于10或高于200、哈代-温伯格平衡(HWE)P值低于0.001、缺失基因型水平高于20%和次要等位基因频率(MAF)低于1%的任何变异。用于人口结构推断的数据集被修剪为连锁不平衡,排除了高于r的变体2使用PLINK v.0.5时,在50个变体的滑动窗口中阈值为5.1,步长为90个变体[77,78]。使用SNPRelate v.x从6,390,876个位点修剪连锁不平衡的变异,使用500kb的滑动窗口和0.2的连接不平衡阈值[79]。
基因组学结构。
尽管由于采样有限,能量较低,但我们初步尝试识别基因组中可能有助于种群之间分化的区域。对于博士。PAPATASI样品VCFtools v.0.1.15 [80]用于运行滑动窗口分析,滑动窗口大小为5 kb,步长为500 bp,每个窗口至少有10个变体[80]。在计算每个总体内每个窗口的田岛D后[突尼斯(TUN),埃及(EGP);阿富汗(AFG)],我们使用赖特注视指数(F圣).我们进行了三个成对比较:i)TUN与EGP;(二) TUN 至 AFG;以及 iii) EGP 到 AFG。这些结果的分布不是正态的,因此我们依靠百分位数方法,并选择了满足田岛D和5千F 的百分位数圣.删除了少于 10 个 SNP 的窗口和坐标为 1-500 的窗口。然后,我们搜索了超过以下阈值的5 kb窗口:i)人口内低田岛的D和ii)高F圣.我们寻找高F的直接重叠窗口圣田岛的D分数低,间接重叠,允许在我们确定的每个窗口的两端都有10kb的缓冲区。
使用外加剂v.1.9估计个体血统[81]。对K值进行分析(范围从30到1,每K迭代1次)。为了更好地理解外加剂报告的不同溶液,在CLUMPAK v.82.1中对外加剂结果进行了后处理[1]。主成分分析(PCA)在scikit-allel v.10.83.84中[<>]中按照[<>]中所述的方法进行。威尔和科克汉姆的F圣,内氏·XY,田岛的D是使用VCFtools和python脚本 popGenWindows.py(https://github.com/simonhmartin/genomics_general)计算的。使用HapFLK v.85.1 [4]进行单标记FLK测试[86]。
系统发育分析。
我们通过使用R包adegenet v在基因组中构建邻居连接(NJ)树来探索个体之间的祖先系统发育关系。2.1.1 [87,88],猿诉。5.1 [89],波普尔诉。2.7.1 [90]和vcfR v.1.7.0 [91]。对于博士。帕帕塔西,我们包括两个博士。贝格罗蒂和博士。杜博斯奇,并用后者来扎根树木。对于陆。长睑系统发育分析我们纳入了两个N。中间和M.米戈内,用了M.米戈内为新泽西树扎根。我们使用1次自举重复评估了节点支持[000]。
dN/dS
使用为直系同源组多序列比对计算的dN / dS统计量估计基因序列进化的选择性约束。通过交叉引用OrthoDB v8目录将蛋白质序列分配给直系同源物组[93]。对于具有一对多和多对多直系同源物的直系同源物组,通过从每个物种的序列中随机选择具有均匀概率,为每个物种选择单个蛋白质序列。首先使用Clustal-Ω生成蛋白质序列多次比对[94],然后用于通过密码子感知PAL2NAL比对程序通知CDS比对[95]。PAML v00.4 [8] 中的 yn96 程序用于计算每个对齐直系同源组中每对序列的 dN/dS 比率。
结果和讨论
测序和基因组特征
Ph的基因组。papatasi 是 ~350 Mb,于 2012 年完成,用于社区分析和种群比较(S1 表)。该组件由 ~22.5 倍总序列覆盖率的输入构建而成,产生了 139,199 个重叠群,N50 为 5.8 kb,106,826 个脚手架,N50 为 28 kb。卢的基因组草案。longipalpis(Llon_1.0)也于2012年完成,大约154.2 Mb,比Ph小两倍多。papatasi基因组,代表38.9倍的覆盖率(S1表)。有 35,696 个重叠群,N50 为 7.5 kb,11,532 个脚手架,N50 为 85.1 kb。基于自动和手动注释,Ph.帕帕塔西和卢。Longipalpis基因组估计分别包含11,216和10,311个蛋白质编码基因。BSCO分析[97]表明Ph的完整性分别为86.5%和86.1%。帕帕塔西和卢。分别是长睑基因组(S2表)。N50大小和BSCO完整性得分表明组装体是碎片化的,可能是基因组缺失的区域。注释增加了来自不同生命周期阶段的RNA-seq表达证据,成虫出苗后数天,以及未感染者和Le的血液喂养后。主要感染的Ph血液。帕帕塔西和勒.婴儿感染的血液为卢。长睑(S3表)。
正字学
为了提高我们对系统发育关系的理解,我们使用从包含43种昆虫(包括36种双翅目)的直系学数据集中选择的直系同源基因生成了最大似然系统发育树。与[14]一致,系统发育树支持沙蝇与下目(蚊子和黑蝇)而不是下目(果蝇和舌蝇)的沙蝇聚类(图2A)。此外,沙蝇和蚊子之间的直系同源物百分比高于沙蝇和果实锉之间的同源物百分比,与系统发育的最大可能性一致(图2A)。沙蝇和蝇类的排他性共享直系同源群是沙蝇与白蝇的三倍多,这也与系统发育的最大似然性一致(图2B)。然而,对单个基因系统发育的分析显示出极大的不确定性,几乎相同比例的系统发育支持沙蝇与蚊子和白蝇的聚集(S1图)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 分子物种系统发育和直系同源物共享。
(A)从1,627个直系同源蛋白质编码基因的串联超比对计算的定量最大似然物种系统发育将沙蝇(Psychodomorpha)作为蚊子(Culicomorpha)而不是苍蝇(Muscomorpha)的姐妹组,所有分支都显示出100%的自举支持。Culicomorpha由四种按蚊和Culex quinquefasciatus和Muscomorpha包括四种果蝇果蝇物种和采采蝇G。莫西坦。外群物种代表鳞翅目(Bombyx mori),鞘翅目(T.Castaneum),膜翅目(Apis mellifera),系统发育植根于Phthirapteran人体虱Pe。人性。插图箱图显示,每只沙蝇之间的单拷贝(1:1)和多拷贝(X:X)直系同源氨基酸百分比相同性较高(Ll,Lu.长睑;页,博士。帕帕塔西)和安。冈比亚(Ag)比D。黑腹肌(DM)。箱线图显示中值,其中箱形延伸到分布的第一和第三四分位数。(B)维恩图总结了两只沙蝇(L. lon.,Lu.长睑;帕普,博士帕帕塔西)和/或库利科莫拉和/或麝香。对直系同源物共享的分析表明,沙蝇与蝇类(按蚊和库莱克斯)共享的直系同源群数量是麝香目(果蝇、舌蝇)(用细虚线和粗虚线突出显示的亚群)的三倍多。独特基因的数量以斜体显示。图A和图B中的颜色与分析的物种和物种集相匹配。
https://doi.org/10.1371/journal.pntd.0010862.g002
可转座元素。
转座元件(TEs)是存在于真核基因组中普遍存在的重复序列,可能是影响基因组大小的重要因素,被认为是进化的驱动力之一[63]。一些昆虫基因组的TE含量不到3%,而另一些昆虫基因组的TE含量高达50%或更多,这与基因组大小差异较大有关[98]。我们的分析表明,Ph.papatasi基因组由5.65%的TE衍生序列组成,而Lu.Longipalpis基因组仅包含0.57%,对应于两种沙蝇物种之间的基因组大小差异。TE衍生序列的这种差异可能是由于某些TE家族或超家族的不同进化动力学的结果,影响了它们在基因组中的分布(是否存在特定超家族)或丰度(每个超家族的拷贝数)。更高的TE衍生序列丰度,全长TE的存在和Ph中的基因组大小扩展。papatasi基因组也可能是由于最近活跃的TEs。或者,TE含量的基因组差异可能是Lu中内在基因组缺失模式的结果。Longipalpis,由于有效的识别和消除机制从基因组中删除这些外来序列,正如已经证明在果蝇物种中发生的那样[99]。
尽管基因组组装的碎片化性质使得难以完全准确地评估TE含量,但比较两个沙蝇基因组组装体中的TE含量表明,Ph中的所有TE类别和顺序都有所扩展。帕帕塔西基因组。这种增殖在属于II类或“剪切和粘贴”TE的元件中更为明显,特别是在非自主微型倒重复转座元件(MITEs)中,代表了两个基因组之间高达29倍的差异。MITEs的扩展表明最近II类TEs在Ph中的活动。帕帕塔西基因组。另一方面,I类元素或“复制粘贴”元素,包括传统上负责基因组扩增的长末端重复(LTR)和非LTR,在两个沙蝇基因组之间显示出更微妙的变化,差异高达4倍。(表1)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 1. 可转座元素。
https://doi.org/10.1371/journal.pntd.0010862.t001
免疫基因。
昆虫之间有几种免疫途径是保守的。这些包括Toll,免疫缺陷(IMD),Janus激酶/信号传感器和转录激活剂(JAK / STAT),凝集素和封装途径。我们发现Toll信号通路在两种沙蝇物种的基因组中高度保守,包括上游肽聚糖识别蛋白(PGRP)和葡聚糖结合蛋白(GNBPs)的同系物(S4表)。同样,IMD和JAK / STAT途径在双翅目中似乎是保守的,包括果蝇,伊蚊,按蚊和本研究中分析的两种沙蝇物种(S5和S6表)。
半乳糖结合蛋白(半乳糖凝集素)是一个多样化的蛋白质家族,在发育和免疫中发挥作用[100]。将沙蝇的半乳糖凝集素蛋白序列与其他双翅目进行比较,鉴定出共享和独立的直系同源物(S2图和S7表)。评估利什曼原虫寄生虫与Ph相互作用的未来分析。帕帕塔西和卢。由于一些半乳糖凝集素在寄生虫建立和存活中起关键作用,因此可以更好地了解影响限制性与允许性载体能力的机制[101]。
在各沙蝇基因组中发现了8个与TGF-β或TGF-β通路相关的基因(S16表),在Lu的基因组中发现了15个和9个不同的MAPK基因位点。长睑和Ph。分别是帕帕塔西基因组(S10表)。有趣的是,在每个物种中鉴定出两个丙酚氧化酶同系物(S1表)。在两个Lu的基因组中也发现了TEP-5样蛋白和COX样直系同源物。长睑和Ph。帕帕塔西(S<>表)。
血液喂养基因。
我们绘制了Ph。帕帕塔西和卢。长睑推定唾液基因沉积在NCBI到沙蝇组件(S11表)。在静脉白蝇中同样研究的是与消化特性相关的基因[102-111]。在这里,我们表征了以下消化基因家族:肽酶(S12表);糖苷水解酶家族13(S13表);几丁质酶和几丁质酶样蛋白家族(S14表);N-乙酰己糖胺酶(S15表和S3图);甲壳素脱乙酰酶(S16表和S4图);和周营养蛋白样蛋白(S17表和S5图)。GH13基因(包括淀粉酶、麦芽糖酶和蔗糖酶)的详细分析已在别处发表[112]。水通道蛋白(AQP)是水和其他小溶质通过细胞膜运输所必需的,对于从血粉中排泄水分很重要。我们已经从两种沙蝇中鉴定了六个AQP基因(S18表和S6图)。这与蚊子的数量相似(N = 6),但分别比果蝇和舌蝇少113只和<>只[<>]。先前从昆虫中鉴定的每个AQP组的成员都存在于沙蝇基因组中。
昼夜节律基因。
在两个Lu的基因组中都发现了所有核心生物钟基因的直系同源物。长睑(S19表)和Ph。帕帕塔西(S20表)。有趣的是,隐花色素的进化一直是一个令人非常感兴趣的问题[48],我们同样在沙蝇CRY基因结构中发现了引人注目的特征。我们在Ph中发现了CRY1和CRY2基因。帕帕塔西 但令人惊讶的是,我们没有在Lu中发现CRY1基因。长睑基因组组装(S7图)。尽管这两种沙蝇物种密切相关,但这些数据表明,虽然Ph.帕帕塔西似乎有一个类似于蝴蝶、蚊子和其他双翅目动物的功能性哺乳动物时钟,具有CRY1和CRY2基因Lu。长睑可能有一个生物钟,其机制与锥螨、蜜蜂和甲虫的机制更相似,仅呈递CRY2基因。我们可以推测,CRY1在卢的可能损失。Longipalpis基因组可能与这些昆虫更好地适应生活在洞穴和黑暗的地方有关,或者,只是在当前的碎片化组装中缺失。
化学感觉受体。
沙蝇嗅觉受体(OR)、味觉受体(GR)和IR剧库已在别处发表[35]。基因组组装中的沙蝇OR库包含Lu中的139个规范OR。长睑和Ph。帕帕塔西,外加一个副本的气味受体辅受体Orco。91个基因编码77个GRs。长睑和88个基因编码Ph中的23个GR。在参考文献组装中鉴定出papatasi,在Lu中鉴定出28个和35个IR基因。长睑和Ph。帕帕塔西分别被确定。三个OR和三个IR怀疑在Lu中失踪。在现场分离株的从头组装中发现了Longipalpis参考组装[<>]。
在Lu中发现了瞬时受体电位(TRP)阳离子通道家族的九个和十个成员。长睑和Ph。帕帕塔西基因组和系统发育树分别显示出不同TRP亚科的分离(S8图)。扒手(PPK)受体系统发育树显示9个不同的PPK亚科(S14图)在Lu中分别有13个和<>个家族成员。长睑和Ph。帕帕塔西基因组,分别。
G蛋白偶联受体。
G蛋白偶联受体(GPCR)是一大类膜结合蛋白,它们在细胞信号转导中起作用,并与包括小分子、神经肽和蛋白质在内的多种化学物质相互作用。这些蛋白质在无脊椎动物的基本功能中发挥作用[114]。我们利用一种新的分类器来鉴定两个Ph中的昆虫GPCRs[115]。帕帕塔西和卢。Longipalpis,然后对已识别的基因进行验证和手动注释。来自Ph的92个和21个GPCR。帕帕塔西和卢。分别将长睑与其他具有良好特征的GPCR的昆虫(如D)进行比较。黑腹果,安。冈比亚,埃。埃及伊蚊和埃及伊蚊。人形(S50表)。A类(视紫红质样)是数量最多的一类,每只沙蝇中有~7个基因,包括被认为在视觉过程和昼夜节律中起作用的视蛋白。两种沙蝇的每个功能群都有一个视蛋白基因,即长波长、短波长、紫外线、rh20样和翼手蛋白。B类(促胰液素样),C类(代谢性谷氨酸样)和D类(非典型GPCRs)的成员较少,每只沙蝇分别为~10、~10和~<>。沙蝇包括D中不存在的GPCR基因。黑腹肌(眼部白化病)且在 Ae 中不存在。埃及伊蚊和安。冈比亚(甲状旁腺激素受体);两个基因都来自B类。
细胞色素P450单加氧酶基因。
细胞色素P450(CYP或P450)构成一个保守的酶超家族,具有多种功能,从核心发育途径到异生素的解毒[116]。CYP基因库(CYPome)在昆虫生理学和对用于病媒控制的杀虫剂的抗药性的发展中起着重要作用。在这里,我们在Lu中鉴定并手动策划了104个CYP基因。长睑(S1数据)和Ph中的93个CYP基因。帕帕塔西(S2数据)。这些数字与蚊子An中鉴定的CYP数量相似。冈比亚(n = 100)。在卢.长睑 所有104个CYP都是全长基因,而Ph中有34个全长基因和59个片段化基因。papatasi,可能反映了Ph的基因组组装更加碎片化。帕帕塔西与卢相比。长帕尔皮斯。
已鉴定的沙蝇CYP基因属于昆虫中常见的四个氏族;线粒体(Mito)、CYP2、CYP3和CYP4氏族[116]。值得注意的是,与An相比,这两种沙蝇物种都有扩大的CYP3氏族。冈比亚(S10图)。这种扩张主要是由CYP9J / 9L,CYP6AG和CYP6AK亚家族的增益引起的(S10图)。
其他组。
此外,我们在siRNA,miRNA和piRNA途径中鉴定了核心基因以及非编码RNA,这表明这些调节机制在沙蝇中功能齐全(S22表)。我们还注释了热休克和缺氧蛋白(S23表),角质蛋白(S24表),激素信号(S25表),胰岛素信号(S26表)和抗氧化剂(S27表)基因,以及参与维生素代谢的基因(S28表)。有关注释基因家族的其他信息,请参见 S1 结果。
人口结构
Ph 范围内的遗传结构。帕帕塔西。
平均基因组覆盖率范围为8X-16X(平均值= 12X;S29表)。共有 6,390,876 个站点使用变体调用方法通过了阈值,其中至少有一个样本在参考坐标处显示变体。不出所料,Ph.papatasi样本显示单核苷酸变体(SNV)计数最低(1.84-1.99M SNV),而两个Ph.贝格罗蒂样本(平均SNVs = 3.26M)和Ph.duboscqi样本(4.01M SNV)包含更高的变异计数(S30表)。我们在Ph中发现了一小部分单例(独特的SNV)。Papatasi样本(3.0%-4.3%)和3,482个共享变异等位基因。帕帕塔西样本。我们还计算了转变:转移率,近亲繁殖系数和成对相关性(S30表)。
对于系统发育分析,数据集仅保留最高质量的变体进行过滤,总共留下1,084,952个变体:阿富汗284,341个,埃及435,972个,突尼斯439,446个。用于人口结构推断的数据集被进一步修剪以消除连锁不平衡,创建了一个包含 423,236 个总变体的最终数据集。
我们通过在基因组中构建一棵NJ树来探索个体之间的祖先系统发育关系。新泽西树聚集了Ph。帕帕塔西个体分为与地理位置相关的三个分支,自举值为100(S11A图)。
使用外加剂来估计个体祖先。外加剂交叉验证误差(CV)表明,最能解释观察到的种群结构的遗传簇数量为K = 2(S12A图),其中阿富汗样本与突尼斯和埃及样本不同(S11C图)。
接下来,我们执行了PCA,它不依赖于任何模型假设,因此可以为外加剂分析的结果提供有用的验证。PCA支持系统发育分析,将个体分成三个不同的集群,来自收集地点的所有个体聚集在一起。主成分1和2占总变异的20.1%(S11B图)。
我们没有发现高F的直接重叠窗口圣田岛的D分很低。帕帕塔西人口。接下来,我们搜索了符合上述条件但包含 20 kb(窗口两侧各 10 kb)的窗口,以识别间接重叠。我们确定了29个属于间接重叠窗口的基因(S31表)。功能注释显示3个tRNA,3个推定的转录因子和一个snoRNA可能在选择压力下,以及9个参与代谢途径的基因。
卢内神秘物种的基因组证据。长睑鳞鲀。
平均基因组覆盖率范围从8X到105X(平均值= 47X;S32 表)。我们在所有个体中确定了4,821,847个变异。为了帮助对变体进行质量评估,按照pH值的描述进行过滤。帕帕塔西。过滤后,剩下1,937,819个变体,范围从Marajó的206,588到Jacobina的633,519(图1)。过滤和LD修剪后,数据集包含1,059,627个变体。
与基于化学感受器库的系统发育一致[35],全基因组系统发育根据歌曲和信息素类型将种群聚类为两个分支,其中Marajó和Sobral 2S(Burst,Sobralene)聚集在一起,Lapinha和Sobral 1S(脉冲,(S)-9-甲基锗烯-B)聚集在一起(图3A).对从Lapinha和Sobral收集的雄配求爱歌曲的分析与先前记录的一致[27]。在这三个重新采样的群体中,我们观察到Lapinha中的亚型P2,Sobral 3S中的亚型P1和Sobral 2S中的突发型。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 长睑卢佐米亚种群结构。
推断卢的种群结构。从Marajó(MAR;粉红色),Lapinha(LAP;蓝色),Jacobina(JAC;红色)和Sobral收集的longipalpis个体,包括Sobral 1S(S1S;橙色)和16个Sobral 2S(S2S;绿色)。(A)有根邻居连接(NJ)径向树。我们包括了两个N。中间(INT;黄色)和M。米戈内(MIG;紫色)并使用M。米戈内扎根树木。引导值表示 1,000 次重复的百分比。(B) 主成分分析。根据个体在前两个主成分(PC1和PC2)上的坐标绘制。(三)外加剂分析。外加剂模型的祖先比例从 K = 2 到 K = 7 个祖先种群。每个个体由一条细的垂直线表示,分为 K 个彩色段,代表个人对 K 簇的估计成员分数。这些数据是通过 CLUMPAK 分析得出的主要 q 矩阵簇的平均值。
https://doi.org/10.1371/journal.pntd.0010862.g003
有趣的是,系统发育分析将雅各比纳种群分为两组。正如预期的那样,因为已知来自雅各比纳的苍蝇表达 C16H32信息素和脉冲状交配歌曲,一些个体与Sobral 1S和Lapinha聚集在一起。然而,出乎意料的是,六个个体聚集了二萜样信息素和表达爆裂的歌曲,这表明在雅各比纳遗址有不止一个种群生活在同源中。没有为雅各比纳样本录制男配歌曲。然而,从雅各比纳附近的两个地方收集的沙蝇,阿拉奇和奥林迪纳(巴伊亚州)(S13A图)表现出不同的交配歌曲模式,表明雅各比纳可能存在两个群体,如分子数据所示。来自阿拉奇的雄性表现出P1交配歌曲模式(S13B图),由一系列相似的脉冲组成,如之前在雅各比纳收集的雄性中描述的[27]。来自附近地区Olindina的雄性产生了与Sobral 13S雄性相似的爆发型歌曲(S2B图)[27]。从这些苍蝇观察到的所有歌曲参数的平均值(S33表)与先前报道的相似[29]。
此外,系统发育分析表明Sobral 1S群体中的亚结构。然而,歌曲追踪并没有暗示任何形式的分裂。尽管分析表明有七个不同的种群,但没有足够的统计支持将六个雅各宾纳个体与Sobral 2S人群分开,导致支持六个种群。
基于全基因组的PCA也将个体分为六组(图3B)。然而,与系统发育分析相反,六个雅各宾纳个体紧密聚集,但与马拉霍和索布拉尔2S种群分开,这是无法区分的。PC1解释了5.3%的变异,并将从雅各比纳收集的个体分为两个群体。与NJ树一致,Sobral 1S种群也表现出一些种群结构,两个簇可以通过PC1和PC2区分。PC2占总变异的4.6%,并将Lapinha与其他种群区分开来。同源的Sobral 1S和2S群体由PC1和PC2分开。有趣的是,虽然与希克纳等人一致。2020年,全基因组PCA允许簇之间的区分能力高于基于化学感受器库的PCA,后者仅识别3-4个离散簇[35]。
在K = 7时,七个组与外加剂分析明显区别,与PCA,NJ树(图3C)和[35]一致。然而,交叉验证误差分析表明有3-4个种群(S12B图),一个种群由所有Marajó和Sobral 2S个体和8个雅各比纳个体组成,一个种群由7个雅各比纳个体组成,另一个种群由1个Sobral 1S个体组成。与新泽西树表明来自拉皮尼亚的个体构成一个种群相反,加剂分析表明所有拉皮尼亚个体和六个Sobral 1S个体具有相似的血统。分析表明,同源的Sobral 2S和<>S个体之间没有渗入。
为了确定有助于生殖隔离的候选基因组区域并区分两种物种形成模型,即有和没有基因流,计算了Marajó,Sobral 1S,Sobral 2S和Lapinha的成对差异度量。相对(威尔和科克汉姆的F圣)和绝对(内氏DXY) 计算所有总体比较(不包括雅各宾纳)的 1 kb 非重叠窗口的分歧度量。平均加权 F圣数值表明,在不同信息素和歌曲类型的群体比较中,全基因组分化更大(Lapinha-Marajó,0.214;拉皮尼亚-索布拉尔 2S,0.211;Sobral 1S-Sobral 2S,0.116与Lapinha-Sobral 1S相比,0.154;马拉霍-索布拉尔2S,0.114)和异域种群(拉皮尼亚-马拉霍,0.214;拉皮尼亚-索布拉尔 2S,0.211;Lapinha—Sobral 1S, 0.154 与 Sobral 1S-Sobral 2S, 0.116 相比) (S14 图)。
我们确定了可能导致群体分化的基因组区域为F圣对于不同信息素/歌曲表型的每个同源和异域比较,处于前 2.5% 分位数的异常值窗口(S15 图)。在所有不同的信息素和歌曲类型比较中,共有170个分化区域(图4A)。均值 F圣在多个比较共享的基因组区域中的估计值高于每个比较所特有的基因组区域,这表明在每种情况下,这些区域都是选择的目标。支持索布拉尔种群最近彼此分化的假设,F圣异常值窗口的平均值小于异域种群(图4B)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. 具有高成对 F 的基因组区域圣在长睑露佐米亚的不同种群之间。
(A)描述具有F 1 kb非重叠基因组窗口数量的维恩图圣不同总体比较中排名前 2.5% 的分位数(异常值)中的值。(B) 异常值 F 的箱形图圣与其他总体比较共享的窗口(蓝色)或总体比较的唯一窗口(粉红色)。箱形图显示中位数(线)和四分位数间距(箱形);晶须从箱形图延伸到四分位数间距的 1.5 倍,超出此限制的值用点表示。均值 F圣值由开放菱形表示。
https://doi.org/10.1371/journal.pntd.0010862.g004
我们通过在每个窗口中计算额外的统计数据来进一步表征基因组区域。我们通过在1 kb非重叠窗口中计算田岛的D来测试这些区域是否富集了选择特征,田岛D的负值表明潜在的选择性扫描。与 F 一样圣值,我们将异常值窗口视为位于下限或上部 2.5% 分位数的窗口(S16 图)。田岛的D异常值窗口绝大多数对每个种群都是唯一的(S17图)。四个群体之间没有正异常值窗口重叠(S17A图),所有群体之间只有四个负异常值窗口共享(S17B图),其中只有一个包含未知功能的基因LLOJ005792。田岛的 D 异常值窗口均未与异常值 F 重叠圣窗户。
由于背离的绝对度量受种群内多态性水平的影响小于相对分歧度量,如F圣 [117],我们计算了Nei的绝对背离度量,DXY,作为选择的附加签名。正如预期的那样,由于这些种群被认为最近彼此分化,因此前2.5%的D。XY值大大低于异常值 F圣窗口(图5A)。大多数异常值 F圣值未落在 D 的上分位数XY值(表2)和具有最高D的窗口XY值未与 F 重叠圣异常值窗口(图5B),表明每个种群内可能存在不同程度的遗传多样性。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. 1 kb非重叠基因组窗口在不同长睑Lutzomyia 种群之间的差异测量。
(A) D 的箱线图XY和 F圣每个总体比较的前 2.5% 分位数(异常值)中的值。(B) D 的箱线图XY和 F圣同时具有高 D 的窗口的值XY和高 F圣(分化岛)。(C) 分化岛的田岛 D 值箱形图。(D) 分化岛内地点的FLK值箱线图。箱形图显示中位数(线)和四分位数间距(箱形);晶须从箱形图延伸到四分位数间距的 1.5 倍,超出此限制的值用点表示。平均值由开口菱形表示。
https://doi.org/10.1371/journal.pntd.0010862.g005
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 2. 长睑露佐米亚分化岛 (DI) 统计。
https://doi.org/10.1371/journal.pntd.0010862.t002
为了确定可能导致这些群体生殖隔离的基因组位点[39],我们将“感兴趣区域”定义为那些落在F的2.5%分位数上部的窗口。圣和 DXY值。Lapinha-Marajó、Lapinha-Sobral 729S、Marajó-Sobral 841S和Sobral 740S-Sobral 1023S之间分别有2、1、1和2个感兴趣区域(表2)。在我们解释为“分化岛”(DI)的所有人口比较中共享的92个感兴趣区域。
我们通过计算这些窗口的田岛D并使用HapFLK v. 85.1 [4]进行单标记FLK测试[86]来测试DI是否富集用于选择签名。田岛的D(图5C)和FLK(图5D)值没有提供证据证明选择(平衡或正)导致了这些区域的基因组差异。
DI中存在的基因是可能解释种群生殖隔离的候选者。92个DI包含35个基因,其中25个在An中具有直系同源物。冈比亚(S34表)。其中001208个基因未被表征,LLOJ16是MAK009447蛋白同源物,LLOJ6是rRNA腺嘌呤N(009732)-甲基转移酶,LLOJ<>是脂肪酶成熟因子。使用AN未鉴定出基因本体学术语的富集。冈比亚直系同源物。
结论
我们的研究提供了两种不同沙蝇物种的基因组组装和注释,这将有助于对这些医学上重要的载体进行分子和比较研究。这些结果为注释和分析未来由单只沙蝇产生的染色体长度组件提供了基础。沙蝇载体之间的全球比较将极大地为这些物种之间的进化关系提供信息,并导致我们对参与重要现象(如载体容量、宿主特异性、血液喂养、杀虫剂抗性和免疫系统调节)的基因的理解取得进展。
支持信息
用于手动批注的方法。
显示 1/55: pntd.0010862.s001.docx
跳到无花果共享导航
两种利什曼原虫载体的基因组分析:补充方法。|2022 年 1 月 |版本 <>两只金血沙蝇的基因组分析向量利什曼原虫来自新旧世界补充方法:手动注释方法可转座元素长终端重复Psiblast用于从推导的编码中构建反向位置特定矩阵来自TEFAM和REPBASE中发现的转座元素的序列[1]数据库。这查询沙蝇基因组(50 KB片段,包含10 KB的前一个片段)针对此数据库使用工具 RPSblast[2]E 值截止值为 1E-15。这>800 NT的火柴坐标扩展了500 NT,以包括侧翼区域。包含基因组支架名称以及 n1 和 n2 扩展坐标的最终文件是排序并融合了重叠的坐标。这个压缩的坐标表是最后用于检索推定的转座元素作为 fastA 文件。序列是在终端反转重复 (TIR) 序列处修整,或者在编码序列处进行修整当找不到重复时。根据保守域数据库对域进行分类[3]和完整的长度 用于进行系统发育分析的逆转录酶-核糖核酸酶 H 区这允许将序列进一步分类为家族。不同长末端重复序列(LTR)超家族的分类基于以下系统发育分析。全长逆转录酶结构域与参考文献对齐属于主要 LTR 超家族的序列,由 Mafft 算法实现http://mafft.cbrc.jp/alignment/server/[4]和手动地编辑在超级5[5].1123456789101112131415161718192021222324
两种利什曼原虫载体的基因组分析:补充方法。|2022 年 1 月 |版本 <>非长端子重复使用TEseeker[6]我们检索了假定的非LTR元素。要注释这些我们为每个推定元素诗句执行了系统树构建先前已知的来自其他昆虫基因组的代表性非LTR,并分配一个分支。我们还使用 ClustalW 进行聚类[7]所有推定和所有带注释的元素,以及分支内和整体内其他生物的代表。我们考虑了蛋白质与一个元素 80% 相同的序列,并进行手动校正,我们构建了一个80%相同元素的共识序列。然后,我们利用这个共识序列来对基因组中每个元素的拷贝数进行最终计数,并估计基因组覆盖率百分比。微型反重复转座元件重复建模器[8]小于 500 bp 的输出用作运行 BLAST 的查询反对基因组组装。前 20 名热门歌曲与其侧翼序列一起检索(每侧 500 个基点)。这些序列使用ClustalW进行比对[7]以揭示 TE边界、TIR和目标站点重复是微型倒置的特征重复转座元素 (MITE)。对初始 MITE 候选对象进行了自我爆炸使用总体 80% 标识的截止值来消除冗余。发现短插核元件 (SINE),小于 500 bp 且与 tRNA 相似的序列选择其它聚合酶III启动子。元素边界,目标站点重复并且作为SINE特征的3'末端的串联重复也由前 20 名点击的克罗斯塔尔对齐。消化基因肽酶、GHF13 和 GHF18肽酶和糖苷水解酶家族 (GHF)(定义见沙蝇基因组中的MEROPS和CAZy数据库分别使用以下方法进行表征225262728293031323334353637383940414243444546474849
1 / 55
下载
无花果分享
S1 方法。 用于手动批注的方法。
https://doi.org/10.1371/journal.pntd.0010862.s001
(文档)
S1 结果。 注释基因家族的详细信息。
https://doi.org/10.1371/journal.pntd.0010862.s002
(文档)
S1 表。 程序集统计信息。
https://doi.org/10.1371/journal.pntd.0010862.s003
(文档)
S2 表。 布斯科分析。
https://doi.org/10.1371/journal.pntd.0010862.s004
(文档)
S3 表。 RNAseq样本。
https://doi.org/10.1371/journal.pntd.0010862.s005
(三十)
S4 表。 收费路径注释。
https://doi.org/10.1371/journal.pntd.0010862.s006
(四十一)
S5 表。 昆虫免疫缺陷通路注释。
https://doi.org/10.1371/journal.pntd.0010862.s007
(三十)
S6 表。 JakStat通路注释。
https://doi.org/10.1371/journal.pntd.0010862.s008
(三十)
S7 表。 半乳糖凝集素家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s009
(四十一)
S8 表。 转换生长因子-β家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s010
(三十)
S9 表。 丝裂原活化蛋白激酶家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s011
(三十)
S10 表。 丙酚氧化酶家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s012
(三十)
S11 表。 唾液蛋白注释。
https://doi.org/10.1371/journal.pntd.0010862.s013
(四十一)
S12 表。 肽酶注释。
https://doi.org/10.1371/journal.pntd.0010862.s014
(英文)
S13 表。 糖苷酶水解酶家族13注释。
https://doi.org/10.1371/journal.pntd.0010862.s015
(三十)
S14 表。 几丁质酶家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s016
(三十)
S15 表。 己糖胺苷酶家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s017
(四十一)
S16 表。 几丁质酶脱乙酰酶家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s018
(四十一)
S17 表。 周营养蛋白家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s019
(四十一)
S18 表。 Aquoporin家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s020
(三十)
S19 表。 长睑睑昼夜节律通路注释。
https://doi.org/10.1371/journal.pntd.0010862.s021
(文档)
S20 表。 帕帕塔西静脉节律通路注释。
https://doi.org/10.1371/journal.pntd.0010862.s022
(文档)
S21 表。 G蛋白偶联受体家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s023
(三十)
S22 表。 微核糖核酸注释。
https://doi.org/10.1371/journal.pntd.0010862.s024
(四十一)
S23 表。 热休克和缺氧基因家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s025
(三十)
S24 表。 角质层蛋白基因家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s026
(三十)
S25 表。 幼年激素家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s027
(三十)
S26 表。 胰岛素信号通路注释。
https://doi.org/10.1371/journal.pntd.0010862.s028
(三十)
S27 表。 抗氧化剂家族注释。
https://doi.org/10.1371/journal.pntd.0010862.s029
(三十)
S28 表。 维生素代谢途径注释。
https://doi.org/10.1371/journal.pntd.0010862.s030
(三十)
S29 表。 帕帕塔西静脉虫群体测序中位覆盖深度。
https://doi.org/10.1371/journal.pntd.0010862.s031
(三十)
S30 表。 帕帕塔西鹦鹉种群变异汇总统计。
https://doi.org/10.1371/journal.pntd.0010862.s032
(三十)
S31 表。 帕帕塔西 F圣-田岛的D重叠(包括10kb的上游和下游)。
https://doi.org/10.1371/journal.pntd.0010862.s033
(XLSX)
S32 Table. Lutzomyia longipalpis population sequencing median coverage depth.
https://doi.org/10.1371/journal.pntd.0010862.s034
(三十)
S33 表。 来自阿拉奇和奥林迪纳的Lutzomyia longipalpis的男配歌曲的参数值。
https://doi.org/10.1371/journal.pntd.0010862.s035
(文档)
S34 表。 分化岛内的长睑露脊髓菌基因。
https://doi.org/10.1371/journal.pntd.0010862.s036
(三十)
S1 图 相互矛盾的系统发育信号。
对单个直系同源群的基因系统发育的分析确定了沙蝇-蚊子(41%)、沙蝇-蝇(37%)或蚊蝇(22%)姊妹进化枝的三种主要拓扑结构。对每种拓扑的平均分支长度的比较表明,尽管苍蝇的取代率总是较高,但支持沙蝇-蚊子拓扑的直系同源物在苍蝇中的取代率最低,苍蝇、沙蝇和蚊子分支之间的取代率差异最小。相比之下,沙蝇-蝇和蚊蝇拓扑结构在苍蝇中的取代率要高得多,而三个分支之间的取代率差异要大得多。
https://doi.org/10.1371/journal.pntd.0010862.s037
(提夫)
S2 图 沙蝇半乳糖凝集素蛋白序列的聚类。
描述沙蝇半乳糖凝集素蛋白序列聚类的缩聚邻接树(P.帕帕塔西和卢。长睑;分别是开放和填充的正方形),蚊子(Ae。埃及伊蚊和安。冈比亚;分别是开放圆圈和填充圆圈)、飞(D.黑腹肌;实心三角形)、东部牡蛎(C.弗吉尼亚;倒置的开放三角形)和淡水蜗牛(B.光棍;倒置的填充三角形)。包含共享直系同源物的分支以蓝色阴影突出显示。沙蝇特定的簇和基因由橙色阴影突出显示。进化距离是使用p距离法计算的,并且以每个位点的氨基酸差异数为单位。执行了一千次自举重复,仅显示至少显示 50% 置信度的分支。
https://doi.org/10.1371/journal.pntd.0010862.s038
(提夫)
S3 图 描述沙蝇n-乙酰己糖胺苷酶蛋白序列聚类的浓缩邻域连接树(P.帕帕塔西和卢。长睑;分别是开放和填充的正方形),蚊子(Ae。埃及伊蚊和安。冈比亚;分别是开放圆圈和填充圆圈)、飞(D.黑腹肌;填充三角形)和甲虫(T.卡斯塔尼;填充钻石)。
包含属于I-IV组n-乙酰己糖胺酶的序列的分支以蓝色阴影突出显示。沙蝇特定的簇由橙色阴影突出显示。进化距离是使用p距离法计算的,并且以每个位点的氨基酸差异数为单位。执行了一千次自举重复,仅显示至少显示 50% 置信度的分支。
https://doi.org/10.1371/journal.pntd.0010862.s039
(提夫)
S4 图 描述沙蝇甲壳素脱乙酰酶催化结构域序列聚类的缩聚邻接树(P.帕帕塔西和卢。长睑;分别是开放和填充的正方形),蚊子(Ae。埃及伊蚊和安。冈比亚;分别是开放圆圈和填充圆圈)、飞(D.黑腹肌;填充三角形)和甲虫(T.卡斯塔尼;填充钻石)。
包含属于组 1-5 和 9 CDA 的序列的分支以蓝色阴影突出显示。进化距离是使用p距离法计算的,并且以每个位点的氨基酸差异数为单位。执行了一千次自举重复,仅显示至少显示 50% 置信度的分支。
https://doi.org/10.1371/journal.pntd.0010862.s040
(提夫)
S5 图 描述沙蝇之间营养蛋白CBD域相似性的浓缩最大似然树P。帕帕塔西和卢。长面甲虫和红面甲虫T.卡斯塔尼姆。
开放方块、实心方块和实心菱形表示 P。帕帕塔西,卢.隆基帕尔皮斯和T.分别是卡斯塔尼姆域。T专属的分支机构。卡斯塔内姆用洋红色编码;那些特定于沙蝇的用蓝色突出显示。包含类似CBD的域“CBDput”的分支以绿色突出显示。沙蝇和RFB CBD域共享的分支以橙色颜色编码。最大似然树是使用惠兰和戈德曼(WAG)模型构建的,伽马分布在不变位点(G+I)中,如Mega6软件的模型测试函数所示。执行了一千次自举重复,仅显示至少显示 50% 置信度的分支。
https://doi.org/10.1371/journal.pntd.0010862.s041
(提夫)
S6 图 比较其他苍蝇预测的水通道蛋白。
使用MEGA6使用Dayhoff模型和成对匹配生成邻接树;分支值表示支持以下 3000 个引导程序;省略低于 50% 的值。
https://doi.org/10.1371/journal.pntd.0010862.s042
(提夫)
S7 图 含Lu的脊椎动物和无脊椎动物光解酶的分子系统发育分析。长睑和P.帕帕塔西基因模型。
不同的光离子显示在右侧。进化历史是通过使用基于琼斯-泰勒-索顿+四个伽马类别的最大似然法推断的,有1000个自举重复(仅显示65个以上)。带有正方形的序列是脊椎动物隐色素(黑色-cry-4,白色-cry-1,cry-2和cry-3);带有黑色菌株的序列代表(6-4)昆虫光解酶;带有倒黑色三角形的序列正在回复所有昆虫光解酶 Repir 蛋白;带有点符号的序列显示昆虫隐色(黑色-CRY-1,白色-CRY-2)。虚线箭头指向 P。帕帕塔西光解酶序列和直箭头到卢。长睑光解酶序列。
https://doi.org/10.1371/journal.pntd.0010862.s043
(提夫)
S8 图 卢的分子系统发育分析.隆基帕尔皮斯,P.帕帕塔西和D.黑腹肌TRP 通道序列。
不同的 TRP 亚族显示在右侧。进化历史是通过使用基于惠兰和Goldman +Freq.模型的最大似然法推断的,该模型具有1000个自举重复。
https://doi.org/10.1371/journal.pntd.0010862.s044
(提夫)
S9 图 卢的分子系统发育分析.隆基帕尔皮斯,P.帕帕塔西和D.黑腹肌PPK 序列。
不同的 PPK 子族显示在右侧。进化历史是通过使用基于惠兰和Goldman +Freq.模型的最大似然法推断的,该模型具有1000个自举重复。
https://doi.org/10.1371/journal.pntd.0010862.s045
(提夫)
S10 图 人工策划的CYP在沙蝇中的最大可能性系统发育。长睑(名称以蓝色显示)和Ph。帕帕塔西(名字以红色显示)。
蚊子A的CYPome。冈比亚(名称以橙色显示)作为参考,而该树则以人类CYP51A1作为外群扎根。所有四个昆虫CYP氏族都得到了良好的支持,自举值>95%。叶子代表Lu中的CYP9J / 9L,CYP6AG和CYP6AK扩展。长睑和Ph。帕帕塔西分别用青色、灰色和绿色突出显示。四种不同的昆虫CYP氏族中的每一个的分支颜色不同;水户氏族—青色,CYP2氏族—金色,CYP3氏族—绿色,CYP4氏族—橙色。
https://doi.org/10.1371/journal.pntd.0010862.s046
(提夫)
S11 图 帕帕塔西痣蝽种群结构。
P.从阿富汗(PPAFG;绿色)、北西奈-埃及(PPNS;紫色)和突尼斯(PPTUN;橙色)收集的papatasi个体。(a) 系统发育分析。用 R 的 Adegenet 和 Appe 包生成的根邻居连接 (NJ) 径向树。我们包括了两个P。贝格罗蒂(PBRG;黑人)和P.duboscqi(PDMA;灰色),并使用P。杜博斯奇扎根树木。引导值表示 1,000 次重复的百分比。(B) 主成分分析。根据个体在前两个主分量(PC1 和 PC2)上的坐标绘制个体。(三)外加剂分析。外加剂模型的祖先比例从 K = 2 到 K = 7 个祖先种群。每个个体由一条细的垂直线表示,分为 K 个彩色段,代表个人对 K 簇的估计成员分数。这些数据是通过 CLUMPAK 分析得出的主要 q 矩阵簇的平均值。
https://doi.org/10.1371/journal.pntd.0010862.s047
(提夫)
S12 图 外加剂交叉验证错误。
每个 K 值的 30 个重复中每个重复的交叉验证误差的小提琴图。(A) 帕帕塔西静脉瘤种群。(B)长睑露脊髓菌种群。
https://doi.org/10.1371/journal.pntd.0010862.s048
(提夫)
S13 图 来自阿拉奇和奥琳达的男配求爱歌曲。
(A)阿拉奇和奥林达与雅各比纳的大致距离(B)。从阿拉奇和奥林迪纳收集的雄配求偶歌曲追踪。该图显示了每种情况下 ~1 秒的歌曲。主地图来源:世界影像(资料来源:Esri、Maxar、地星地理和 GIS 用户社区;http://goto.arcgisonline.com/maps/World_Imagery)。插图来源:World Dark Gray Canvas Base(Esri、HERE、Garmin、OpenStreetMap 贡献者和 GIS 用户社区;http://goto.arcgisonline.com/maps/Canvas/World_Dark_Gray_Base)。
https://doi.org/10.1371/journal.pntd.0010862.s049
(提夫)
S14 图 成对 F 的分布图圣在长睑露佐米亚的不同种群之间。
加权 F圣对于每个群体比较,在整个基因组中计算1kb非重叠窗口的值。
https://doi.org/10.1371/journal.pntd.0010862.s050
(提夫)
S15 图 成对F的曼哈顿图圣在长睑露佐米亚的不同种群之间。
红色水平线表示 F 的上部 0.05%圣分布在整个基因组中。
https://doi.org/10.1371/journal.pntd.0010862.s051
(提夫)
S16 图 Tajimas'D的曼哈顿地块,每个Lutzomyia longipalpis种群。
红色和蓝色水平线分别表示田岛D分布的上部和下部0.05%。
https://doi.org/10.1371/journal.pntd.0010862.s052
(提夫)
S17 图 具有高(异常值)Tajimas'D的基因组区域,用于不同种群的Lutzomyia longipalpis。
(A)维恩图总结了1kb基因组窗口的数量,Tajimas'D值位于不同群体的上2.5%。(B)维恩图总结了1kb基因组窗口的数量,Tajimas'D值在不同群体中较低的2.5%。
https://doi.org/10.1371/journal.pntd.0010862.s053
(提夫)
S1 数据。 帕帕塔西静脉瘤CYPome fasta 文件。
使用文本编辑器打开。
https://doi.org/10.1371/journal.pntd.0010862.s054
(法斯塔)
S2 数据。 长睑露佐米亚CYPome fasta 文件。
使用文本编辑器打开。
https://doi.org/10.1371/journal.pntd.0010862.s055
(法斯塔)
确认
我们的两位合作者,Alexandre A. Peixoto博士(2013年2021月)和Hector M. Diaz Albiter博士(<>年<>月)对这个项目很有影响力,但在工作完成之前就去世了。我们将这份手稿献给他们,以表彰他们对这项工作和整个媒介疾病界的贡献。此外,还要感谢桑德拉·克利夫顿(Sandra Clifton),他在工作中发挥了重要作用,但在完成之前就退休了,以及丹尼尔·劳森(Daniel Lawson),他在项目的初始阶段发挥了重要作用,同时是VectorBase的工作人员。作者感谢华盛顿大学基因组中心和贝勒医学院人类基因组测序中心的测序团队成员在生成原始序列数据方面所做的努力。
引用
1.Desjeux P. 利什曼病:现状和新观点。比较免疫学,微生物学和传染病。2004;27(5):305–18.pmid:15225981。
查看文章PubMed/NCBI谷歌学术搜索
2.Alvar J, Velez ID, Bern C, Herrero M, Desjeux P, Cano J, et al.全球利什曼病及其发病率的全球估计。普洛斯一。2012;7(5):e35671.pmid:22693548。
查看文章PubMed/NCBI谷歌学术搜索
3.琼斯CM,韦尔本SC.东非以外的利什曼病。兽医科学 2021;8:618766.Epub 20210226。pmid:33732738。
查看文章PubMed/NCBI谷歌学术搜索
4.世卫组织世卫组织关于全球监测易流行传染病的报告。2000.
查看文章谷歌学术搜索
5.拉马略-奥尔蒂高 M, 萨拉瓦 EM, 特劳布-切科 YM.沙蝇互动:长期关系不一定容易。开放的寄生虫学杂志。2010;4:195–204.pmid:24159365。
查看文章PubMed/NCBI谷歌学术搜索
6.Maroli M,Feliciangeli MD,Bichaud L,Charrel RN,Gradoni L. Phlebotomine白蛉和利什曼病和其他公共卫生关注疾病的传播。Med Vet Entomol.2013;27(2):123–47.Epub 20120827。PMID:22924419。
查看文章PubMed/NCBI谷歌学术搜索
7.Sacks D,Kamhawi S.利什曼病中寄生虫 - 载体和载体 - 宿主相互作用的分子方面。微生物学年鉴。2001;55:453–83.pmid:11544364。
查看文章PubMed/NCBI谷歌学术搜索
8.Esseghir S,Ready PD. Larroussius亚属的白蛉的形态与地中海次区域的中新世-上新世晚期干旱化相吻合。林奈学会生物学杂志。2000;70:189–219.
查看文章谷歌学术搜索
9.Esseghir S,Ready PD,Killick-Kendrick R,Ben-Ismail R.利什曼原虫大静脉开口载体的线粒体单倍型和系统地理学。昆虫分子生物学. 1997;6(3):211–25.PMID:9272439。
查看文章PubMed/NCBI谷歌学术搜索
10.Lainson R, Ward RD, Shaw JJ. 新热带内脏利什曼病的病原体利什曼原虫的实验性传播,由白蛉 Lutzomyia longipalpis.自然界。1977;266(5603):628–30.pmid:859627。
查看文章PubMed/NCBI谷歌学术搜索
11.梅斯科娃 J, 斯沃博多娃 M, 贝弗利 SM, 沃尔夫 P.利什曼原虫在放任性沙蝇中脂质聚糖非依赖性发展。微生物感染。2007;9(3):317–24.pmid:17307009。
查看文章PubMed/NCBI谷歌学术搜索
12.基利克-肯德里克·金丝蝇沙蝇的生物学与防治.克林皮肤托尔。1999;17(3):279–89.pmid:10384867。
查看文章PubMed/NCBI谷歌学术搜索
13.Yeates DK,Wiegmann BM.一致性和争议:迈向双翅目更高水平的系统发育。安努·恩托莫尔。1999;44:397–428.PMID:15012378。
查看文章PubMed/NCBI谷歌学术搜索
14.Wiegmann BM, Trautwein MD, Winkler IS, Barr NB, Kim JW, Lambkin C, et al.生命飞树中的偶发辐射。美国国家科学院院刊, 2011;108(14):5690–5.噗嗤:21402926。
查看文章PubMed/NCBI谷歌学术搜索
15.Simon S,Narechania A,Desalle R,Hadrys H.昆虫系统发育组学:使用新的转录组学数据探索不一致的来源。基因组生物学和进化。2012;4(12):1295–309.pmid:23175716。
查看文章PubMed/NCBI谷歌学术搜索
16.冰壶GR,莫尔顿JK。从核DNA序列推断的心理亚科(双翅目:Psychodidae)的系统发育,并回顾了关系的形态学证据。系统恩托莫尔。2012;37(3):603–16.
查看文章谷歌学术搜索
17.Akhoundi M, Kuhls K, Cannet A, Votypka J, Marty P, Delaunay P, et al.利什曼原虫寄生虫和白蛉的分类、进化和传播的历史概述。公共科学图书馆 2016;10(3):e0004349.Epub 2016/03/05.pmid:26937644。
查看文章PubMed/NCBI谷歌学术搜索
18.Hamarsheh O. 利什曼原虫主要合子与帕帕塔西沙蝇种群的关系分布。寄生虫和媒介。2011;4:9.PMID:21266079。
查看文章PubMed/NCBI谷歌学术搜索
19.Colacicco-Mayhugh MG,Masuoka PM,Grieco JP。中东亚历山大蝴蝶和P. papatasi(双翅目:Psychodidae)的生态位模型。国际健康地理学杂志。2010;9.Artn 210.1186/1476-072x-9-2。密码:20089198
查看文章PubMed/NCBI谷歌学术搜索
20.Depaquit J, Lienard E, Verzeaux-Griffon A, Ferte H, Bounamous A, Gantier JC, et al.从ND4 mtDNA和ITS2 rDNA推断的不同地理群体中的分子同质性 帕帕塔西(双翅目,Psychodidae)流行病学后果。感染基因埃沃尔。2008;8(2):159–70.pmid:18243814。
查看文章PubMed/NCBI谷歌学术搜索
21.Hamarsheh O,Presber W,Abdeen Z,Sawalha S,Al-Lahem A,Schonian G.通过线粒体细胞色素b单倍型分析的白蛉Phlebotomus papatasi地中海种群的遗传结构。Med Vet Entomol.2007;21(3):270–7.pmid:17897368。
查看文章PubMed/NCBI谷歌学术搜索
22.Hamarsheh O,Presber W,Al-Jawabreh A,Abdeen Z,Amro A,Schonian G.Phlebotomus papatasi(双翅目:Psychodidae)的分子标记及其对群体遗传分析的有用性。Trans R Soc Trop Med Hyg.2009;103(11):1085–6.pmid:19303124。
查看文章PubMed/NCBI谷歌学术搜索
23.Hamarsheh O, Presber W, Yaghoobi-Ershadi MR, Amro A, Al-Jawabreh A, Sawalha S, et al.通过微卫星变异揭示的利什曼原虫主要病媒帕帕塔西的种群结构和地理细分。Med Vet Entomol.2009;23(1):69–77.pmid:19239616。
查看文章PubMed/NCBI谷歌学术搜索
24.弗兰利 CM, 拉马略-奥尔蒂高 M, 库蒂尼奥-阿布雷乌四世, 穆克贝尔 R, 哈纳菲 HA, 埃尔-霍萨里 SS, 等.基于线粒体细胞色素b单倍型的埃及和约旦帕帕塔西沙蝇群体遗传学分析.寄生虫和媒介。2018;11(1):214.Epub 2018/03/29.pmid:29587873。
查看文章PubMed/NCBI谷歌学术搜索
25.Khalid NM,Aboud MA,Alrabba FM,Elnaiem DE,Tripet F.来自苏丹的Phlebotomus papatasi人群中微地理尺度遗传分化的证据。寄生虫和媒介。2012;5:249.pmid:23146340。
查看文章PubMed/NCBI谷歌学术搜索
26.荒木AS, 费雷拉 GE, 马佐尼 CJ, 索萨纳, 马查多 RC, 布鲁诺 RV 等.巴西长睑 Lutzomyia longipalpis 复合体同源和异域兄弟姐妹物种的分化和渗入的多位点分析。公共科学图书馆忽视了热带疾病。2013;7(10):e2495.Epub 2013/10/23.pmid:24147172。
查看文章PubMed/NCBI谷歌学术搜索
27.Souza NA, Vigoder FM, Araki AS, Ward RD, Kyriacou CP, Peixoto AA.巴西六个种群中Lutzomyia longipalpis的交配求偶歌曲分析。J 医学恩托莫尔。2004;41(5):906–13.Epub 2004/11/13.pmid:15535620。
查看文章PubMed/NCBI谷歌学术搜索
28.荒木AS, 维戈德FM, 包泽LG, 费雷拉GE, 索萨NA, 阿劳霍IB, et al.巴西长睑露脊髓菌种群的分子和行为分化(双翅目:Psychodidae:Phlebotominae)。公共科学图书馆忽视了热带疾病。2009;3(1):e365.Epub 2009/01/28.pmid:19172187。
查看文章PubMed/NCBI谷歌学术搜索
29.Vigoder FM, Souza NA, Brazil RP, Bruno RV, Costa PL, Ritchie MG, et al.巴西长睑露脊髓复合体兄弟物种之间情歌性状的表型分化。寄生虫和媒介。2015;8:290.Epub 2015/05/29.PMID:26017472。
查看文章PubMed/NCBI谷歌学术搜索
30.Vigoder FM,Araki AS,Carvalho AB,Brazil RP,Ritchie MG。 晚餐和表演:来自巴西拉皮尼亚的男配求偶歌和女性血液喂养在Lutzomyia longipalpis生殖成功中的作用。感染基因埃沃尔。2020;85:104470.Epub 2020/08/09.pmid:32763442。
查看文章PubMed/NCBI谷歌学术搜索
31.冈萨雷斯 马, 贝尔 M, 索萨 CF, 马西尔德弗雷塔斯 R, 巴西 RP, 考特尼 O, 等.长叶利什曼原虫的南美沙蝇载体Lutzomyia longipalpis的合成性聚集信息素可远距离吸引雄性和雌性。公共科学图书馆忽视了热带疾病。2020;14(10):e0008798.密码:33079936
查看文章PubMed/NCBI谷歌学术搜索
32.汉密尔顿 JG, 马因贡路, 亚历山大 B, 沃德路, 巴西 RP.分析来自巴西六个地区的个体雄性长睑白蛉的性信息素提取物。Med Vet Entomol.2005;19(4):480–8.Epub 2005/12/13.pmid:16336313。
查看文章PubMed/NCBI谷歌学术搜索
33.Hamilton JG,Ward RD.来自Lutzomyia pessoai(双翅目:Psychodidae)的假定性信息素的化学分析。热带医学和寄生虫学年鉴。1994;88(4):405–12.Epub 1994/08/01.PMID:7979628。
查看文章PubMed/NCBI谷歌学术搜索
34.汉密尔顿 JGC, 沃德 RD, 多尔蒂 MJ, 迈尼翁 R, 庞塞 C, 庞塞 E, 等.洪都拉斯和哥斯达黎加内脏和非典型皮肤利什曼病地区的长睑露脊髓菌(双翅目:Psychodidae)的性信息素成分比较。热带医学和寄生虫学年鉴。1996;90(5):533–41.密码:8915130
查看文章PubMed/NCBI谷歌学术搜索
35.希克纳PV, Timoshevskaya N, Nowling RJ, Labbé F, Nguyen AD, McDowell MA, et al.静脉沙蝇中流的分子特征。公共科学图书馆负理论 2020;14(12):e0008967.Epub 20201228。PMID:33370303。
查看文章PubMed/NCBI谷歌学术搜索
36.Palframan MJ,Bandi KK,Hamilton JGC,Pattenden G. Sobralene,一种新的性聚集信息素和紫杉二烯合酶级联的可能分流代谢物,由沙蝇Lutzomyia longipalpis物种复合体的成员产生。四面体 2018;59(20):1921–3.Epub 2018/05/22.pmid:29780183。
查看文章PubMed/NCBI谷歌学术搜索
37.冈萨雷斯-卡瓦列罗 N, 罗德里格斯-维加 A, 迪亚斯-洛佩斯 G, 巴伦苏埃拉 JG, 里贝罗 JM, 卡瓦略 PC 等.甲羟戊酸途径酶在长睑 Lutzomyia (Diptera:Psychodidae) 性信息素腺中的表达通过综合蛋白质组学方法证明。蛋白质组学杂志。2014;96:117–32.Epub 2013/11/05.PMID:24185139。
查看文章PubMed/NCBI谷歌学术搜索
38.Palframan MJ, Bamdi KK, Hamilton JGC, Pattenden G. 酸催化白蛉信息素索布拉烯重排为黄萎缩烯,巩固其与紫杉烷类和磷脂素的关系。辛莱特。2019;30(16):1899–903.
查看文章谷歌学术搜索
39.Souza NA, Andrade-Coelho CA, Vigoder FM, Ward RD, Peixoto AA.巴西长翅目Lutzomyia longipalpis s.l.(双翅目:Psychodidae)的同源和异域巴西种群之间的生殖隔离。梅姆·奥斯瓦尔多·克鲁兹。2008;103(2):216–9.Epub 2008/04/22.pmid:18425278。
查看文章PubMed/NCBI谷歌学术搜索
40.Ward RD,Ribeiro AL,Ready PD,Murtagh A.不同形式的Lutzomyia longipalpis(Lutz & Neiva),(Diptera:Psychodidae),利什曼原虫donovani chagasi Cunha和Chagas的载体及其对南美洲Kala-Azar分布的意义。奥斯瓦尔多·克鲁兹研究所的纪念馆。1983;78:269–80.
查看文章谷歌学术搜索
41.Boulanger N, Lowenberger C, Volf P, Ursic R, Sigutova L, Sabatier L, et al.由细菌或原生动物寄生虫利什曼原虫重症攻击诱导的沙蝇的防御素的特征。感染免疫. 2004;72(12):7140–6.PMID:15557638。
查看文章PubMed/NCBI谷歌学术搜索
42.泰莱里亚 EL, 圣安娜先生, 阿尔库尔比莫, 皮塔卢加安, 狄龙 RJ, 特劳布-切科 YM.细菌喂养、利什曼原虫感染和不同的感染途径诱导长睑 Lutzomyia 中不同的防御素表达。寄生虫和媒介。2013;6:12.噗:23311993。
查看文章PubMed/NCBI谷歌学术搜索
43.Telleria EL, Tinoco-Nunes B, Le?tinová T, de Avellar LM, Tempone AJ, Pitaluga AN, et al. 抗菌肽:发育过程中的差异表达以及与微生物群和微生物的载体相互作用的潜在参与。2021;9(6).Epub 20210611。
查看文章谷歌学术搜索
44.Kykalová B, Tichá L, Volf P, Loza telleria E. 幼虫和雌性中的抗菌肽和肠道特异性防御素上调。微生物。2021;9(11).Epub 20211106。
查看文章谷歌学术搜索
45.Telleria EL, Sant'Anna MR, Ortigao-Farias JR, Pitaluga AN, Dillon VM, Bates PA, et al.卡斯帕样基因耗竭可减少沙蝇宿主长睑卢佐米亚的利什曼原虫感染。生物学杂志 2012;287(16):12985–93.pmid:22375009。
查看文章PubMed/NCBI谷歌学术搜索
46.卢拉杜尔一世,戈什K,英巴尔E,萨克斯DL。帕帕塔西静脉中的CRISPR / Cas9诱变:免疫缺陷途径影响利什曼原虫重症的载体能力。移动生物。2019;10(4).Epub 20190827。PMID:31455654。
查看文章PubMed/NCBI谷歌学术搜索
47.阿卜杜拉迪姆 M, 卡姆哈维 S, 巴伦苏埃拉 JG.沙蝇叮咬的背后是什么?沙蝇唾液对宿主止血、炎症和免疫力的深远影响。感染基因埃沃尔。2014;28:691–703.pmid:25117872。
查看文章PubMed/NCBI谷歌学术搜索
48.Meireles-Filho AC,Kyriacou CP.昆虫病媒中的昼夜节律。梅姆·奥斯瓦尔多·克鲁兹。2013;108 增刊 1:48–58.pmid:24473802。
查看文章PubMed/NCBI谷歌学术搜索
49.Meireles-Filho AC, da S Rivas GB, Gesto JS, Machado RC, Britto C, de Souza NA, et al.噬血昆虫的生物钟:血餐后的运动活动节律,昼夜节律表达和下调。2006年580月刊;1(2):8–20051201.Epub 16337945。PMID:<>。
查看文章PubMed/NCBI谷歌学术搜索
50.Meireles-Filho AC, Amoretty PR, Souza NA, Kyriacou CP, Peixoto AA.循环基因在噬血昆虫载体中的节律表达。BMC 分子生物学. 2006;7:38.pmid:17069657。
查看文章PubMed/NCBI谷歌学术搜索
51.Yuan Q, Metterville D, Briscoe AD, Reppert SM. 昆虫隐花色素:基因复制和丢失定义了构建昆虫生物钟的各种方法。分子生物学。2007;24(4):948–55.噗嗤:17244599。
查看文章PubMed/NCBI谷歌学术搜索
52.Ceriani MF, Darlington TK, Staknis D, Mas P, Petti AA, Weitz CJ, et al.CRYPTOCHROME对TIMELESS的光依赖性封存。科学。1999;285(5427):553–6.PMID:10417378。
查看文章PubMed/NCBI谷歌学术搜索
53.托马斯·人类病媒的生物控制:挑战和机遇的观点。生物防治(多德)。2018;63(1):61–9.Epub 2018/02/03.PMID:29391855。
查看文章PubMed/NCBI谷歌学术搜索
54.莫迪GB,Tesh RB。一种在实验室中大规模饲养长睑Lutzomyia 和 Phlebotomus papatasi(双翅目:Psychodidae)的简单技术。J 医学恩托莫尔。1983;20(5):568–9.pmid:6644754。
查看文章PubMed/NCBI谷歌学术搜索
55.沃伦 WC, 库德尔纳 L, 亚历山大 A, 卡滕 J, 佩雷斯-席尔瓦 JG, 洛佩斯-奥廷 C, 等.抹香鲸基因组的新进化。基因组生物学 Evol.2017;9(12):3260–4.噗嗤:28985367。
查看文章PubMed/NCBI谷歌学术搜索
56.张 Z, 施瓦茨 S, 瓦格纳 L, 米勒 W.一种用于比对DNA序列的贪婪算法。计算生物学杂志. 2000;7(1–2):203–14.pmid:10890397。
查看文章PubMed/NCBI谷歌学术搜索
57.Choi YJ, Bisset SA, Doyle SR, Hallsworth-Pepin K, Martin J, Grant WN, et al.环形苜蓿中场源性多发驱虫抗性的基因组渗入图谱。公共科学图书馆热内特。2017;13(6):e1006857.Epub 20170623。pmid:28644839。
查看文章PubMed/NCBI谷歌学术搜索
58.罗莎, 崔 YJ, 麦克纳尔蒂 SN, 荣格 H, 马丁 J, 阿加苏玛 T, 等.4 种并殖吸虫物种的比较基因组学和转录组学为肺吸虫寄生和发病机制提供了见解。千兆科学。2020;9(7).噗嗤:32687148。
查看文章PubMed/NCBI谷歌学术搜索
59.Magrini V, Gao X, Rosa BA, McGrath S, Zhang X, Hallsworth-Pepin K, et al.使用单分子mRNA测序改进真核基因组注释。BMC 基因组学。2018;19(1):172.Epub 20180301。PMID:29495964。
查看文章PubMed/NCBI谷歌学术搜索
60.邓J, 沃利KC. 阿特拉斯链接 2010.https://www.hgsc.bcm.edu/software/atlas-link。
61.宋 X, 刘 Y, 曲 J, 吉布斯 RA, 沃利 KC. 阿特拉斯间隙填充 2.2.2012.
62.Holt C,Yandell M. MAKER2:用于第二代基因组计划的注释管道和基因组数据库管理工具。BMC生物信息学。2011;12:491.Epub 20111222。pmid:22192575。
查看文章PubMed/NCBI谷歌学术搜索
63.Nene V, Wortman JR, Lawson D, Haas B, Kodira C, Tu ZJ, et al.埃及伊蚊的基因组序列,一种主要的虫媒病毒载体。科学。2007;316(5832):1718–23.pmid:17510324。
查看文章PubMed/NCBI谷歌学术搜索
64.沃特豪斯RM,特根费尔特F,李J,兹多布诺夫EM,克里文采娃EV。OrthoDB:动物、真菌和细菌直系同源物的分层目录。核酸研究 2013;41(数据库问题):D 358–65.pmid:23180791。
View ArticlePubMed/NCBIGoogle Scholar
65.Neafsey DE, Christophides GK, Collins FH, Emrich SJ, Fontaine MC, Gelbart W, et al. The evolution of the Anopheles 16 genomes project. G3. 2013;3(7):1191–4. pmid:23708298.
View ArticlePubMed/NCBIGoogle Scholar
66.Neafsey DE, Waterhouse RM, Abai MR, Aganezov SS, Alekseyev MA, Allen JE, et al. 蚊子基因组学.高度可进化的疟疾媒介:16种按蚊的基因组。科学。2015;347(6217):1258522.PMID:25554792。
查看文章PubMed/NCBI谷歌学术搜索
67.Rognes T. Faster Smith-Waterman 数据库搜索与序列间 SIMD 并行化。BMC生物信息学。2011;12:221.pmid:21631914。
查看文章PubMed/NCBI谷歌学术搜索
68.埃德加·MUSCLE:一种多序列比对方法,降低了时间和空间的复杂性。BMC生物信息学。2004;5:113.pmid:15318951。
查看文章PubMed/NCBI谷歌学术搜索
69.Capella-Gutierrez S,Silla-Martinez JM,Gabaldon T. trimAl:用于大规模系统发育分析中自动对齐修剪的工具。生物信息学。2009;25(15):1972–3.pmid:19505945。
查看文章PubMed/NCBI谷歌学术搜索
70.Salichos L,Rokas A.推断古代分化需要具有强系统发育信号的基因。自然界。2013;497(7449):327–31.pmid:23657258。
查看文章PubMed/NCBI谷歌学术搜索
71.Salichos L,Stamatakis A,Rokas A.基于信息理论的新型测量,用于量化系统发育树之间的不一致。分子生物学。2014;31(5):1261–71.PMID:24509691。
查看文章PubMed/NCBI谷歌学术搜索
72.Stamatakis A. RAxML 版本 8:用于大型系统发育的系统发育分析和后分析的工具。生物信息学。2014;30(9):1312–3.PMID:24451623。
查看文章PubMed/NCBI谷歌学术搜索
73.朱尼尔T,兹多布诺夫EM。Newick实用程序:UNIX shell中的高吞吐量系统发育树处理。生物信息学。2010;26(13):1669–70.PMID:20472542。
查看文章PubMed/NCBI谷歌学术搜索
74.用BWA-MEM对齐序列读取,克隆序列和组装重叠群。arXiv:1303.3997v1 [q-bio.GN];2013.
75.李H, 汉德克 B, 威索克 A, 芬内尔 T, 阮 J, 荷马 N, 等.序列对齐/映射格式和 SAMtools。生物信息学。2009;25(16):2078–9.论文2://publication/doi/10.1093/bioinformatics/btp352.密码:19505943
查看文章PubMed/NCBI谷歌学术搜索
76.科博尔特, 张琪, 拉森德, 沈丹, 麦克莱伦, 林林, 等.VarScan 2:通过外显子组测序发现癌症的体细胞突变和拷贝数改变。基因开发 2012;22(3):568–76.论文2://publication/doi/10.1101/gr.129684.111.密码:22300766
查看文章PubMed/NCBI谷歌学术搜索
77.Chang CC, Chow CC, Tellier LC, Vattikuti S, Purcell SM, Lee JJ. 第二代 PLINK:迎接更大、更丰富的数据集的挑战。千兆科学。2015;4:7.Epub 2015/02/28.pmid:25722852。
查看文章PubMed/NCBI谷歌学术搜索
78.Purcell S, Neale B, Todd-Brown K, Thomas L, Ferreira MA, Bender D, et al. PLINK:用于全基因组关联和基于人群的联系分析的工具集。Am J Hum Genet。2007;81(3):559–75.Epub 2007/08/19.pmid:17701901。
查看文章PubMed/NCBI谷歌学术搜索
79.郑 X, 莱文 D, 沈 J, 戈加滕 SM, 劳里 C, 威尔 BS.用于SNP数据的相关性和主成分分析的高性能计算工具集。生物信息学。2012;28(24):3326–8.论文3://publication/doi/10.1093/bioinformatics/BTS606.密码:23060615
查看文章PubMed/NCBI谷歌学术搜索
80.Danecek P, Auton A, Abecasis G, Albers CA, Banks E, DePristo MA, et al.变体调用格式和 VCF 工具。生物信息学。2011;27(15):2156–8.密码:21653522
查看文章PubMed/NCBI谷歌学术搜索
81.Alexander DH,Novembre J,Lange K.基于模型的快速估计无关个体的祖先。基因组研究。2009;19(9):1655–64.Epub 2009/08/04.pmid:19648217。
查看文章PubMed/NCBI谷歌学术搜索
82.Kopelman NM,Mayzel J,Jakobsson M,Rosenberg NA,Mayrose I. Clumpak:一个用于识别聚类模式和打包K. Mol Ecol Resour的人口结构推断的程序。2015;15(5):1179–91.Epub 2015/02/17.PMID:25684545。
查看文章PubMed/NCBI谷歌学术搜索
83.Suite 2011: LigPrep, version 2.5, Schr?dinger, LLC, New York, NY, 2011.
84.Patterson N, Price AL, Reich D. 人口结构和特征分析。公共科学图书馆热内特。2006;2(12):e190.Epub 2006/12/30.pmid:17194218。
查看文章PubMed/NCBI谷歌学术搜索
85.Bonhomme M, Chevalet C, Servin B, Boitard S, Abdallah J, Blott S, et al.检测种群树中的选择:Lewontin和Krakauer测试扩展。遗传学。2010;186(1):241–62.Epub 2010/09/22.pmid:20855576。
查看文章PubMed/NCBI谷歌学术搜索
86.Fariello MI,Boitard S,Naya H,SanCristobal M,Servin B.通过分层结构人群中的单倍型分化检测选择特征。遗传学。2013;193(3):929–41.Epub 2013/01/12.pmid:23307896。
查看文章PubMed/NCBI谷歌学术搜索
87.Jombart T. adegenet:用于遗传标记多变量分析的R包。生物信息学(英国牛津)。2008;24(11):1403–5.Epub 2008/04/10.PMID:18397895。
查看文章PubMed/NCBI谷歌学术搜索
88.Jombart T,Ahmed I. adegenet 1.3-1:用于分析全基因组SNP数据的新工具。生物信息学(英国牛津)。2011;27(21):3070–1.Epub 2011/09/20.pmid:21926124。
查看文章PubMed/NCBI谷歌学术搜索
89.Paradis E,Claude J,Strimmer K. APE:R语言中的系统发育和进化分析。生物信息学(英国牛津)。2004;20(2):289–90.Epub 2004/01/22.pmid:14734327。
查看文章PubMed/NCBI谷歌学术搜索
90.Kamvar ZN,Tabima JF,Grunwald NJ。Poppr:一个R包,用于对具有克隆,部分克隆和/或有性生殖的种群进行遗传分析。皮尔·2014;2:e281.Epub 2014/04/02.pmid:24688859。
查看文章PubMed/NCBI谷歌学术搜索
91.克瑙斯·vcfr:用于在 R. Mol Ecol Resour 中操作和可视化变体调用格式数据的包。2017;17(1):44–53.Epub 2016/07/13.pmid:27401132。
查看文章PubMed/NCBI谷歌学术搜索
92.Efron B, Halloran E, Holmes S. 系统发育树的引导置信水平。美国国家科学院院刊, 1996;93(23):13429–34.Epub 1996/11/12.PMID:8917608。
查看文章PubMed/NCBI谷歌学术搜索
93.Kriventseva EV, Tegenfeldt F, Petty TJ, Waterhouse RM, Simao FA, Pozdnyakov IA, et al.OrthoDB v8:更新了直系同源物和底层自由软件的分层目录。核酸研究 2015;43(数据库问题):D 250–6.pmid:25428351。
查看文章PubMed/NCBI谷歌学术搜索
94.Sievers F, Wilm A, Dineen D, Gibson TJ, Karplus K, Li W, et al.使用Clustal Omega快速、可扩展地生成高质量蛋白质多序列比对。分子系统生物学。2011;7:539.
查看文章谷歌学术搜索
95.Suyama M,Torrents D,Bork P. PAL2NAL:蛋白质序列比对到相应密码子比对的稳健转换。核酸研究 2006;34(网络服务器问题):W609–12.PMID:16845082。
查看文章PubMed/NCBI谷歌学术搜索
96.PAML 4:通过最大似然进行系统发育分析。分子生物学。2007;24(8):1586–91.pmid:17483113。
查看文章PubMed/NCBI谷歌学术搜索
97.西芒 FA, 沃特豪斯 RM, 约阿尼迪斯 P, 克里文采娃 EV, 兹多布诺夫 EM.BUSCO:使用单拷贝直系同源物评估基因组组装和注释完整性。生物信息学(英国牛津)。2015;31(19):3210–2.Epub 2015/06/11.pmid:26059717。
查看文章PubMed/NCBI谷歌学术搜索
98.Gilbert C,Peccoud J,Cordaux R.转座元件和昆虫的进化。安努·恩托莫尔。2021;66:355–72.Epub 20200915。pmid:32931312。
查看文章PubMed/NCBI谷歌学术搜索
99.彼得罗夫,哈特尔·黑腹果蝇和果蝇物种组的DNA丢失率很高。分子生物学。1998;15(3):293–302.Epub 1998/03/21.pmid:9501496。
查看文章PubMed/NCBI谷歌学术搜索
100.半乳糖凝集素在感染中的作用。自然评论微生物学。2009;7(6):424–38.PMID:19444247。
查看文章PubMed/NCBI谷歌学术搜索
101.Kamhawi S, Ramalho-Ortigao M, Pham VM, Kumar S, Lawyer PG, Turco SJ, et al.昆虫半乳糖凝集素在寄生虫生存中的作用。细胞。2004;119(3):329–41.pmid:15543683。
查看文章PubMed/NCBI谷歌学术搜索
102.Abrudan J, Ramalho-Ortigao M, O'Neil S, Stayback G, Wadsworth M, Bernard M, et al.帕帕塔西静脉瘤转录组的特征。昆虫分子生物学. 2013;22(2):211–32.pmid:23398403。
查看文章PubMed/NCBI谷歌学术搜索
103.Coutinho-Abreu IV, Sharma NK, Robles-Murguia M, Ramalho-Ortigao M. 靶向中肠分泌的PpChit1可减少利什曼原虫在其天然载体沙蝇Phlebotomus papatasi中的重大发展。公共科学图书馆忽视了热带疾病。2010;4(11):e901.Epub 2010/12/15.pmid:21152058。
查看文章PubMed/NCBI谷歌学术搜索
104.Coutinho-Abreu IV,Sharma NK,Robles-Murguia M,Ramalho-Ortigao M.帕帕塔西静脉萎缩蛋白的特征,以及PpPer1在其自然载体中利什曼原虫主要生存中的作用。公共科学图书馆 2013;7(3):e2132.PMID:23516661。
查看文章PubMed/NCBI谷歌学术搜索
105.小奥蒂高-法里亚斯, 迪布拉西 T, 泰莱里亚 EL, 安多里尼奥 AC, 莱莫斯-席尔瓦 T, 拉马略-奥尔蒂高 M, 等.替代剪接起源于长睑露脊髓蛤蟆几丁质酶的不同结构域结构组织。梅姆·奥斯瓦尔多·克鲁兹。2018;113(2):96–101.Epub 2017/12/14.pmid:29236932。
查看文章PubMed/NCBI谷歌学术搜索
106.Pitaluga AN, Beteille V, Lobo AR, Ortigao-Farias JR, Davila AM, Souza AA, et al. 对美洲主要的内脏利什曼病媒介Lutzomyia longipalpis的血液喂养和利什曼原虫感染的中肠进行EST测序。摩尔基因基因组学。2009;282(3):307–17.Epub 2009/07/01.pmid:19565270。
查看文章PubMed/NCBI谷歌学术搜索
107.Pruzinova K, Sadlova J, Seblova V, Homola M, Votypka J, Volf P. 四种沙蝇物种对多诺瓦尼利什曼原虫易感性的血粉消化和周围基质的比较。普洛斯一。2015;10(6):e0128203.Epub 2015/06/02.pmid:26030610。
查看文章PubMed/NCBI谷歌学术搜索
108.拉马略-奥尔蒂高 JM, 卡姆哈维 S, 罗顿 ED, 里贝罗 JM, 巴伦苏埃拉 JG.来自沙蝇载体帕帕塔西静脉瘤的中肠胰蛋白酶和胰凝乳蛋白酶样蛋白酶的克隆和表征。昆虫生物化学分子生物学. 2003;33(2):163–71.噗:12535675。
查看文章PubMed/NCBI谷歌学术搜索
109.Ramalho-Ortigao JM, Temporal P, de Oliveira SM, Barbosa AF, Vilela ML, Rangel EF, et al.通过表达的序列标签、差异显示逆转录酶-PCR 和来自沙蝇载体 Lutzomyia longipalpis 的随机扩增多态 DNA-PCR 来表征组成型和推定的差异表达的 mRNA。梅姆·奥斯瓦尔多·克鲁兹。2001;96(1):105–11.pmid:11285481。
查看文章PubMed/NCBI谷歌学术搜索
110.拉马略-奥尔蒂高JM,特劳布-切科YM。Llchit1的分子表征,Llchit2003是来自利什曼病载体Lutzomyia longipalpis的中肠几丁质酶cDNA。昆虫生化分子生物学. 33;3(279):87–12609513.pmid:<>。
查看文章PubMed/NCBI谷歌学术搜索
111.淡水河谷VF,莫雷拉BH,莫赖斯CS,佩雷拉MH,根塔FA,贡蒂霍NF。长叶卢特佐米亚幼虫(双翅目-Psychodidae)中的碳水化合物消化。昆虫生理学杂志. 2012;58(10):1314–24.Epub 2012/07/31.PMID:22841889。
查看文章PubMed/NCBI谷歌学术搜索
112.da Costa-Latgé SG, Bates P, Dillon R, Genta FA. 糖苷水解酶家族 13 和 31 的表征揭示了 α-淀粉酶基因在静脉中扩增和多样化。前生理学. 2021;12:635633.Epub 20210409。
查看文章谷歌学术搜索
113.Benoit JB,Hansen IA,Szuter EM,Drake LL,Burnett DL,Attardo GM。 水通道蛋白在血液摄性节肢动物生理学方面的新兴作用。比较生理学杂志B,生物化学,系统和环境生理学。2014;184(7):811–25.PMID:24942313。
查看文章PubMed/NCBI谷歌学术搜索
114.昆虫G蛋白偶联受体(GPCRs)-新杀虫剂开发的潜在靶点.分子。2021;26(10).Epub 20210518。PMID:34069969。
查看文章PubMed/NCBI谷歌学术搜索
115.诺林 RJ, 阿布鲁丹 JL, 舒达, 阿卜杜勒-瓦希德 B, 沃兹沃思 M, 留回 G, 等.新型节肢动物载体G蛋白偶联受体的鉴定。寄生虫和媒介。2013;6:150.pmid:23705687。
查看文章PubMed/NCBI谷歌学术搜索
116.Fevereisen R. Insect CYP,基因和P450酶。在:吉尔伯特·李,编辑。昆虫分子生物学和生物化学。阿姆斯特丹:爱思唯尔;2012.第236–316页。
117.克鲁克香克 TE,哈恩 MW。再分析表明,物种形成的基因组孤岛是由于多样性的减少,而不是基因流动的减少。分子生态学 2014;23(13):3133–57.Epub 2014/05/23.噗嗤:24845075。
查看文章PubMed/NCBI谷歌学术搜索