《对拟南芥近缘多毛芥基因型和表型的泛欧研究揭示了适应、人口统计学和发育如何塑造多样性模式》期刊简介
对拟南芥近缘多毛芥基因型和表型的泛欧研究揭示了适应、人口统计学和发育如何塑造多样性模式
抽象
我们研究了拟南芥相对多毛芥的天然DNA多态性和相关表型。我们观察到几个祖先群体之间存在强烈的遗传分化,并且伊比利亚孑遗菌株在欧洲C中分布更广泛。多毛与拟南芥相比。我们发现营养发育和生殖发育之间的同步以及异慢性途径在塑造C中的普遍作用。多毛自然变异。单个快速循环的ChFRIGIDA等位基因适应性地进化,允许从冰川避难所扩大范围,这与涉及多个FRIGIDA单倍型的拟南芥不同。拟南芥稀少的亚速尔群岛是C的热点。多毛多样性。我们确定了异时SPL9转录因子中的定量性状位点(QTL)作为亚速尔群岛形态型的决定因素。该QTL显示了正选择的证据,其分布反映了广泛塑造亚速尔群岛植物群的气候梯度。总体而言,我们建立了一个框架来探索适应,人口统计和发展的相互作用如何塑造了2种相关植物物种的多样性模式。
数字
Fig 4Fig 5图1图2图3Fig 4Fig 5图1图2图3
引文: Baumgarten L, Pieper B, Song B, Mane S, Lempe J, Lamb J, et al. (2023) 拟南芥相对多毛胭脂虫基因型和表型的泛欧研究揭示了适应、人口统计学和发展如何塑造多样性模式。公共科学图书馆生物学21(7): e3002191. https://doi.org/10.1371/journal.pbio.3002191
学术编辑: Nick H. Barton,奥地利科学技术研究所(IST Austria),奥地利
收到: 29月 2022, 10;接受: 六月 2023, 18;发表: 2023月 <>, <>
版权所有: ? 2023 鲍姆加滕等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 原始Illumina基因组DNA读数存放在NCBI(项目编号:PRJNA844203)上,并在发布之日公开可用。与这些数字相关的数据和代码在 https://doi.org/10.5281/zenodo.7907435 发布之日是公开的。
资金: 这项工作得到了马克斯·普朗克学会(对MT的核心资助)、联邦文献和研究部(BMBF)(增强作物光合作用031B0189至MT)、生物技术和生物科学研究委员会(BBSRC)(BB/D010977/1至MT)、盖茨比慈善基金会(对MT)、德国研究协会(DFG)(SFB 680进化创新的分子基础TP13至MT;CRC TRR 341 植物生态遗传学 A3 至 MT 和 SL;SPP 适应组学 TS 229/2-1 至 MT;植物科学卓越集群(CEPLAS)对MT的资助,SPP 1991分类组学SCHA 1875/4-2至HS),MCIN/AEI / 10.13039 / 501100011033(PID2019-104249GB-I00至CAB),惠康信托基金(高通量基因组学组090532/Z/09/Z)和医学研究委员会(MRC)(中心授予G0900747 91070至RM)。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
竞争利益: 提交人声明不存在相互竞争的利益。
缩写: 亚利桑那州, 亚述尔群岛;Az1, 亚速尔群岛1;巴尔, 巴尔干;CDS, 编码顺序;Chspl9, C.SPL9的多毛功能丧失等位基因;简历 交叉验证;罗斯福 错误发现率;FLC,开花位点C;弗里,弗里吉达;全球大气层, 全基因组关联;HIF, 异质自交家庭;国际教育局, 伊比利亚;赫姆 渗入线;摇头丸 连锁不平衡;LLN4, 4号染色体上的传单编号QTL;传销, 多位点混合模型;NCE, 中北欧;零 近等基因系;牛 牛津;质检 主成分;PCA, 主成分分析;PGD, 成对遗传距离;QTL, 数量性状轨迹;RCCR, 相对交叉聚结率;RIL, 重组近亲繁殖系;RLN, 莲座叶数;顺丰, 站点频率;SFS, 站点频谱;单核苷酸单核苷酸, 单核苷酸多态性;SPL9,鳞状启动子结合样9;固态硬盘, 单种子血统;TPPI, 三甲糖-6-磷酸磷酸酶I
介绍
相关分类群的比较分析为研究适应、历史偶然性(过去事件的结果通常是随机的)和发育限制的相互作用如何影响表型和遗传多样性提供了机会[1-4]。在此过程中,它还有助于理解进化的可重复性,以及不同分子途径中保守和分歧之间的平衡如何塑造性状多样性[5]。在过去的4年中,对模式生物拟南芥的研究对种子植物发育过程中基因型如何转化为表型产生了基本的见解[6,7]。自然变异研究揭示了A中生态重要性状多样性的基础因果变异。塔利亚娜 [8–15] .同时,对天然发生的多态性的研究表明A.塔利亚纳的人口历史和人口结构,并允许调查人口统计学对性状多样性的影响[16-19]。胭脂红,A的近亲。Thaliana提供了以比较方式理解多样性的绝佳机会,因为它具有许多构成良好模式生物的属性,同时还显示出关键性状的差异,包括花形态,种子传播和叶子形状[20]。这些属性已被用于识别基因和过程两个物种之间潜在的差异。其中包括C的细分。多毛叶成不同的小叶,与A的简单叶子。拟南芥和C的爆炸性种子传播。多毛与A中的被动分散。塔利亚娜 [2–21]
C. hirsuta还显示出许多性状的自然变异,这为种群水平的多样性比较研究提供了未开发的资源[25]。A自然变异研究的主要焦点。拟南芥一直在开花时间,这是标志着生殖开始并有助于局部适应的关键生活史特征[26-29]。总体而言,这些拟南芥研究表明,开花时间基因的自然等位基因变异通常会多效性地影响生理和形态性状,也可以影响种子萌发和水分利用效率等[30,31]。开花时间位点的这种综合效应可能允许出现支持生态适应的综合生活史策略[32-36]。在C中克隆的定量性状位点(QTL)。多毛为开花时间与复杂叶片形态之间的性状整合提供了证据[25]。具体来说,花卉抑制因子开花轨迹C(FLC)的弱等位基因通过加速从较简单的幼叶到带有更多小叶的成年叶形式的过渡速度来异时地起作用。开花时间和叶子发育的这种同步导致更多的小叶在预期繁殖时产生,这可能支持以种子的形式向下一代分配资源[25]。因此,年龄依赖性途径的遗传变异可能导致C的地上部形态的自然变异。毛田。值得注意的是,种子植物的许多性状都受到年龄依赖性控制,包括应激反应和营养状况[37-40],因此有可能使它们在不同的自然环境中得到综合发育控制[41,42]。然而,异慢性途径广泛塑造C全物种形态变异的程度。Hirsuta,以及推动其维护的生态因素仍然未知。解决这个问题并研究塑造C自然性状变异的途径的保守程度与差异程度。希苏塔和A.拟南芥需要对C的遗传和表型多样性进行全面调查。毛田。
在这里,我们使用全基因组单核苷酸多态性(SNP)数据来分析欧洲和马卡罗尼西亚C人群的人口历史。毛田。我们发现C.来自伊比利亚半岛和马卡罗尼西亚群岛的多毛虫保留了相当大的遗传多样性,因此类似于A的孑遗种群。塔利亚娜。然而,C.多毛孑遗菌样菌株比A延伸更多。拟南芥是欧洲大陆的遗迹,因此更有能力在冰川保护区之外建立。然后,我们使用我们的菌株面板来研究小叶数量和开花时间的遗传控制。我们发现它们通过开花时间位点FRIGIDA和FLC以及海藻糖生物合成途径的组成部分进行相关控制的证据。此外,FRIGIDA的多态性显示出明显的正选择特征,为与A平行自适应进化提供了一个突出的例子。拟南芥,其中多个功能丧失等位基因驱动北纬开花时间适应[43]。然而,与A相反。拟南芥,一种单一的功能丧失单倍型主导C的变异。Hirsuta,强调了随机力和确定性力量之间的平衡如何驱动这两个物种的平行性状进化。最后,我们发现丰富多样的C。亚速尔群岛的多毛虫种群,与欧洲大陆相比,季节性有所减少。在探索亚速尔群岛定植的遗传基础时,我们发现了一个QTL簇,它影响叶形式的年龄依赖性变化,而对开花时间没有明显影响,并且包括异时作用转录因子SQUAMOSA启动子结合样2(SPL9)的衍生等位基因,我们在转基因测定中验证了该等位基因。该等位基因显示了亚速尔群岛东西向地理分布的两极分化,这与环境差异有关,特别是水的可用性。同一基因组区域显示了SPL9位点及其周围的正选择证据,表明SPL9依赖性变化在枝条发育中的调节有助于C的适应。Hirsuta 位于亚速尔群岛西部的生态位,那里的植物全年都适合生长,夏季干燥。我们的研究建立了C。Hirsuta作为植物种群水平比较研究的宝贵模型,表明异时途径在不同生态条件下对该物种的自然变异有重大贡献。
结果
深层遗传结构和最近的范围扩展是C遗传多样性的特征。希苏塔
我们着手了解C的人口历史。希苏塔并将其与A进行比较。塔利亚娜。鉴于这两个物种具有相似的生命周期,我们推断,如果它们的分布和殖民历史是由相似的生态力量塑造的,那么这种相似性可能会保留在两个分类群现存遗传多样性的共同模式中。相反,这两个物种进化轨迹的巨大差异可能在遗传多样性模式的分布中留下了印记。
作为这些比较的第一步,我们对一组488 C进行了重新测序。Hirsuta 菌株并研究了基于 5,336,586 个双等位基因高质量 SNP 的遗传结构模式。我们小组的地理分布集中在西欧,但也包括来自美国、新西兰、澳大利亚和日本的少量菌株(S1表)。我们使用ADMIX软件[44]来估计最可能的血统组数,并为每个菌株估计每个菌株的血统比例(图1A,1B和S1A)。该分析的结果揭示了3个遗传分化组的存在:(1)伊比利亚(IBE)血统组;2)巴尔干(BAL)祖先群体;(3)中北欧(NCE)血统组。国际教育局主要包括从伊比利亚半岛收集的菌株,但也包括从法国、英国、荷兰、爱尔兰、美国和新西兰收集的菌株(图1B)。还发现具有大量国际教育局血统的菌株在马德拉群岛和亚速尔群岛广泛分布。BAL的菌株主要在克罗地亚和奥地利采样,但具有BAL血统的混合菌株广泛分布在欧洲大陆,马德拉岛,埃塞俄比亚,日本和美国。NCE主要由从北纬50°至60°之间从欧洲采样的菌株组成。ADMIX结果还表明,大量具有BAL和NCE共同祖先的菌株表明基因流动,而IBE在这方面似乎更加孤立。主成分分析(PCA)证实了这些发现,其中来自3个群体的非混合个体代表分化良好的遗传群体,而混合菌株主要在BAL和NCE之间观察到(S1B图)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 多毛胭脂虫的种群结构和人口统计。
(A) C的混合分析。经过近亲关系(n = 358)过滤后的多毛菌株揭示了3个主要的祖先群体。发现最拟合数据的聚类数为3(另见S1A图)。每个垂直条代表一个菌株,其中颜色表示 3 个祖先组的混合比例。菌株被分配到血统比例至少为0.5的血统组。祖先组根据其各自菌株的主要采样位置命名:BAL-巴尔干;IBE-伊比利亚;NCE–中北欧。所有血统组比例小于0.5的菌株被归类为未分组(右上)。(B) C.西欧的多毛人祖先群体。每个点代表菌株的收集位点,并根据其所属的祖先组进行着色,未分组的菌株以灰色显示。亚速尔群岛和马德拉群岛的马卡罗尼西亚群岛在地图上下方以较小的比例尺显示。地图图层是用自然地球和[142]制作的。(C)成对遗传距离(PGD)的分布表明C组之间的深度分裂。多毛菌株。显示了所有可能的菌株对之间的PGD直方图,其中每个箱中的对数与PGD作图。黑色轮廓显示了我们样品中所有菌株的PGD。分布中存在 2 种主要模式,其中一种在高遗传距离上,表明我们样本中的一组菌株与其他菌株高度分化。层次聚类揭示了一组孑遗菌样菌株,这些菌株负责分布中的第二个主要模式。包含 1 或 2 个孑遗物样菌株的 PGD 以蓝色显示,不包括这些菌株的 PGD 以灰色显示。(D) C族的确定。基于PGD的多维缩放和分层聚类而彼此高度分化的多毛菌株。前 2 个 PC 相互绘制,其中每个点都是一个菌株,根据它所属的 ADMIX 祖先组着色,未分组的菌株以深灰色显示。在ADMIX分析中,仅在单个血统组中具有血统的菌株以较深的色调与较浅的色调显示混合菌株。PGD基质的分层聚类表明,沿PC1分离的菌株代表了用虚线包围的3组不同的菌株。左边和中间的组负责PGD分布的第二个主要模式(图1C,S1B和S1C)。这 2 组在此处以蓝色和灰色显示。(东、女)分段常数有效种群大小(Ne)作为使用MSMC3(E)和相关(F)的2个祖先组的时间函数,以及考虑到4×10突变率的估计它们之间的分裂时间?9每个碱基,每代的突变。用fastsimcoal2(S1I图)估计的BAL-NCE和BAL-IBE的分割时间分别由x轴上的红色和蓝色三角形表示。顶部面板显示 N 的祖先变化e在以年为单位绘制时间的组中,当考虑每年 1 代时。使用MSMC2(E),分析了20个随机组的4个菌株,这些菌株都被绘制成图,而对于相关(F),所有菌株被联合分析,因此是一条线。底部面板显示了 BAL 与 NCE(实线)和 IBE 与 BAL(虚线)中的 RCCR。图中的浅蓝色阴影区域分别根据MISs 2-4,6,8,10,12,14,16和18[45]从左到右显示了古老的冰川期。LGM [46] 的周期同样由嵌入在 MIS2-4 中的深蓝色阴影表示。此图中显示的图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。巴尔,巴尔干;IBE,伊比利亚语;LGM,末次冰期最大值;MIS,海洋同位素阶段;NCE,中北欧;PC,主要坐标;PGD,成对遗传距离;RCCR,相对交叉聚结率。
https://doi.org/10.1371/journal.pbio.3002191.g001
在 A.拟南芥是一组遗传分化的菌株(所谓的遗物),根据对个体菌株之间成对遗传距离(PGD)分布的检查,已经鉴定出[17]。我们进行了类似的分析,将数据集中种群之间的遗传分化与A中报告的孑遗物和非遗物之间的分化进行了比较。塔利亚娜。不像A。拟南芥,其分布具有约0.475%的单一主模态(图3A在[17]中),PGD在C中。hirsuta显示2种主要模式,约为0.4%和0.8%(图1C)。第二种模式的中心高于观察到的 A 的最高值。拟南芥[17],它反映了国际教育局和非国际教育局菌株之间的成对比较(图1D、S1C和S1D)。值得注意的是,伊比利亚C.多毛塔孑遗物类群在伊比利亚半岛以外的分布比其A更广泛。拟南芥对应物(S1E图)。这一观察结果表明,C.希苏塔国际教育局的遗迹可能比它们的A具有更高的殖民欧洲环境的潜力。塔利亚纳同行。
我们进一步比较了C之间祖先群体特异性多样性模式。希苏塔和A.通过计算核苷酸多样性、田岛的 D 和 F圣两个物种描述的遗传组中的值(S2表)。我们发现在C.多毛,国际教育局是最多样化的,其次是BAL和NCE。IBE的核苷酸多样性(0.14%)与A中观察到的相似。属于伊比利亚组(遗物和非遗物)的拟南芥菌株。NCE的较低多样性与最近伴随南欧谱系在末次冰期最大值后在北纬地区殖民化的人口过程的影响一致[46],并且与C的其他种群相比,NCE中较慢的联系不平衡(LD)衰减进一步证实了这一点。希苏塔和A.塔利亚纳(S1F图)。田岛在 C 中的 D 值。hirsuta是积极的,比A更积极。拟南芥(IBE除外),并可能由更明显的种群规模瓶颈(S2表)引起,这也可能是NCE中田岛D高方差的原因。F圣值表明 IBE 与 C 中其他组之间的遗传分化。希苏塔 (F圣= 0.55)比A之间观察到的最高遗传分化大45%。1001基因组计划中拟南芥的孑遗和非遗余种群(F圣= 0.38;S2 表)。因此,国际教育局与非国际教育局C的遗传分化。多毛比遗物与非遗物A更重要。拟南芥,而NCE则呈现了在地理上等效的A中找不到的瓶颈特征。拟南芥种群。
了解形成C变异模式的进化过程的本质。Hirsuta,我们进行了一系列人口推断分析,旨在估计人口规模的变化,人口差异的年龄以及种群之间的基因流动水平。我们使用软件relate [47]和MSMC2[48-50](图1E,1F,S1G和S1H)估计了IBE,BAL和NCE随时间变化的种群大小和交叉合并率的分段常数分布。在这两种情况下,结果表明,我们样本历史上最古老的事件是国际教育局的祖先谱系与BAL和NCE的一个祖先之间的分歧。另一方面,BAL和NCE之间的分歧发生在最近,随后NCE的有效人口规模明显减少,这可能反映了高纬度地区的殖民化(图1E和1F)。为了获得这些分歧时间的点估计值,我们使用fastsimcoal4中实现的最大似然优化方法对2种备选人口统计情景进行了模型选择和参数优化[51,52]。我们假设相关和MSMC2分析建议的群体树是正确的,并且仅将模型选择分析集中在基因流和群体大小瓶颈的缺失或存在上。我们的最佳模型(S1I图和S3表)的特点是IBE和NCE中所有人群之间的基因流动和种群规模瓶颈。对 2 次发散时间(图 1E 和 1F 中的三角形表示)的估计结果与使用相关方法获得的结果一致,并证实了祖先 IBE 谱系的古老分歧(约 534,000 年)以及 NCE 和 BAL 之间的最近分裂(约 16,000 年)。此外,祖先和目前的种群规模估计与相关和MSMC2的估计基本一致,并且所有方法都确定了NCE在差异后的大小减少。总体而言,我们的观测表明在伊比利亚存在一个孑遗群体,从而突出了空间种群结构与A的惊人平行性。尽管这两个物种的估计分歧时间超过2万年前[25]。此外,最近NCE对高纬度地区的定植表明,在该人群的基因组水平上,可以在基因组水平上检测到潜在的相关适应性事件,这些事件是光周期和季节性相关变化的基础[53,54]。
GWAS揭示异时性是C中小叶数量的主要决定因素。希苏塔
建立了上述框架,以了解塑造欧洲C的人口事件。Hirsuta 遗传多样性,我们接下来试图将表型与相应种质中的基因型联系起来。为此,我们测量了多样性面板中352株的开花时间和小叶数。在考虑种群结构后,我们观察到相当大的表型变异(S2A图)。我们使用全基因组关联(GWA)分析来鉴定与开花时间和小叶数量相关的遗传变异。分别在6号和8号染色体上检测到两个非常显着的开花时间关联(图2A),并且还发现这些相同的位点含有与后期叶节点上的小叶数量密切相关的SNP(图2A)。对6号染色体关联的仔细检查揭示了2kb区域内的20个候选基因:FLC和C。海藻糖-6-磷酸磷酸酶I(TPPI)的多毛直系同源物。FLC影响A的开花时间和叶片发育。塔利亚娜和C.希苏塔 [25,56,57] 。TPPI催化海藻糖-6-磷酸的去磷酸化,其浓度影响A的开花时间和异时芽发育。塔利亚纳[58]。15号染色体上6个最显着相关的SNPs被发现与FLC和TPPI非常接近,其中6个在其开放的阅读框或启动子区域内。多位点GWAS表明,两个基因中的SNPs具有独立的作用,表明两者都有助于我们菌株组中的表型多样性(图2B)。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 选择加速北欧和中欧发育进程。
(A)开花时间和叶子7上的小叶数的GWA使用352 C。多毛菌株。用于单个SNP的关联测试的负对数基数10转换P值与8条染色体上的物理位置作图。水平虚线显示显著性阈值,并根据邦弗罗尼(洋红色)和罗斯福(青色;对于两者α = 0.05)对多次测试进行校正。转换后的 P 值高于 FDR 阈值的 SNP 显示为红色,其他 SNP 显示为灰色。在包含候选基因FLC/TPPI和FRI的6号和8号染色体上检测到两个具有强相关SNP的区域。(B)具有最强关联的位点的特写视图,显示开花时间的GWAS,TPPI中最重要的SNP用作协变量。使用多位点混合模型GWAS进行正向回归表明,6号染色体的高度显着关联由2个独立关联组成。黄色区域表示2个候选基因FLC(左)和TPPI(右),其中较浅的阴影表示启动子区域(-3,000 bp),较深的阴影表示ORF。没有协变量的GWAS显示为红色,SNP由TPPI中的蓝色包围的红点表示为蓝色协变量。这一结果揭示了FLC第一内含子中SNP的显著关联,这些关联独立于与TPPI相关的SNP的关联。以蓝色显示的FLC中的相关SNP是该分析中最重要的全基因组。(C) 主要存在于欧洲 C 样本中的 3 种不同截短 FRI 等位基因的功能验证。毛田。与全长FRI等位基因转化的植物莲座叶数显著增加相反,截短的FRI等位基因没有影响(Bonferroni调整P值的邓恩检验,***:P值<0.001)。 3个等位基因中的一个是在高频(FRIstop)下发现的,并且仅在NCE菌株中发现(另见S2B图)。(D)在GWA鉴定的3个候选基因下的所有基因型组合在DAG中的开花时间直到开花。每个基因的代表性SNP的基因型显示为anc或der。条形表示平均开花时间,点表示每个菌株的单独观测值。点根据菌株的祖先组进行着色(图1A)。(东、女)南北遗传分化(S1B图中PC2)与开花时间(E)以及叶片8(F)小叶数的相关性。这些点是根据其血统组着色的单个菌株的观察结果(图1A),使得只有1组血统的菌株以较深的色调显示,而混合的较浅的色调显示。这些线显示了拟合到BAL和NCE群体数据的线性模型(P<0.001,R2 = 0.54,r = -0.73,图2E;P<0.001 R2 = 0.38,r = 0.62,图2F)。大点表示这两个群体中的非混合样本。(G)在FRI位点进行选择性扫描的证据(另见S2图)。核苷酸的滑动窗口分析8号染色体的多样性(π,顶部),田岛的D(中)和由SweepFinder2 [59](底部)计算的CLR。分析分别在具有NCE组的FRIstop(蓝色)和FRIfunc(黑色)等位基因的菌株中进行(图1A)。请注意,该区域(包括 FRI 轨迹(橙色虚线))如何显示π降低、田岛 D 降低和高 CLR,与选择性扫描一致,仅在使用 FRIstop 的菌株中。顶部和中间面板中的水平虚线以蓝色或灰色表示各个组的全基因组平均值,在下方面板中,水平虚线表示使用我们的最佳人口统计模型从中性模拟得出的阈值(α = 0.05)。(H) 地图上全长和截断FRI等位基因的地理分布及其对A纬度的投影。塔利亚纳(*)和C.Hirsuta(三角形)表现出很高的相似性。颜色代表不同的截断FRI等位基因。矩形表示两个物种的高采样密度区域。饼图显示了 C 中功能性和非功能性等位基因的比例。多毛(左)和A中的全长和截短等位基因。塔利亚娜(右)。各个矩形内的菌株总数显示在饼图中。右侧的直方图显示了沿纬度的功能/全长(黑色)和非功能/截短的FRI等位基因(不同的颜色代表不同的截断等位基因)。FRIstop是主要的截短FRI等位基因。请注意,所有欧洲大陆C中只有一个。hirsuta菌株包含FRIstop2和无FRIstop3。地图图层是用自然地球和[142]制作的。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。ANC,祖先;巴尔,巴尔干;CLR,复合似然比;DAG,发芽后几天;德尔,派生;罗斯福,错误发现率;FLC,开花位点C;弗里,弗里吉达;GWA,全基因组关联;IBE,伊比利亚语;NCE,中北欧;ORF,开放式阅读框架;SNP,单核苷酸多态性;TPPI,三氯蔗糖-6-磷酸磷酸酶I。
https://doi.org/10.1371/journal.pbio.3002191.g002
8号染色体上显著相关的区域含有一个延伸的LD块,其中包含FRI是一种经过充分研究的基因,通过激活FLC表达来控制开花时间[60,61]。因此,FRI成为确定C中开花时间和小叶数自然变化的候选者。毛田。我们发现3个独立的多态性预测会截断FRI蛋白。由泛素10-启动子(UBQ10)驱动的任何截短FRI等位基因的编码序列(CDS)的C. hirsuta Oxford(Ox)系没有显示增加的莲座叶数(RLN),这是开花时间的代表,而表达非截断CDS(FRIfunc)的系使RLN增加了20%,证实了截断的功能意义(图2C)。在3个等位基因中,只有一个(FRIstop)以高频发生,因此可能是8号染色体关联的原因。该等位基因仅对NCE具有特异性,并且存在于45种非混合菌株中的57种中(S2B图)。这些观察结果与来自双亲杂交的重组近交系(RIL)种群中的QTL映射相结合([25]和图3E)表明,FRI/FLC模块是C中开花时间和小叶数量进展自然变化的主要决定因素。hirsuta(S2D图)。
FRIGIDA功能丧失突变的选择突出了C适应的异同。希苏塔和A.塔利亚纳
在GWA分析的候选基因FLC和TPPI中,与祖先等位基因相比,衍生等位基因与开花时间增加有关,反之亦然(图2D)。携带所有3个等位基因的菌株减少了开花时间属于NCE群体,并且确实显示出最低的平均和开花时间方差(图2D)。此外,区分BAL和NCE的主成分(PC)(S1B图)与开花时间呈负相关,与小叶数呈正相关(图2E和2F)。考虑到功能降低的FRI等位基因先前已被确定为A中自然选择的靶标。thaliana [29,43,62–66],我们假设我们在FRI发现的功能变异可能允许C。最近适应北欧气候条件的多毛。为了验证这一假设,我们使用程序SweepFinder2 [59]对正选择的特征进行了全基因组扫描,该程序使用复合似然比统计来识别多态性模式偏离中性预期的区域。我们发现,在使用NCE人群的最佳人口统计模型控制混杂人口效应后,FRI位点包含最显着的复合似然比值(图2G和S2E)。与基因组背景相比,该区域还显示出低核苷酸多样性(π)和田岛的D,表明遗传变异减少和低频等位基因过多,这是最近选择性扫描的标志[67](图2G和S2E-S2G)。值得注意的是,FRI位点位于8号染色体着丝粒周围区域的远端[53](S9表)。因此,选择性扫描跨越基因组区域,每代和核苷酸(r)的重组率非常不同,范围从4.7×10?10至 6.6 × 10?9在着丝粒区域内和两侧。我们假设,在着丝粒周围区域的r降低可以解释为什么选择性扫描在FRI位点的近端着丝粒区域进一步延伸,与FRIstop等位基因的菌株相同。我们通过模拟测试了这一假设,发现扫描谱与在NCE和BAL谱系之间的分歧时间之后发生的单个强选择的有益突变的硬扫描一致(S2H图)。然后,我们研究了A中FRI功能丧失等位基因的地理分布。塔利亚娜和C.毛田。鉴于这两个物种具有相似的生命周期,并且至少部分面临相似的生态挑战,我们推断,如果FRI功能丧失等位基因的平行进化有助于局部适应,则该等位基因应该在两个物种中表现出相似的地理分布。为了验证这一想法,我们利用了来自2,1 A的基因组重测序数据。塔利亚纳和公元115年。来自欧洲的多毛菌株。我们发现FRI功能丧失等位基因在两个物种中表现出相似的地理分布,中欧和英国北部的频率较高,瑞典的频率较低,南欧的频率甚至更低(图426H)。这一观察结果,以及选择性扫描的证据,与ChFRIstop在这个范围内的适应性进化是一致的。就像在 A 中一样。Thaliana,这些纬度地区充足的降水和相对较短的冬季等环境条件将允许夏季年和冬季年行为[2,35]。携带FRI功能丧失等位基因的快速循环系更有可能在夏末发芽时在冬季开始之前完成一个完整的周期,因此产生更多的后代[68]。这两个物种之间的显着差异是不同的FRI功能丧失等位基因的数量。我们在C中总共检测到69个不同的截短FRI等位基因。多毛,所有这些都在转基因实验中显示出功能丧失表型(图2C)。相比之下,我们在整组A中发现了3种不同的截短和可能的功能丧失FRI等位基因。拟南芥菌株(S2I图和S29表)。A中最丰富的功能丧失等位基因。拟南芥[2]发生在4%的欧洲A中。含有FRI功能丧失等位基因的拟南芥菌株(60株中有40株),而FRIstop在欧洲C的112.280%中被发现。具有功能丧失等位基因的多毛菌株(98 株中的 2 株)。
总之,我们的数据表明两种C中FRI活性降低的相同遗传机制的进化。希苏塔和A.在最后一次冰川最大值之后,在北欧和中欧殖民期间赋予快速循环。即使在像开花时间这样的遗传复杂性状中,这种保守机制也突出了进化如何以可预测的方式重用特定的遗传模块[70]。在这个保护框架内,表明在冰川最大值后需要快速循环以适应,一个重要的区别是不同数量的功能丧失等位基因似乎支持了两个物种快速循环的进化。这种差异可能可以追溯到人口统计学和基因组结构的差异,这导致A中重复选择多个等位基因。拟南芥与C中本质上是单一事件的东西。希苏塔(见讨论)。
转录因子SPL9介导的亚速尔群岛局部适应的证据
上面研究的FRI/FLC模块影响开花时间,同时影响营养发育的速度,包括小叶数量的节点依赖性变化。这一发现突出表明,小叶数量的年龄依赖性进展为监测发育时间的进展提供了一个有吸引力的特征。进一步了解C异时机制的自然变异。多毛及其在局部适应中的可能作用,我们评估了小叶数量相对于开花时间的变化。在GWA面板中,前8个莲座叶的累积小叶数与开花时间呈负相关(P < 0.001,cor = -0.34,皮尔逊相关性)。我们推断,如果异时过程在该物种的地上部形态变异中起核心作用,它们也可能是开花时间没有差异的菌株之间变异的基础。这与金鱼草的情况类似,其中对年龄依赖性叶形变化的遗传控制与开花时间无关[72],并且这也与营养相变和生殖能力在某种程度上在A中遗传可分离的发现一致。塔利亚纳[73,74]。我们还假设,如果存在这种独立于开花时间的异时变异,那么它的生物地理分布可能有助于我们理解其适应性相关性。我们注意到,在我们的GWA面板中的IBE菌株中,开花时间和小叶数没有相关性(S3A图)。平均而言,与NCE和BAL相比,IBE菌株产生的小叶数量最高。 有趣的是,一种源自亚速尔群岛法亚尔群岛的IBE菌株亚速尔1(Az1)尽管开花较早,但产生的小叶数量明显较少(图3A和3B),因此,与早期开花菌株中常见的加速异母细胞进展形成鲜明对比[25].我们假设,相对于其他IBE菌株,传单数量的这种强烈变化可能是亚速尔群岛局部适应的结果。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 4号染色体上的QTL簇导致亚速尔群岛C的小叶数量低。多毛菌株。
(A) 从第一叶到第八片叶的传单数进展表明 Az1 菌株与 IBE 组的其他菌株有很强的偏差(另见 S3A 图)。IBE菌株每个叶片节点的小叶数用蓝点表示,Az1的叶数用蓝色星号表示。阴影区域突出了 Az1 与其他 IBE 菌株之间的差异。(B)8周龄C的前4片莲座叶的代表剪影。希苏塔牛和Az1菌株在长日照内生长,显示后者的小叶数较低。(C) 用421 C进行外加剂分析。在过滤近亲关系后,753 株中剩余的 hirsuta 菌株。发现最适合数据的祖先组数为4个。每个垂直条代表一个菌株,其中颜色表示 4 个祖先组的混合比例。菌株被分配到血统比例至少为0.5的血统组。再次发现了图3A中的1个簇,并且在附加簇中具有最大血统的菌株仅来自AZ。 所有簇中血统低于0.5的菌株在图的右侧显示为“未分组”。(D) 分段常数有效种群大小(Ne)使用MSMC4对图3C中的2个祖先组进行,并考虑到4×10的突变率估计它们之间的分裂时间?9每个碱基,每代的突变。顶部面板显示 N 的祖先变化e考虑每年 1 代。颜色表示根据图3C的祖先组。分析了 4 组随机的 2 个菌株,这些菌株都是单独绘制的。底部面板显示了可用区与 IBE(实线)、IBE 与 BAL(长虚线)以及 NCE 与 BAL(短虚线)中的 RCCR。图中的浅蓝色阴影区域分别根据MIS 4-6,8,10,12,14,16,18和45[46]从左到右显示了古老的冰川期。LGM [2] 的周期同样由嵌入在 MIS 4-10 中的深蓝色阴影表示。(E)牛x Az1 RIL种群中从第10片莲座叶到第0片莲座状叶片的小叶数和总RLN(开花时间的代理)的多个性状QTL映射。将复合区间映射扫描的负对数基数 05 变换的 P 值与上面板左上角指示的染色体连锁组上的位置作图。水平红色虚线表示显著性阈值 (α = 4.1)。每个QTL对每个性状的显着等位基因效应显示在下部面板中,其中红色和蓝色表示方向,阴影根据左上角的图例表示效应的大小。(F)5号染色体不同叶节点上小叶数的多个QTL模型。使用 MQM 映射检测的 y 轴上指示的特征的 QTL 用黑点表示,1.5 LOD 间隔用阴影区域表示。1.4 LOD 间隔的颜色表示 QTL 根据图上方图例解释的方差。请注意,两个QTL的作用方向与传单数的亲本差异一致(即Az1的传单数低于Ox)。(G) 0号染色体不同基因组区域分离的HIF的传单数量。牛或Az05等位基因纯合子的传单数量分别以黄色和蓝色显示。垂直条表示均值的标准误差,点显示单个重复的传单数。特定叶节点的叶数差异显著为:*,P ≤ 0.01;**, P ≤ 0.001;,P < 1.4。请注意,具有HIF的Az1等位基因的植物LLN4_1A和LLN1_4B都显示出减少的小叶数量,但分别在更早或更晚的叶节点上。相比之下,HIF LLN1_4中具有Az1等位基因的植物携带较大的渗入,包括LLN4_1A和LLN4_1B,在早期和晚期的叶节点上显示出小叶数量减少。(H) HIF中3号染色体基因型的图形表示。黄色和蓝色分别表示纯合 Ox 和 Az10 等位基因,而分离区域则以红色着色。在该区域发现的5281个不同QTL的地图位置被描绘成黑匣子。图中所示图表背后的数据可以在 https://doi.org/7907435.1/zenodo.1 中找到。亚利桑那州,亚速尔群岛;Az<>,亚速尔群岛<>;巴尔,巴尔干;HIF,异质自交家族;国际教育局,伊比利亚;LGM,末次冰期最大值;MIS,海洋同位素阶段;NCE,中北欧;牛津牛;QTL,数量性状轨迹;RCCR,相对交叉聚结率;RIL,重组近亲繁殖系;RLN,莲座叶编号。
https://doi.org/10.1371/journal.pbio.3002191.g003
为了验证这一假设,我们首先探讨了低叶表型的流行程度。我们进行了更密集的采样并对267 C进行了测序。来自亚速尔群岛各地的多毛菌株发现,其中约24%的小叶数量很少(S3B图)。ADMIX分析揭示了亚速尔群岛特有的分化良好的祖先群体(AZ;图3C和S3C),包括Az1菌株。使用MSMC2和相关的人口分析估计,AZ和IBE的祖先群体至少在30万年前就分化了,因此表明C.亚速尔群岛上的多毛虫种群可能在很长一段时间内一直在当地适应(图000D和S3D)。为了确定这种低叶表型的遗传基础,我们在源自Az3和NCE菌株Ox杂交的RIL群体中对小叶数量和RLN进行了QTL定位(图1E和S3表)。我们检测到6个QTL同时影响RLN和传单数量(图7E)。3个位点中有7个对小叶数量和RLN的影响与TPPI/FLC和FRI描述的异时效应相似(图2A;[25]). 其余位点包括4号染色体(LLN4)上一个非常显着的小叶数QTL,该小叶数量强烈影响,但不影响开花时间(图3E)。对具有4个异质自交系(HIF)的LLN4进行遗传解剖,确定了位于3.17 Mb和39.22 Mb位置之间的83个紧密相连的QTL簇,其传单编号称为LLN4_1A,LLN4_1B和LLN4_2(图3F-3H和S3E和S6表)。与父母的行为和LLN4检测到的影响一致,每个位点的Az1等位基因减少了小叶数量。这3个QTL的效果也在渗入线(ILs;S3F图),显示最远端的位点LLN4_2对小叶数量的影响最强。为了进一步表征LLN4_2,我们首先测试了它对小叶数量的影响是否是异时性的,并且与开花时间无关。为此,我们使用近等基因系(NILs)进行了光周期偏移实验,该实验基于幼年植物对长光周期的开花诱导刺激没有反应的属性[75]。我们发现,与牛等位基因的纯合子系纯合子相比,Az1等位基因的纯合子将幼年到成人的相变延迟了1.97天(图4A)。然而,两条线在短光周期和长光周期中仅显示出RLN的微小但统计学上不显着的差异。我们得出结论,LLN4_2的影响是异时性的,影响幼年到成虫过渡的时间,从而影响小叶数量,在很大程度上与开花过渡无关。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. SPL9中的错义多态性是传单编号QTL LLN4_2的基础。
(A)光周期偏移实验表明,QTL处的Az1等位基因LLN4_2延迟幼年到成虫的相变。SPL1位点的Ox(黄色)或Az9(蓝色)等位基因的HIF纯合子植物从开花诱导长光周期转变为非诱导短光周期。植物的RLN与在长光周期中花费的时间作图。点显示单个工厂的 RLN,而线显示拟合到数据的逻辑模型。模型的拐点由 x 轴上的垂直箭头指示。(B) 传单编号QTL的精细映射LLN4_2。HIF LLN4_2的基因型信息显示在顶部面板中。在LLN4_4基因组区域中分离的 2 个不同重组系的纯合后代的图形基因型如下所示,包括上轴上遗传标记的位置 (Mb)。右侧的条形图显示了左侧相应基因型的叶子 1 到 8 产生的小叶数量。条形显示平均传单数量,以及单个重复的传单编号的点。进行Kruskal-Wallis试验以测试同一杂合重组的2个纯合后代之间的小叶数差异:*** P < 0.001,n.s.不显着。在右侧,描绘了从每条线的表型推断出的LLN4_2位点(Ox或Az1)的基因型。4 kb的LLN2_49精细映射区域包含面板下部所示的14个基因,其中较宽的矩形表示外显子,窄矩形表示内含子和UTR。包含SPL9的区域在底部扩展,Ox和Az2之间的1个错义SNP以红色着色,其他SNP为蓝色(另见S4A图)。(C)Chspl9突变体与SPL9Ox(gSPL9Ox)和SPL9Az1(gSPL9Az1)基因组构建体的转基因互补。转基因的估计拷贝数在括号中表示。作为对照,Chspl9突变体用空载体进行转化。gSPL9Ox和gSPL9Az1的两个拷贝可以分别将表型补充到牛wt和IL LLN4_2Az1的水平。点对应于来自2个独立T27植物的单个T1转基因植物,前8个叶子上累积小叶数的平均和标准误差由条形显示。紧凑的字母显示显示,根据邓恩检验,对多个成对比较的P值进行本杰明-霍尔姆事后校正,基因型之间存在显着差异。(D)等位基因交换为牛和Az2之间不同的9个SPL1错义SNP。SPL4位点的Az2等位基因纯合HIF_LLN1_9系(图4A和4B)用图4C所示的基因组构建体和携带Ox和Az2等位基因的另外1个嵌合基因组构建体或SNP的Az1和Ox等位基因(SPL9 mixAz1_Ox和SPL9mixOx_Az1)转化。HIF用空向量作为对照进行变换。点对应于单个独立的T1转基因植物,它们在前8个叶子上的平均累积小叶数由条形图显示。紧凑的字母显示显示,根据邓恩检验,对多个成对比较的P值进行本杰明-霍尔姆事后校正,基因型之间存在显着差异。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。Az1,亚速尔群岛1;HIF,异质自交家族;牛津牛;RLN,莲座叶编号;WT,野生型。
https://doi.org/10.1371/journal.pbio.3002191.g004
为了鉴定潜在的LLN4_2基因,我们首先将其精细映射到包含49个预测基因的14kb区域。其中,C.编码基因鳞片启动子结合样9(SPL9;图4B)成为该QTL的最佳候选者,因为它在调节A的发育时间中的作用。希氏梭菌的拟南芥和潜在的传单数量[75-77]。与这一观点一致,分析一个C。通过CRISPR-Cas9基因组编辑产生的SPL9(Chspl9)的多毛功能丧失等位基因显示小叶数量减少,类似于Az1菌株的表型(S4A图)。为了直接比较两种SPL9等位基因的影响,我们分析了携带来自Ox或Az9的SPL9基因组构建体的转基因Chspl1系。与Chspl9突变背景相比,SPL1Az9比SPL9Ox等位基因更不能够增加小叶数量(图4C),因此表明它是一种较弱的等位基因。为了测试这些差异效应是否可能是由9个等位基因的SPL2表达改变引起的,我们对2对基因型进行了RNA-seq分析,在差异表达基因列表中没有发现SPL9(S4B和S4C图)。然而,对预测编码序列的分析揭示了2个错义SNP(E242Q和D352N),它们可能会影响SPL9的功能(图4B和S4D)。我们分别评估了用亲本基因转化的HIFs中2个SNP中的每一个以及2个嵌合结构中仅2个错义SNP中的一个不同的效果。对小叶数量的表型分析表明,具有SNP E1Q的Az242或Ox等位基因的转基因系分别与用Az1或Ox基因组构建体转化的转基因系相似(图4D)。因此,我们得出结论,SPL9的等位基因变异是LLN4_2的基础,并且错义多态性E242Q有助于Az1菌株的低叶数。
为了测试SPL9及其连锁QTL(我们统称为SPL9 QTL簇)的遗传多样性是否可以通过适应性过程保持,我们首先确认了SPL9Az1等位基因在亚速尔群岛田间种植植物中的表型效应(S5A图),然后使用pcadapt在753亚速尔群岛和欧亚品系上寻找自然选择的特征。类似于 F圣基于PCadapt的方法,PCADAPT识别具有极端遗传分化的基因组区域[78]。然而,与 F 不同圣基于方法,它不需要事先的总体分配。这一特征有利于识别在复群结构和混合的情况下非中性进化的区域,如C的情况。多毛虫种群[78](图1和S1)。这些分析表明,SPL9 QTL簇与pcadapt检测到的最显着峰重叠(图5A和S5B),并且83,8个全基因组最重要的SNP中有1.000%落在6.4 Mb基因组间隔内,包括SPL9 QTL簇。因此,该基因组区域中的SNP表现出比基因组背景更强的遗传分化模式,与正向选择的作用一致[78]。然后,我们通过仅在高于阈值的区间内使用SNP进行PCA,探索了SPL9 QTL簇中pcadapt峰的遗传结构(图5B)。与基因组背景相比,来自亚速尔群岛的两组103和50株菌株在pcadapt峰处表现出更强的遗传分化(S5C图)。因此,这2组显示F圣值高于全基因组背景的第95个百分位数,在pcadapt峰处(图5A)。此外,两组在SPL9 QTL簇区域中的核苷酸多样性和田岛D明显低于其余基因组背景(图5C),这为SPL9 QTL簇基因组区域在正选择下进化提供了额外的证据。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. SPL9 QTL集群作为亚速尔群岛本地适应的驱动力。
(A) SPL9 QTL 集群上的选择签名。上图显示了曼哈顿图,其中包含753 C的pcadapt结果。多毛菌株(另见S5B图)。将 10 号染色体上 SNP 的负对数基数 4 变换的 P 值与它们的物理位置作图。水平虚线表示分隔1,000个全基因组最显着SNP的P值,其中83.8%位于SPL9 QTL簇附近。被发现负责QTL LLN9_242的SPL4误义SNP E2Q由红色圆圈突出显示。面板下部的黄色框描绘了 QTL LLN4_1A、LLN4_1B和LLLN4_2 (SPL9) 的位置。下图显示了沿加权 F 的 4 号染色体的滑动窗口分析圣在来自亚速尔群岛的两组菌株之间,grp2和grp1,在SPL2 QTL簇区被发现高度分化(另见图9B)。水平虚线显示加权 F 的全基因组第 5 个百分位数圣.(B)通过pcadapt分析检测到的838个异常SNP的PCA,这些SNP位于SPL9 QTL簇区域内,在全球753个菌株中。两组菌株彼此高度分化(grp1 –蓝色,grp2 –红色)和其他菌株(灰色和黑色)。SPL9 QTL簇中具有重组的菌株以黑色显示。(C)亚速尔群岛grp9(蓝色)和grp 1(红色)菌株的核苷酸多样性(π)和田岛D在SPL2 QTL簇周围的pcadapt峰区域以及GBG在峰外。(D) C.亚速尔群岛内的多毛菌株。饼图显示了根据图5B着色的样品中不同组的菌株的比例(蓝色-grp1;红色-grp2;黑色-SPL9 QTL簇中的重组;灰色-其他)。来自grp1和grp2的菌株仅在亚速尔群岛采样,并分别在东部和西部显示出频率最高的不均匀分布。地图图层是用自然地球和[142]制作的。(五)C的物价场数据。来自东西样带4个岛屿的多毛植物根据SPL242的功能错义SNP E9Q的等位基因着色(蓝色-Az1;红色-非Az1;黄色-杂合子;)。植物的发育阶段从1(非常幼苗)到6(高级种子脱落)不等。在Flores,Faial和Pico上,发现携带SPL9Az1的菌株比携带替代等位基因的菌株处于更晚期的发展阶段(*** P < 0.001,Kruskal-Wallis)。(F)来自亚速尔群岛的气象站数据显示,与西部相比,东部的降水量有所减少。在 1970 天的滑动窗口中分析了 2020–11 年的数据,步幅为 5 天,在每个窗口中计算了观测总天数中降雨天数 (> 0 mm) 的比例。每个窗口中下雨的天数分数由点显示,线显示拟合到数据的平滑样条以显示趋势。请注意,在东部的圣玛丽亚,从 10 月到 5281 月,降雨天数的比例与西部弗洛雷斯和法亚尔的最低年值一样低或更低。图中所示图表背后的数据可以在 https://doi.org/7907435.9/zenodo.9 中找到。GBG,基因组背景;PCA,主成分分析;QTL,数量性状轨迹;SPL<>,鳞状启动子结合质子样<>。
https://doi.org/10.1371/journal.pbio.3002191.g005
为了研究SPL9 QTL簇中可能的选择驱动因素,我们探索了该基因组位置中2个亚速尔群岛单倍群的地理和气候关联(图5B)。两组均沿亚速尔群岛东西纵轴表现出很强的地理结构(图5D),在采样年份中保持稳定(S5D图)。携带低叶SPL9等位基因的单倍型在西方占主导地位(grp1),而grp2的替代等位基因在东部普遍存在(图5E)。值得注意的是,这种东西向的临床分布反映了亚速尔群岛特有的植物区系(例如,Leontodon,Ranunculus和Tolpis)中的其他谱系,这被认为反映了西部温暖的夏季和东部干燥的夏季之间的气候梯度,与欧洲大陆相比,整个群岛的温度和日长年变化减小[78-82](图)5F 和 S5E–S5G)。因此,C中的群体基因组学和QTL分析。hirsuta揭示了关键异时转录因子SPL9的潜在适应性等位基因变异,这似乎是跨异质气候条件形态分化的主要驱动因素。
讨论
C.希尔苏塔和A.拟南芥都是主要的自花授粉植物,属于芸苔科谱系I[83],并且具有相似的年度生命周期,地理分布和一般栖息地。因此,比较人口分析为评估宏观气候周期(如冰川作用)对这两个相关物种的欧洲种群的基因组后果提供了极好的机会。我们的结果表明,欧洲人群的C.Hirsuta 由 2 个祖先群体组成,其中 IBE 和 BAL/NCE 可能在不同的冰川避难所中分化,现在是西欧类似于 A 的二级接触区的一部分。塔利亚娜[3]。就像在 A 中一样。拟南芥是其中一个集群,主要分布在伊比利亚半岛,与巴尔干地区和中欧北部发现的其他两个祖先群体有很强的分化。当使用与[84]相同的突变率时,使用fastsimcoal2获得的伊比利亚和非伊比利亚人群之间的分裂时间为2 kya(S319表)(见材料和方法)。这个分裂时间与A中遗余和非遗弃欧洲血统的分化估计相当。拟南芥[3],以及A中任何谱系报告的最古老的分化时间。塔利亚纳[17]。这一发现表明,C.多毛人谱系在几个冰川期相互隔离。C.伊比利亚的多毛孑遗物(17 株中有 19 株,而 A 的 68 株中有 86 种。塔利亚纳)它们在西欧的更广泛的地理分布(图22B)表明它们有可能适应比A更多样化的环境。塔利亚纳伊比利亚同行。
我们使用欧亚菌株面板中SNP变异的全基因组目录将基因型与开花时间和小叶数的表型联系起来。这些分析表明,这两种性状都受到多效性控制,FRI/FLC和/或TPPI有助于营养和生殖发育的同步。TPPI编码一种酶,该酶预测可去磷酸化海藻糖-6-磷酸,产生海藻糖。这种代谢物被认为可作为碳可用性传感器,在年龄依赖性途径中影响开花时间[58,85,86]。因此,TPPI的自然变异也可能影响碳感知,在自然表型多样性的背景下,可能将代谢和发育联系起来。
对FRIGIDA自然变异的研究说明了人口统计学和适应的平衡如何塑造了这两个物种的进化历史和多态性模式。在适应方面,截短的FRI等位基因主要发生在最后一次冰川最大值后殖民北欧的菌株中,这种模式与局部适应一致。巴尔干和中北欧集群之间的分裂时间(2 kya;图16E和1F),人口统计模型中的瓶颈(S1I图),以及MSMC1/相关检测到的有效种群规模的不断减少(图2E和1F)在很大程度上与以下情况一致:在上一个冰川期结束后,来自南部避难所的谱系殖民了北欧。此模式与 A 中的发现相似。符合这些纬度地区夏季和冬季年生命周期均保持不变的观点[1,35]。然而,在A中分离的功能丧失等位基因的数量和频率的差异。塔利亚娜和C.Hirsuta指出,快速循环的进化可能还受到调节基因组水平适应性反应的其他因素的影响。其中一个因素可能是C独特的爆炸种子传播策略。多毛菌,这可能促进了一些有益突变和古代单倍型的快速传播[69]。这一过程可能涉及增加孤立亚群之间的连通性,从而减少适应性等位基因扩散所需的时间[23,23]。或者,两个物种中FRI周围重组速率的差异(由C中较大的着丝粒区域引起。平田)还影响中欧FRI功能丧失突变引起的快速循环模式。而在 A 中。拟南芥FRI位于C染色体87号染色体短臂的远端附近。多毛,它位于4号染色体的着丝粒周围区域。选择性扫描中遗传搭便车的程度取决于局部重组率[8,88],因此,低重组区域往往会积累更多有害突变[89]。因此,FRI的多个独立有益等位基因的固定可能在C中受到限制。由于与A相比,由于潜在的遗传负荷更高。拟南芥,这限制了在人群中传播的能力。因此,基于对沿相似地理斜线的90个物种的多样性模式的广泛比较评估,FRI平行进化的案例说明了人口学,自然选择和基因组结构的复杂相互作用如何塑造适应过程。FRI中导致开花时间变化的自然等位基因变异也已在其他芸苔科植物中发现,例如芸苔油菜[2]和拟南芥[91],因此一旦存在更多物种的更大数据集,评估等位基因变异的空间模式将很有趣,就像我们在这里对C所做的那样。毛田。
我们对亚速尔群岛C的广泛分析。多毛苣种质表明,该岛复合体含有相当多的C。尽管先前的工作表明,亚速尔群岛的整体生物多样性可能很低,而且很少有谱系显示出适应性辐射的模式[93]。解释这些发现的一种可能性是,这个岛屿综合体代表了一个古老的避难所,其中C。Hirsuta是由流浪鸟类[94]在很长一段时间内引入的种子建立的,早在公元1449年人类大规模殖民亚速尔群岛和公元700年人类定居者的第一个证据之前[95,96]。在这种情况下,SPL9 QTL簇的地理局部分布加上正向选择的证据表明,我们在这里报告的表型分化可能在西亚速尔群岛具有适应性。这一观察结果提出了一个问题,即这种分布的环境驱动因素可能是什么。对气候变量的检查表明,亚速尔群岛西部相对于东部的主要区别是西部夏季降雨更频繁,并旱期打断[97](图5F,S5D和S5E)。在这种情况下,夏季降雨后发芽的种子可能会面临短暂的干旱期,这可能会对幼苗的建立和存活构成挑战。先前的工作已将SPL功能和幼年状态与耐旱性联系起来[39],这表明SPL9 QTL赋予的延长青春期可能有助于在面对短暂干旱时建立这种夏季幼苗。根据这一观点,拥有SPL9 QTL簇的菌株全年丰富,并且在11月在西亚速尔群岛已经发育先进(图5E),这与它们在夏季的成功建立一致。SPL9Az1的功能降低和较慢的少年到成年的过渡也可能是生活史策略的一部分,该策略是在相对于季节性更强的欧洲大陆在更广泛的宽松西亚速尔群岛环境中进化的,在这种环境中,更严格地控制过渡到生殖能力的成年阶段可能是有益的。分离以Az1等位基因为基础的其他QTL,加上实地研究和生理测定,以及开发用于共同估计人口统计学和选择的统计框架[98],将为这些问题提供更多的线索。作为起点,我们确认了我们在这项研究中表征的SPL9Az1小叶数量的减少也存在于田间种植的植物中(S5A图),支持了它在自然环境中相关的假设。总体而言,我们反复恢复的异时病作用QTL也显示出选择的证据,这突出了年龄依赖性发育途径对植物形态进化的高度意义[99]。这种流行的原因之一可能是,通过同时调节发育和对环境的反应的多个方面,这些途径为进化提供了快速修补综合特征和修改生活史策略的机会,通过改变频率异慢性调节因子的等位基因变异,如 SPL、FRI 和 FLC。我们在这里找到的SPL9和FRI变体是在编码而不是监管区域。由于多效性相对较低,调节变异经常有助于形态多样性,从而防止对发育和健康产生不利影响[100]。就FRI而言,这可能反映了其在FLC上游开花时间遗传网络中的关键作用,如上所述,FLC已被提出使其成为表型进化[101]和人口因素的潜在热点。另一方面,SPL9Az1是一种相对较弱的等位基因,其作用也可以被潜在的冗余副体SPL15部分缓冲[75]。这些事实可能通过限制潜在的有害影响而促进其流行。
C.我们在这里报告的多毛虫遗传和表型变异以及人口历史,以及先前对A的工作。Thaliana,说明了人口水平分析与种间比较研究的整合如何促进我们对适应机制,历史偶然过程和发展限制的相互作用如何塑造进化的理解。发现C.尽管是一种世界性的杂草,但亚速尔群岛的特有特征表明了广泛跨物种分布范围(包括分布边缘)进行深入多样性研究对于保护工作和了解不同生态系统的长期进化趋势的重要性。有趣的是,A.拟南芥仅零星出现在亚速尔群岛,1974年首次发现[80,102](S7表),而在其他马卡罗尼西亚岛屿也很丰富[19]。使用我们在这里报告的资源以及实地工作的未来比较研究将有助于理解这些差异的基础。这些研究还将加深我们对随机因素和确定性因素之间的相互作用如何形成相关物种生态地理分布和表型多样性的异同的理解。它们还应有助于了解当前气候变化对生物多样性的影响。
材料和方法
资源可用性
引线联系人。
更多信息和对资源和试剂的要求应直接提交给通讯作者Miltos Tsiantis(tsiantis@mpipz.mpg.de)。
材料可用性
本研究中产生的质粒和种子已存放在马克斯普朗克植物育种研究所Tsiantis实验室的相关收藏中,并将根据要求分发。对于天然菌株,只有GWAS小组的种子将在马克斯普朗克植物育种研究所的Tsiantis实验室进行策划。
道德声明
我们进行了尽职调查,以确保种子收集符合《名古屋生物多样性公约》。葡萄牙亚速尔群岛收集植物材料的相关现场许可证编号如下:SAI-DRA-2010-550、SAI/DRA/2011/1426、SAI-DRA/2014/1193和17/2017/DRA,由亚速尔群岛地方当局、能源区域秘书、环境与旅游、亚速尔群岛自治区提供。
实验模型和主题详细信息
S1表列出了此处使用的C. hirsuta菌株的起源。
植物栽培
植物在德国科隆的马克斯普朗克植物育种研究所或英国牛津大学植物科学系栽培。将C. hirsuta种子在10°C下在潮湿的土壤或滤纸上在黑暗中分层4天。 植物在气候控制的房间/橱柜或温室中种植。在前者中,长日照条件包括昼夜16小时和夜间8小时的循环,昼夜温度为20°C/18°C,光强度为200μmol·m?2·s?1,相对湿度为70%;和短日照条件,昼间/夜间循环 8 小时,光照强度为 16 μmol·m?2·s?1否则与长日相同。在温室中,温度设置为20°C,当光强度降至75μmol·m以下时,白天打开补充灯?2·s?1.温室中的相对湿度约为60%。
方法详细信息
用于研究C的应变面板。多毛遗传多样性和人口统计学
全基因组测序。
使用CTAB DNA提取方案或具有相关化学的自动化KingFisher Flex系统(赛默飞世尔科技)从752株新鲜叶中提取DNA,而不是来自牛津的参考菌株和1种卡达明寡精子菌株。在威康信托基金会人类遗传学中心(WTCHG,英国牛津)或马克斯-普朗克基因组中心(MPGC,德国科隆)使用Illumina HiSeq2000或HiSeq3000仪器(Illumina)进行配对端文库制备和短读长测序。读取长度各不相同,包括跨项目的49、100、150和151个核苷酸(详见S1表)。我们的目标是原始读取深度为20×,所有样本的中位数为20.28×(见S8表)。
参考菌株Ox[53]的长读数是使用Oxford Nanopore GridION X5在80×(MPGC,科隆)的覆盖率下生成的。
变体调用和质量控制。
C的参考序列。本研究中使用的hirsuta在[53],https://doi.org/10.5281/zenodo.7907435 和 http://chi.mpipz.mpg.de/assembly.html 中提供,直接或通过GenBank的链接提供(生物样本:SAMN02183597;生物项目:PRJNA293154)。使用IMR-DENOM-IRISAS管道执行短读对齐和变体调用[103]。通过双脱氧测序对称为SNP进行质量控制。共产生了 32,333 bp 的双链序列,其中包含 333 个称为 SNP,用于 84 个重测序菌株和牛参考的 8 个位点。后者的序列被发现与参考基因组完全一致。在8株中,根据SNP调用验证了2,640个SNP等位基因,发现6个等位基因不同,错误率为0.23%。6个错误称为SNPs位于2个位点。对于 1 个 SNP,在应该具有它的 4 种菌株中的任何一种中都没有发现替代等位基因。对于第二个SNP,在2株中未发现单个测序片段中的1个单例。
各种分析依赖于对重测序基因组中多态性和非多态性位点的准确描述。应用几种常见和菌株特异性掩码来控制基因组数据中的不同不确定性来源。我们屏蔽了读取深度小于4次读取的重新测序的基因组。使用samtools mpileup版本8.1,从bam文件中提取9条染色体的读取深度,该文件分别包含与参考基因组对齐的每个重新测序菌株的读取。IMR-DENOM确定了特别不同的序列基序,并将它们称为等位基因长度大于1但不一定长度相等的单个变体。IRISAS召回变异的结果是,这些基序的两个等位基因之间的所有差异都被称为SNP。因此,我们屏蔽了每个菌株中跨越相关变体的区域,位于其被称为的位置加上最长等位基因的长度。为了控制参考基因组中序列模糊性赋予的称为SNP的不确定性,我们对参考基因组的所有100-mer亚序列应用了Heng Li的SNPable区域方法,如下所述:http://lh3lh3.users.sourceforge.net/snpable.shtml。任何大多数重叠的100-mers没有唯一映射并且没有1差异的位置在所有菌株中都被掩盖。上述掩模应用于IRISAS召回的所有后续分析的变体,例如,如果该位置被所讨论的菌株掩盖,则SNP的等位基因更改为未知。未掩蔽位点的数量被认为是每个菌株观察到的核苷酸总数。由IRISAS生成的SDI文件被转换为使用IRISAS的SdiToSnpPlink命令的plink文件。SNP 总数为 11,576,732 个,每个 SNP 的第一分位数、中位数、第三分位数和平均缺失呼叫数分别为 1.461%、4.382%、15.14% 和 12.49%。
人口结构和人口分析
成对遗传距离和分层聚类。
PGDs从每对17菌株及其基因组掩码之间检测到的SNP数量计算[488]。前者被认为是差异的数量,并将其除以基因组中两个菌株都没有被掩盖的位置总数作为观察到的位点总数。分别使用cmdscale和hclust函数在R中对所得PGD矩阵进行主坐标分析和分层聚类,以识别和可视化远亲菌株的主要群。使用iTOL [104] (https://itol.embl.de/)将分层聚类的结果绘制为树状图。
外加剂。
为了使用程序ADMIX[105]分析群体结构,使用PGD过滤了菌株集的紧密相关性。临界PGD被选为0.0007,因为较低的距离表明由最近的自体事件引起的非常密切相关的应变(见图1C)。当PGD小于或等于0.0007时,将删除缺失数据量最大的应变。C的初始样本。多毛菌株包括来自亚速尔群岛的25株菌株,共产生488株。过滤密切相关性留下358个菌株用于ADMIX分析。SNP数据使用plink(-geno 0.05—indep-pairwise 30,000 5,000 0.2)过滤缺失值和相关SNP,剩下84,065个SNP。然后,程序ADMIX针对每个祖先种群(K = 75)到K = 1运行10次,使用不同的随机种子。评估单个游程的最低交叉验证(CV)误差,以确定最佳K。使用CV误差最低的单个重复运行的结果进行进一步分析。为了分析所有753种菌株,包括来自亚速尔群岛的所有种质,应用相同的程序,过滤后产生421株菌株和24,391个SNP的子集(-基因0.05-独立成对30,000 5,000 0.1)。由于与保留菌株密切相关而被过滤掉的菌株被分配与后者相同的祖先。
主成分分析。
使用R包SNPRelate[106]使用所有488菌株进行遗传变异数据的PCA。排除非双等位基因SNPs,并以0.2的截止值进行LD修剪。PCA图中的菌株根据ADMIX分析中鉴定的祖先组进行颜色编码。
核苷酸多样性的计算,田岛D,F圣和联动不平衡。
核苷酸多样性、田岛 D 和 F圣S2表中的值是使用vcftools版本0.1.16计算的[107]。对于C.使用来自BAL,NCE和IBE血统组的多毛,非混合种质。排除外显子和低重组着丝粒周区域(定义见[53])。使用滑动窗口方法计算统计数据,跨度和步幅为 100 kb。根据所有窗口计算平均值和标准偏差。对于 A.thaliana,我们创建了一个由代表C对应物的人群组成的数据集。依靠VCF文件和1,001个基因组数据的ADMIX分析(1001genomes.org;http://1001genomes.github.io/admixture-map),以及来自 [19] 的马德拉人口的 VCF 文件。与C类似的标准。使用Hirsuta数据集:仅考虑混合物少于5%的种质,并过滤掉外显子和着丝粒周围区域(定义见[108])。汇总统计数据的计算过程与 C 的过程相同。毛田。在从周围着丝粒区域排除SNP后,使用PopLDdecay [300]在同一组种质上计算沿109 kb物理距离的LD衰变。
MSMC2 和相关。
使用程序MSMC2[50]和相关[47]确定祖先组间聚结率的祖先变化。为了进行这些和进一步的分析,准备了另外2个面罩,并与上述面具相结合:(i)所有外显子都被掩蔽;(ii)低重组的着丝粒区域被掩盖。对于MSMC2,使用掩模准备输入数据,以确定SNP之间观察到的单态位点的总数。 为比较BAL-IBE,BAL-NCE和IBE-AZ分别准备了4个独特的数据集。每个数据集包含每组随机选择的4个菌株,这些菌株是从ADMIX分析中没有显示混合证据的菌株中随机选择的菌株。确保每组2个菌株的选择是独一无二的。包括数据集中8个菌株中至少8个是多态性的所有SNP,同时允许缺失值。SNP之间的观测位点总数计为所有2个菌株被揭开的位点数。然后以时间模式“1*2+40*1+1*2+1*3+<>*<>”分别在血统组内和跨血统组上运行MSMC<>。Ne从组内聚结率估计,并根据一般MSMC指南(https://github.com/stschiff/msmc/blob/master/guide.md)将缩放的时间段转换为世代,使用每代,每个核苷酸的突变率为4×10?9(图1E和3D)或者,出于与早期作品可比的原因,7×10?9 (S1G图)。相对交叉聚结率(RCCR)的计算方法是,组内合并率两者的总和除以组间聚结率的两倍。当RCCR降至0.5以下时,它被认为是人口分裂的时间。
该程序相关所需的SNP没有缺失值。为了防止由于这个原因而丢失太多的SNP,使用SHAPIT4 [110]版本4.1.2估算缺失值。选项“区域 1 - 线程 20 - 有效大小 150000 - PBWT 深度 10”和下面描述的遗传图谱。所有分析均使用相关版本1.1.14进行。输入数据是使用模块 RelateFile 格式从 VCF 文件准备的。由于C中的高水平自受精。Hirsuta,我们认为每个菌株贡献了一个单倍体基因组,并相应地修改了输入文件。为来自ADMIX分析确定的20个祖先组中每个组的4个种质的样品构建了祖先重组图,这些种质没有显示混合的证据。此外,低重组的着丝粒周和外显子区域被掩盖,以尽量减少直接和间接选择对估计的影响。relate 使用我们的重组映射和以下选项“—mode All -m 4e-9 -N 100000—线程 20”执行;用最近发表的 2 个 A 突变率重复分析。塔利亚纳:4·10?9 [111]和7·10?9 [17,112]。将相关为每条染色体生成的树序列用作输入,以使用相关模块 EstimatePopulationSize 估计合并率的变化。嘘。
快煤2.
对于使用软件fastsimcoal2(版本2.6.0.3)进行的人口统计学分析,我们使用了来自软件ADMIX识别的20个祖先组中每个群体的3个个体,这些个体没有显示来自其他组的混合物。滤除低重组合的近着丝粒区和外显子区域,以尽量减少直接和间接负选择对位点频谱(SFS)的影响。排除了缺失数据的位点,并通过对多态性和单态性位点应用相同的质量标准来确定单态位点的数量(即观察到的SFS的0,0,0类)。BAL、NCE和IBE祖先组的展开SFS是使用基于pyVCF和dadi库的内部python脚本构建的[113];具有2个以上等位基因的位点被删除。本分析中考虑的所有 5 个模型都有 3 个种群,对应于 3 个祖先组 BAL、NCE 和 IBE,并且它们具有相同的种群树拓扑((BAL,NCE) IBE)。圣、PCA、MSMC2 和相关分析。不对称迁移率允许在所有3对种群之间自由变化,并且随着时间的推移而保持不变。每个总体的大小是恒定的,除了可能的瓶颈(取决于模型)和允许与最后一次种群分裂同时发生的最终大小变化。S3 表中提供了模型的详细说明和汇总所有参数的表格,包括用于选择似然优化的初始参数值的范围。软件fastsimcoal2使用以下选项“-m -n 100000 -M 0。01 -N 100000 -l 10 -L 40 -q -x–multiSFS“;每个模型的最大似然被选为50个独立游程中的最大似然。模型选择基于rAIC值进行,如[51]所述。使用两种不同的已发表突变率将我们的估计重新调整为有效种群大小:4·10?9 [111]和7·10?9 [17],我们假设每年有1代人,将人口统计事件的年龄放大到几年。置信区间是通过在我们的最佳人口统计模型下模拟 100 个数据集并使用与观测数据相同的过程重新估计每个模拟数据集的参数值获得的。
将遗传变异与GWA面板中的表型联系起来
表型和GWAS。
在温室中进行了长时间日照条件下的实验,其中前10个莲座状叶上的小叶数和开花时间分别在4 C中分别量化了多达3个和最多352个重复。多毛菌株。平均开花时间用于进一步分析。异母细胞导致莲座叶上的小叶数量相关,我们之前描述了异母细胞进展速率与开花时间之间的负相关关系[25]。对小叶数的慢性影响在后期叶(>叶5)上变得明显,但由于开花早,一些植物产生的叶子不超过6片。因此,我们没有使用每个叶节点的平均小叶数量,而是将指数模型拟合到这些数据,并使用每个叶节点的预测值作为平均值的估计值。这种方法的优点包括:(i)利用所有叶子的信息更好地估计每片叶子的传单数量;(ii) 由于在连续尺度上而不是序数上估计,正态性得到改善;(iii)对由于早开花而没有产生那么多叶子的植物,将小叶数外推到叶子10。然而,对于图7A和3B所示的叶3上传单编号的GWAS,仅通过外推法估计了5个值。对平均开花时间数据应用分位数归一化以提高正态性。在计算亲属矩阵以校正GWAS期间的种群结构之前,使用PLINK369(www.cog-genomics.org/plink/241.2/)将SNP数据过滤至2,0个SNP,如下所示:(i)最大缺失呼叫率为0.35;(ii) 最小次要等位基因计数为 10;(三) (周围)着丝粒除外;和 (iv) 平方相关 (r2) 小于 0.8。然后使用GEMMA[114]计算中心亲属矩阵,其中包括203,701个SNP中的369,241个。 使用GEMMA进行GWAS,在过滤最大缺失率为2.651和次要等位基因频率为721.0后剩余的3,0,04个SNP。我们还使用R包mlmm中实现的多位点混合模型(MLMM)方法[115]对开花时间进行了GWAS。GWAS 版本 1.0.6。基于MLMM的结果,我们使用GEMMA执行了具有最显着SNP作为协变量的GWAS,并使用结果生成图2B。
FRIGIDA功能丧失突变的正选择突出了C在适应中欧气候方面的异同。希苏塔和A.塔利亚纳
8号染色体重组。
作为C的遗传图谱和物理图谱之间对应关系的质量控制。hirsuta,我们从低覆盖率重测序数据中重建了牛× Az1 RIL群体的遗传图谱(参见材料和方法段落“牛×Az1 RIL群体中的QTL映射”)。遗传标记之间的重组部分确定了在物理图谱的第2号染色体上分配的8组制造商,这些制造商与同一染色体的其他标记没有联系,但与7号染色体没有联系(S9表和S6A图)。此外,对遗传图谱的分析表明,在8号染色体物理图谱的周围着丝粒区域的边界处有一个顺序倒置的大段(S6B图)。牛×Az1 RIL群体的低覆盖率重测序数据的重组位置与纳米孔读数的复合位置与C对齐。hirsuta基因组能够识别物理地图上错误组装区域的边界(S9表和S6C图)。为此,首先使用带有选项(-ax map-ont)的minimap2将纳米孔读数与参考基因组对齐[116]。其次,在预测的错误组装区域的边界附近,检查读数在对齐中的一致截断,从而可以精确定位基因组错误组装的位置。切换到重新组装的基因组后,纳米孔读数确认了新的组装(S6D和S6E图)。此程序集应用于下游分析中使用的变体文件。
FRI 等位基因预测。
746 C的FRIGIDA基因中发生的遗传变异。希苏塔和 1,212 A。拟南芥菌株从SDI文件中过滤。A的遗传变异。使用IMR-DENOM-IRISAS管道从公开的重测序数据中调用拟南芥菌株[103],以确保可比性。不同FRIGIDA等位基因的序列是通过使用自定义R脚本根据基因内部调用的变异修改参考序列而获得的。然后使用R包seqinr将它们翻译成计算机中的氨基酸序列[117]。截短等位基因根据过早终止密码子的位置进行鉴定和标记。剪接位点突变、起始密码子或比全长等位基因短 10% 的等位基因被归类为截短等位基因(S4 表)。对于 A.拟南芥,有可能恢复 29 个截短的 FRI 等位基因,包括 FRI 山坳和 FRI勒等位基因。已鉴定的A等位基因。thaliana在757例全长病例中的761例和截短FRI等位基因的239例中有241例同意张和希门尼斯-戈麦斯的预测[118],表明该方法的可靠性。
FRIGIDA构建体,质粒和互补。
为了获得pUBQ10::FRIstop1-3和pUBQ10::FRIfunc,用引物TGCAGTACCCGACGAGTCAGTAATAA和CTCGAGAGTTAATCAAAACTCA扩增ATUBQ10::p romoter,从而附着3′ PstI和5′ XhoI限制位点。根据协议将该片段亚克隆到pJet 1.2(赛默飞世尔科技)中,随后作为PstI和XhoI片段克隆到pBJ36中。FRI的开放阅读框从C放大。希苏塔牛津(FRIstop1),C.希苏塔日本(FRIstop2),C.hirsuta 858B (FRIstop3) 和 C.希苏塔Azores1 (FRIfunc) 使用引物 GAATTCATGCAGGAGGAGCAACCCTCAACGGC 和 GGATCCTTACGTTCTTCCTTTGCGGTCTAGTG,添加了 3′ EcoRI 和 5′ BamHI 限制性位点。将平端PCR片段亚克隆到pJet1中。2.使用EcoRI / BamHI双消化将FRI等位基因插入pBJ36-pUBQ10中,随后进行连接。然后将pUBQ10::FRI片段使用NotI克隆到pML-BART中。所有质粒均通过双脱氧测序验证,并在根癌农杆菌菌株GV3101中转化。植物用A转化。通过花卉浸渍技术进行根癌[119]。收集并播种T1种子,并用BASTA处理发芽幼苗,以鉴定具有Basta抗性的转化T1个体。在实验中,我们分别测量了用pML-BART转化的20、41、48、49和58株植物的RLN。 我们使用邓恩检验和邦弗朗尼调整测试了组之间的统计差异以进行多重比较。分别播种了pUBQ2::FRIfunc和pUBQ3::FRIstop的2株独立T20植株中的1株T10植株,以及来自pML-BART转化的10种独立转基因的48株对照植株。在使用引物GAAGTCCAGCTGCCAGAAAC和TACATCGAGACAAGCAAGCAGGT通过基因分型确认存在BASTA抗性基因后,我们分别在至少3,7和33株FRIfunc,FRIstop和Control上对直到叶37的传单数量进行了评分。我们使用邓恩检验和邦弗朗尼调整分别测试了每片叶子上所有组之间的统计差异以进行多重比较。
中北欧人群的核苷酸多样性和田岛D。
PLINK PED文件被转换为VCF文件,仅保留使用PLINK99超过1%的NCE血统比例的菌株。9[120]。最终数据集包含 12 个携带全长 (FRIfunc) 的菌株和 45 个携带截短 FRI 等位基因 (FRIstop) 的菌株。Pi和Tajima的D是使用VCFtools[107]计算的,窗口大小为200 kb,步长为50 kb。
使用扫描查找器进行选择性扫描分析2。
我们对齐了外群物种C的Illumina短读。如前所述,寡精子在已知的多态性位点使用Samtools mpileup称为SNP。我们仅保留了在NCE菌株中具有99%以上NCE血统比例的多态性SNP。我们根据外群等位基因将这些SNP极化为祖先和派生等位基因,并使用自定义R脚本创建了一个站点频率(SF)文件。SweepFinder2 [59]分别在每个染色体和每个组(FRIstop和FRIfunc)上运行,包括使用预先计算的经验全基因组频谱以10,000步长的单态位点。为了获得复合似然比的显著性阈值,使用msprime版本1.000.8 [0]根据最佳fastsimcoal模型(S7I图和S3表)的估计值,对121号染色体进行了1,3次中性模拟。外(6.17 × 10)?9每代每个碱基对的重组)和内部(4.39 × 10?10)从第3.1节描述的遗传图谱中估计了着丝粒周围区域,方法是在物理距离上回归遗传距离,突变率为4×10?9使用每代每个碱基对的突变。然后对所有模拟数据集进行SweeD [122]分析,并将显著性阈值计算为每次模拟的最大CLR值的第95个百分位数。8号染色体上最强和显着的CLR峰范围为8,365,935至11,617,060 bp。我们可视化了SFS,它在峰内为U形,在峰外为L形。
扫描大小的模拟。
模拟用于确定在8号染色体上观察到的含有FRIstop的扫描区域的大小是否与NCE相对较新的分化一致。我们使用SLiM版本3.3根据fastsimcoal123发现的最佳人口统计模型(S124I图和S2表)模拟Wright-Fisher模型[1,3]下的树序列。应用了100代的老化期,并通过概括最终确定。C中8号染色体长度的染色体。模拟了Hirsuta(18,747,412 bp)。染色体组重组率为9.944·10?8重组·BP?1·世代?1(建议·BP)?1·艰?1),降低率为 4.945·10?9建议·bp?1·艰?1在着丝粒周围区域(根据[53])。自施肥率设定为每代95%。
代表FRIstop的选定隐性突变(h = 0)被引入位置11,100,000,即FRIstop的大致位置,在NCE从其祖先种群(BAL)分裂之前16,030代或之后。使用msprime版本0.4.7[121]将模拟的树序列与中性多样性叠加,突变率为4·10?9突变·bp?1·世代?1.选择系数 0.001、0.01 和 0.1 的所有组合以及 FRIstop 在 16,030、13,030 10,030、7,030、4,030、1,030 之前出现的所有组合均模拟了 12 次,但 1 次组合除外 8 次。模拟中FRIstop在我们的C中没有达到79.31%的经验频率。毛蕊样品被丢弃。
使用VCFtools版本0.1.16 [107]对模拟数据进行了核苷酸多样性(Pi)的滑动窗口分析,窗口大小为200 kb,步幅为25 kb。模拟扫描的大小被测量为包含所选突变的还原Pi区域。扫描的边界由窗口确定,其中Pi低于模拟染色体上18,000,000至18,747,412 bp区域的平均Pi,选择该窗口是最远的,因此与模拟突变的联系最弱。将模拟扫描大小与经验扫描大小进行比较,经验扫描大小通过Pi在位置上的分段线性回归确定为6,832,662 bp。
SPL9转录因子是亚速尔群岛潜在适应性异时变异的基础
来自亚速尔群岛的C. hirsuta系列。
Az1菌株采集自亚速尔群岛法亚尔岛[20]。之后,进行了4次采样旅行,3次在春末,一次在秋季。每次采样从每个岛屿测序的收集菌株数量可以在S10表中找到。
从每个访问种群中的多株植物中收集种子或成熟的长方形植物,但每个种群仅对1株植物进行测序,除了秋季旅行中从弗洛雷斯收集的单个种群中的12株。在同一次采样旅行中,收集了所访问人群的物候数据。植物根据6个类别对植物的发育阶段进行原位评分,从1个(非常年轻的幼苗)到6个类别(成熟植物破碎种子)。这些数据记录在每个种群的几个代表性斑块中。同时,使用硅胶收获和干燥叶片材料。从这种材料中提取的DNA后来在实验室中对SPL1的Az9等位基因进行了基因分型。
亚速尔群岛菌株的表型。
264 C各重复四次。从亚速尔群岛收集的多毛菌株在长时间的白天条件下在气候室(受控环境)中培养。在前6个莲座叶上计算传单编号。小叶数低的菌株被鉴定为属于小叶数分布的第一模式,其中包括Az1菌株。
在亚速尔群岛进行实地实验。
常见的花园实验是在亚速尔群岛(葡萄牙)的法亚尔植物园进行的。种子于13年2018月22日播下。大约在植物开花时计算19个牛wt菌株和4条渗入线(IL LLN2_1Az1)的传单数量,这些菌株在SPL9位点两侧的牛遗传背景中包含一个Az<>渗入(参见材料和方法部分关于渗入线的构建和验证)。
叶子剪影。
叶子轮廓是通过将叶子粘在纸上后,以800 dpi和位深度24的分辨率扫描叶子获得的 爱普生完美V700照片扫描仪.对于图3B,首先使用Adobe Photoshop将叶子转换为黑白轮廓,然后使用Adobe Illustrator的图像跟踪选项转换为矢量化路径对象。
牛×Az1 RIL群体的构建及其遗传图谱。
Az1菌株通过单种子下降(SSD)繁殖3代,以减少杂交到牛菌株之前的潜在杂合量。总共有 192 条 F2 系列通过 SSD 传播到 F9 代。通过Illumina重新测序获得遗传标记,覆盖率为0.5×(科隆马克斯普朗克基因组中心),随后使用重建进行插补[125]。为每个重组断点创建一个遗传标记。使用这些标记构建遗传图谱是使用R / qtl [126]和MSTMap [127]的组合进行的。删除重复标记、缺失数据超过 6.25% 的标记和明显偏离 1:1 分离比(邦弗朗尼调整 P 值< 0.05)的标记。同时,我们使用MSTMap创建了一个从头创建的遗传图谱,以包括来自非锚定支架的标记,使用分组对数(LOD)为3和Kosambi函数。无法映射到任何主要连接组的未锚定支架的标记被丢弃。如果未锚定脚手架的相邻标记显示距离大于 8 cM,这些标记也被丢弃。从头地图显示的标记顺序与物理地图几乎相同,但不完全相同。为了定位基因上未锚定的支架,根据8条染色体的物理图谱强制进行标记顺序。然后添加来自未锚定支架的标记,以根据重组频率明确定位它们。如上所述,最初在8号染色体上发现的一些遗传标记被转移到7号染色体上,并且着丝粒周围区域的标记顺序颠倒。单独检查大于5 cM的间隙以找到低质量的潜在标记物,这将导致与侧翼标记物的明显过量重组。为此,在没有遗传标记侧翼大间隙的情况下计算遗传图谱的长度,我们排除了那些导致增加2.5 cM或更多的标记。最终地图包含2,720个标记,平均间距为0.3 cM,最大间距为8.9 cM,总长度为815.2 cM(见S5表)。
牛×Az1重组自交系的表型:在潮湿的土壤上播种12个重测序RIL的后代的10个重复和亲本系的4个重复,并在10°C下分层<>天。 这些植物在长时间的日照条件下在温室中生长。对前<>片莲座叶上的传单编号和莲座叶总数进行评分。
QTL映射程序:使用GENSTAT第20版进行多性状QTL分析[128]。使用QMTQTLSCAN程序使用叶节点2至10和RLN上的小叶数的每个基因型的平均性状值进行多性状QTL映射扫描。简单的区间映射扫描之后是几轮复合区间映射。在后者中,添加,删除辅因子或改进其位置,直到无法实现QTL模型的进一步改进。然后将最后一组辅因子用作QMTESTIMATE程序中的遗传预测因子,以拟合最终的QTL模型并估计这些QTL解释的等位基因效应和方差。
使用R/qtl [126]和自定义R脚本分别对每个性状进行多个QTL模型分析,以找到每个性状的最佳QTL模型[129]。使用HALEY Knott回归在1 cM分辨率下使用SCANTWO间隔映射函数鉴定了新的QTL和上位相互作用[130]。当无法使用 SCANTWO 识别出 QTL 时,通过 SCANONE 间隔映射以 1 cM 分辨率识别新的 QTL。所有新的QTL都被添加到模型中,并使用REFINEQTL优化位置。使用 ADDPAIR 和 ADDQTL 添加了新的 QTL,并使用 ADDINT 添加了新的交互。所有模型均使用FITQTL进行检查,我们仅保留高于由10,000个排列确定的LOD阈值的QTL,这对应于单个QTL的LOD为3.14,上位相互作用的LOD为4.17。相距小于10 cM的QTL被认为是相同的。当无法识别新的 QTL 或在迭代过程中相同的 QTL 模型出现两次时,新 QTL 的搜索完成。在最终 QTL 模型中为每个 QTL 计算每个 QTL 的 1.5 LOD 间隔。
异质近交系的选择。
HIF是NIL(姊妹植物),仅在其他纯合子尽管异质性背景中分离感兴趣的区域。HIF是从F7代的Ox× Az1 RIL群体中选择的[131]。这些是RIL48(HIFLLN4_1)和RIL126(HIFLLN4_2)。为了验证QTL LLN4_1,我们使用S4表中的标记选择了HIFLLN1_11后代中的重组系。杂合HIF的后代在短日照条件下生长,并在分离区域内的标记处进行基因分型。我们对 Az17 等位基因的 18、19、37 和 1 株植物进行了表型分型,对 20、26、19 和 33 株具有 HIF LLN4_1、LLN4_2、LLN4_1A 和 LLN4_1B 的牛等位基因纯合子植物进行了表型分型。我们使用非参数成对Wilcoxon符号秩检验测试每个叶节点上基因型之间的小叶数量差异。
渗入线的构建和验证。
衍生出1个IL,携带Az4等位基因的LLN1_4和LLN2_2位点在牛遗传背景中。它们是从HIF LLN4_1Az1和HIF LLN4_2Az1中选出的4株植物中获得的,分别使用C在6代和12代中回交。希苏塔牛菌株作为复发性亲本。使用S1表中引物的标记辅助选择来获得从Az4渗入的系,跨越4号染色体的完整LLN4区域(IL LLN1_1Az4+LLN2_1Az4),并且仅LLN2_1区域。横跨整个区域的线仅用于LLN4_1位点推导具有较小Az<>渗入片段的IL。
IL LLN4_1Az1+LLN4_2Az1 和 IL LLN4_1Az1系分别携带来自 Az1 4 号染色体的渗入片段,分别约为 9.8 Mb 和约 6.3 Mb。两个系在位于4.13 Mb和074.13 Mb的标记之间的147号染色体上都有近端重组事件。然而,IL系LLN4_1携带标记之间的远端重组点17.504和19.361 Mb,而IL LLN4_1Az1+LLN4_2Az1的渗入一直持续到4号染色体末端(22.86 Mb)。IL LLN4_2Az1系通过Illumina全基因组测序(科隆马克斯普朗克基因组中心)验证。这也允许确定1号染色体上的Az4渗入从位置20,439,000 bp到20,891,000 bp(约0.5 Mb),并且来自Az1的基因组在Ox背景中的总比例为3.15%。来自杂合IL的种子在短日照条件下生长,并在分离区域内进行基因分型,遗传标记列于S12表中。我们对 Az18 等位基因的 19、10 和 1 株纯合子植物进行了表型分型,对 IL 的 Ox 等位基因进行了 20、18 和 10 株纯合子的表型LLN4_1分别为 +LLN4_2、LLN4_1 和 LLN4_2。
光周期偏移实验。
使用针对QTL LLN4_2进行分离的HIF进行光周期偏移实验。10株牛等位基因纯合子和1株Az0等位基因纯合子植物在播种后4、6、8、9、10、11、14、18、20、24和1天从最初的长日照条件转变为短日照条件。RLN在开花后被指望在所有植物上。在R中进行统计分析,方法是使用公式为y ~ A / (95 + B * E^?×的函数nls拟合以RLN为因变量的逻辑模型,并在移位之前将漫长的一天天数拟合。拐点的置信区间(10%)由000,<>个自举估计,如果置信区间不重叠,则拐点之间的差异被认为是显着的。
SPL9的精细映射。
对HIF_LLN4_2进行了两轮精细映射,该在4,20,280和337,21,408 bp之间的115号染色体上分离。对8个不同重组系的后代进行基因分型和小叶数表型。4种信息量最大的重组品系如图4C和4D所示。我们分析了21和21,42和32,21和21以及11和8植物的重组HIFs rec 29,rec37,rec36和rec39分别携带分离区域的Az1和Ox等位基因。对于每个重组HIF,使用Kruskal-Wallis检验测试2个等位基因之间的小叶数的显着差异,然后对所得P值进行Bonferroni调整。根据PCR标记,20号染色体上的QTL间隔降低到570.20至619.4 Mb(见S13表)。
SPL9的CRISPR-Cas9诱变。
spl9突变体是通过CRISPR-Cas9获得的[132]。包含2个sgRNA序列(SPL9 gRNA1:CCGGGTCAGGCAGAGTCCGG,SPL9 gRNA2:TCAAACAGACGGGTCCGTGG)的构建体被整合到针对拟南芥优化的pDE-Cas9载体中[133]。 对C. hirsuta Ox进行转化,并使用BASTA选择转化体(T1)。T2 系测序显示,核苷酸 G 和 C 分别在相对于起始密码子的位置 1 和 53 之后插入两个 179 bp 片段,导致移码和过早终止密码子,从而产生 23 个氨基酸的肽。T-DNA被分离出来,这通过PCR和BASTA抗性的丧失得到证实。纯合T3植株用于基因组互补实验。为了验证spl9突变的效果,在短日照条件下生长了10个spl9突变体,IL LLN4_2 Az1等位基因纯合子和牛野生型植物的重复。对于每个叶节点,使用邓恩检验比较3种不同基因型之间的小叶数量。
用于分析SPL9的基因组构建体。
为了获得质粒pChSPL9::gSPL9,以及来自Az9(gSPL1Az9)或牛(gSPL1Ox)的SPL9基因组克隆,使用引物TTTGCGGCCGCGAAGTTAACTCGATCTAAATCAATAT和CAGCCGCAGCAGCGAGAGAGACCAGTTTATAGTtatg,通过PCR扩增含有开放阅读框(ORF),UTR和6 kb上游序列的3 kb基因组片段。扩增产物在pGEM-T Easy载体系统(Promega)中克隆。交换的1个错义SNP等位基因的嵌合结构由SPL2的Az1和Ox CDS制成。为此,用BlpI消化CDS,并将所得片段连接,以选择具有等位基因互换的片段。SPL9mixOx_Az9在SPL1的第一个SNP上具有Ox等位基因,在第二个SNP中具有Az9等位基因,SPL1mixAz9_Ox反之亦然。通过用Kpn I-XmaI消化,将所有CDS片段克隆到已经含有ChSPL1Ox启动子和终止子章鱼合酶(OCS)的pBJ36中。pChSPL9::gSPL2的9个亲本版本,以及SPL9mixOx-Az9和SPL1mixAz9-Ox,使用非I限制性内切酶转移到二元载体pML-BART中。所有质粒均通过双脱氧测序验证并在A中转化。根癌菌株GV1。植物也用空的pML-BART作为对照进行改造。
我们获得并量化了 12、19、32、12 和 20 株 HIF LLN1_4纯合子的 T2 植株的传单数量分别与 pML-BART 空、gSPL9Az1、gSPL9Ox、SPL1mixAz-Ox、SPL9mixOx-Az9 转化。 在spl1突变体的互补实验中,我们传播了9个独立的T1系,其中包含gSPL9Az10和gSPL1Ox的单个转基因拷贝以及对照系的9个拷贝。在T1代中,在长日照条件下生长和表型生长互补的spl9突变体的3个重复和每个对照系的2个重复。在互补的SPL10突变体中估计转基因拷贝数,范围在9到5个转基因拷贝之间。在分析中,将没有转基因的植物与对照植物分组在一起。Az9纯合的牛野生型植物和IL LLN0_2植物与其他品系一起生长和表型。比较对照植物4、2、1、92、42、23和50株、gSPL26Az19(15)、gSPL9Az1(1)、gSPL9Ox(1)、gSPL2Ox(9)、ILLLN1_9Az2和Ox从第一叶到第八片叶片的累积小叶数。使用邓恩检验使用P值的Bonferroni平差方法检验组间的统计差异。
RNA-seq分析。
为了比较Ox和Az1的转录组,将种子在4°C的土壤上分层10天,然后在短时间内转移到生长室中。幼苗在发芽后7天和12天切下胚轴上方,并立即在液氮中快速冷冻。HIF-LLN4_2(Rec29)Ox和HIF-LLN4_2(Rec29)Az1系在长日照条件下生长。幼苗发芽后12天收获地上组织。使用标准方案使用植物总RNA试剂盒(Sigma)进行RNA提取。分别使用Illumina HiSeq3和Illumina HiSeq2在科隆马克斯普朗克基因组中心对每种菌株的3000个重复和每个HIF的2000个重复的RNA进行测序。Illumina读段按照[53]中所述进行处理,产生每个基因的读段计数。使用R封装DESeq2分析这些数据[134]。使用方差稳定变换对计数数据进行归一化,并将盲参数设置为 FALSE。P值调整以0.1的错误发现率(FDR)进行。
不同芸苔科物种的SPL9序列的比对
对于SPL9氨基酸序列的种间比较,从 https://phytozome-next.jgi.doe.gov/ 下载了21个不同的序列,包括来自外组物种Tarenaya hassleriana的2个SPL9序列。使用最大似然法和基于JTT矩阵的模型推断进化史[135]。将显示对数似然度最高的树 (?3,561.01)。通过将相邻连接和 BioNJ 算法应用于使用 JTT 模型估计的成对距离矩阵,然后选择具有卓越对数似然值的拓扑,自动获得启发式搜索的初始树。树按比例绘制,分支长度以每个站点的替换次数来衡量。该分析涉及除C的SPL21序列外的9个序列。希苏塔牛和C。希苏塔Az1氨基酸序列。最终数据集中共有 401 个位置。在MEGA X中进行进化分析[136]。
使用 pcadapt 进行选择性扫描分析
为了使用pcadapt[78]进行分析,使用PLINK1过滤SNP数据。9(https://www.cog-genoimcs.org/plink/)在包括亚速尔群岛在内的0个全球野生菌株中,每个SNP的次要等位基因频率大于05.20,每个SNP缺失的数据为753%或更少。过滤后,剩下2,247,751个SNP。最初,使用PCADAPT进行PCA,包括LD聚集,阈值为0.1,以减少LD对种群结构的影响。前9台PC高于PC的基线水平,并保留用于PCADAPT分析以进行异常值检测。pcadapt分析计算出的P值分布呈U形,显示出极低和高P值的过量。由于QQ图显示偏差P值过多,因此FDR阈值的计算是不合适的。或者,我们将P值最低的1,000个SNP分类为顶级异常SNP(所有SNP的顶部0.00044%)。然后,对位于pcadapt峰内并与SPL1 QTL簇重叠的前000,9个显着SNP进行PCA(位于14号染色体上的256,679,20 bp和661,850,4 bp之间)。根据PCA定义两组高度发散的菌株如下:grp1与PC1 < 0和PC2 > 0.07,grp2与PC1>0.11。使用IGV [9]目视检查SPL137单倍型中的SNP可以识别该区域具有重组的菌株。如上所述,所有SNP的PCA,在pcadapt峰内和外部,均使用pcadapt进行。LD团块既未应用于前1,000个SNP的PCA,也未应用于pcadapt峰内外所有SNP的PCA。
计算核苷酸多样性、田岛 D 和F圣
PLINK ped文件被转换为VCF文件,仅保留属于grp1(n = 103)或grp2(n = 50)的菌株,使用PLINK1。9[120]。核苷酸多样性 (π)、田岛 D 和加权 F圣使用VCFtools[107]计算两组之间的菌株,窗口大小和步幅为100 kb。使用Kruskal-Wallis检验测试基因组背景(n = 1,766个窗口)和pcadapt峰值(n = 64个窗口)之间的π和田岛D的差异。用于绘制加权 F圣,我们只保留了超过 700 个 SNP 的窗口,以排除对齐中存在较大间隙的区域。
气候数据
气候数据以30英寸的分辨率从 http://worldclim.org/ 下载[138]。使用R包栅格提取了亚速尔群岛和牛的菌株位置的生物气候(BIO)变量[139]。此外,使用KNMI气候浏览器(http://climexp.knmi.nl)下载了来自8个当地气象站的每日数据:PO000008506(法亚尔,亚速尔群岛,葡萄牙纬度38.52,长-28.63),POM00008501(葡萄牙亚速尔群岛弗洛雷斯,纬度39.455,长-31.131),POM00008512(亚速尔群岛圣米格尔,纬度37.741,长-25.698),POM00008515(圣玛丽亚,亚速尔群岛,葡萄牙,纬度36.971,长-25.171),UK000056225(英国牛津,纬度51.77,长-1.27), HRE00105217(克罗地亚Split_Marjan,纬度43.5167,多头16.4331),ITM00016310(意大利帕利努罗,纬度40.017,多头15.283)和SPE00120566(西班牙托莱多,纬度39.8844,长-4.0492)。为了分析降水,在 11 年至 5 年期间,在一年中的几天应用了滑动窗口,具有 1970 天窗口和 2020 天的步幅。在每个窗口中,计算有观测的总天数的降雨天数(即降雨量超过0毫米)的比例。温度数据被分析为一年中每天的平均值。
统计分析和数据可视化
使用R(R核心开发团队)分析数据。有关本手稿中所示结果的统计细节的信息,请参见方法详情和/或图例的相应部分。将不同组(例如基因型)之间的每片叶子数与2组的非参数Wilcoxon秩检验和2组以上的Kruskal-Wallis检验进行比较。必要时,使用Bonferroni或Benjamini-Hochberg校正对P值进行多次测试校正。对于数据准备和可视化,R 打包数据。使用table,KRIS,Rmisc,packcircles,rnaturalearth,ggplot2(扩展为scatterpie和ggrepel,ggforce,ggpubr,ggnewscale和cowplot)[140-144]。数据表示为SEM和/或单个观测值±平均值。P 值 < = 0.05 被认为是显著的。P 值 ≤0.05、≤0.01 和 ≤0.001 分别标有 (*)、(**) 和 (***)。
支持信息
C.毛田。
显示 1/19: pbio.3002191.s001.tiff
跳到无花果共享导航
https://ndownloader.figstatic.com/files/41604177/preview/41604177/preview.jpg
1 / 19
下载
无花果分享
S1 图 C.毛田。
(A)不同随机种子ADMIX分析中的CV误差。CV误差与75个独立分析的所选总体数量(K)作图。CV 误差越低,表示与数据的拟合越好。在此分析中,一致发现K = 3是数据的最佳总体数量。(B)SNP数据的PCA证实了ADMIX分析。第一台 PC 将 IBE(蓝色)与其他 PC 分开,而第二台 PC 将 BAL(红色)和 NCE (黄色)分开。在ADMIX分析(图1A)中,仅在单个血统组中具有血统的菌株由较深的色调与较浅的色调显示混合菌株。(C)PGD的分层聚类(hclust)揭示了遥远的孑遗物类群。Chlust用于识别基于PGD的孑遗菌样菌株,以及其中的远距离群体。hclust 的结果显示为树状图,其中分支长度是 PGD 的量度。第一次分叉将菌株分成两组,它们之间的遗传距离很高,其中一组主要类似于拟南芥中发现的孑遗物样组(彩色标签)[2],因为它包含所有IBE菌株。与ADMIX相比,该分析还允许鉴定由少量菌株代表的组,这导致发现了17个不同的孑遗样菌株组,它们之间的遗传距离相对较大。确定了来自西班牙西北部、瑞典、荷兰和新西兰的 2 个谱系(洋红色)。在ADMIX分析中,这些菌株作为混合系位于BAL或NCE中,或者它们未分组。11个谱系中的一些谱系之间的巨大遗传和地理距离表明,他们可能代表一个不同的混合群体,可能具有代表性不足的群体的祖先。(D)用hclust发现的11个孑遗类群是PGD分布中第二个主要模式的原因。所有菌株的PGD分布由黑色轮廓显示。颜色表示由PGD基质的hclust鉴定的2个最远的菌株组的贡献,其余的菌株对以灰色显示。在图例中,PGD基团被直接或括号中分配给所含菌株所属的ADMIX簇(图2A)。分布中的颜色表示按图例顺序从数据中逐渐删除各个 hclust 组所引起的变化。蓝色区域表示IBE组菌株与所有其他菌株之间的PGD,其他孑遗类菌株与除IBE以外的所有其他菌株之间的PGD洋红色区域。(E) 孑遗物状C。多毛菌株主要类似于在拟南芥中发现的伊比利亚遗迹。C的地理分布。多毛菌株由相应的颜色表示PGD组成员身份(S1D图)。与拟南芥[1]中的伊比利亚遗迹相似,C.希苏塔国际教育局线(蓝色)在伊比利亚半岛的频率很高,但在西欧和马卡罗尼西亚群岛也更广泛地发现。地图图层是用自然地球和[17]制作的。(F)C的可比祖先群体中的LD衰变。希尔苏塔(C.h.) 和 A.塔利亚纳(A.平均平方相关(r2) 与 SNP 对之间的平均物理距离(以千碱基为单位)绘制。对于 A.拟南芥,与C相当的祖先群体。包括:遗物(C.h. 国际教育局)、NWC_Europe(西欧+中欧+德国;三.h. NCE)、IBC(意大利、巴尔干、高加索;三.h. BAL),以及伊比利亚非遗弃人口(A.t. 伊比利亚)。(G, H)使用MSMC3(G)和相关(H)对2个ADMIX组中的祖先有效种群大小(Ne)进行分段重建,并考虑7?10的突变率估计它们之间的分裂时间?9每个碱基对,每代的突变。上图显示了ADMIX组中Ne的祖先变化,当考虑每年1代时,以年为单位绘制时间。红线、蓝线和黄线分别表示 BAL、BE 和 NCE 基因簇。使用MSMC2(G),分析了20个随机组的4个菌株,这些菌株都被绘制成图,而使用相关(H)则对所有菌株进行联合分析,因此是一条线。底部面板显示了 BAL 与 NCE(实线)和 IBE 与 BAL(虚线)中的 RCCR。用fastsimcoal2(S1I图)重新调整的分裂时间估计,突变率为7?10?9由 x 轴下方的三角形表示。图中浅蓝色阴影区域分别根据海洋同位素阶段2-4、6、8、10、12、14、16和18[45]从左到右显示了古老的冰川期。LGM [46] 的周期同样由深蓝色阴影表示。(一)突变率为2?4的fastsimcoal10最佳人口统计模型?9每个碱基对的每代突变,以及估计的参数。通过ADMIX分析确定的3个种群沿y轴显示为列,表示从底部的现在到顶部的更古老的时间。列的宽度根据估计的相应Ne进行缩放,该Ne也显示在列本身或上方。种群之间的分割时间由连接列的箭头显示,其中种群的所有谱系都与其祖先种群合并。发生这种情况的时间也标记在 y 轴上。瓶颈由暂时收缩表示,但不扩展。向后看时瓶颈期开始的时间在 y 轴上指示。图中下方的双向箭头表示模型中相应的迁移模式。有关所有估计参数及其置信区间,请参阅 S3 表。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。巴尔,巴尔干;简历,交叉验证;hclust,分层聚类;IBE,伊比利亚语;LD,连锁不平衡;LGM,末次冰期最大值;NCE,中北欧;PC,主成分;PCA,主成分分析;PGD,成对遗传距离。
https://doi.org/10.1371/journal.pbio.3002191.s001
(蒂夫)
S2 图 在北欧和中欧的FRIGIDA进行选择性扫荡。
(A)C的3个混合血统组内莲座叶2至9(L2-L9)的萌发后天数和侧小叶数的变化。hirsuta(另见图1A和1B)。(b) C的对齐方式。希苏塔(CH)弗里吉达和A。拟南芥(AT)FRIGIDA氨基酸序列。C 中的高频 FRIstop 等位基因。Hirsuta和由此产生的截短蛋白以蓝色表示。(C)S1B图所示PCA中指示的FRIstop等位基因(黑色圆圈)的存在。FRIstop分别在IBE和BAL的85个和83个非混合系中没有发现,也只是零星地存在于这些组的混合系中。在 CHE 中,去除密切相关菌株后,频率为 57 条非混合系中的 45 条,主要存在于该组中。(D)与含有FRIstop等位基因的转基因系和携带空载体的对照植物相比,携带功能性FRIGIDA等位基因的转基因系在后期叶节点中的小叶数量减少(Bonferroni调整P值的邓恩检验,***:P值<0.001)。 黑色十字架代表SEM±平均值。 (E)在FRIGIDA位点进行选择性扫描的证据。显示了核苷酸多样性(PI,顶部),田岛D(中)以及CLR分析(底部)的全基因组滑动窗口分析。分析分别在具有NCE群体的FRIstop(蓝色)和FRIfunc(黑色)等位基因的菌株中进行(图1A)。请注意 FRI 轨迹周围的区域(橙色虚线)如何显示 PI 降低、田岛 D 降低和高 CLR,与选择性扫描一致,仅在使用 FRIstop 的菌株中。顶部和中间面板中的水平虚线以蓝色或灰色表示各个组的全基因组平均值,在下图中,水平虚线表示从中性模拟得出的阈值(α = 0.05)。(F)8号染色体上等位基因频率的图形表示显示包含FRI位点(橙色虚线)的扩展单倍型块。对于NCE血统组,显示了次要等位基因频率大于5%的所有SNP的主要(黑色)和次要(白色)等位基因。请注意,与具有FRIfunc的菌株相比,携带菌株的FRIstop(底部)中FRI位点周围的遗传多样性降低。(G)携带NCE组菌株的FRIstop中SNPs的SFS。选择性扫描区域(图2G)外的SFS以黑色显示,选择性扫描区域内的SFS以橙色显示。(H)模拟中扫描区域的物理尺寸作为选择系数和持续时间的函数,表明NCE中含有FRIstop的大单倍型块与最近的强选择一致。FRI位点的选择是在C染色体8号染色体的经验局部重组率估计的背景下模拟的。在 x 轴上指示的持续时间内。模拟染色体的物理大小OME 与 8 号染色体的实际大小相同,用水平虚线表示。模拟的中位数扫描大小由彩色线显示,其 95% 分位数由误差线显示,其中红色、蓝色和黄色分别表示模拟选择系数 0.001、0.01 和 0.1。在我们的C中含有FRI的扫描区域的估计大小。Hirsuta 样品由连续水平线表示。A中各种截短FRI等位基因的频率。塔利亚纳(奥地利)和C.希苏塔(瑞士)。等位基因被命名为“at”或“ch”,后跟产生截断的多态性的物理位置。标有“x”的等位基因仅在来自欧洲以外的菌株中发现。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。巴尔,巴尔干;CLR,复合似然比;IBE,伊比利亚语;NCE,中北欧;PCA,主成分分析;SFS,站点频谱。
https://doi.org/10.1371/journal.pbio.3002191.s002
(蒂夫)
S3 图 亚速尔群岛C区低叶数表型的遗传基础。多毛菌株。
(A)IBE菌株(蓝色)和其余菌株(灰色)小叶数对开花时间的回归。点显示单个菌株的前7个莲座叶的累积小叶数,线显示拟合的线性模型。P 值和 R2的回归显示在两组的右上角。星号(*)表示亚速尔群岛(Az1)菌株,显示开花时间早,小叶数低。(B)C的前6片莲座叶上累积小叶数的直方图。从亚速尔群岛收集的多毛菌株。被认为共享低小叶表型的菌株由蓝色阴影区域表示。(C)不同随机种子ADMIX分析中的CV误差。CV误差与75个独立分析的所选总体数量(K)作图。CV 误差越低,表示与数据的拟合越好。在此分析中,发现K = 4是数据的最佳总体数量。(D)使用相关性对4个ADMIX组中祖先有效种群大小(Ne)进行分段重建(图3C),并估计它们之间的分裂时间。上图显示了ADMIX组中Ne的祖先变化,当考虑每年1代时,以年为单位绘制时间。红线、蓝线和黄线分别表示 BAL、BE 和 NCE 基因簇。底部面板显示了 BAL 与 NCE (实线)、IBE 与 BAL(虚线)以及 IBE 与 AZ(虚线)中的 RCCR。图中浅蓝色阴影区域分别根据海洋同位素阶段2-4、6、8、10、12、14、16和18[45]从左到右显示了古老的冰川期。LGM [46] 的周期同样由深蓝色阴影表示。(E)牛×Az1 RIL群体中不同小叶数性状和RLN的多个QTL模型映射结果。估计的 QTL 位置由纯黑色符号表示。参与 2 向上位相互作用的 QTL 共享相同的开放符号。QTL 周围的框表示 1.5 LOD 区间,并指示效果的方向(蓝色:牛等位基因增加表型值,红色:Az1 等位基因增加值)和解释的变异百分比(根据图例的颜色强度)。估计LLN4_1和LLN4_2对携带一个或两个位点的 Az1 等位基因的 IL 的影响。点显示针对叶节点绘制的单个重复的叶片上的小叶数。竖线显示平均传单数量的标准误差。牛(牛津亲本菌株)或 Az1 等位基因 (IL) 纯合子的植物分别以黄色或蓝色显示。根据克鲁斯卡尔-瓦利斯检验的显著差异用星号显示:*:P ≤ 0.05;**: P ≤ 0.01;: P ≤ 0.001。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。Az1,亚速尔群岛1;巴尔,巴尔干;简历,交叉验证;IBE,伊比利亚语;IL,渗入线;LGM,末次冰期最大值;NCE,中北欧;牛津牛;QTL,数量性状轨迹;RCCR,相对交叉聚结率;RIL,重组近亲繁殖系;RLN,莲座叶编号。
https://doi.org/10.1371/journal.pbio.3002191.s003
(蒂夫)
S4 图 SPL9的自然变化。
(A) C的传单数级数。希苏塔Ox,Chspl9突变体和渗入线IL-LLN4_2,都在牛的遗传背景下。用邓恩检验测试3种基因型之间的小叶数量差异,根据Bonferroni方法调整的P值用星号表示:*:P≤0.05;**: P ≤ 0.01;: P ≤ 0.001。(乙、丙)整个幼苗的全基因组RNA-seq分析。(b) C的比较。希苏塔Az1 和 C。希苏塔Ox和(C)在SPL4区域具有Az2和Ox等位基因的NILs HIF-LLN29_1(Rec9)。负对数基数 10 变换的 P 值与表达的倍数变化作图,每个点都是一个基因。红色点的表达方式明显不同,而黑色点则没有。SPL9基因在每个图中标明。(D)9种芸苔科SPL16基因的系统发育和同源性。左图显示了SPL9基因树。顶部面板显示了携带最常见AA的基因的比例。底部-中间面板显示了整个 SPL9 蛋白序列,而右下面板对应于 SPL9 错义 SNPE242Q 周围的区域(用星号表示)。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。AA,氨基酸;Az1,亚速尔群岛1;Chspl9, C.SPL9的多毛功能丧失等位基因;牛津牛;SPL9,鳞状启动子结合蛋白样9。
https://doi.org/10.1371/journal.pbio.3002191.s004
(蒂夫)
S5 图 SPL9 QTL簇的遗传差异与亚速尔群岛的气候梯度一致。
(A)在亚速尔群岛法亚尔岛的一个普通花园中生长时,与野生型相比,在牛背景(IL LLN9_1Az4)中携带SPL2Az1位点的IL中的小叶数量减少。使用威尔科克森秩和检验检验均值之间的差异的显著性。(B)全基因组扫描以选择pcadapt。显示了曼哈顿图以及 753 C 的分析结果。多毛菌株。SNP的负对数基数10转换P值与它们在每个染色体上的物理位置作图。水平虚线表示全基因组阈值,在该阈值上或高于该阈值时,只有1,000个SNP。SPL242底层QTL LLN9_4的功能错义SNP E2Q由红色圆圈突出显示。面板下部的黄色框表示 QTL LLN4_1A、LLN4_1B和LLLN4_2的位置。(C) PCA 的 753 C。使用所有SNP(次要等位基因频率>= 5%)在SPL9 QTL簇(GBG,左)和内部(SPL9簇,右)的pcadapt峰外使用PCADAPT的多毛菌株。每个点都是一个菌株,颜色表示它属于西亚速尔群岛组grp1(蓝色),亚速尔群岛东部组grp2(红色)还是其他(灰色)。(D)亚速尔群岛的东西气候梯度,由最干旱地区的降水(BIO17)和根据pcadapt分析分组的菌株分布(S5A和S5B图)所示。每个独立抽样由饼图表示,按季节(S、春季;F,秋季)和年份(例如,S10 – 2010 年春季)。饼图显示了根据图5B着色的样品中不同组的菌株的比例(蓝色-grp1;红色-grp2;黑色-SPL9簇中的重组;灰色-其他)。饼图的大小根据左下角的图例缩放到菌株数。采集地点在地图上由根据 BIO17 着色的点表示,如右侧图例所示。BIO17在亚速尔群岛收集地点的纬度和纵向梯度也沿图的上边缘和右边缘表示。地图图层是用自然地球和[142]制作的。(E) 显示C位置之间气候差异的箱线图。多毛菌株属于来自西亚速尔群岛的grp1(蓝色)和来自东亚速尔群岛(红色)的grp2。仅显示了根据Kruskal-Wallis检验在两组之间显着不同的生物气候变量。检验的 P 值用星号表示:* 0.01 < P ≤ 0.05 ,*** P ≤ 0.001 。(F) 分析数据的气象站的地理位置。选择台站来代表通过ADMIX分析发现的4个主要组(图3C;AZ、IBE、BAL、NCE)基于其地理位置的菌株丰度。地图图层是用自然地球和[142]制作的。来自AZ和代表其他ADMIX组的位置的当地气象站数据的年度温度趋势(S5E图)。日平均温度与一年中的某一天作图。与其他地区相比,亚速尔群岛的年气温变化大大减少,主要是由于冬季和夏季气温温和。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。亚利桑那州,亚速尔群岛;巴尔,巴尔干;GBG,基因组背景;IBE,伊比利亚语;IL,渗入线;NCE,中北欧;牛津牛;PCA,主成分分析;QTL,数量性状轨迹;SPL9,鳞状启动子结合蛋白样9。
https://doi.org/10.1371/journal.pbio.3002191.s005
(蒂夫)
S6 图 8号染色体的重新排序。
(A) 牛× Az1 RIL 群体中遗传标记的 RF 显示 2 号染色体上有 8 个区域,这些区域很可能属于 7 号染色体,而不是先前分配给 8 号染色体(箭头)。此外,着丝粒周围区域的标志物(灰色对角线)可能倒置。(乙、丙)基于8号染色体先前(左侧)和新组装(右侧)的遗传(B)和物理(C)图谱。以红色、黄色和蓝色显示的区域表示地图中未更改的线段,而灰色区域对应于倒置的线段。具有倒置标记顺序的遗传图谱显示支持倒置组装的遗传长度减少(B)。由 1 和 2 指示的预测反转的断点先前已被映射到 8 号染色体 (C) 原始组装的纳米孔长读段中的一致断点发现。(D、E)代表纳米孔的图像读取(正链-蓝色;负链-红色),跨越重新组装的1号染色体的2(D)和8(E)区域,并确认新组装的正确性。图中所示图表背后的数据可以在 https://doi.org/10.5281/zenodo.7907435 中找到。Az1,亚速尔群岛1;牛津牛;射频,重组分数;RIL,重组近交系。
https://doi.org/10.1371/journal.pbio.3002191.s006
(蒂夫)
S1 表。 所有752 C的样品位置和Illumina测序信息。多毛天然菌株。
https://doi.org/10.1371/journal.pbio.3002191.s007
(中新社)
S2 表。 C.希苏塔和A.塔利亚娜。
https://doi.org/10.1371/journal.pbio.3002191.s008
(三十)
S3 表。 欧洲C的人口分析。多毛虫种群与法西姆煤2。
https://doi.org/10.1371/journal.pbio.3002191.s009
(三十)
S4 表。 C天然菌株中FRIGIDA等位基因的分析。希苏塔和A.塔利亚娜。
https://doi.org/10.1371/journal.pbio.3002191.s010
(中新社)
S5 表。 Ox-Az1-RIL种群的连锁图。
https://doi.org/10.1371/journal.pbio.3002191.s011
(中新社)
S6 表。 QTL 映射摘要。
https://doi.org/10.1371/journal.pbio.3002191.s012
(三十)
S7 表。 亚速尔群岛菌株的收集细节。
https://doi.org/10.1371/journal.pbio.3002191.s013
(中新社)
S8 表。 752个重新测序菌株的Illumina读取覆盖率摘要。
https://doi.org/10.1371/journal.pbio.3002191.s014
(三十)
S9 表。 参考染色体 8 新组装区域的位置。
https://doi.org/10.1371/journal.pbio.3002191.s015
(三十)
S10 表。 从亚速尔群岛测序的C. hirsuta菌株按岛屿和采样行程排列。
https://doi.org/10.1371/journal.pbio.3002191.s016
(三十)
S11 表。 用于选择重组HIF的引物。
https://doi.org/10.1371/journal.pbio.3002191.s017
(三十)
S12 表。 用于开发IL的引物。
https://doi.org/10.1371/journal.pbio.3002191.s018
(三十)
S13 表。 用于精细绘制QTL LLN4_2的引物。
https://doi.org/10.1371/journal.pbio.3002191.s019
(三十)
确认
我们感谢罗伯特·苏格兰、马克·卡琳和安吉拉·海伊在项目的早期阶段进行的有益讨论和投入;Stefan Schiffels提供有关MSMC2的建议;高通量基因组学组(惠康人类遗传学信托基金中心)进行额外测序;和安德鲁·哈德森对手稿的批判性阅读。我们感谢这项工作中包含的种质资源的所有捐赠者。我们感谢Britta Grosardt,Sieglinde Effgen和Swen Langer提供的出色技术援助。
引用
1.布朗特ZD,伦斯基RE,洛索斯JB。进化中的偶然性和决定论:重播生命的磁带。科学。2018;362(6415):eaam5979.密码:30409860
查看文章PubMed/NCBI谷歌学术搜索
2.欧文·进化的偶然性。当代生物学. 2006;16(19):R825–R826.密码:17027471
查看文章PubMed/NCBI谷歌学术搜索
3.古尔德SJ,莱万廷RC。圣马可和泛语范式的斯潘德尔斯——对适应主义计划的批判。Proc R Soc Ser B-Bio.1979;205(1161):581–598.WOS:A1979HN99900010.邮编:42062
查看文章PubMed/NCBI谷歌学术搜索
4.布朗特ZD,博兰德CZ,伦斯基RE。大肠杆菌实验人群中的历史偶然性和关键创新的演变。美国国家科学院院刊, 2008;105(23):7899–7906.密码:18524956
查看文章PubMed/NCBI谷歌学术搜索
5.斯特恩、奥尔戈佐·基因进化是可预测的吗?科学。2009;323(5915):746–751.密码:19197055
查看文章PubMed/NCBI谷歌学术搜索
6.Alonso JM, Stepanova AN, Leisse TJ, Kim CJ, Chen H, Shinn P, et al. 拟南芥全基因组插入诱变。科学。2003;301(5633):653–657.密码:12893945
查看文章PubMed/NCBI谷歌学术搜索
7.Weigel D. 拟南芥的自然变异:从分子遗传学到生态基因组学。植物生理学. 2012;158(1):2–22.密码:22147517
查看文章PubMed/NCBI谷歌学术搜索
8.Alonso-Blanco C, Bentsink L, Hanhart CJ, Blankestijn-de Vries H, Koornneef M. 拟南芥种子休眠位点的自然等位基因变异分析。遗传学。2003;164(2):711–729.
查看文章谷歌学术搜索
9.Kover PX, Valdar W, Trakalo J, Scarcelli N, Ehrenreich IM, Purugganan MD, et al.多亲高级世代杂交,以精细绘制拟南芥的定量性状。公共科学图书馆热内特。2009;5(7):e1000551.
查看文章谷歌学术搜索
10.Atwell S, Huang YS, Vilhjálmsson BJ, Willems G, Horton M, Li Y, et al.拟南芥自交系中107种表型的全基因组关联研究。自然界。2010;465:627.密码:20336072
查看文章PubMed/NCBI谷歌学术搜索
11.布拉奇 B, 福尔 N, 霍顿 M, 弗拉豪 E, 巴斯克斯 A, 诺德堡 M, 等.拟南芥自然界开花时间的连锁与关联图谱.公共科学图书馆热内特。2010;6(5):e1000940.pmid:20463887
查看文章PubMed/NCBI谷歌学术搜索
12.?gren J, Oakley CG, McKay JK, Lovell JT, Schemske DW.适应的遗传图谱揭示了拟南芥的适应性权衡。美国国家科学院院刊, 2013;110(52):21077–21082.密码:24324156
查看文章PubMed/NCBI谷歌学术搜索
13.马尔卡迪埃 E, 哈纳米安 M, 蒂斯内 S, 巴赫 L, 巴扎科斯 C, 吉尔博 E, 等.拟南芥地枝生长自然变异的复杂遗传结构.公共科学图书馆热内特。2019;15(4):e1007954.pmid:31009456
查看文章PubMed/NCBI谷歌学术搜索
14.Togninalli M, Seren ü, Freudenthal JA, Monroe JG, Meng D, Nordborg M, et al.AraPheno和AraGWAS目录2020:一个主要的数据库更新,包括拟南芥的RNA-Seq和敲除突变数据。核酸研究 2020;48(D1):D 1063–D1068.
查看文章谷歌学术搜索
15.Tergemina E, Elfarargi AF, Flis P, Fulgione A, G?ktay M, Neto C, et al.两步自适应步行在具有挑战性的环境中重新连接营养运输。科学进展 2022;8(20):eabm9385。pmid:35584228
查看文章PubMed/NCBI谷歌学术搜索
16.普拉特 A, 霍顿 M, 黄 YS, 李 Y, 阿纳斯塔西奥 AE, 穆利亚蒂 NW, 等.拟南芥种群结构规模.公共科学图书馆热内特。2010;6(2):e1000843.密码:20169178
查看文章PubMed/NCBI谷歌学术搜索
17.1001基因组联盟。1,135个基因组揭示了拟南芥多态性的全局模式。细胞。2016;166(2):481–491.
查看文章谷歌学术搜索
18.Durvasula A, Fulgione A, Gutaker RM, Alacakaptan SI, Flood PJ, Neto C, et al.非洲基因组阐明了拟南芥的早期历史和向自我的过渡。美国国家科学院院刊, 2017;114(20):5213–5218.密码:28473417
查看文章PubMed/NCBI谷歌学术搜索
19.富尔吉奥内A,汉考克AM。古代谱系拓宽了我们对拟南芥历史的看法。新植物醇。2018;219(4):1194–1198.密码:29862511
查看文章PubMed/NCBI谷歌学术搜索
20.Hay AS, Pieper B, Cooke E, Mandáková T, Cartolano M, Tattersall AD, et al. Cardamine hirsuta:用于比较研究的多功能遗传系统。植物学报 2014;78(1):1–15.
查看文章谷歌学术搜索
21.巴库拉斯 M, 海伊 A, 库吉乌穆齐 E, 齐安蒂斯 M.拟南芥相对多毛芥解剖叶形成的发育框架。纳特热内。2008;40(9):1136–1141.
查看文章谷歌学术搜索
22.Vlad D, Kierzkowski D, Rast MI, Vuolo F, Ioio RD, Galinha C, et al. 通过复制、调控多样化和同源盒基因丢失实现叶形进化。科学。2014;343(6172):780–783.pmid:24531971
查看文章PubMed/NCBI谷歌学术搜索
23.Hofhuis H, Moulton D, Lessinnes T, Routier-Kierzkowska A-L, Bomphrey Richard J, Mosca G, et al. 形态力学创新推动爆炸性种子传播。细胞。2016;166(1):222–233.密码:27264605
查看文章PubMed/NCBI谷歌学术搜索
24.Kierzkowski D, Runions A, Vuolo F, Strauss S, Lymbouridou R, Routier-Kierzkowska A-L, et al.基于生长的叶形发育和多样性框架。细胞。2019;177(6):1405–1418.e17.密码:31130379
查看文章PubMed/NCBI谷歌学术搜索
25.卡托拉诺 M, 皮珀 B, 伦佩 J, 塔特索尔 A, 惠瑟 P, 特雷施 A, 等.异时性是胭脂红多毛叶形式的自然变异的基础。美国国家科学院院刊, 2015;112(33):10539–10544.
查看文章谷歌学术搜索
26.惠特克 C, 迪恩 C.FLC位点:表观遗传学和适应发现的平台。细胞开发生物学年鉴, 2017;33:555–575.
查看文章谷歌学术搜索
27.Taylor MA, Wilczek AM, Roe JL, Welch SM, Runcie DE, Cooper MD, et al.大效应开花时间突变揭示了拟南芥健身景观的条件适应性路径。美国国家科学院院刊,2019;116(36):17890–17899.密码:31420516
查看文章PubMed/NCBI谷歌学术搜索
28.赫普沃斯 J, 安东尼乌-库鲁尼奥蒂 RL, 伯格伦 K, 塞尔加 C, 都铎 EH, 耶茨 B, 等.秋季表达的自然变异是区分拟南芥FLC单倍型的主要适应性决定因素。电子生活。2020;9:e57671.密码:32902380
查看文章PubMed/NCBI谷歌学术搜索
29.Fulgione A, Neto C, Elfarargi AF, Tergemina E, Ansari S, G?ktay M, et al.从头突变平行减少开花时间使殖民谱系的进化拯救成为可能。纳特公社。2022;13(1):1461.密码:35304466
查看文章PubMed/NCBI谷歌学术搜索
30.Chiang GC, Barua D, Kramer EM, Amasino RM, Donohue K. 主要开花时间基因,开花位点C,调节拟南芥的种子萌发。美国国家科学院院刊, 2009;106(28):11661–11666.
查看文章谷歌学术搜索
31.哈米安 M, 瓦塞尔 F, 马尔卡迪尔 E, 吉尔博 E, 布列松 J, Gy I, 等.FLM剪接的自然变异具有调节拟南芥生态策略的多效性作用。纳特公社。2020;11(1):1–12.
查看文章谷歌学术搜索
32.门德斯-维戈 B, 皮科 FX, 拉米罗 M, 马丁内斯-萨帕特 JM, 阿隆索-布兰科 C. 海拔和气候适应由拟南芥的开花性状和 FRI、FLC 和 PHYC 基因介导。植物生理学. 2011;157(4):1942–1955.密码:21988878
查看文章PubMed/NCBI谷歌学术搜索
33.迪特马尔 EL, 奥克利 CG, 奥格伦 J, 舍姆斯克 DW.拟南芥自然种群开花时间QTL及其适应性价值的影响.分子生态学报 2014;23(17):4291–4303.
查看文章谷歌学术搜索
34.Li P, Filiault D, Box MS, Kerdaffrec E, van Oosterhout C, Wilczek AM, et al.由独立的顺式调节变异定义的多种FLC单倍型是拟南芥生活史多样性的基础。基因开发 2014;28(15):1635–1640.
查看文章谷歌学术搜索
35.Exposito-Alonso M. 拟南芥地理范围内的季节性时间适应。美国国家科学院院刊, 2020;117(18):9665–9667.
查看文章谷歌学术搜索
36.马丁内斯-贝尔德亚 A, 斯蒂策 MC, 泰勒马, 冈田 M, 埃兹库拉 E, 朗西德, 等.DOG1的功能变异控制拟南芥种子冷却反应和季节性生活史策略的变化。美国国家科学院院刊, 2020;117(5):2526–2534.pmid:31964817
查看文章PubMed/NCBI谷歌学术搜索
37.杨玲, 徐敏, 古义, 何杰, 诗玲.糖通过抑制MIR156A和MIR156C的表达来促进拟南芥的营养相变。电子生活。2013;2:e00260.密码:23538384
查看文章PubMed/NCBI谷歌学术搜索
38.于淑, 曹林, 周春明, 张通庆, 连华, 孙莹, 等.糖是植物幼年到成虫相变的内源线索。电子生活。2013;2:e00269.密码:23543845
查看文章PubMed/NCBI谷歌学术搜索
39.崔立国, 单建鑫, 石敏, 高建平, 林海鑫.miR156-SPL9-DFR途径协调植物发育与非生物胁迫耐受性之间的关系。植物学报 2014;80(6):1108–1117.密码:25345491
查看文章PubMed/NCBI谷歌学术搜索
40.Stief A, Altmann S, Hoffmann K, Pant BD, Scheible W-R, B?urle I. 拟南芥 miR156 通过 SPL 转录因子调节对反复出现的环境压力的耐受性。植物细胞。2014;26(4):1792–1807.密码:24769482
查看文章PubMed/NCBI谷歌学术搜索
41.诗人 RS.植物的相变和发育时间的调节。科学。2003;301(5631):334–336.pmid:12869752
View ArticlePubMed/NCBIGoogle Scholar
42.Xu M, Hu T, Zhao J, Park M-Y, Earley KW, Wu G, et al. Developmental Functions of miR156-Regulated SQUAMOSA PROMOTER BINDING PROTEIN-LIKE (SPL) Genes in Arabidopsis thaliana. PLoS Genet. 2016;12(8):e1006263. pmid:27541584
View ArticlePubMed/NCBIGoogle Scholar
43.Toomajian C, Hu TT, Aranzana MJ, Lister C, Tang C, Zheng H, et al.非参数测试揭示了拟南芥基因组中快速开花的选择。公共科学图书馆生物学. 2006;4(5):e137.pmid:16623598
查看文章PubMed/NCBI谷歌学术搜索
44.Alexander DH,Novembre J,Lange K.基于模型的快速估计无关个体的祖先。基因组研究 2009;19(9):1655–1664.pmid:19648217
查看文章PubMed/NCBI谷歌学术搜索
45.利谢茨基·勒,雷莫·上新世-更新世57个全球分布的底栖三角洲O-18记录(第20卷,艺术号PA1003,2005年)。古海洋学。2005;20(2).沃斯:000229777700002。
查看文章谷歌学术搜索
46.Clark PU, Dyke AS, Shakun JD, Carlson AE, Clark J, Wohlfarth B, et al.末次冰期最大值。科学。2009;325(5941):710–714.沃斯:000268723700039。pmid:19661421
查看文章PubMed/NCBI谷歌学术搜索
47.斯佩德尔 L, 森林 M, 施 S, 迈尔斯 SR.一种对数千个样本进行全基因组谱系估计的方法。纳特热内。2019;51(9):1321–1329.密码:31477933
查看文章PubMed/NCBI谷歌学术搜索
48.Schiffels S,Durbin R.从多个基因组序列推断人口规模和分离历史。纳特热内。2014;46(8):919–925.pmid:24952747
查看文章PubMed/NCBI谷歌学术搜索
49.马拉斯皮纳斯 A-S, 韦斯特威 MC, 穆勒 C, 索萨 VC, 老奥, 阿尔维斯一世, 等.澳大利亚原住民的基因组史。自然界。2016;538(7624):207–214.密码:27654914
查看文章PubMed/NCBI谷歌学术搜索
50.Schiffels S, Wang K. MSMC 和 MSMC2:多个顺序马尔可夫合并。统计人口基因组学。纽约,纽约:Humana;2020.第147–166页。
51.埃科菲 L, 杜潘卢普一世, 韦尔塔-桑切斯 E, 索萨 VC, 福尔 MJPG.从基因组和SNP数据进行可靠的人口统计推断。公共科学图书馆热内特。2013;9(10):e1003905.pmid:24204310
查看文章PubMed/NCBI谷歌学术搜索
52.Excoffier L, Marchi N, Marques DA, Matthey-Doret R, Gouy A, Sousa VC.FastSimcoal2:复杂进化情景下的人口推断。生物信息学。2021;37(24):4882–4885.pmid:34164653
查看文章PubMed/NCBI谷歌学术搜索
53.Gan X, Hay A, Kwantes M, Haberer G, Hallab A, Ioio RD, et al.胭脂红多毛虫基因组提供了对形态多样性进化的见解。纳特植物。2016;2(11):16167.
查看文章谷歌学术搜索
54.Mattila TM, Aalto EA, Toivainen T, Niittyvuopio A, Piltonen S, Kuittinen H, et al.在冰川后定植期间,选择群体特异性适应塑造了拟南芥天琴光周期途径基因的变异模式。分子生态学 2016;25(2):581–597.密码:26600237
查看文章PubMed/NCBI谷歌学术搜索
55.Michael TP, Salomé PA, Yu HJ, Spencer TR, Sharp EL, McPeek MA, et al. 通过生物钟自然发生的变化赋予增强的适应性。科学。2003;302(5647):1049–1053.密码:14605371
查看文章PubMed/NCBI谷歌学术搜索
56.开花位点C编码一种新的MADS结构域蛋白,可作为开花的抑制因子。植物细胞。1999;11(5):949–956.
查看文章谷歌学术搜索
57.威尔曼先生,波提格·花卉抑制剂FLC对拟南芥营养相变的时间和进展的影响。发展。2011;138(4):677–685.密码:21228003
查看文章PubMed/NCBI谷歌学术搜索
58.Wahl V, Ponnu J, Schlereth A, Arrivault S, Langenecker T, Franke A, et al.海藻糖-6-磷酸信号传导对拟南芥开花的调节。科学。2013;339(6120):704–707.密码:23393265
查看文章PubMed/NCBI谷歌学术搜索
59.DeGiorgio M, Huber CD, Hubisz MJ, Hellmann I, Nielsen R. Sweep Finder 2:提高灵敏度、鲁棒性和灵活性。生物信息学。2016;32(12):1895–1897.密码:27153702
查看文章PubMed/NCBI谷歌学术搜索
60.Johanson U, West J, Lister C, Michaels S, Amasino R, Dean C. FRIGIDA的分子分析,拟南芥开花时间自然变化的主要决定因素。科学。2000;290(5490):344–347.
查看文章谷歌学术搜索
61.Shindo C, Aranzana MJ, Lister C, Baxter C, Nicholls C, Nordborg M, et al.FRIGIDA和开花位点C在决定拟南芥开花时间变化中的作用。植物生理学. 2005;138(2):1163–1173.密码:15908596
查看文章PubMed/NCBI谷歌学术搜索
62.Cao J, Schneeberger K, Ossowski S, Günther T, Bender S, Fitz J, et al. Whole-genome sequencing of multiple Arabidopsis thaliana populations. Nat Genet. 2011;43:956. pmid:21874002
View ArticlePubMed/NCBIGoogle Scholar
63.Clark RM, Schweikert G, Toomajian C, Ossowski S, Zeller G, Shinn P, et al. 共同序列多态性塑造拟南芥遗传多样性。科学。2007;317(5836):338–342.密码:17641193
查看文章PubMed/NCBI谷歌学术搜索
64.霍顿 MW, 汉考克 AM, 黄 YS, Toomajian C, Atwell S, Auton A, et al.来自RegMap面板的全球拟南芥种质中遗传变异的全基因组模式。纳特热内。2012;44:212.密码:22231484
查看文章PubMed/NCBI谷歌学术搜索
65.Le Corre V,Roux F,Reboud X.拟南芥FRIGIDA基因的DNA多态性:广泛的非同义变异与开花时间的局部选择一致。分子生物学。2002;19(8):1261–1271.
查看文章谷歌学术搜索
66.洛弗尔 JT, 尤恩格 TE, 迈克尔斯 SD, 拉斯基 JR, 普拉特 A, 理查兹 JH, 等.FRIGIDA的多效性增强了多变量适应的潜力。Proc R Soc B. 2013;280(1763):20131043.pmid:23698015
查看文章PubMed/NCBI谷歌学术搜索
67.田岛F.通过DNA多态性检验中性突变假说的统计方法。遗传学。1989;123(3):585–595.密码:2513255
查看文章PubMed/NCBI谷歌学术搜索
68.Grime JP,Hodgson JG,Hunt R.比较植物生态学:常见英国物种的功能方法:施普林格;2014.
69.Wilczek AM, Roe JL, Knapp MC, Cooper MD, Lopez-Gallego C, Martin LJ, et al.遗传扰动对季节性生活史可塑性的影响.科学 2009;323(5916):930–934.密码:19150810
查看文章PubMed/NCBI谷歌学术搜索
70.Bouché F, Lobet G, Tocquin P, Périlleux C. FLOR-ID:拟南芥开花时间基因网络的交互式数据库。核酸研究 2015;44(D1):D 1167–D1171.
查看文章谷歌学术搜索
71.Srikanth A, Schmid M. 开花时间的规定:条条大路通罗马。细胞分子生命科学 2011;68(12):2013–2037.密码:21611891
查看文章PubMed/NCBI谷歌学术搜索
72.科斯塔, 杨 S, 克里奇利 J, 冯 X, 威尔逊 Y, 兰拉德 N, 等.抗痧痧异母细胞自然变异的遗传基础。新植物醇。2012;196(4):1251–1259.
查看文章谷歌学术搜索
73.Hyun Y, Richter R, Vincent C, Martinez-Gallegos R, Porri A, Coupland G. SPL15的多层调控以及与SOC1的合作整合了拟南芥枝条分生组织的内源性开花途径。开发单元。2016;37(3):254–266.密码:27134142
查看文章PubMed/NCBI谷歌学术搜索
74.赵杰, 杜迪E, 波提格.生殖能力的调节独立于拟南芥的营养相变。当代生物学. 2023;33(3):487–497.
查看文章谷歌学术搜索
75.施瓦茨 S, 格兰德 AV, 布伊多索 N, 赛德勒 H, 惠瑟 P.microRNA调控的SBP盒基因SPL9和SPL15控制拟南芥的地上部成熟。植物分子生物学. 2008;67(1):183–195.密码:18278578
查看文章PubMed/NCBI谷歌学术搜索
76.Wang J-W, Schwab R, 捷克 B, Mica E, Weigel D. miR156 靶向 SPL 基因和 CYP78A5/KLUH 对拟南芥质体长度和器官大小的双重影响.植物细胞。2008年20月;5(1231):1243–<>.
查看文章谷歌学术搜索
77.卢比奥-索摩查一世, 周CM, 康弗拉里亚 A, 马蒂尼奥 C, 冯玻恩 P, 巴埃纳-冈萨雷斯 E, 等.通过 miRNA 调控的蛋白质复合物许可对叶片复杂性进行时间控制。当代生物学. 2014 17月 24;22(2714):9–25448000.邮编:<>
查看文章PubMed/NCBI谷歌学术搜索
78.Luu K, Bazin E, Blum MG. pcadapt:一个R包,用于执行基于主成分分析的基因组扫描以进行选择。Mol Ecol Resour.2017;17(1):67–77.密码:27601374
查看文章PubMed/NCBI谷歌学术搜索
79.莫拉 M, 席尔瓦 L, 迪亚斯 EF, 舍费尔 H, 卡琳 M.基于形态学和分子证据对亚速尔群岛狮子齿象(菊科)属的修订。植物分类群。2015;210(1):24–46.
查看文章谷歌学术搜索
80.舍费尔 H. 亚速尔群岛植物群的舞蹈学和多样性。威尔德诺维亚。2003;33:481–482.
查看文章谷歌学术搜索
81.图廷·亚速尔群岛的植被。J Ecol. 1953:53–61.
查看文章谷歌学术搜索
82.威廉姆斯 BR, 舍费尔 H, 德塞奎拉 MM, 雷耶斯-贝坦科特 JA, 帕蒂诺 J, 卡琳马.马卡罗尼西亚有没有广泛分布的特有开花植物物种?毛茛皮条的系统地理学.Am J Bot。2015;102(10):1736–1746.密码:26453597
查看文章PubMed/NCBI谷歌学术搜索
83.Nikolov LA, Shushkov P, Nevado B, Gan X, Al-Shehbaz IA, Filatov D, et al.解析芸苔科系统发育的骨干,用于研究性状多样性。新植物醇。2019;222(3):1638–1651.pmid:30735246
查看文章PubMed/NCBI谷歌学术搜索
84.贝克 JB, 施穆斯 H, 沙尔 BA.拟南芥的原生范围遗传变异具有很强的地理结构,反映了更新世冰川动力学。分子生态学 2008;17(3):902–915.pmid:18179426
查看文章PubMed/NCBI谷歌学术搜索
85.伦恩 JE, Feil R, Hendriks JH, Gibon Y, Morcuende R, Osuna D, et al.糖诱导的海藻糖6-磷酸增加与ADP葡萄糖焦磷酸化酶的氧化还原活化和拟南芥淀粉合成速率的提高有关。生物化学杂志 2006;397(1):139–148.
查看文章谷歌学术搜索
86.Schluepmann H, Pellny T, van Dijken A, Smeekens S, Paul M. 海藻糖 6-磷酸对于拟南芥的碳水化合物利用和生长是必不可少的。美国国家科学院院刊, 2003;100(11):6849–6854.pmid:12748379
查看文章PubMed/NCBI谷歌学术搜索
87.Slatkin M, Wiehe T. 细分人群中的遗传搭便车。基因研究 1998;71(2):155–160.沃斯:000075333100007。密码:9717437
查看文章PubMed/NCBI谷歌学术搜索
88.巴顿新罕布什尔州。基因搭便车。Philos Trans R Soc B Biol Sci. 2000;355(1403):1553–1562.密码:11127900
查看文章PubMed/NCBI谷歌学术搜索
89.史密斯、海格·有利基因的搭便车效应。基因研究 1974;23(1):23–35.pmid:4407212
查看文章PubMed/NCBI谷歌学术搜索
90.Rodgers-Melnick E, Bradbury PJ, Elshire RJ, Glaubitz JC, Acharya CB, Mitchell SE, et al.不同玉米的重组是稳定的、可预测的,并且与遗传负荷有关。美国国家科学院院刊, 2015;112(12):3823–3828.密码:25775595
查看文章PubMed/NCBI谷歌学术搜索
91.王楠, 钱文, 苏潘兹一, 魏玲, 毛斌, 龙莹, 等.油菜(Brassica napus L.)的开花时间变化与FRIGIDA同系物BnaA的等位基因变异有关。周五。a. J Exp Bot.2011;62(15):5641–5658.邮编:21862478
查看文章PubMed/NCBI谷歌学术搜索
92.Kuittinen H, Niittyvuopio A, Rinne P, Savolainen O. FRIGIDA Indel 多态性赋予的拟南芥春化要求的自然变异。分子生物学。2007;25(2):319–329.pmid:18032403
查看文章PubMed/NCBI谷歌学术搜索
93.卡琳·马, 舍费尔·亚速尔群岛多样性之谜:为什么亚速尔群岛特有的开花植物如此之少,为什么它们如此普遍?J 生物地理学。2010;37(1):77–89.
查看文章谷歌学术搜索
94.巴塞洛斯,罗德里格斯公关,布里德J,门东萨EP,加布里埃尔R,博尔赫斯PAV。来自亚速尔群岛的鸟类:更新的清单,其中包含对物种分布的一些评论。生物多样性数据杂志2015(3):e6604。密码:26696765
查看文章PubMed/NCBI谷歌学术搜索
95.拉波塞罗 PM, 埃尔南德斯 A, 普拉-拉贝斯 S, 贡萨尔维斯 V, 鲍 R, 萨斯 A, 等.气候变化促进了中世纪亚速尔群岛的早期殖民化。美国国家科学院院刊 2021;118(41):e2108236118.密码:34607952
查看文章PubMed/NCBI谷歌学术搜索
96.鲁尔五世, 劳拉 A, 卢比奥-英格莱斯 MJ, 吉拉特 S, 贡萨尔维斯五世, 拉波塞罗 P, 等.亚速尔群岛自然和人为强迫下的植被和景观动态:来自圣米格尔岛的700年花粉记录。Quat Sci Rev. 2017;159:155–168.
查看文章谷歌学术搜索
97.Hijmans RJ, Cameron SE, Parra JL, Jones PG, Jarvis A. 全球陆地区域的高分辨率插值气候表面。国际 J 气候。2005;25(15):1965–1978.
查看文章谷歌学术搜索
98.Johri P, Eyre-Walker A, Gutenkunst RN, Lohmueller KE, Jensen JD.关于实现与种群历史的准确联合选择估计的前景。基因组生物学 Evol.2022;14(7).沃斯:000820802100003。密码:35675379
查看文章PubMed/NCBI谷歌学术搜索
99.Hudson CJ, Freeman JS, Jones RC, Potts BM, Wong MML, Weller JL, et al.球状桉树异时性的遗传控制。G3:基因、基因组、遗传学。2014;4(7):1235–1245.PMID:24950963。
查看文章PubMed/NCBI谷歌学术搜索
100.Carroll SB. Evo-devo 和不断扩大的进化综合:形态进化的遗传理论。细胞。2008;134(1):25–36.密码:18614008
查看文章PubMed/NCBI谷歌学术搜索
101.斯特恩·进化、发展和可预测的基因组:罗伯茨公司出版社;2011.
102.舍费尔 H, 哈代 OJ, 席尔瓦 L, 巴拉克洛 TG, 萨沃莱宁 V. 在亚速尔群岛检验达尔文的归化假说。生态学报 2011;14(4):389–396.密码:21320262
查看文章PubMed/NCBI谷歌学术搜索
103.Song B, Mott R, Gan X. 利用INDELs关联和综合负担测试恢复拟南芥和黑腹果蝇的新关联位点。公共科学图书馆热内特。2018;14(10):e1007699.pmid:30325920
查看文章PubMed/NCBI谷歌学术搜索
104.Letunic I,Bork P. 交互式生命之树(iTOL)v5:用于系统发育树显示和注释的在线工具。核酸研究 2021;49(W1):W293–W296.沃斯:000672775800039。密码:33885785
查看文章PubMed/NCBI谷歌学术搜索
105.Alexander DH,Lange K.用于个体血统估计的ADMIX算法的增强。BMC生物信息学。2011;12(1):246.pmid:21682921
查看文章PubMed/NCBI谷歌学术搜索
106.郑 X, 莱文 D, 沈 J, 戈加滕 SM, 劳里 C, 威尔 BS.用于SNP数据的相关性和主成分分析的高性能计算工具集。生物信息学。2012;28(24):3326–3328.密码:23060615
查看文章PubMed/NCBI谷歌学术搜索
107.Danecek P, Auton A, Abecasis G, Albers CA, Banks E, DePristo MA, et al.变体调用格式和 VCF 工具。生物信息学。2011;27(15):2156–2158.密码:21653522
查看文章PubMed/NCBI谷歌学术搜索
108.安德伍德 CJ, 崔 K, 兰宾 C, 赵 X, 塞拉 H, 博尔赫斯 F, 等.拟南芥着丝粒附近减数分裂重组的表观遗传激活通过 H3K9me2 和非 CG DNA 甲基化缺失。基因组研究 2018.密码:29530927
查看文章PubMed/NCBI谷歌学术搜索
109.张春, 董淑, 徐建英, 何伟文, 杨天.PopLDdecay:基于变体调用格式文件进行连锁不平衡衰减分析的快速有效工具。生物信息学。2019;35(10):1786–1788.沃斯:000469437800026。pmid:30321304
查看文章PubMed/NCBI谷歌学术搜索
110.德拉诺 O, 扎古里 J-F, 罗宾逊 MR, 马尔基尼 JL, 德米扎基斯 ET.准确、可扩展和综合的单倍型估计。纳特公社。2019;10(1):1–10.
查看文章谷歌学术搜索
111.Exposito-Alonso M, Becker C, Schuenemann VJ, Reiter E, Setzer C, Slovak R, et al.定植植物谱系中新突变的速率和潜在相关性。公共科学图书馆热内特。2018;14(2):e1007155.密码:29432421
查看文章PubMed/NCBI谷歌学术搜索
112.Ossowski S, Schneeberger K, Lucas-Lledó JI, Warthmann N, Clark RM, Shaw RG, et al.拟南芥自发突变的速率和分子谱。科学。2010;327(5961):92–94.密码:20044577
查看文章PubMed/NCBI谷歌学术搜索
113.古腾昆斯特RN,埃尔南德斯RD,威廉姆森SH,布斯塔曼特CD。从多维SNP频率数据推断多个人群的联合人口历史。公共科学图书馆热内特。2009;5(10):e1000695.密码:19851460
查看文章PubMed/NCBI谷歌学术搜索
114.周X,斯蒂芬斯M.用于关联研究的全基因组高效混合模型分析。纳特热内。2012;44(7):821.pmid:22706312
查看文章PubMed/NCBI谷歌学术搜索
115.Segura V, Vilhjálmsson BJ, Platt A, Korte A, Seren ü, Long Q, et al.一种有效的多位点混合模型方法,用于结构化人群的全基因组关联研究。纳特热内。2012;44(7):825–830.密码:22706313
查看文章PubMed/NCBI谷歌学术搜索
116.Li H. Minimap2:核苷酸序列的成对比对。生物信息学。2018;34(18):3094–3100.密码:29750242
查看文章PubMed/NCBI谷歌学术搜索
117.Charif D,Lobry Jr. SeqinR 1.0-2:R项目的贡献包,用于生物序列检索和分析的统计计算。序列进化的结构方法。斯普林格;2007.第207–232页。
查看文章谷歌学术搜索
118.张 L, 希门尼斯-戈麦斯 JM.使用拟南芥天然存在的变异对FRIGIDA进行功能分析。植物学报 2020;103(1):154–165.
查看文章谷歌学术搜索
119.克拉夫SJ,弯曲的AF。花蘸:农杆菌介导拟南芥转化的简化方法。植物学报 1998;16(6):735–743.密码:10069079
查看文章PubMed/NCBI谷歌学术搜索
120.Chang CC, Chow CC, Tellier LCAM, Vattikuti S, Purcell SM, Lee JJ. 第二代 PLINK:迎接更大、更丰富的数据集的挑战。千兆科学。2015;4(1):7.密码:25722852
查看文章PubMed/NCBI谷歌学术搜索
121.Kelleher J, Etheridge AM, McVean G. 大样本量的高效聚结模拟和谱系分析。公共科学图书馆计算生物学. 2016;12(5):e1004842.密码:27145223
查看文章PubMed/NCBI谷歌学术搜索
122.Pavlidis P,?ivkovi? D,Stamatakis A,Alachiotis N. SweeD:基于可能性的数千个基因组中选择性扫描的检测。分子生物学。2013;30(9):2224–2234.密码:23777627
查看文章PubMed/NCBI谷歌学术搜索
123.Haller BC, Galloway J, Kelleher J, Messer PW, Ralph PL. SLiM中的树序列记录为全基因组的正向时间模拟开辟了新的视野。Mol Ecol Resour.2019;19(2):552–566.密码:30565882
查看文章PubMed/NCBI谷歌学术搜索
124.哈勒BC,梅塞尔PW。SLiM 3:超越赖特-费舍尔模型的前瞻性遗传模拟。分子生物学。2019;36(3):632–637.密码:30517680
查看文章PubMed/NCBI谷歌学术搜索
125.Gan X, Stegle O, Behr J, Steffen JG, Drewe P, Hildebrand KL, et al.拟南芥的多个参考基因组和转录组。自然界。2011;477:419.pmid:21874022
查看文章PubMed/NCBI谷歌学术搜索
126.Broman KW, Wu H, Sen ?, Churchill GA. R/qtl:实验杂交中的QTL映射。生物信息学。2003;19(7):889–890.密码:12724300
查看文章PubMed/NCBI谷歌学术搜索
127.Wu Y, Bhat PR, Close TJ, Lonardi S. 从图的最小生成树高效准确地构建遗传连锁图谱。公共科学图书馆热内特。2008;4(10):e1000212.密码:18846212
查看文章PubMed/NCBI谷歌学术搜索
128.VSN国际.Genstat for Windows。第20版赫默尔汉普斯特德,英国:VSN国际;2020.
129.阿伦德 D, 普林斯 P, 詹森 RC, 布罗曼 KW.R/qtl:高通量多 QTL 映射。生物信息学。2010;26(23):2990–2992.密码:20966004
查看文章PubMed/NCBI谷歌学术搜索
130.布罗曼·使用 R/qtl 进行 QTL 映射的指南。斯普林格;2009.
131.皮珀 B, 蒙尼奥 M, 海伊 A.胭脂红多毛花瓣数的遗传结构.新植物醇。2016;209(1):395–406.密码:26268614
查看文章PubMed/NCBI谷歌学术搜索
132.杜德娜、卡彭捷·CRISPR-Cas9基因组工程的新前沿。科学。2014;346(6213).
查看文章谷歌学术搜索
133.福瑟 F, 席姆尔 S, 普赫塔 H.基于CRISPR/C的核酸酶和切口酶都可以有效地用于拟南芥的基因组工程。植物学报 2014;79(2):348–359.
查看文章谷歌学术搜索
134.Love MI,Huber W,Anders S.使用DESeq2调节RNA-seq数据的倍数变化和分散估计。基因组生物学. 2014;15(12):550.pmid:25516281
查看文章PubMed/NCBI谷歌学术搜索
135.琼斯DT,泰勒WR,桑顿JM。从蛋白质序列快速生成突变数据矩阵。生物信息学。1992;8(3):275–282.密码:1633570
查看文章PubMed/NCBI谷歌学术搜索
136.Kumar S,Stecher G,Li M,Knyaz C,Tamura K. MEGA X:跨计算平台的分子进化遗传学分析。分子生物学。2018;35(6):1547.密码:29722887
查看文章PubMed/NCBI谷歌学术搜索
137.Robinson P. 综合基因组学查看器(IGV):可视化对齐和变体。计算外显子组和基因组分析。查普曼和霍尔/CRC;2017.第233–245页。
138.菲克SE,希曼斯RJ。WorldClim 2:全球陆地面积新的1公里空间分辨率气候表面。国际 J 气候。2017;37(12):4302–4315.
查看文章谷歌学术搜索
139.Hijmans RJ, Van Etten J, Mattiuzzi M, Cheng J, Sumner M, Greenberg J. raster: Geographic Data Analysis and Modeling.R 包版本 2.9–23。R 核心团队 R 统计计算基础。奥地利维也纳;2019.
140.Kassambara A. ggpubr:“ggplot2”基于出版物准备的情节。R 包版本 01。2017;6.
141.Slowikowski K. Ggrepel:使用“ggplot2”自动定位不重叠的文本标签。R 包版本 08 0.2018.
142.Massicotte P, South A. rnaturalearth: World Map Data from Natural Earth.R 包版本 0.3.3.9000。2023;3(1) 可从: https://docs.ropensci.org/rnaturalearth/https://github.com/ropensci/rnaturalearth.
查看文章谷歌学术搜索
143.Wickham H. ggplot2:用于数据分析的优雅图形:Springer;2016.
144.Wilke C. cowplot:简化的情节主题和“ggplot2”的情节注释。R 包版本 09 2.2017.