《使用生成模型进行漏斗调节肽设计:钙调磷酸酶蛋白-蛋白质相互作用干扰物的发现和表征》期刊简介
使用生成模型进行漏斗调节肽设计:钙调磷酸酶蛋白-蛋白质相互作用干扰物的发现和表征
杰罗姆·图比亚纳 ,露西亚·阿德里安娜-利夫希茨 ,迈克尔·日产,马坦·加贝,英巴尔谢尔,玛丽娜·索瓦,海姆·沃尔夫森 ,马扬加尔
发布时间:2 年 2023 月
抽象
肽结合剂的设计是靶向“不可成药”蛋白质-蛋白质界面的一种有吸引力的策略。当前的设计方案依赖于从靶蛋白的一个已知蛋白质相互作用体中提取初始序列,然后进行基于计算机或体外诱变的结合亲和力优化。湿实验室实验方案只能探索庞大序列空间的一小部分,无法有效地筛选其他理想的特性,如高特异性和低毒性,而计算机设计需要大量的计算资源,并且通常依赖于简化的结合模型。然而,对于多价蛋白质靶标,细胞环境中已经存在数十到数百个天然蛋白质伴侣。在这里,我们描述了一种肽设计协议,该方案通过机器学习生成模型利用这种多样性。在通过文献和同源性搜索鉴定假定的天然结合片段后,训练和采样组合受限玻尔兹曼机以产生数百种不同的候选肽。后者通过灵活的分子对接和基于体外微芯片的结合测定进一步过滤。我们验证并测试了钙调磷酸酶的方案,钙调磷酸酶是一种钙依赖性蛋白磷酸酶,参与健康和疾病的各种细胞途径。在单轮筛选中,我们从最接近的天然序列中鉴定出多个16长度的肽,这些肽具有多达六个突变,这些突变成功干扰钙调磷酸酶与其底物的结合。总之,整合蛋白质相互作用和序列数据库、生成建模、分子对接和相互作用测定能够发现新的蛋白质-蛋白质相互作用调节剂。
作者摘要
有效结合目标蛋白并干扰其天然蛋白质-蛋白质相互作用的肽是基础研究和治疗应用的有吸引力的试剂。然而,合理的肽设计仍然具有挑战性,因为i)不可能对广阔的序列空间进行详尽的探索,ii)一般来说,选择标准和靶标之间存在不匹配,以及iii)低毒性等其他限制通常至关重要。在这里,我们提出了一种基于在靶标的天然蛋白质相互作用器上训练的序列生成模型的综合肽设计方案。我们测试了钙调磷酸酶的方案,钙调磷酸酶是一种丝氨酸/苏氨酸磷酸酶,涉及多种健康和疾病途径。我们表明,生成模型i)能够对序列空间进行广泛的探索,ii)近似于与靶标的结合亲和力,以及iii)产生高度多样化的候选序列。通过分子对接和高通量结合测定进一步选择后,我们发现70%的设计肽成功干扰了Cn-底物相互作用。因此,我们的综合方案可以广泛适用于蛋白质 - 蛋白质相互作用干扰物的合理设计。
引文: Tubiana J, Adriana-Lifshits L, Nissan M, Gabay M, Sher I, Sova M, et al. (2023) 使用生成模型进行漏斗调节肽设计:钙调磷酸酶蛋白质-蛋白质相互作用破坏子的发现和表征。公共科学图书馆计算生物学19(2): e1010874. https://doi.org/10.1371/journal.pcbi.1010874
编辑 器: Elena Papaleo,丹麦癌症协会研究中心,丹麦
收到: 十月 12, 2022;接受: 16月 2023, 2;发表: 2023月 <>, <>
版权: ? 2023 图比亚纳等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 以下内容作为补充数据提供:种子Cn相互作用物列表(补充数据1),多片段比对(补充数据2),通过对接和微阵列结合分析的768种肽列表(补充数据3),模型学习的序列基序集(补充数据4)。用于训练受限玻尔兹曼机的源代码可从 https://github.com/jertubiana/PGM 获得;PepCrawler 灵活对接算法可作为 http://bioinfo3d.cs.tau.ac.il/PepCrawler/ 的 Web 服务器使用,也可作为 Linux 可执行文件与 http://bioinfo3d.cs.tau.ac.il/PepCrawler/download/PepCrawler.zip 的 Python 3 API 使用(补充数据 5)。
资金: 这项工作得到了Zimin工程解决方案促进更美好生活研究所(H.J.W和M.G.),TAD人工智能与数据科学中心(H.J.W.和M.G.),特拉维夫大学Edmond J. Safra生物信息学中心(J.T.),人类前沿科学计划(跨学科博士后奖学金LT001058 / 2019-C, J.T.)、安道麦作物保护新型输送系统中心(博士奖学金,L.A-L.)、Len Blavatnik和Blavatnik家庭基金会(H.J.W.)。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
竞争利益: 作者声明没有竞争利益。
介绍
蛋白质-蛋白质相互作用(PPI)是所有细胞信号通路的重要组成部分[1]。因此,能够干扰特定PPI网络的化学和生物调节剂对于基础和应用研究非常重要。然而,PPI抑制剂的设计,特别是小分子形式的PPI抑制剂,仍然是一个主要挑战,主要是由于蛋白质 - 蛋白质界面的物理化学性质。后者通常比其对应的酶活性位点更大、更平坦、更灵活[2]。这些因素限制了小分子的抑制潜力和计算分子对接工具的准确性,而计算分子对接工具严重依赖于形状互补性[3,4]。肽,i.e.没有稳定折叠的小长度(L<30-40)蛋白质是一类有前途的PPI扰动器。它们易于合成,并且可以通过模仿其中一个伴侣的结合位点来干扰天然PPI。它们的潜在覆盖率很高,因为据估计,高达40%的人PPI涉及至少一个无序的肽样结合区域,特别是在细胞信号传导和调节途径中[5]。尽管肽由于其有限的口服生物利用度和体内快速降解速率而具有有限的直接治疗应用[6],但设计高亲和力肽可以i)为难以通过实验表征的瞬时PPI提供结构见解,ii)提出用于小分子计算机筛选的药效团假设[6] iii)促进基于体外的小分子筛选 竞争测定(例如通过荧光偏振[7-9])和iv)导致基于拟肽的疗法[6,10,11]。
肽发现的主要挑战在于对序列空间进行详尽而准确的探索,因为有 20L长度为L的肽。对于L>10来说,这远远超出了基于分子对接的实验研究和计算方法的能力。尽管如此,抑制性肽发现的一个关键优势是结合目标蛋白的蛋白质片段已经存在于自然界中。这一观察结果为当前的肽发现方案奠定了基础:从已知的蛋白质-蛋白质复合物结构开始,初始肽序列来自一个伴侣的结合界面[11],随后通过计算机[12-21]或体外[22-25]优化其结合亲和力。]诱变。此类方案通常仅探索序列空间的局部邻域,并且不能轻易筛选其他所需特性,例如高结合特异性,高溶解度或低免疫原性。
机器学习序列生成模型(SGM)的最新进展已被证明在以下方面非常成功:i)从原始序列数据中学习支撑天然蛋白质功能的生物物理约束,以及ii)快速探索序列空间,以设计具有类似天然功能的人工蛋白质[26-31]。然而,训练准确的SGM需要大量具有相似功能的进化相关序列[28,32]。将这种方法直接转换为肽设计具有挑战性,因为尽管也可以通过同源性搜索先验获得额外的结合片段,但目标PPI i)可能仅在少数真核生物中保守和/或ii)可能由高度保守的短线性基序(SLiM)介导。因此,SGM引导的肽设计仅限于具有不同序列数据集的情况,例如抗菌、抗癌或细胞穿透肽[33-36]。然而,在许多PPI中,至少有一个合作伙伴是高度多价的,即i。E,它与多个蛋白质相互作用,并且相应的结合区域高度重叠。这提供了从进化无关但具有相似结合功能的不同序列片段中学习的机会。
向自然伴侣学习的一个重要警告是,许多伴侣仅与靶标短暂相互作用,在102?103微摩尔范围。因此,用于过滤高亲和力肽结合剂的额外计算机和/或体外筛选必须补充SGM。所有这些考虑促使我们构建一个由四个步骤组成的综合肽设计方案:(i)构建从已知和假定结合剂中提取的推定结合片段的多个比对(ii)SGM的训练和验证,以及候选肽序列库的生成(iii)通过计算机柔性蛋白质 - 肽对接和体外微阵列芯片结合测定过滤文库。
在本文中,我们在钙调磷酸酶(Cn)及其含有保守SLIM PxIxIT的底物之间的PPI上实施和评估我们的肽设计方案。其中包括活化T细胞核因子(NFAT),这是一种转录因子,在广泛的正常细胞过程和多种疾病中起关键作用[37-39]。尽管存在临床认可的Cn抑制剂(环孢素A和他克莫司),但它们会阻塞Cn催化位点,抑制其在所有底物上的活性,并导致不良副作用,如肾毒性和肝毒性[40,41]。因此,基于肽的调节剂干扰Cn与其底物的结合,同时保持其催化位点可用,可能是有利的替代方案[22,41,42]。重要的是,Cn是高度多价的[43],其信号网络已在酵母和人类中得到广泛研究[44,45]。因此,可以获得有关其各种蛋白质底物及其相应结合位点的可靠信息,从而促进我们的案例研究。
结果
钙调磷酸酶信号网络依赖于PxIxIT和LxVP SLIM。
钙调磷酸酶(Cn)是一种在后生动物中保守的异二聚体钙依赖性磷酸酶,由催化(~510个氨基酸)和调节结构域(~170个氨基酸)组成;其结构如图1A所示。在钙螯合和与钙调蛋白相互作用(均由调节结构域介导)时,Cn采用其活性构象(此处描述),其中其催化位点(以蓝色显示)和结合区暴露[43,46]。反过来,Cn底物(其中大多数本质上是无序的)结合它,使Cn能够对丝氨酸和苏氨酸残基进行去磷酸化。NFAT家族 - 一组在脊椎动物中保守的五种转录因子 - 是Cn底物的已知例子;在被Cn去磷酸化时,它们会发生构象变化,暴露细胞核定位基序,允许易位到细胞核,进而与DNA结合。更一般地说,使用体内、体外和计算机法的组合在哺乳动物和酵母中系统地研究了Cn信号网络,并分别鉴定了至少29种和38种蛋白质底物,对人类和酵母具有很高的置信度[44,45]。为了确定拴系底物的区域,我们使用ScanNet Web服务器[47,48]来预测固有无序蛋白质的结合位点(在图1A中显示为红色鳞片着色)。除催化位点外,还发现了两个底物结合位点。先前的研究表明,它们识别两个SLiM:PxIxIT和LxVP,其中大写字母代表保守的残基,x代表交替氨基酸。两个基序i)单独结合Cn(代表性Cn结合的PxIxIT和LxVP基序的晶体结构分别以图1A的洋红色和黄色表示)和ii)在广泛的底物上保守,如图1B中的NFAT亚型所示。底物衍生的含PxIxIT的片段与Cn的结合相对较弱,解离常数kd~ 0.5–250 uM [43,49,50]。事实上,较高的亲和力相互作用在体内可能是有害的:例如,Cn-NFAT相互作用在进化上被调整为仅在高钙浓度下发生[22]。这推动了PxIxIT肽变体的设计,具有更高的亲和力,例如PVIVIT肽(kd~0.5–2.0 uM)及其拟肽衍生物(高达kd~2.5 nM)[22,24,42],可以成功竞争细胞中的Cn底物结合,从而去磷酸化。然而,这些肽主要是通过实验筛选接近NFAT衍生肽的序列而发现的,而没有探索广泛的其他底物基序。在此,我们采用了这一策略,旨在设计能够与已知的PVIVIT肽竞争的替代肽。新的肽序列为进一步设计具有比先前序列更高的亲和力、特异性和/或溶解度的变体铺平了道路。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 钙调磷酸酶-底物复合物概述。
(a)钙调磷酸酶与代表性的含SLiM肽结合的结构(pdb代码:2p6b [51],5sve [52])。钙调磷酸酶以分子表面表示形式显示,并且根据结合无序区域的倾向(从白色=低到深红色=高)着色,基于ScanNet[47,48]。催化位点呈蓝色。图中显示了催化域和调节域(用绿色圈出)。含有PxIxIT和LxVP的肽以棒状表示形式显示(或洋红色和黄色)。(b) 结合钙调磷酸酶的PxIxIT短线性基序的序列比对。
https://doi.org/10.1371/journal.pcbi.1010874.g001
综合肽设计方案
图2说明了所提出的设计协议的主要步骤,并在下文进行了总结;有关更多详细信息,请参阅方法。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 目标PPI肽抑制剂设计方案概述。
首先从先前的实验中鉴定目标酶的蛋白质底物及其结合片段。通过同源性搜索识别其他相互作用的直系同源物,并提取和对齐相应的结合区域。训练序列生成模型(SGM)以生成候选肽库。后者通过结构建模和高通量结合测定筛选亲和力。选择最佳候选者进行进一步的低通量实验表征。
https://doi.org/10.1371/journal.pcbi.1010874.g002
步骤0:从文献调查中整理已知的钙调磷酸酶结合片段。
我们的实验方案从67种来自人类和酵母的钙调磷酸酶(Cn)蛋白底物(44,45)及其相应的含PxIxIT片段(S1数据)开始。
第 1 步:通过同源搜索进行数据增强。
由于这个数字对于有意义的序列生成建模来说太有限了,我们首先通过跨序列数据库进行同源搜索来丰富该集合,以识别每个列出的底物的同源序列中的其他PxIxIT样片段。重要的是,蛋白质-蛋白质相互作用(PPI)不能保证在所有直系同源物/副同源物中都是保守的,特别是在像Cn信号网络这样的情况下,它们在整个进化过程中会经历快速的重新布线[44]。因此,应用基于两阶段序列的统计过滤协议来消除假定的非相互作用同源物。在重新比对和重复数据删除后,我们获得了天然的、假定的Cn结合片段的多序列比对(S1图)。
第 2 步:使用序列生成模型设计肽库。
接下来,我们训练了一个组成受限玻尔兹曼机(cRBM),这是一种受统计力学启发的可解释序列生成模型,之前已被证明适用于蛋白质序列建模[53,54]。在定量和定性验证所学习的模型(图 3 和 S3)后,我们使用它生成了 10 个不同的库2?3候选肽序列。我们还为后续质量评估构建了阴性和阳性对照。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. PxIxIT绑定基序的生成建模。
(a) 生成式方法示意图。整个序列空间上的“平滑”概率分布是从有限数量的样本中学习的。具有高概率的看不见的序列是潜在的新型结合剂,而低概率的区域可能是非功能性蛋白质。(b) cRBM模型的图形描述,即所选择的参数形式。可见层对应于对齐的序列;每个可见单元贡献一个特定于站点的术语 G我(s我) 到对数似然。隐藏(表示)层对应于未观察到的隐藏单元,每个隐藏单元都为对数似然函数贡献一个附加项,定义为通过稀疏张量的线性投影,后跟可训练的严格凸非线性。(c,d)cRBM预测的NFATc2和AKAP79肽的突变景观。红色、白色和蓝色条目分别对应于有益、中性和有害突变。(e) 由Nguyen等人测量的cRBM预测突变景观与结合亲和力变化的深度突变扫描之间的比较。以PVIVIT,PKIVIT,NFATc2和AKAP79肽为野生型进行1种DMS。斯皮尔曼相关系数被注释。(法,克,小时)cRBM(f)学习的序列基序的选定示例,以及它们的活性分布(g)和顶部激活序列。基序 2 是基因特异性的,而基序 3 和 <> 由多个基因共享。
https://doi.org/10.1371/journal.pcbi.1010874.g003
第 3 步:计算机和体外筛选。
然后,我们通过基于模板的对接,然后使用Modeller [55]和PepCrawler [56](图4和S4)对各种肽与Cn的结合强度进行了计算机分析。同时,我们使用PEPperPRINT肽微阵列进行了中等通量定性结合测定,以评估Cn与选定肽的直接结合(图4和S5,S3数据)。选择最有希望的肽进行进一步表征。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. 通过结构建模和微阵列筛选进行中等通量过滤。
(a)结构建模协议描述:对准已知PxIxIT结合位点后,应用高效的柔性骨架结构细化算法估计对接能量。(b)生成的肽和所选对照的对接能量评分直方图(越低越好;归一化为零均值和单位方差)。(c) 通过稀疏线性回归拟合的等效单站点模型的系数,以权重标志表示形式显示。在每个位置,字母的高度与相应的回归系数成正比;负系数大的残基(例如基序位置的疏水残基)对对接分数有有利贡献。颜色表示物理性质(黑色=疏水,红色=带负电等)。(d) 跨天然片段的对接评分的每个基因分布(越低越好)。对接协议定性区分义务交互和瞬态交互。(e) 微阵列芯片筛选概述。肽印在芯片上(每个肽两个圆圈)。在倒入Cn并随后洗涤后,荧光标记,覆盖Cn靶向抗体并拍摄图像。荧光斑点表示强Cn结合剂。(f)序列似然(按长度归一化,越高越好)与荧光水平(越高越好,有关数据分析的详细信息,请参阅方法)的散点图。
https://doi.org/10.1371/journal.pcbi.1010874.g004
步骤4:定量结合测定。
最后,我们通过荧光偏振(FP)测定通过实验量化了设计的肽与PVIVIT肽结合Cn的能力(图5,S6和S7)。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. 用于Cn与PVIVIT肽结合的选定肽的FP竞争测定。
将每种选定肽的可变浓度与与FITC标记的PVIVIT肽结合的Cn孵育。读取极化水平并将归一化值拟合到单个站点模型。曲线显示了Cn与PVIVIT的结合分数与肽的对数浓度的关系。红色 - 天然肽,紫色 - 设计肽,黑色 - PVIVIT。
https://doi.org/10.1371/journal.pcbi.1010874.g005
天然Cn结合肽高度多样化(步骤0&1)
同源性搜索后,我们获得了1886个片段和16列的多重比对,对应于每侧的2个基序位置和2个侧翼残基(S<>数据)。序列徽标可视化(S<>A图)揭示了高度的序列多样性:仅在位置P,I观察到强烈的氨基酸偏好1和我2,分别用于脯氨酸和疏水残基。T-SNE预测显示,片段主要按源基因和分类单元聚集(S2B和S2C图)。单个基因亚比对的序列标志可视化揭示了比整个比对更强的保护模式(S2D 图)。中央SLIM比PxIxIT,e更多样化。g. 基因特异性苗条P[T/S]F[N/S]FS, P[E/D]IT[V/I]T, PQ[F/Y]x[I/L/V]x, P[F/Y][M/V]xFx被发现。在六个规范的SLIM位置之外也发现了保护模式:e。对于CAPN11基因,位置-5,-4,-1,+1,+5是保守的,表明它们对结合也很重要。总之,天然Cn结合剂具有不同的序列,单个SLIM或PSSM模型无法很好地概括这些序列。局部保存和全球多样性的这种结合可能是由结合能的多种结合构象和/或明显的空间重新分配引起的。与天然基序相比,重新组合这些基序可能会产生具有相似或改进结合的合成序列。此外,它可以使特定竞争与确定的底物,同时保持对其他底物的约束力。
通过序列生成模型对结合片段进行逆向工程(步骤 2)
生成建模是一种无监督的学习模式。它由拟合参数概率分布 P 组成Θ(S)在序列空间上通过最大化参数Θ平均对数似然〈log PΘ(S)〉 个观察到的序列。由于PΘ(S) 归一化为统一 (∑SPΘ(S) = 1),此最大化协议相当于分配较大的 P 值Θ(S)用于观察到的序列,其他地方较低(图3A)。因此,学习的PΘ(S)定性地反映了进化适应度函数,对于进化选择的序列,该函数也很高,而对于在整个进化过程中被消除的未观察到的序列,该函数也很低[32]。重要的是,PΘ(S)在序列空间中必须是“平滑的”,因为观察到的序列只是稀疏地对所有进化拟合序列的集合进行采样:未观察到但进化拟合序列也应该具有很高的概率。训练完成后,可以生成与训练数据不同的新型高概率序列,并且是潜在的Cn结合剂。功能形式P的选择Θ(S) 确定先于(i.例如,感应偏置)在离散序列空间上。在这里,我们使用了组合受限玻尔兹曼机(cRBM,图3B),正式定义如下。设 S = {s1,..,我,..,N} 是长度为 N 的蛋白质序列,其中 s我∈{A,C,D,...,Y?} 其中—是对齐间隙符号。它的概率 P(S) 写着:
(1)
其中 是归一化因子(分区函数),使得 P 归一化,g我(一) 是Nx21位点特异性氨基酸场,w我μ(a) 是一个 Nx21xM 稀疏权重张量,用于将序列投影到连续的 M 维空间(称为隐藏单元空间)和电位Γμ(I)是可训练的,严格凸非线性,如二次函数。非正式地,这些字段量化了每个位点的氨基酸偏好:如果序列的氨基酸与每个位点的首选氨基酸相匹配,则为序列分配高分。每个权重矩阵w.,μ(.)非正式地表示在数据子集中一致找到的序列基元。投影量化了给定序列与基序之间的匹配程度,并且模型将高概率分配给具有较大正或负I的序列μ(S) 通过类似二次的非线性Γμ(注意,对于二次势Γμ(一)∝I2,方程(1)简化为具有低秩交互矩阵的Potts模型。等式(1)源自经典的RBM定义(i.e. 具有成对二分交互作用的无向图模型),通过边缘化隐藏单元上的联合分布 [53]。训练后,可以通过正负基序匹配的组合重组来生成新的序列。cRBM被证明是蛋白质序列建模的强大归纳偏差,因为它通过结合稀疏的高阶上位相互作用项来推广单位点和成对Potts模型,并且比成对模型或深度生成模型更容易解释[53,54]。我们通过改变M和正则化强度在多个片段比对上训练多个cRBM,并选择了一个在性能和可解释性之间最妥协的cRBM(方法,S3A和S3B图)。在这里,模型的性能和可解释性分别通过保留测试数据的对数似然来量化(i.E. 它为看不见的天然粘合剂分配高概率的能力)和 w 的非零条目的比例iμ(a)(越低越容易解释)。稀疏性减少了过度拟合,简化了对学习序列基序的可视化和解释,并将生成模型搅拌到所谓的组合状态,其中每个序列仅存在几个基序[57,53,54]。
为了验证该模型,我们将其学习的对数概率函数与Nguyen et最近进行的结合亲和力的深度突变扫描进行了比较。铝[24]。我们计算了四种PxIxIT肽的所有单点突变体的对数似然差Δlog P:从人NFATc2和AKAP79蛋白中提取的天然片段,以及合成的PVIVIT和PKIVIT肽(图3C和3D)。图3E显示了实验确定的结合亲和力ΔΔG变化(越低越好)和预测的适应度变化Δlog P(越高越好)之间的散点图。PKIVIT和PVIVIT肽具有极好的相关性(Spearman相关性分别为?ρ = 0.76,0.77),NFATc2和AKAP79相关性良好(?ρ = 0.25,0.43分别为)。该协议比以前使用Rosetta flex_ddG和FoldX ddG协议[24]进行的基于结构的ΔΔG预测要好得多(PVIVIT的ρ = 0.2,0.21,AKAP0的ρ = 21.0,39.79)。基于cRBM的Δ对数P与ΔΔG测量的相关性也优于使用ProteinMPNN [58]计算的对数似然差,ProteinMPNN [0]是最近发表的用于基于结构的蛋白质设计的图形神经网络(?ρ = 53.0,45.0,53.0,36.2,参考复合物:6p1b:AB-E)或PSSM(i.e. 独立模型)在同一对齐方式(S3 表)上训练。虽然侧翼残基的突变通常比基序残基耐受性更好(图3C和100D),但我们也发现前者也很重要。为了量化它,我们对3个具有代表性的比对自然片段进行了额外的虚拟深度突变扫描(通过Kmeans++算法从比对中随机采样),并计算了每个位置突变时可能性变化的分布(S1C图)。平均耐受性突变最低的位置依次为-<>,P,I1, +3, I2和 -3。此外,位置对之间有效上位耦合的可视化(S3D 图)显示了中心残基和侧翼残基之间的重要协变(特别是-1)。这证实了先前的生化研究,这些研究显示了侧翼残基对Cn结合的重要性[24]。最后,我们研究了该模型是否能够识别不同基材之间共享的共同基序。为此,我们可视化了学习的序列基序(图3F中显示的三个代表性基序,其余作为S3数据提供),以及它们的匹配分数分布(图3G)和选定的正负顶部匹配片段。我们发现一些基序,如基序1(聚焦于中心残基)和基序3(聚焦于C端)是底物特异性的,正如三峰匹配评分分布及其顶部激活片段来自相同底物的事实所证明的那样。其他,例如基序2(在位置-1同时存在天冬酰胺,在位置x处存在疏水残基2并在位置 +3 和 +5) 处带负电荷的残基)在各种底物的碎片中发现。在位置+3和+5同时存在或不存在带负电荷的残基是一种反复出现的模式;我们假设它们对应于在位置100,318和/或332处同时存在或不存在带有Cn带正电荷的赖氨酸/精氨酸的稳定盐桥。
总之,序列模型概括了Cn相互作用的众所周知的生化特征。接下来,我们使用该序列模型生成两个候选肽库,分别使用常规蒙特卡罗采样和所谓的低温采样,以更高的概率值聚焦样品,遵循Russ等人[26]。前者肽跨越了序列空间的较大部分,平均距离自然序列集更远,而后者具有更高的概率得分(S3E图)。冗余减少后,选取180个常规样品和361个低温样品进行进一步分析。为了进行比较,我们进一步包括:(i)作为阳性对照,已知以高亲和力结合Cn的两种合成肽(PVIVIT和PKIVIT),(ii)作为阴性对照,36个纯随机的16长度肽(iii)来自四个人类NFATc1-4基因的天然结合片段,加上MFA的70个附加代表(方法);(iv)作为基线生成模型,来自PSSM模型的72个样本。S784 数据中报告了 4 个序列的完整列表。
通过分子对接和微阵列结合测定进行文库细化(步骤3)
先验序列模型平等对待所有自然序列。然而,它们的结合亲和力几乎跨越三个数量级(0.5-250 uM)。为了进一步完善候选肽列表,我们使用与含有PxIxIT的肽结合的Cn的五种可用晶体结构和一个基于临时模板的分子对接,然后是基于Modeller [55]和PepCrawler [56]的柔性骨架细化管道(图4A,方法)估算了对接能量评分(分数越低越好)。从一个Cn晶体结构到另一个Cn晶体结构的对接能量是一致的(S4A图),并且与SGM的可能性相关(S4B图,皮尔逊相关r = -0.21,p < 10?8).随机或PSSM设计的序列具有明显高于自然或cRBM设计的序列的能量(p < 10?12,双侧曼-惠特尼-威尔科克森检验)。相比之下,天然片段和cRBM设计之间没有统计学上的显着差异。然而,随机肽(阴性对照)和天然结合肽(阳性对照)的能量分布显着重叠:14%的随机肽的能量得分低于至少一半的天然肽(图4B)。因此,仅基于对接设计肽可能会导致大量假阳性。为了合理化肽序列的对接能量评分,我们通过稀疏线性回归(LASSO)将加性单位点模型拟合到对接结果中。单站点模型很好地接近了对接能量结果(交叉验证皮尔逊相关r = 0.89,S4E图)。回归系数的可视化(图4C)证实基序位点是最重要的位点,在这些位置具有高度疏水性的侧链(I,V,L,M,F),在位置“P”处有利于脯氨酸。侧翼残基总体上不太重要,但也有所贡献,特别是在位置+3处,其中带负电荷的残基(D,E)受到青睐,与序列模型一致。为了评估对接能量区分天然粘合剂的能力,我们使用单位点模型计算了所有天然片段的近似对接分数,并计算了每个底物的平均值(图4D)。平均对接能量最低的底物是A激酶锚定蛋白79(AKAP79),这与先前的结合亲和力测量一致(kd~0.1–2.0 uM)及其生物学功能。事实上,AKAP79将Cn系在突触裂隙旁边的神经膜上,用于突触信号传导的磷酸化调节[59]。NFAT位于光谱的中间,与先前的观察一致,即其亲和力被微调为中间值,以防止在没有钙的情况下NFAT过度激活[22]。
总之,我们得出结论,对接评分可以通过区分具有可变结合强度的天然基因来有效地补充进化评分。另一方面,仅基于对接方案的肽设计会导致高度疏水的结合基序,可能具有低溶解度和高反应性,以及侧翼残基的准确性有限。
同时,测试选定的肽在芯片微阵列(PEPperPRINT)上的Cn结合。将786种肽打印在芯片上,并与GST标记的Cn在4°C下孵育过夜。 经过大量洗涤后,通过应用荧光标记(Alexa-Fluor 647)GST抗体检测结合。在额外的洗涤和干燥后,扫描微阵列载玻片(图4E),荧光斑点显示结合Cn的肽。该实验重复五次,并在原始数据的后处理后确定Z标准化荧光水平(方法,S5A,S5B和S5C图)。
虽然实验确定的荧光水平与序列模型或对接分数之间没有统计学上的显着相关性,但芯片中的正异常值也具有良好的序列模型和对接分数(图4F和S5D)。此外,由于PVIVIT和PKIVIT肽的荧光水平较弱,并且基于序列的单位点模型不能很好地解释荧光的后验,因此观察到假阴性读数(S5E图)。我们得出的结论是,单独的实验荧光水平并不能一致地表明结合,但阳性命中可以被认为是可靠的。基于对芯片上的序列似然评分、对接评分和荧光水平的分析,选择了15种肽进行进一步分析:PVIVIT肽、<>种天然片段和<>种cRBM设计的肽。
体外定量结合测定和分析(步骤4)
合成选定的肽,并通过FP竞争测定(方法)评估其特异性结合Cn PxIxIT结合位点的能力。将每种肽的不同浓度在与荧光标记的PVIVIT肽络合的Cn溶液中孵育,读取FP水平表明肽与PVIVIT竞争的能力(图5)。将极化值拟合到单个位点抑制模型后,提取相应的IC50值并在表1中报告。我们发现7/10的合成肽和3/4的天然肽成功地与PVIVIT竞争Cn结合,IC50值范围为1.17μM至250μM。为了进行比较,我们还使用相同的方案测试了未标记的PVIVIT的自我竞争,发现IC50为10.2μM。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 1. 通过竞争性荧光偏振测定表征的肽序列列表。
缩写:IC50:一半最大抑制浓度;注意:没有约束力;低T:低温采样。
https://doi.org/10.1371/journal.pcbi.1010874.t001
最好的肽是人类C16Orf74基因的一个片段,因其高序列评分而被选中,IC50 = 1.17 uM。这与它的高基因平均对接评分(排名5/67,图4D)以及最近对CABIN1基因(一种紧密同源物(ATKFPPEITVTPPTPT)的结合亲和力测量结果一致[60]。C16Orf74具有高度疏水的类似PxIxIT的基序,有趣的是,具有富含C端脯氨酸的基序。使用C16Orf74和PVIVIT的AlphaFold-multimer进行的结构建模表明,富含脯氨酸的脯氨酸采用刚性聚脯氨酸螺旋构象,有效地扩展了β片,从而能够在没有任何熵成本的情况下与Cn进行额外的相互作用表面(S6图)。我们强调,这种聚脯氨酸基序极不可能通过诱变发现,因为刚性结构的出现需要三个同时突变到脯氨酸。第二好的肽(IC50 = 17.5uM)是人类AKAP79基因的一个片段,与其高序列评分,基因平均对接评分(排名1/67,图4D)和以前的研究一致。
我们最好的合成肽ADEAIPEIVISKPEEP(以下简称rbmTRESK)是通过对cRBM和结合Cn进行低温采样而获得的,其强度与PVIVIT(IC50 = 14uM)相当。它具有来自其最接近的天然对应物的六个突变,人类TRESK蛋白的Cn结合片段,其IC50几乎低四倍(IC50 = 54uM)。具有如此大量突变的序列很难通过经典的计算诱变方法获得,并且在单轮筛选中仅通过实验方法几乎是不可能的。相反,通过对TRESK的左翼残基(ADEAIPQIVIDAGADE)、KCNN3的基序残基(PTQNPPEIVISSKEDS)和CAPN11的右侧残基(TFWTNPQFKIYLPEED)进行合理重组,有效地获得了rbmTRESK。
有趣的是,上述肽都具有类似PxIxIT的基序,但这不是必需的:肽rbmAKAP79和rbmAKAP79_2,都与鹈鹕的AKAP79基因相似,尽管缺乏脯氨酸残基,但成功地与PVIVIT结合竞争。
最后,我们发现所有四种与CAPN11基因相似的天然或合成肽始终未能与PVIVIT竞争。有三种可能的解释:(i)它们结合Cn的独特区域,(ii)结合依赖于翻译后修饰,如磷酸化,(iii)它们是真正的非结合剂,i。e. 我们的训练数据集已损坏。在所有情况下,从多片段比对中去除所有CAPN11样肽对于未来的筛选都是简单的。
讨论
据估计,细胞中有超过五十万个PPI,其中许多起着重要的生理作用,是潜在的治疗靶点[1]。然而,PPI调节剂的发现,特别是小有机分子形式的发现,受到PPI界面固有的理化性质,结构数据的可用性有限和对接工具准确性的阻碍。这通常促使人们得出PPI是“不可成药”靶标的结论[61]。能够结合具有高亲和力和特异性的目标蛋白并干扰其天然蛋白质-蛋白质相互作用的合成肽是基础系统生物学研究、蛋白质-蛋白质相互作用的结构表征和药物发现活动的有吸引力的试剂。然而,由于搜索空间大,难以在体外或计算机中估计高通量的结合亲和力和特异性,以及需要整合多个设计约束,合理的肽设计仍然是一个主要挑战。
在这里,我们提出了一种新的综合方法来设计针对蛋白质特定结合位点的肽,基于从天然相互作用伙伴中提取的蛋白质片段。在使用可用的实验数据和同源性搜索鉴定天然伴侣及其相互作用片段后,训练序列生成模型(此处为cRBM)并从中采样,产生103-4个“逆向工程”肽的计算机库。随后通过具有成本效益的中等通量方法(基于模板的对接和微阵列结合测定)过滤肽。最后,优先考虑~101种肽的聚焦列表,并通过FP测定定量它们干扰目标蛋白质-蛋白质相互作用的能力。我们将我们的方案应用于钙信号通路的关键组成部分Cn-PxIxIT复合物,发现7/10设计的肽和3/4的天然肽成功结合靶标结合位点。我们最成功的肽是一种以前被忽视的天然肽,具有富含C端脯氨酸的基序,以及一种设计的重组肽,其携带来自其最接近的天然对应物的六个突变。两者都几乎不可能在一轮筛选中通过经典诱变获得。这些肽为通过体外诱变[62]或迁移学习[27]和/或多组分构建体[63]进一步优化奠定了基础,这些构建体也靶向二级LxVP结合位点。
在序列生成模型的选择方面,协议的稳健性如何?在这里,我们使用了组合受限玻尔兹曼机(cRBM),这是一种具有闭式似然函数和可处理参数数量的表达生成模型,通过结合稀疏的高阶交互作用项来推广PSSM(即独立模型)和Potts模型。仅基于PSSM的协议,忽略位置之间的相互依赖性,将产生低得多的成功率,如(i)熵计算所证明的那样,该计算表明显式建模相互依赖性可将候选序列的空间大小减少至少~4000倍(方法)(ii)灵活的对接模拟,表明PSSM生成的序列平均比cRBM生成的序列具有更差的对接能量,以及(iii)微阵列实验, 未鉴定出任何与Cn具有高结合亲和力的PSSM生成的序列。另一方面,生成Potts模型[64,26,65]也集成了相互依赖关系,同样很好地模拟了天然粘合剂的分布(方法,S3A图),并且可能具有相当的效果。其他解释相互依赖关系的机器学习生成模型(参见Wu.等人[28]的概述)也可能是合适的。另一方面,不清楚基于语言模型的序列生成协议有多好(见e。g., [66,67]) 会执行,因为它们通常在全长序列而不是片段上训练和评估;在这里,它们可能缺乏关键的上下文信息(例如,片段属于无序区域)。
成功的其他重要因素是(i)基于先前实验的关于Cn底物的足够序列和结构数据的可用性(ii)SGM协议在损坏的训练数据方面的稳健性以及(iii)基于进化和基于对接的方法之间的互补性。事实上,虽然仅基于进化的模型无法区分瞬时和紧密的天然粘合剂,但仅基于结构的对接无法解释氨基酸对侧翼残基的偏好,也无法解释中心残基的混杂疏水侧链。因此,我们发现我们的cRBM模型更好地预测了ProteinMPNN [58]突变时的结合亲和力变化,ProteinMPNN是最近发表的用于序列设计的基于结构的自回归图神经网络。基于进化和基于结构的蛋白质设计方法之间的协同作用已经确立[68-71],因此,尽管基于结构的计算设计方法正在迅速改进[58,72,73],但我们预计进化信息在未来仍将证明是有价值的。
我们的协议有以下限制:
i) 培训 SGM 需要一组足够多样化的序列。因此,该协议仅适用于相互作用在整个进化过程中高度保守的情况,和/或已经表征了多种天然粘合剂的情况。尽管该方案仅针对高度多价和经过深入研究的Cn进行了测试,但我们指出,许多其他感兴趣的蛋白质靶标具有类似的壮举。
ii) 不能保证用于训练的多序列比对中的所有序列都绑定目标。事实上,相互作用的直系同源物配对是一个具有挑战性的问题,只能近似解决。此外,翻译后修饰经常调节SLiM的结合。
iii) 至少一个活页夹必须有一个实验结构或可靠的模型可用,以便执行基于模板的对接和评分。
iv)在微芯片定性结合测定中,肽与芯片化学连接,而不是在溶液相中自由移动。这可能无法准确反映它们在溶液中的物理行为,阻碍结合,进而导致高假阴性率。在这里,我们使用了五重体来限制这个问题。
材料和方法
天然粘合剂的多片段排列的构建
使用以下缩写:Cn的催化结构域:CnA,Cn的调节结构域:CnB,底物蛋白:SP。 短线性基序:SLiM。总结协议的流程图如S1A图所示。该协议从先前在文献中表征的双域Cn酶的67种(38种来自酵母,29种来自人类)的实验验证底物蛋白列表中启动。对于每个SP,先前通过噬菌体展示筛选和/或SLiM匹配确定与Cn PxIxIT结合位点结合的片段的位置[44,45]。由于生成建模通常受益于增加的序列多样性,因此我们试图通过同源性搜索来增强这一初始集。然而,朴素同源性搜索并不合适,因为Cn-SP相互作用在整个进化过程中不是系统保守的[44];我们改为按以下方式进行。对于CnA,CnB和每个SP,首先构建了相互作用的直系同源物的初始种子比对。直系同源物是从同源基因数据库中收集的(如果有的话),或者通过UniProt的BLAST搜索(默认参数,前100名点击,仅保留具有相同或同义基因名称的序列)。对于有序蛋白质,使用MAFFT [74](默认参数)比对种子序列。对于无序蛋白质(由IUPred2鉴定[75]),对MAFFT输出的目视检查显示不令人满意的比对,不能一致地对齐结合的SLiMs。取而代之的是KMAD [76],一种为无序蛋白质量身定制的多重比对软件(参数:自定义模式“P.I.I.”,加法分数= 100,减去分数= 5,否则默认)。接下来,对于每个Cn结构域和SP,使用HHblits 30(2018次迭代,其他参数的默认值)在UniClust06数据库(时间戳:3/4)上搜索其他同系物[77]。接下来使用MirrorTree [78]方法的变体[79]过滤掉非相互作用的同系物。MirrorTree背后的直觉是,当两个蛋白质家族相互作用时,它们各自的系统发育树往往是相似的。更具体地说,如果蛋白质 1 和 2 之间的相互作用在物种 A 和 B 中是保守的,那么它们的序列应该以相似的速率彼此分化。相反,偏离这种模式表明可能存在不一定保留功能相互作用的基因复制事件。从形式上讲,每个SP都有一组种子三胞胎[(CnA种子组织1, CnB种子组织1、SP种子组织1),(CnA种子组织2, CnB种子组织2、SP种子组织2), ..]和一组候选三胞胎 [(CnA组织1, CnB组织1、SP组织1),(CnA组织2, CnB组织2、SP组织2), ..]要过滤掉——一般来说,每个生物体有多个候选三胞胎。对于每个三元组l和种子三元组l',计算每个伙伴的序列恒等式:,其中k∈(CnA,CnB,SP)是复分量索引。 接下来,确定皮尔逊相关矩阵,然后确定其非对角线平均值:。R量化了所提出的三元组相对于种子三元组的进化分歧的总体一致性。接下来,通过最大化平均R为每个物种鉴定CnA和CnB的单个拷贝l.涉及另一个 CnA/CnB 拷贝的三元组被丢弃,在其余的三元组中,所有具有 R 的三元组l保持阈值以上。为每个SP单独确定阈值,作为R的种子三元组的最小值l (一.e.,使得所有种子三胞胎都被保留)。
接下来,对于每个相互作用的SP,通过取i*-10列和I * + 16列之间的所有氨基酸(包括插入片段)来提取其假定的相互作用片段,其中i*是种子序列SLIMS的起始位置。将片段汇集在一起,并用MAFFT重新对齐(间隙开放惩罚:6,间隙扩展惩罚:2)。 在这个阶段,目视检查发现片段明显偏离主分布(异常长,没有可见的SLiM),可能是由于序列比对错误或未正确过滤掉。为了去除这些序列,训练了一个具有 10 个 dReLU 隐藏单元和稀疏正则化惩罚的限制玻尔兹曼机(见下一节),并计算每个序列的对数似然对数P。S1B图中显示的分布具有沉重的左尾,这意味着许多序列是异常值,属于序列空间中人口稀少的区域。为了确定临界值,按似然区间(虚线)对序列进行分组,并计算每个组的序列图(S1C图)。Z-归一化似然得分低于-0.3的序列没有预期的SLiM基序,也没有任何显着的序列守恒,因此被丢弃。在过滤、重新比对和重新训练后,新的似然分布(未显示)具有与先前研究的蛋白质家族模型一致的单峰形状,序列谱具有预期的保守模式。最后,每侧仅保留5个侧翼残留物,以方便与之前的作品进行比较。请注意,我们没有使用CnA / CnB比对,因为与PxIxIT的结合位点高度保守,并且Cn与其底物之间没有协同进化。
序列生成建模
cRBM通过持续对比发散训练了多片段比对[53](源代码可从 https://github.com/jertubiana/PGM 获得),并使用以下参数:隐藏单元数:从5个增加到30个;隐藏单元电位:双整流线性单元(dReLU);批量:100;MCMC采样器:备用吉布斯;马尔可夫链数:100;每个梯度评估之间的蒙特卡罗步数:20;梯度更新次数:20000;优化器:初始学习率:10 的 ADAM?3,在 50% 的训练后呈指数衰减到 10?5, β1= 0, β2= 0.99, ? = 10?3.对于正则化,我们对权重(强度范围从 0.0 到 1.0)和 L 使用了稀疏惩罚2场上的惩罚(力量)。训练样本被分配的权重与MSA中最多1个相似氨基酸的相似序列的数量成反比。为了计算似然分数,使用退火重要性抽样算法评估分区函数,使用 104中间温度和10次重复。为了量化学习序列基序的稀疏性,通过参与率估计非零权重的比例,如方程20,21中所述[53]。对于参数选择,MFA 被拆分为训练集和验证集,使得训练和验证的序列至少相差三个残基。这是通过使用单链接合并标准(scipy.cluster.hierarchy.single command)执行分层聚类来完成的,将树切成2,并将80%的聚类分配给训练,20%分配给验证。对隐藏单元的数量和正则化强度进行网格搜索,并监测模型稀疏性和保持平均对数似然(S3A和S3B图);选择了在良好稀疏性和可能性之间做出最佳折衷的模型,对应于 30 个隐藏单元和 0.25 个正则化强度。其每站点的可能性大大优于最佳独立/PSSM 模型(针对伪计数值进行了优化),并且略低于使用相同算法训练的最佳 Potts 模型(针对 L 进行了优化)2正则化强度)。选择参数后,在整个MFA上重新训练最佳cRBM。训练后,通过重复应用等式(3)对野生型和单点变异体计算图3C和1D中显示的突变景观。S3D 图的有效上位矩阵通过 [15] 的方程 16,53 计算。对大约10 000个肽进行常规和低温采样,随后进行分层聚类以将其减少到361和180个肽(其中选择簇代表作为cRBM可能性最高的序列)。MFA同样被聚类以获得70个代表性片段。基于1)PSSM分布,2)低温PSSM分布,3)cRBM分布和4)低温cRBM分布的熵计算,估计Cn结合肽的集合大小分别为1)1017.3, 2) 1012.9, 3) 1013.7和 4) 102.8- 10 个中的一小部分20.8可能的肽长度为16。
基于模板的对接和绑定评分
通过基于模板的对接确定768种候选肽中每种肽的物理结合评分,如下所示。从pdb中收集了与各种含PxIxIT的肽复合物中的2种Cn催化结构域结构:6p3b(PVIVIT),8ll79(AKAP6),1uuq(RCAN6),1nuf(NHE2)和51jog(PVIVIT,NMR)[80,83–100]。给定肽序列和模板复合物,对齐候选肽序列和模板肽序列(通过基序匹配),然后使用Modeller构建肽的55个同源结构模型[2]。将候选肽叠加到模板肽上,如果发生空间位阻冲突(任何一对原子之间的中心-中心距<0A),则将其平移离Cn。然后,通过最大化成本函数来选择具有扩展构象和形成多个接触的模型 覆盖率 + 05.0 * 原子触点数 + 05.4 * 扩展 其中 NumAtomContacts 是原子触点的数量(仅重原子,原子中心之间的距离截止为 56A),覆盖率是形成至少一个原子接触的肽残基数,延伸是 C 端和 N 端 Calpha 原子之间的欧氏距离。接下来,使用PepCrawler[10]对初始构象进行细化,PepCrawler是一种基于快速探索的随机树和全原子能量函数的快速,灵活的骨架构象采样算法。对每种结构重复上述同源建模+细化方案50次,并保留能量最小的构型。每个肽总共对接 1 次,相当于在英特尔至强融核处理器的单个 CPU 内核上进行 ~2-12 天的计算。还计算了漏斗评分(衡量最小能量配置周围能量景观陡峭程度的指标),因为先前已证明漏斗评分可表征良好的肽抑制剂[56,4]。S0A 图(或 b)显示了从五种结构确定的结合(或漏斗)分数之间的互相关矩阵。对接能量相关性良好(所有对的r~5.<>),但漏斗评分不相关,据称是由于同源建模步骤或相对较长的肽长度。因此,仅保留粘合剂能量评分。
肽阵列读数和分析
肽阵列制备为定制阵列辣椒片(PEPperPRINT)。对于结合检测,将1mg / ml GST标记的Cn在4°C的微阵列上孵育过夜。 经过大量洗涤后,荧光标记(Alexa-Fluor 647)GST抗体。根据建议的制造商方案进行额外的洗涤和干燥后,使用InnoScan 1100扫描仪扫描微阵列载玻片。实验重复五次。每次扫描的分析如下:使用边界HA标记叠加网格以确定每种肽的感兴趣区域(ROI)(每种肽两个ROI),并计算每个ROI的平均荧光强度的对数。整个阵列的基线荧光水平并不均匀,正如对数荧光强度与行和列指数的散射图所证明的那样(S5A和S5B图)。为了消除空间伪影,使用二阶多项式拟合位置依赖性基线荧光,并减去荧光。接下来,在每种肽的两个ROI上平均荧光水平并Z-归一化。由于边界HA标记物的溢出,发现沿边界的肽具有显着更高的荧光水平(S5C图),并且没有进一步分析。我们通过监测荧光评分的空间自相关函数来检查芯片内部没有明显的溢出。在五次重复中平均Z评分,以产生每种肽的一个荧光评分。
Cn表达和纯化
Cn的催化结构域如[84,85]所述。简而言之,编码残基2-347并取代Y341S,L343A和M347D的基因在E中表达为可切割的GST融合蛋白。大肠杆菌BL21细胞。在LB中生长,达到OD(600nm)= 0.8后,通过在1°C下加入25 mM IPTG诱导蛋白质表达。 16小时后收获细胞,并重悬于适用于下游纯化的基于PBS的裂解缓冲液中,通过超声处理破坏并通过离心除去所有不溶性碎片后,将其重悬于可溶性级分的GST柱(谷胱甘肽琼脂糖4快速流动)上。GST色谱柱的洗脱液通过超dex75色谱柱的体积排阻色谱进一步纯化。
多肽合成
肽由肽2公司(美国)通过N-ter乙酰化和C-ter酰胺化合成。
荧光偏振实验
使用配备偏振光学系统的 Biotek HybridH96 读数仪对排列在 1 孔板中的样品进行荧光测量。所有测量一式三份进行。通过将可变浓度的每种未标记测试肽添加到含有100nMFITC标记的PVIVIT肽和4uM的Cn A的孔中来评估竞争。 使用GraphPad Prism7拟合来自简单和竞争性结合实验的实验极化数据,误差线代表标准偏差。
事后分析
所有统计分析,包括统计测试,LASSO 回归(在图4C和S5E中用于将单位点模型拟合到分子对接和微阵列结合实验的结果)和T-SNE降维(用于可视化自然片段的分布并突出显示S2A和S2B图中的簇)都是使用numpy,scipy和scikit-learn Python包进行的。
支持信息
各种基于结构和基于进化的模型的性能比较,用于预测单点突变对四种肽与钙调磷酸酶结合亲和力的影响,见图3C-3E。
显示 1/13: pcbi.1010874.s001.xlsx
跳到无花果共享导航
一个 B C D E F
1 数据 型 北维特 PVIVIT NFATc2 阿卡普79
2 所有突变 成果管理制 0.76 0.77 0.52 0.43
3 独立 0.74 0.72 0.39 0.13
4 罗塞塔flex_ddG 那 -0.2 那 0.21
5 折叠X ddG 那 0.21 那 0.39
6 蛋白质MPNN 0.53 0.45 0.53 0.36
7
8 侧翼突变 成果管理制 0.52 0.5 -0.12 0.3
9 独立 0.57 0.53 -0.06 -0.29
10 罗塞塔flex_ddG 那 -0.56 那 -0.09
11 折叠X ddG 那 0.31 那 0.32
12 蛋白质MPNN 0.59 0.39 0.13 -0.08
表1
1 / 13
下载
无花果分享
S1 表。 各种基于结构和基于进化的模型的性能比较,用于预测单点突变对四种肽与钙调磷酸酶结合亲和力的影响,见图3C-3E。
数据来自Nguyen等人[24]。
https://doi.org/10.1371/journal.pcbi.1010874.s001
(三十)
S1 图 多片段比对 (MFA) 的构建和细化。
(a) 构建多片段比对的方案概述。(b,c)基于cRBM的从同源性搜索中获得的MFA细化:在MFA上训练cRBM模型,并计算所有序列的可能性分数(越高越好)。具有低似然值的序列不共享其他序列的主要守恒和协同进化模式,可能会被丢弃。为了确定临界值,我们按可能性对序列进行分组,并可视化每个子组(c)的序列谱。Z< -0.3 的序列没有任何守恒模式,被认为是异常值。
https://doi.org/10.1371/journal.pcbi.1010874.s002
(巴布亚新几内亚)
S2 图
多个片段对齐的选定数据可视化。(一、二)MFA的T-SNE可视化,按门/基因着色,揭示片段主要按基因聚集。(c) 基因特异性序列图谱,揭示了保守结合基序的多样性。B 表示发现的唯一片段的数量。
https://doi.org/10.1371/journal.pcbi.1010874.s003
(巴布亚新几内亚)
S3 图 有关序列模型的其他信息。
(一、二)模型选择协议。对隐藏单元的数量和稀疏惩罚值执行网格搜索。选择在精度(高似然)和可解释性(低基元稀疏性)之间实现最佳折衷的模型(黑色三角形)。(c) 突变时可能性变化的分布,按位置分组。从比对中计算19个代表性片段的每个位置的所有100个可能的突变的分布(通过Kmeans++算法随机选择)。平均值低的位置对突变的耐受性较差,并且可能对功能更重要。(d) 模型了解到的有效上位耦合,表明核心残余物和侧翼残余物之间存在显著的协变。(e) 所生成序列的质量多样性权衡。序列似然与最接近的天然片段的突变数的散点图。可以生成与自然序列相似或更高但与自然序列不同的可能性的序列。相反,随机或PSSM生成的序列距离较远,但与天然片段区分开来。
https://doi.org/10.1371/journal.pcbi.1010874.s004
(巴布亚新几内亚)
S4 图 有关结构建模协议的其他信息。
(一、二)使用不同晶体结构的五个重复之间的对接能量和漏斗分数的皮尔逊互相关矩阵Cn。 (c,d) 对接能量和漏斗分数相对于序列模型似然的平均五次重复的散点图;两者的相关性较弱,但显著相关。(e) 通过LASSO 回归对接能量得分的单站点模型拟合:对接能量和交叉验证预测之间的散点图。
https://doi.org/10.1371/journal.pcbi.1010874.s005
(巴布亚新几内亚)
S5 图 有关微量测定实验数据处理的其他详细信息。
(一、二)荧光强度水平相对于芯片上七个重复之一的行和列索引的散点图(每个肽一个点)。拟合趋势(红色曲线)并在进一步分析之前删除。(c) 印在芯片边缘和内部的肽的荧光强度水平(对数刻度,归一化为零平均值和单位方差,在七个重复中取平均值)的分布。来自相邻荧光标签的溢出导致边界肽的荧光水平更高;在下游分析中,边界沿线的正面命中被忽略。(d) 对接能量评分相对于荧光水平的散点图。(e) 通过LASSO 回归对接能量得分的单站点模型拟合:对接能量和交叉验证预测之间的散点图。
https://doi.org/10.1371/journal.pcbi.1010874.s006
(巴布亚新几内亚)
S6 图 使用ΑFold-multimer对Cn-PVIVIT和Cn-C16orf74配合物进行计算建模。
钙调磷酸酶以表面表示形式显示,由静电势着色。PVIVIT和C16orf74肽分别以绿色和橙色表示。使用ChimeraX进行可视化。
https://doi.org/10.1371/journal.pcbi.1010874.s007
(巴布亚新几内亚)
S7 图 肽与荧光标记的PVIVIT肽的FP竞争。
将每种肽的可变浓度与Cn和PVIVIT的共复合物一起孵育。将极化值拟合到单个位点抑制模型中,并提取IC50值。
https://doi.org/10.1371/journal.pcbi.1010874.s008
(巴布亚新几内亚)
S1 数据。 先前研究鉴定的天然钙调磷酸酶结合片段列表。
https://doi.org/10.1371/journal.pcbi.1010874.s009
(三十)
S2 数据。 用于训练序列生成模型的多片段比对。
https://doi.org/10.1371/journal.pcbi.1010874.s010
(法斯塔)
S3 数据。 序列生成模型学习的序列基序。
https://doi.org/10.1371/journal.pcbi.1010874.s011
(三十)
S4 数据。 在基于芯片的测定中评估的选定肽列表。
https://doi.org/10.1371/journal.pcbi.1010874.s012
(英文)
S5 数据。 用于 PepCrawler 的 Linux 二进制可执行文件。
https://doi.org/10.1371/journal.pcbi.1010874.s013
(邮编)
确认
J.T.感谢Dina Schneidman-Duhovny的有益讨论和Naama Hurwitz对PepCrawler的帮助。
引用
1.Stumpf MPH, Thorne T, de Silva E, Stewart R, An HJ, Lappe M, et al.估计人类相互作用组的大小。国家科学院院刊 2008;105: 6959–6964.密码:18474861
查看文章PubMed/NCBI谷歌学术搜索
2.Chen J, Sawyer N, Regan L. 蛋白质-蛋白质相互作用:结合亲和力与界面埋藏表面积之间关系的一般趋势。蛋白质科学出版蛋白质学会 2013;22: 510–515.密码:23389845
查看文章PubMed/NCBI谷歌学术搜索
3.Scott DE,Bayly AR,Abell C,Skidmore J.小分子,大靶点:药物发现面临蛋白质 - 蛋白质相互作用的挑战。纳特雷夫药物迪斯科夫。2016;15: 533–550.密码:27050677
查看文章PubMed/NCBI谷歌学术搜索
4.Shin W-H,Kumazawa K,Imai K,Hirokawa T,Kihara D.设计蛋白质 - 蛋白质相互作用靶向药物的当前挑战和机遇。高级应用生物信息化学AABC。2020;13: 11–25.密码:33209039
查看文章PubMed/NCBI谷歌学术搜索
5.佩萨拉基 E, 罗素 RB.生物系统中肽介导的相互作用:新发现和应用。Curr Opin Biotechnol.2008;19: 344–350.pmid:18602004
查看文章PubMed/NCBI谷歌学术搜索
6.Hummel G,Reineke U,Reimer U.将肽翻译成小分子。摩尔生物系统。2006;2: 499–508.密码:17216031
查看文章PubMed/NCBI谷歌学术搜索
7.霍尔医学博士,亚斯加尔A,佩里亚T,布拉斯特德JC,贾达夫A,西梅诺夫A等。荧光偏振测定在高通量筛选和药物发现中的综述。方法应用荧光。2016;4: 022001.密码:28809163
查看文章PubMed/NCBI谷歌学术搜索
8.维德·维尔格 J, 达哈尔 S, 永达尔 T, 格罗特利 M, 塔马斯 MJ.应用基于肽的测定来表征靶向酵母蛋白激酶的抑制剂。柯尔热内。2014;60: 193–200.密码:24643376
查看文章PubMed/NCBI谷歌学术搜索
9.Peier A, Ge L, Boyer N, Frost J, Duggal R, Biswas K, et al. NanoClick:一种高通量、与靶标无关的肽细胞通透性测定。化学生物学 2021;16: 293–309.pmid:33539064
查看文章PubMed/NCBI谷歌学术搜索
10.Cabri W, Cantelmi P, Corbisiero D, Fantoni T, Ferrazzano L, Martelli G, et al. 临床开发中靶向PPI的治疗肽:概述,作用机制和观点。前分子生物科学。2021;8.可用: https://www.frontiersin.org/article/10.3389/fmolb.2021.697586 pmid:34195230
查看文章PubMed/NCBI谷歌学术搜索
11.伦敦 N, 拉维 B, 莫夫肖维茨-阿提亚斯 D, 舒勒-弗曼 O.自抑制肽能否从球状蛋白质-蛋白质相互作用的界面衍生出来?蛋白质结构功能生物信息。2010;78: 3140–3149.pmid:20607702
查看文章PubMed/NCBI谷歌学术搜索
12.扎德曼D,沃尔夫森HJ。PinaColada:肽抑制剂蚁群临时设计算法。生物信息学。2016;32: 2289–2296.密码:27153578
查看文章PubMed/NCBI谷歌学术搜索
13.Alam N,Schueler-Furman O.使用Monte Carlo采样方法建模肽 - 蛋白质结构和结合:Rosetta FlexPepDock和FlexPepBind。在:Schueler-Furman O,伦敦N,编辑。肽-蛋白质相互作用建模:方法和协议。纽约州纽约:施普林格;2017.第139–169页。https://doi.org/10.1007/978-1-4939-6798-8_9
14.Ciemny MP, Kurcinski M, Kozak KJ, Kolinski A, Kmiecik S. 使用 CABS-Dock 的高度灵活的蛋白质-肽对接。在:Schueler-Furman O,伦敦N,编辑。肽-蛋白质相互作用建模:方法和协议。纽约州纽约:施普林格;2017.第69–94页。https://doi.org/10.1007/978-1-4939-6798-8_6
15.耿 C, 纳拉西姆汉 S, 罗德里格斯 JPGLM, 邦万 AMJJ.使用HADDOCK的信息驱动,集成灵活的肽对接。在:Schueler-Furman O,伦敦N,编辑。肽-蛋白质相互作用建模:方法和协议。纽约州纽约:施普林格;2017.第109–138页。https://doi.org/10.1007/978-1-4939-6798-8_8
16.Alam N,Goldstein O,Xia B,Porter KA,Kozakov D,Schueler-Furman O.使用基于片段的PIPER-FlexPepDock进行高分辨率全球肽蛋白对接。公共科学图书馆计算生物学. 2017;13: e1005905.密码:29281622
查看文章PubMed/NCBI谷歌学术搜索
17.Zheng F, Grigoryan G. 通过基于序列的原子模型表示简化蛋白质-肽相互作用特异性的设计。在:Schueler-Furman O,伦敦N,编辑。肽-蛋白质相互作用建模:方法和协议。纽约州纽约:施普林格;2017.第189–200页。https://doi.org/10.1007/978-1-4939-6798-8_11
18.福伊特, 陈TS, 里奇曼D, 基廷AE.通过计算导向文库设计富集肽库以实现结合亲和力和特异性。在:Schueler-Furman O,伦敦N,编辑。肽-蛋白质相互作用建模:方法和协议。纽约州纽约:施普林格;2017.第213–232页。https://doi.org/10.1007/978-1-4939-6798-8_13 pmid:28236241
19.D'Annessa I, Hurwitz N, Pirota V, Beretta GL, Tinelli S, Woodford M, et al.HSP90–Cdc37接口中断器的设计。分子。2020;25: 360.密码:31952296
查看文章PubMed/NCBI谷歌学术搜索
20.赫维茨 N, 扎德曼 D, 沃尔夫森 HJ.Pep–Whisperer:抑制性肽设计。蛋白质结构功能生物信息。不适用 pmid:35598299
查看文章PubMed/NCBI谷歌学术搜索
21.Khramushin A,Ben-Aharon Z,Tsaban T,Varga JK,Avraham O,Schueler-Furman O.用于高分辨率盲肽对接的匹配蛋白质表面结构贴片。国家科学院院刊 2022;119: e2121153119.pmid:35482919
查看文章PubMed/NCBI谷歌学术搜索
22.Aramburu J, Yaffe MB, López-Rodríguez C, Cantley LC, Hogan PG, Rao A. 比环孢菌素更具选择性的 NFAT 抑制剂的亲和力驱动肽选择。1999;285: 2129–2133.密码:10497131
查看文章PubMed/NCBI谷歌学术搜索
23.Hamzeh-Mivehroud M,Alizadeh AA,Morris MB,Bret Church W,Dastmalchi S.噬菌体显示作为一种技术,实现了肽药物发现的承诺。今天的毒品迪斯科夫。2013;18: 1144–1157.密码:24051398
查看文章PubMed/NCBI谷歌学术搜索
24.Nguyen HQ, Roy J, Harink B, Damle NP, Latorraca NR, Baxter BC, et al.使用光谱编码磁珠对蛋白质-肽亲和力景观进行定量映射。电子生活。2019;8.密码:31282865
查看文章PubMed/NCBI谷歌学术搜索
25.Hein JB,Cyert MS,Fordyce PM. MRBLE-PEP测量揭示了对PP56A调节亚基B2的准确结合亲和力。ACS 测量科学 Au.2021;1: 56–64.密码:35128539
查看文章PubMed/NCBI谷歌学术搜索
26.Russ WP, Figliuzzi M, Stocker C, Barrat-Charlaix P, Socolich M, Kast P, et al.用于设计绒毛膜变位酶的基于进化的模型。科学。2020;369: 440–445.密码:32703877
查看文章PubMed/NCBI谷歌学术搜索
27.Biswas S,Khimulya G,Alley EC,Esvelt KM,Church GM。 具有数据高效深度学习的低N蛋白质工程。纳特方法。2021;18: 389–396.密码:33828272
查看文章PubMed/NCBI谷歌学术搜索
28.吴志, 柯强斯顿, 阿诺德, 杨国.使用深度生成模型进行蛋白质序列设计。化学生物学杂志. 2021;65: 18–27.密码:34051682
查看文章PubMed/NCBI谷歌学术搜索
29.Hawkins-Hooker A, Depardieu F, Baur S, Couairon G, Chen A, Bikard D. 使用变分自动编码器生成功能蛋白变体。公共科学图书馆计算生物学. 2021;17: e1008736.密码:33635868
查看文章PubMed/NCBI谷歌学术搜索
30.雷佩卡 D, 黄尼斯基斯 V, 卡普斯 L, 伦贝扎 E, 罗凯蒂斯 I, 兹里梅克 J, 等.使用生成对抗网络扩展功能蛋白质序列空间。纳特·马赫·英特尔。2021;3: 324–333.
查看文章谷歌学术搜索
31.Shin J-E, Riesselman AJ, Kollasch AW, McMahon C, Simon E, Sander C, et al.使用自回归生成模型进行蛋白质设计和变异预测。纳特公社。2021;12: 2403.密码:33893299
查看文章PubMed/NCBI谷歌学术搜索
32.Cocco S,Feinauer C,Figliuzzi M,Monasson R,Weigt M.蛋白质序列的逆统计物理学:关键问题综述。代表进展物理 2018;81: 032601.密码:29120346
查看文章PubMed/NCBI谷歌学术搜索
33.Grisoni F,Neuhaus CS,Gabernet G,Müller AT,Hiss JA,Schneider G.通过建设性机器学习设计抗癌肽。化学医学。2018;13: 1300–1302.密码:29679519
查看文章PubMed/NCBI谷歌学术搜索
34.吴志, 杨 KK, Liszka MJ, Lee A, Batzilla A, Wernick D, et al. 基于注意力的神经网络生成的信号肽。合成生物学 2020;9: 2154–2161.密码:32649182
查看文章PubMed/NCBI谷歌学术搜索
35.陈德普, 多田 S, 汤本 A, 北尾 A, 伊藤 Y, 宇泽 T, 等.使用分子动力学模拟来确定和理解 AI 生成的细胞穿透肽。科学代表 2021;11:10630。密码:34017051
查看文章PubMed/NCBI谷歌学术搜索
36.万 F, 孔托乔戈斯-海因茨 D, 富恩特-努涅斯 C de la.用于肽设计的深度生成模型。数字迪斯科夫。2022 [24-2022-35769205引用].密码:<>
查看文章PubMed/NCBI谷歌学术搜索
37.Hogan PG, Chen L, Nardone J, Rao A. 钙、钙调磷酸酶和 NFAT 的转录调节。基因开发 2003;17: 2205–2232.pmid:12975316
查看文章PubMed/NCBI谷歌学术搜索
38.李智宇, 金立国, 崔建明重新审视靶向NFAT控制T细胞免疫和自身免疫性疾病的概念。前免疫。2018;9.可用: https://www.frontiersin.org/article/10.3389/fimmu.2018.02747 pmid:30538703
查看文章PubMed/NCBI谷歌学术搜索
39.骨髓系白细胞中的钙调磷酸酶-NFAT信号传导:免疫抑制治疗的新前景和陷阱。EMBO Mol Med. 2017;9: 990–999.密码:28606994
查看文章PubMed/NCBI谷歌学术搜索
40.Rao A, Luo C, Hogan PG. NFAT家族的转录因子:调节和功能。免疫年鉴。1997;15: 707–747.密码:9143705
查看文章PubMed/NCBI谷歌学术搜索
41.Sieber M,Baumgrass R.钙调磷酸酶/ NFATc枢纽的新型抑制剂 - CsA和FK506的替代品?小区通信信号。2009;7: 25.密码:19860902
查看文章PubMed/NCBI谷歌学术搜索
42.钱Z, Dougherty PG, 刘T, Oottikkal S, Hogan PG, Hadad CM, et al. 肽基抑制剂对活化T细胞钙调磷酸酶-核因子(NFAT)相互作用的基于结构的优化.医学化学杂志 2014;57: 7792–7797.密码:25162754
查看文章PubMed/NCBI谷歌学术搜索
43.钙调磷酸酶与底物和靶向蛋白的相互作用.趋势细胞生物学. 2011;21: 91–103.密码:21115349
查看文章PubMed/NCBI谷歌学术搜索
44.Goldman A, Roy J, Bodenmiller B, Wanka S, Landry CR, Aebersell R, et al.钙调磷酸酶信号网络通过超越底物身份的保守激酶-磷酸酶模块进化。摩尔细胞。2014;55: 422–435.密码:24930733
查看文章PubMed/NCBI谷歌学术搜索
45.Wigington CP, Roy J, Damle NP, Yadav VK, Blikstad C, Resch E, et al. 短线性基序的系统发现解码钙调磷酸酶信号传导。摩尔细胞。2020;79: 342–358.e12.密码:32645368
查看文章PubMed/NCBI谷歌学术搜索
46.桥本Y,佩里诺BA,索德林TR.钙调磷酸酶中自身抑制结构域的鉴定。生物学杂志 1990;265: 1924–1927.密码:2153670
查看文章PubMed/NCBI谷歌学术搜索
47.图比亚娜 J, 施耐德曼-杜霍夫尼 D, 沃尔夫森 HJ.ScanNet:用于基于结构的蛋白质结合位点预测的可解释几何深度学习模型:48。
查看文章谷歌学术搜索
48.图比亚娜 J, 施耐德曼-杜霍夫尼 D, 沃尔夫森 HJ.ScanNet:一种Web服务器,用于通过几何深度学习对蛋白质结合位点进行基于结构的预测。分子生物学杂志. 2022;434: 167758.密码:36116806
查看文章PubMed/NCBI谷歌学术搜索
49.Stemmer PM, Klee CB.钙调磷酸酶和钙调磷酸酶B.生物化学对钙调磷酸酶的双重钙离子调节。1994;33: 6859–6866.密码:8204620
查看文章PubMed/NCBI谷歌学术搜索
50.Brauer BL, Moon TM, Sheftic SR, Nasa I, Page R, Peti W, et al. 利用LxVP SLiM的新定义来发现新型钙调磷酸酶调节剂和底物。化学生物学 2019;14: 2672–2682.密码:31633908
查看文章PubMed/NCBI谷歌学术搜索
51.李H,张L,Rao A,Harrison SC,Hogan PG.钙调磷酸酶与PVIVIT肽复合物的结构:低亲和力信号相互作用的肖像。分子生物学杂志. 2007;369: 1296–1306.密码:17498738
查看文章PubMed/NCBI谷歌学术搜索
52.Sheftic SR, Page R, Peti W. 使用π?LxVP SLiM研究人类钙调磷酸酶相互作用网络。科学代表 2016 61.2016;6: 1–11.pmid:27974827
查看文章PubMed/NCBI谷歌学术搜索
53.Tubiana J,Cocco S,Monasson R.从序列数据中学习蛋白质组成基序。Colwell LJ,Weigel D,编辑。电子生活。2019;8: e39397.密码:30857591
查看文章PubMed/NCBI谷歌学术搜索
54.Tubiana J,Cocco S,Monasson R.学习受限玻尔兹曼机相互作用系统的组成表示:晶格蛋白的比较研究。神经计算。2019;31: 1671–1717.pmid:31260391
查看文章PubMed/NCBI谷歌学术搜索
55.Webb B,Sali A.使用MODELLER的比较蛋白质结构建模。Curr Protoc Bioinforma.2016;54: 5.6.1–5.6.37.pmid:27322406
查看文章PubMed/NCBI谷歌学术搜索
56.唐斯基E,沃尔夫森HJ。PepCrawler:一种基于RRT的快速算法,用于肽抑制剂的高分辨率细化和结合亲和力估计。生物信息学。2011;27: 2836–2842.密码:21880702
查看文章PubMed/NCBI谷歌学术搜索
57.Tubiana J, Monasson R. 受限玻尔兹曼机中组合表示的出现.物理学修订版 2017;118: 138301.密码:28409983
查看文章PubMed/NCBI谷歌学术搜索
58.道帕拉斯 J, 阿尼申科 I, 贝内特 N, 白 H, 拉戈特 RJ, 米勒斯 LF, 等.使用ProteinMPNN进行基于深度学习的稳健蛋白质序列设计。生物物理学;2022年36108050月 pmid:<>
查看文章PubMed/NCBI谷歌学术搜索
59.Gold MG, Stengel F, Nygren PJ, Weisbrod CR, Bruce JE, Robinson CV, et al.A激酶锚定蛋白79(AKAP79)信号传导复合物的结构和动力学。国家科学院院刊 2011;108: 6426–6431.pmid:21464287
查看文章PubMed/NCBI谷歌学术搜索
60.李 S, 李海棠, 金雅, 李一华, 姜世杰, 沈国, 等.源自CABIN1的优化核心肽可有效抑制钙调磷酸酶介导的T细胞活化。实验分子医学 2022;54: 613–625.密码:35550603
查看文章PubMed/NCBI谷歌学术搜索
61.陆华, 周琪, 何军, 姜志, 彭春, 童蓉, 等.蛋白质-蛋白质相互作用调节剂开发的最新进展:机制和临床试验。信号转导目标2020;5: 1–23.密码:32968059
查看文章PubMed/NCBI谷歌学术搜索
62.曹 L, 考文垂 B, 戈列什尼克 I, 黄 B, 朴 JS, 裘德 KM, 等.仅从靶标结构设计蛋白质结合蛋白。自然界。2022;1–1.pmid:35332283
查看文章PubMed/NCBI谷歌学术搜索
63.王平, 李文, 杨莹, 程 N, 张茜, 张 N, 等.钙调磷酸酶的多肽抑制剂在体内和体外阻断钙调磷酸酶-NFAT信号通路。J酶Inhib Med Chem. 37:202–210。pmid:34894973
查看文章PubMed/NCBI谷歌学术搜索
64.Barton JP, De Leonardis E, Coucke A, Cocco S. ACE:用于最大熵图模型推理的自适应集群扩展。生物信息学。2016;32: 3089–3097.密码:27329863
查看文章PubMed/NCBI谷歌学术搜索
65.Muntoni AP,Pagnani A,Weigt M,Zamponi F. adabmDCA:用于生物序列的自适应玻尔兹曼机器学习。BMC生物信息学。2021;22: 528.pmid:34715775
查看文章PubMed/NCBI谷歌学术搜索
66.Hie BL, Xu D, Shanker VR, Bruun TUJ, Weidenbacher PA, Tang S, et al.仅从一般蛋白质语言模型和序列信息高效进化人抗体。生物Rxiv;2022. p. 2022.04.10.487811.
查看文章谷歌学术搜索
67.斯加博萨 D, 卢波 U, 比特博尔 A-F.在多个序列比对上训练的蛋白质语言模型的生成能力。ArXiv电子打印。2022年2022月 可入住: https://ui.adsabs.harvard.edu/abs/220407110arXiv<>S
查看文章谷歌学术搜索
68.韦恩斯坦 J, 赫尔松斯基 O, 弗莱什曼 SJ.结合系统发育和原子计算的实用有用的蛋白质设计方法。当代结构生物学. 2020;63: 58–64.密码:32505941
查看文章PubMed/NCBI谷歌学术搜索
69.Marques SM,Planas-Iglesias J,Damborsky J.基于Web的计算酶设计工具。当代结构生物学. 2021;69: 19–34.密码:33667757
查看文章PubMed/NCBI谷歌学术搜索
70.Malbranke C,Bikard D,Cocco S,Monasson R.使用二级结构质量评估改进基于序列的蛋白质家族建模。生物信息学。2021;37: 4083–4090.密码:34117879
查看文章PubMed/NCBI谷歌学术搜索
71.Malbranke C,Bikard D,Cocco S,Monasson R,Tubiana J.基于进化和物理启发建模的计算蛋白质设计:当前和未来的协同作用。arXiv;2022.
查看文章谷歌学术搜索
72.Bryant P,Elofsson A. EvoBind:在计算机中用AlphaFold定向进化肽结合剂。生物Rxiv;2022. p. 2022.07.23.501214.
查看文章谷歌学术搜索
73.杨孜, 米拉斯·卡, 怀特·现在什么顺序?用于蛋白质序列贝叶斯优化的预训练集成。生物Rxiv;2022. p. 2022.08.05.502972.
查看文章谷歌学术搜索
74.Nakamura T, Yamada KD, Tomii K, Katoh K. 用于大规模多序列比对的 MAFFT 并行化。生物信息学。2018;34: 2490–2492.密码:29506019
查看文章PubMed/NCBI谷歌学术搜索
75.Erd?s G, Dosztányi Z. 用IUPred2A分析蛋白质紊乱。Curr Protoc Bioinforma.2020;70: e99.密码:32237272
查看文章PubMed/NCBI谷歌学术搜索
76.Lange J,Wyrwicz LS,Vriend G. KMAD:基于知识的固有无序蛋白质多序列比对。生物信息学。2016;32: 932–936.密码:26568635
查看文章PubMed/NCBI谷歌学术搜索
77.Steinegger M, Meier M, Mirdita M, V?hringer H, Haunsberger SJ, S?ding J. HH-suite3 用于快速远程同源性检测和深层蛋白质注释。BMC生物信息学。2019;20: 473.pmid:31521110
查看文章PubMed/NCBI谷歌学术搜索
78.马尔米尔 G, 魏格特 M, 比特博尔 A-F.系统发育相关性足以从序列中推断蛋白质伴侣。公共科学图书馆计算生物学. 2019;15: e1007179.密码:31609984
查看文章PubMed/NCBI谷歌学术搜索
79.G?bel U,Sander C,Schneider R,Valencia A.蛋白质中的相关突变和残基接触。蛋白质结构功能生物信息。1994;18: 309–317.pmid:8208723
查看文章PubMed/NCBI谷歌学术搜索
80.Takeuchi K,Roehrl MHA,Sun Z-YJ,Wagner G.钙调磷酸酶-NFAT复合物的结构:使用溶液NMR和晶体坐标定义T细胞活化开关。结构。2007;15: 587–597.pmid:17502104
查看文章PubMed/NCBI谷歌学术搜索
81.Li H, Pink MD, Murphy JG, Stein A, Dell'Acqua ML, Hogan PG. 钙调磷酸酶与AKAP79的平衡相互作用调节Ca2+-钙调磷酸酶-NFAT信号传导。国家结构分子生物学. 2012;19: 337–345.密码:22343722
查看文章PubMed/NCBI谷歌学术搜索
82.Hendus-Altenburger R, Wang X, Sj?gaard-Frich LM, Pedraz-Cuesta E, Sheftic SR, Bends?e AH, et al.钙调磷酸酶结合和选择性去磷酸化Na + / H +交换剂1的分子基础。纳特公社。2019;10: 3489.密码:31375679
查看文章PubMed/NCBI谷歌学术搜索
83.李 Y, 谢夫蒂克 SR, 格里戈里乌 S, 施维特斯 CD, 佩奇 R, 佩蒂 W.RCAN1:CN复合物的结构解释了钙调磷酸酶对底物募集的抑制作用。科学进展 2020;6: eaba3681.密码:32936779
查看文章PubMed/NCBI谷歌学术搜索
84.盖尔 M, 李 S, 露娜 RE, 竹内 K, 瓦格纳 G.LxVP和PxIxIT NFAT基序共同结合到远离调节域的钙调磷酸酶催化域上的重叠表位。结构。2014;22: 1016–1027.pmid:24954618
查看文章PubMed/NCBI谷歌学术搜索
85.多坦 N, 盖德 V, 布洛赫 I, 加尔 M.用于研究钙调磷酸酶-NFAT非结构化区域相互作用的ELISA。肛门生化。2018;549: 66–71.密码:29555327
查看文章PubMed/NCBI谷歌学术搜索