免费医学论文发表-一种基于自动边缘嵌入的癌症相关circRNA和药物预测新方法
抽象
circRNAs的独特表达模式与癌症的进展和预后有关,这突显了它们作为有价值的生物标志物的巨大潜力。将现有药物重新用于新适应症可以显着降低癌症治疗成本。circRNA-癌症和药物-癌症关系的计算预测对于精确的癌症治疗至关重要。然而,先前的计算方法未能在系统水平上分析circRNA、药物和癌症之间的相互作用。必须提出一种方法,以发现更有价值的信息,以实现以癌症为中心的多关联预测。在本文中,我们提出了一种新的计算方法AutoEdge-CCP,以揭示与癌症相关的circRNA和药物。我们将circRNA、药物和癌症之间的复杂关系抽象为一个多源异质网络。在该网络中,每个分子由两种类型的信息表示,一种是分子特征的内在属性信息,另一种是由autoGNN显式建模的链接信息,autoGNN从消息传递神经网络的层内和层间搜索信息。AutoEdge-CCP 在多场景应用和案例研究方面的出色表现使它成为一种强大且有前途的关联预测工具。
作者摘要
CircRNA是癌症治疗中的关键生物标志物和药物靶点。预测癌症相关的circRNA和药物有助于揭示驱动肿瘤发生的复杂分子机制,从而为癌症诊断、治疗和研究提供新的见解。然而,流行的预测方法往往忽视了circRNA、药物和癌症之间的全面相互作用,导致对它们复杂的相互作用的不完全理解。作为回应,我们引入了 AutoEdge-CCP,这是一个在多源异构网络中模拟 circRNA-癌症-药物相互作用的框架。每个分子将描述分子特征的内在属性信息与通过autoGNN得出的相互作用信息相结合,揭示了与癌症相关的关键circRNA和药物。跨多场景的实验结果证明了AutoEdge-CCP与竞争方法相比具有卓越的性能,特别是在预测与癌症相关的新型circRNA和药物方面。此外,边缘嵌入和案例研究的可视化提供了对预测结果的可解释见解。
数字
Fig 6Table 8Fig 7表1图1表2图2表3表4图3图4表5图5Table 6Table 7Fig 6Table 8Fig 7表1图1表2
引文: Chen Y, Wang J, Wang C, Zou Q (2024) AutoEdge-CCP:一种基于自动边缘嵌入的预测癌症相关 circRNA 和药物的新方法。PLoS 计算生物学 20(1): 编号:E1011851。 https://doi.org/10.1371/journal.pcbi.1011851
编辑 器: Renzhi Cao, 太平洋路德大学, 美国
收到: 2023年8月17日;接受: 2024年1月22日;发表: 1月 30, 2024
版权所有: ? 2024 Chen et al.这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: AutoEdge-CCP的所有数据和代码均可在 https://github.com/codejiajia/AutoEdge-CCP 免费获得。
基金资助:国家自然科学基金(第62231013号);Y.C.获得国家自然科学基金(第62302341号);J.W.获得国家自然科学基金(第62301369号);Q.Z.得到了国家自然科学基金(第62131004号,第62250028号),国家重点研发计划(2022ZD0117700)和衢州市政府(第2023D036号)的支持。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
利益争夺: 提交人声明不存在相互竞争的利益。
介绍
癌症是一种极其复杂的疾病,其特征是基因组、转录组和蛋白质组内发生多种突变[1]。大多数转录组学研究主要集中在癌症发生和进展过程中线性转录本的动态变化。遗憾的是,这些研究往往忽略了环状RNA(circRNA),它是由RNA聚合酶II转录和共价反向剪接形成的,形成一个封闭的环状结构[2]。对各种肿瘤组织和邻近正常组织中circRNA表达谱的差异分析显示,一些circRNA在肿瘤中上调或下调,从而促进或抑制肿瘤生长[3–6]。因此,对circRNA与癌症之间关系的研究具有巨大的意义,因为它具有识别癌症潜在治疗靶点和生物标志物的潜力,并具有进行系统基因药物开发的潜力。
药物研究对癌症治疗至关重要,但它是一个昂贵且漫长的过程。一种新药的发现和临床应用大约需要10-15年时间,成本在0.8-15亿美元之间[7-9]。鉴于这些挑战,从已批准或已建立的临床药物中寻找新的适应症已成为一种有效的策略,这一过程称为药物重新定位,这可以通过识别药物与癌症之间的相互作用来实现[10–13]。circRNA-癌症和药物-癌症关联的计算预测对于确定潜在的RNA靶标和候选药物至关重要,这些靶标和候选药物可以指导后续的湿实验室实验,从而推进癌症治疗。
已经提出了许多计算模型来解决circRNA-疾病和药物-疾病关联的任务。这些方法可以大致分为以网络为中心的方法和机器学习驱动的方法。对于前者,利用不同生物分子之间的关系构建异质网络。随后,采用特定算法通过利用该网络中编码的信息来预测潜在的关联。例如,KATZHCDA [14] 利用 KATZ 测量来识别异质网络中的疾病相关 circRNA,这些 circRNA 使用疾病-疾病相似性、circRNA-circRNA 相似性和 circRNA-疾病关联进行整合。CD-LNLP [15]采用线性邻域繁殖标记策略来识别潜伏的疾病相关circRNA。RWR [16] 是一种利用重新开始的随机游走方法的 circRNA 疾病关联预测因子。BNNR[17]基于有界核范数正则化方法恢复了异质性药物-疾病网络的缺失关联。Xie等人整合了加权K最近已知邻居和二分图扩散,以识别新的药物-疾病关联[18]。然而,大多数以网络为中心的方法无法在没有任何交互信息的情况下对节点进行关联预测。机器学习驱动的方法主要利用监督或无监督学习方法来挖掘数据的深层特征,并迭代优化模型参数以准确预测潜在的关联。Niu等人将马尔可夫模型整合到图神经网络中,以推断潜在的疾病相关circRNA[19]。DMFCDA [20] 和 NMF-DR [21] 是两种基于基质分解的模型,分别预测与疾病相关的 circRNA 和药物。LAGCN[22]和HNRD[23]是利用神经网络提取药物疾病特征的两种预测因子,结合注意力机制和邻居信息来增强信息提取。尽管以前的方法取得了有希望的结果,但大多数方法只考虑了节点特征,并以简单的连接方式将它们组合在一起,而没有显式地对节点之间链接中包含的复杂信息进行建模。他们忽视了边缘嵌入学习的重要性,限制了在网络拓扑中充分捕获有价值信息的能力。此外,大多数先前的方法分别处理circRNA-疾病和药物-疾病任务,缺乏系统的视角来分析它们的相互作用,因此忽略了多个生物分子之间的限制和协调。
在这里,我们介绍了AutoEdge-CCP,这是一种通过显式学习边缘嵌入来系统地预测癌症相关circRNA和药物的新模型。首先,整合circRNA-癌、药物-癌、circRNA-药物关联的数据,生成多源异构网络,并基于网络中的节点提取相似性属性特征;接下来,利用具有显式链路信息的autoGNN通过消息传递和读出阶段学习多源异构网络中的边缘特征表示。它在消息传递神经网络中引入了不同的层内和层间维度,并利用鲁棒的搜索算法来确保搜索图神经网络(GNN)框架的有效性。最后,AutoEdge-CCP 利用学习排名 (LTR) 框架来解决 circRNA-癌症和药物-癌症关联的预测问题。通过为每个查询circRNA或药物构建相关癌症的排名列表,我们促进了更有效的分析。此外,在多个场景中的实验结果表明,与其他最先进的方法相比,AutoEdge-CCP具有优越性。此外,案例研究验证了 AutoEdge-CCP 检测潜在 circRNA-癌症和药物-癌症关联的能力。
结果
数据
从公共数据库中收集3种类型的节点和3种类型的关联,以构建用于预测癌症相关circRNA或药物的异构网络。我们从circR2Cancer数据库中检索了circRNA-癌症关联,这是一个精心策划的资源,具有经过实验验证的circRNA-癌症链接。对于药物-疾病关联,我们从CTD数据库中获得了数据,该数据库包括分别来自已发表文献和精选药物-基因相互作用的策划和推断关联。根据先前的研究[24],从circRic数据库中获得了circRNA-药物敏感性数据。我们使用 Wilcoxon 测试确定了 circRNA 与药物敏感性之间的显着联系,通过分析 circRNA 表达与药物敏感性之间的相关性,当 FDR < 0.05 时建立关联。我们排除了孤立的节点,只关注那些在多源异构网络中至少有一个边缘的节点。结果,我们共收集了614个circRNA-癌关联、1197个circRNA-药物关联和523个药物-癌症关联,分别涵盖407个circRNA、24个药物和46个癌症。对于与癌症相关的circRNA和药物预测相关的任务,我们构建了两个不平衡的数据集,表示为S1和 S2分别。这些数据集包括经过实验验证的circRNA-癌症关联和药物-癌症关联作为阳性样本,而它们相应的未观察到的对被视为阴性样本。表1显示了两个数据集的详细统计信息及其在circRNA-癌症和药物-癌症关联任务中的应用。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 1. 数据集的统计信息。“#”表示数字。
https://doi.org/10.1371/journal.pcbi.1011851.t001
多场景应用实验装置
本研究将AutoEdge-CCP算法的多场景应用分为两类。在场景 1 中,我们的目标是预测新发现的与癌症相关的 circRNA 和药物。这些新实体与候选癌症集有着完全未知的联系,被标记为“新查询的相关癌症排名”。在场景 2 中,我们的目标是预测已知的 circRNA(或药物)与候选癌症之间缺失的关联,称为“已知查询的相关癌症排名”。
对于第一个应用场景“新查询的相关癌症排名”,数据集的分布如图1A所示。训练集和测试集之间没有查询 ID 的交集。具体来说,实验过程是使用五重交叉验证方法进行的。我们假设整个数据集包含五个作为查询的 circRNA 或药物,它们对应的查询 ID 标记为 qid1 到 qid5。以图 1A 为例,我们将数据集分为五个不重叠的子集,每个子集对应一个唯一的查询 ID。我们选择了 qid 5 对应的子集作为测试集,其余四个子集作为训练集。此过程重复五次,在每次试验中将维持测试集更改为不同的子集。随后,对从五次实验运行中获得的性能测量值进行平均,以得出模型的最终性能评估。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 1. 数据集在两个应用场景中的分布。
(a) 情景 1:新查询的相关癌症排名 (b) 情景 2:已知查询的相关癌症排名。
https://doi.org/10.1371/journal.pcbi.1011851.g001
对于第二个应用场景“已知查询的相关癌症排名”,数据集的分布如图1B所示。每个查询的部分数据被组合成一个测试集,剩下的数据被组合成一个训练集。在数据拆分过程中,所有数据集被随机划分为五个子集。同样,使用五重交叉验证获得最终的实验结果。
参数分析
为了全面评估我们提出的方法的性能和鲁棒性,我们进行了深入的参数分析。通过系统地探索各种排名器及其关键参数对结果的影响,我们旨在阐明产生最准确和最可靠预测的最优参数配置。我们实现的详细参数设置在 S1 表中提供。
为了更深入地了解不同排名器对癌症列表对 circRNA 查询进行排名的排名模型性能的影响,我们比较了排名器 0-7 的参数,其中每个排名器代表不同的算法:0 (MART)、1 (RankNet)、2 (RankBoost)、3 (AdaRank)、4 (Coordinate Ascent)、6 (LambdaMART) 和 7 (ListNet)。如表2所示,结果表明,LambdaMART模型在AUC和NDCG@10矩阵方面明显优于其他模型,表明其适用于与查询相关的癌症排名任务。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 2. LTR 中不同排名者的比较。
https://doi.org/10.1371/journal.pcbi.1011851.t002
LambdaMART 算法的主要参数包括树数、学习率、候选阈值数和最小叶支持。我们利用更大的 S1 数据集(包含比 S2 数据集更多的样本和查询)来优化这些参数。通过分析 AutoEdge-CCP 在 S1 数据集上的性能变化,我们可以对上述参数进行微调以实现最佳组合。此外,本研究遵循控制变量的原理,在评估特定参数时,其他参数保持在其默认值不变。最终的性能结果是通过对五倍交叉验证的性能分数进行平均而获得的。
图 2 演示了参数微调对 AutoEdge-CCP 方法性能的影响。值得注意的是,AUC 和 NDCG@10 指标都超过了 0.88,这表明 LambdaMART 算法在对癌症相关列表进行排序方面的有效性。经过彻底的比较,我们将树数、学习率、阈值候选数和最小叶子支持数的参数分别设置为 1000、0.1、256 和 1。对模型性能影响最小的其他参数(如叶数和停止)将设置为其默认值。通过这种组合,AutoEdge-CCP 方法可以实现更好的性能和泛化。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 2. LambdaMART 模型参数的影响。
(a)、(b)、(c) 和 (d) 分别表示 AutoEdge-CCP 在树数、学习率、阈值候选数和最小叶支持数变化下获得的 AUC 和 NDCG@10 值。
https://doi.org/10.1371/journal.pcbi.1011851.g002
AutoEdge-CCP在多种场景下的性能
在预测新查询相关癌症排名的场景 1 中,我们将 AutoEdge-CCP 与五种 circRNA-疾病关联预测方法进行了比较,包括三种基于机器学习的方法 KATZHCDA [14]、RWR [16]、CDLNLP [15],以及两种基于深度学习的方法 DMFCDA [20] 和 GMNN2CD [19](表 3).此外,还比较了AutoEdge-CCP与五种药物与疾病关联的预测方法,包括三种基于机器学习的方法BNNR [17]、NMFDR [21]、BGMSDDA [18]和两种基于深度学习的方法LAGCN [22]、HNRD [23](表4)。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 3. AutoEdge-CCP与其他方法在新型circRNA相关癌症预测中的性能比较。
https://doi.org/10.1371/journal.pcbi.1011851.t003
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 4. AutoEdge-CCP与其他方法在新型药物相关癌症预测中的性能比较。
https://doi.org/10.1371/journal.pcbi.1011851.t004
从比较中可以看出:(1)AutoEdge-CCP在场景1中实现了最佳的综合预测性能,并获得了高质量的相关癌症排名列表。(2) 与在 S2 数据集中预测药物相关癌症的任务相比,AutoEdge-CCP 在预测 S1 数据集中的 circRNA 相关癌症任务方面表现出更好的性能。这与基于深度学习进行特征提取的AutoEdge-CCP在大型数据集上表现出良好的可扩展性和适应性是一致的。因此,它可以有效地利用数据集中的信息来增强模型的泛化能力。
我们在场景 1 中比较了不同方法在特定范围 (ROC10-45) 下的 ROCk 值,如图 3A 所示。鉴于我们的场景类似于信息检索,通常最值得关注前 k 个推荐结果。ROCk 指标精确地用于评估排名靠前项目的能力。ROC 曲线下的面积可以扩展到 ROCk 的度量,即前 k 个项目的 AUC。此指标的公式详见 S2 文本。我们可以观察到,AutoEdge-CCP在癌症相关circRNA预测方面优于所有竞争方法。对于药物-癌症关联,尽管某些方法在k的小范围内具有更高的ROCk值,但AutoEdge-CCP在ROC25-45范围内优于其他方法,表明在大规模数据集上具有优势。此外,一些方法显示出波动或减少,这可以通过模型的不均匀排序能力导致某些样本的错误判断来解释。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 3. AutoEdge-CCP在多种场景下的性能。
(A) 方案 1 中 AutoEdge-CCP 与替代方法之间的 ROCk 值比较。(B) 46 种癌症的总体 ROC。AUROC 中位数显示在每个面板的顶部。在这里,每条灰线代表一种癌症,红线代表中位曲线,浅绿色部分代表第 25 和第 75 个分位数之间的区域。(C) 描述场景 2 中 AutoEdge-CCP 指标分数的箱形图。(A-C):左侧为circRNA-癌症关联预测,右侧为药物-癌症关联预测。
https://doi.org/10.1371/journal.pcbi.1011851.g003
图 3B 展示了场景 1 的扩展,从 46 种查询的癌症类型的角度展示了整体 ROC 曲线。circRNA-癌和药物-癌预测任务的中位值分别为0.9917和0.6228。
为了评估 AutoEdge-CCP 在多种场景中的性能,我们还将其应用于预测与场景 2 中已知的 circRNA 或药物相关的癌症。图 3C 说明了 5 倍实验的结果,展示了在已知的 circRNA(或药物)相关癌症中的整体高准确性和排名能力。
对源自 autoGNN 的边缘特征的评估
为了评估 autoGNN 模型对 AutoEdge-CCP 的影响,我们将其与四种经典的图嵌入算法进行了比较,包括 DeepWalk [25]、node2vec [26]、LINE [27] 和 SDNE [28],如图 4 所示。该实验特别关注场景 1 中的 circRNA 相关癌症任务,同时保持 AutoEdge-CCP 算法的其余部分不变,但嵌入模型除外。比较的算法使用默认参数设置。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 4. 分析源自 autoGNN 的边缘特征。
(A)-(B) 不同图嵌入算法下的性能对比.(C) AutoEdge-CCP 与无节点特征或边缘特征的模型之间的性能比较。
https://doi.org/10.1371/journal.pcbi.1011851.g004
如图 4A 和 4B 所示,尽管其他算法在这种情况下表现相当不错,但与 AutoGNN 相比,它们的性能仍然不足。具体而言,我们观察到 AutoEdge-CCP 实现了最高的整体性能,在 AUC、AUPR、NDCD、NDCD@10、MRR 和 MAP 方面,性能最佳的基线 Node2vec 分别提高了 0.6%、13%、6.4%、6.6%、8.9% 和 8.8%。这些结果表明,autoGNN更适合挖掘相关数据中包含的深度信息,从而提高了AutoEdge-CCP算法在多种场景下对癌症关联任务的预测性能。
此外,我们通过去除节点特征或边缘特征进行了烧蚀分析。如图4C所示,结果表明,当缺少节点或边缘特征时,模型表现不佳,凸显了它们的重要性。此外,通过结合边缘功能,性能有了更大的提高,突出了 autoGNN 的有效性。为了进一步探索模型的鲁棒性,我们对三个模型进行了孤立的特征工程,以提取节点GIP属性特征,从而减少潜在的数据泄漏。很明显,AutoEdge-CC的性能尽管略有下降,但仍然值得称赞。
此外,我们在表5中说明了AutoEdge-CCP和烧蚀模型(即“no_nodefeature”)搜索的参数。AutoEdge-CCP模型和烧蚀模型可适应不同的图神经网络架构。对于组合操作,当烧蚀模型搜索两层的和操作时,AutoEdge-CCP 模型适应了两个串联操作。对于激活操作,烧蚀模型分别在第一层和第二层搜索Relu和Prelu函数,而AutoEdge-CCP模型选择反向激活函数顺序。对于层间聚合,烧蚀模型不适应任何操作,而 AutoEdge-CCP 则连接两层。通过以上分析,可以证明AutoEdge-CCP可以搜索操作空间来组成不同的图神经网络架构。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 5. 两个用于 autoGNN 和烧蚀模型的自适应 GNN 框架。
https://doi.org/10.1371/journal.pcbi.1011851.t005
AutoEdge-CCP 的可视化说明
我们进行了一项视觉解释实验,以验证 AutoEdge-CCP 背后的基本原理,并观察其在学习边缘嵌入(即 He在方程 5 中)。我们的目的是了解学习边缘嵌入的差异及其与circRNA-癌症和药物-癌症对预测结果的相关性。为了实现这一点,我们计算了这些对的不同边缘嵌入之间的 Pearson 相关系数。在视觉实验中,我们展示了两个circRNA-癌症对,并为每个circRNA-癌症对随机选择了五个未标记(未观察到)的对,同时保持circRNA恒定进行比较。同样,我们随机选择了两种药物,每种药物都有三对标记的药物-癌症和三对未标记的药物-癌症。在图5A中,我们可以观察到以下发现:(1)对于相同的circRNA,具有相同标签的边缘嵌入(在黄色矩形中突出显示)与具有不同标记的边缘嵌入物(在绿色矩形中突出显示)相比表现出更高的相似性。(2) 对于未标记的对,与同一 circRNA 的边缘嵌入(在绿色矩形中突出显示)相比,不同 circRNA 的边缘嵌入(在蓝色矩形中突出显示)表现出较低的相似性。即使是不同 circRNA 的标记对的边缘嵌入(在红色矩形中突出显示)也比具有相同 circRNA 的不同标记的边缘嵌入(在绿色矩形中突出显示)表现出更低的相似性。这些发现表明,AutoEdge-CCP有效地捕获了阳性和阴性样本之间以及不同circRNA之间的固有差异,从而显著增强了模型的预测能力。图5B展示了药物-癌症对的边缘嵌入的相似矩阵,证实了从图5A中得出的相似结论。这进一步验证了AutoEdge-CCP在学习有效链路信息方面的泛化能力。
缩略图 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 5. 用于边缘嵌入的相似性矩阵的热图。
(a) 和 (b) 分别表示 AutoEdge-CCP 为 12 对 circRNA-cancer 和药物-癌症学习的边缘嵌入相似性矩阵。注:*表示已标记的货币对,其余为未标记的货币对。缩写对应于以下全名:hsa_circ_0001733 (0001733)、hsa_circ_0081161 (0081161)、肺腺癌 (LA);头颈部鳞状细胞癌(HNSCC)、甲状腺状癌(PTC)、乳腺癌(BC)、肝癌(LC)、多发性骨髓瘤(MM)、甲状腺癌(TC)、鼻咽癌(NPC)、急性淋巴性白血病(ALL)、膀胱癌(UBC)、前列腺癌(PC);胃癌(GC)。
https://doi.org/10.1371/journal.pcbi.1011851.g005
个案研究
为了验证 AutoEdge-CCP 在确定未知关联优先级方面的能力,我们在场景 1 中对查询的 circRNA (circ-RAD23B) 和查询的药物 (NVP-AUY922) 进行了案例研究。
对于circRNA circ-RAD23B,如表6所示,可以观察到,在最近发表的文献中,前三种候选癌症(食管癌、结直肠癌、非小细胞肺癌)得到了实验验证。具体而言,circ-RAD23B在食管癌中通过海绵化miR-5095来调节PARP2和AKT2[29]。circRAD23B的抑制已被证明通过调节miR-1205/TRIM44轴来阻碍结直肠癌的进展[30]。此外,还发现circ-RAD23B通过调节miR-142-3p/MAP4K3轴来阻碍非小细胞肺癌的进展[31]。
thumbnail 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 6. AutoEdge-CCP 预测的与 circ-RAD23B 相关的排名靠前的候选癌症。
https://doi.org/10.1371/journal.pcbi.1011851.t006
在表 7 中,AutoEdge-CCP 分析揭示了与药物 NVP-AUY922 相关概率最高的前五种候选癌症。有趣的是,相应的文献证实了其中四种癌症类型,即胃癌、乳腺癌、非小细胞肺癌和结直肠癌。例如,NVP-AUY922是一种有效的热休克蛋白90抑制剂,已显示出对胃癌细胞的显著活性[32]。基于类似的作用机制,NVP-AUY922在乳腺癌细胞系中也具有潜在的生长抑制作用[33]。此外,体外研究表明,NVP-AUY922显著阻碍所有41种非小细胞肺癌细胞系的生长,IC50<100 nmol/L[34]。NVP-AUY922和TRAIL联合使用可改善结直肠癌患者的治疗结局[35]。此外,与NVP-AUY922相关的前5名候选癌症(食管鳞状细胞癌)被记录在CTD数据库中。
thumbnail 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 7. AutoEdge-CCP 预测的与 NVP-AUY922 相关的排名靠前的候选癌症。
https://doi.org/10.1371/journal.pcbi.1011851.t007
需要注意的是,CTD 数据库源包含精选和推断数据的组合,这些数据可能不具有相同级别的权威验证。因此,我们打算通过进一步的调查来严格验证预测的关联,以确保 AutoEdge-CCP 的可靠性和准确性。我们使用 autoDockTools 对未证实的 NVP-AUY922-食管鳞状细胞癌关联进行分子对接模拟实验。使用 Pymol 和 DS 软件可视化结果,如图 6 所示。我们重点关注了与食管鳞状细胞癌相关的三个靶点:TGF-β受体2型(TGFBR2)[36]、细胞肿瘤抗原p53(TP53)[37]和多不饱和脂肪酸脂氧合酶(ALOX12)[38]。从分辨率高于2.5 ?的X射线结构中筛选出人类蛋白质靶标,并从蛋白质数据库(PDB)中检索其晶体结构(PDB ID:5E8Y、4ZZJ、3D3L)[39]。我们用 NVP-AUY922 获得了这些靶标的对接结合能,用负值表示,其中负值越小表示功效越高。此外,我们对NVP-AUY922与三个结直肠癌靶点进行了分子对接,并将结果与食管鳞状细胞癌的结果进行了比较,如表8所示。结果表明,食管鳞状细胞癌与NVP-AUY922的分子对接效果与文献支持的结直肠癌与NVP-AUY922之间的相互作用相当。在5E8Y的情况下,如图6B所示,我们观察到化合物与残基THR325、HIS328和ASN332之间存在常规氢键相互作用。此外,还发现了一系列疏水相互作用。这些残基包括烷基相互作用中的 LYS277、CYS396、LEU305、VAL258 和 ALA275、PI-sigma 相互作用中的 LEU386、PI-π 堆叠相互作用中的 PHE327 以及 PI 堆叠相互作用中的 ALA275、LEU386、VAL250 和 VAL258 等残基。此外,范德华相互作用发生在其他氨基酸残基和小分子之间。
thumbnail 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 6. NVP-AUY922 (PubChem CID: 135539077) 和结合口袋的可视化。
(A) NVP-AUY922 的 3D 表示,结合口袋为 5E8Y、4ZZJ 和 3D3L。(B) NVP-AUY922与5E8Y、4ZZJ和3D3L的相互作用图。
https://doi.org/10.1371/journal.pcbi.1011851.g006
thumbnail 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
表 8. NVP-AUY922 与食管鳞状细胞癌和结直肠癌相关的人类靶蛋白的分子结合能。
https://doi.org/10.1371/journal.pcbi.1011851.t008
讨论
我们提出了一种基于autoGNN的显式链接信息和LTR算法的AutoEdge-CCP方法,用于处理circRNA-癌和药物-癌的多关联预测。与之前的方法相比,AutoEdge-CCP具有以下优势:(1)我们将分离的circRNA-cancer、drug-cancer和drug-circRNA关联结合起来,以创建多源异构网络。这些网络能够对circRNA-癌症和药物-癌症相互作用进行系统的整合分析,从而增强信息互补性。(2)AutoGNN在消息传递网络的层内和层间维度上对边缘特征工程进行显式建模,从而能够综合利用分子相互作用信息,提高链路预测性能。(3) LTR 算法的使用将关联挑战转化为排名问题,从而可以全面评估候选癌症关系并减少假阳性,尤其是在顶层。因此,AutoEdge-CCP 在预测癌症与新型 circRNA 和药物的关联方面非常实用。(4)高阶边缘嵌入和分子对接实验的可视化提供了对预测结果的可解释见解,而不是黑盒结果。
在我们未来的工作中,我们可以通过以下途径努力使我们的模型取得更大的进步。(1)采用约束设计原则,以知识或规则为指导,增强网络结构的内在可解释性(2)深入研究circRNA-癌和药物-癌的多种关系类型,包括促进或抑制等方面,以促进更精确的预测能力。
材料和方法
问题表述
在预测癌症相关的circRNA和药物时,任务是使用多源异质网络作为输入来训练模型,生成一个输出,以识别circRNA(或药物)和癌症之间不存在相互作用。具体来说,给定的异质网络定义为图 G = (V,E),其中 v 包括 circRNA 集合 R = {r1,r2,...,rm},药物组 D = {d1,d2,...,天n},并且癌症集合 C = {c1,c2,...,ck},E 表示边集。我们的目标是找到一个模型 M,它映射节点 c 的联合特征表示k和 rm(或节点 ck和 dn) 转换为交互概率得分 pε[0,1]。
AutoEdge-CCP 框架概述
AutoEdge-CCP被提出用于处理多任务:circRNA-癌症和药物-癌症关联预测。如图7所示,我们的方法框架由四个步骤组成:多源异构网络构建、属性特征表示、边缘特征表示和查询相关癌症排名。详细信息将在后续各节中提供。
thumbnail 下载:
PPT的PowerPoint幻灯片
巴布亚新几内亚放大图像
TIFF的原始图像
图 7. AutoEdge-CCP 的框架。
分四个步骤:(A).多源异构网络建设。整合来自 circRic、circR2Cancer 和 CTD 数据库的关联数据,包括 circRNA、药物和癌症。(B).属性特征表示。基于相似性计算提取癌症、circRNA 和药物属性特征。(C).边缘特征表示。AutoGNN 显式建模链路信息以获取边缘特征。(D).查询相关癌症排名。lambdaMART 算法将关联问题转换为查询的 circRNA 或药物的相关癌症列表排名。
https://doi.org/10.1371/journal.pcbi.1011851.g007
多源异构网络建设
在这项研究中,我们将生物分子概念化为节点,将分子之间的相互作用概念化为边缘,创建了一个多源异质网络,有效地捕捉了各种生物分子之间的复杂关系[43\u201245]。在网络中,每个节点都由两类信息表示:内在属性信息(如circRNA功能、药物化合物结构和癌症语义)和捕获节点之间关系的边缘信息。我们从多个公共数据库中收集了三种类型的淋巴结(circRNA、药物和癌症)和各种相关数据,包括 circRNA-癌症关联、药物-癌症关联和 circRNA-药物敏感性关联。在进行了重复数据删除、标识符标准化、非人类关联数据删除等一系列数据处理操作后,构建了一个由 477 个节点和 2334 个边组成的多源异构网络。该网络通过整合各种信息,从系统的角度增强了对缺失的circRNA-癌症和药物-癌症关联的预测。
属性要素表示
我们计算了癌症语义相似性、circRNA功能相似性和药物化学结构相似性。然后将这些特征分别与GIP核相似性融合,以获得属性特征表示。详细的计算程序在S1文本中提供。
边缘特征表示
在这一部分中,我们的模型采用AutoGNN和显式链接信息[46]算法来构建多源异构网络的边缘特征工程。AutoGNN模型可以针对给定数据自动进行适当的GNN架构设计[47],并以显式方式引入边缘嵌入。边缘特征工程由消息传递阶段和读出阶段组成。
消息传递阶段
在消息传递过程中,从层内消息传递神经网络(MPNNa)和层间消息传递神经网络(MPNNr)中搜索信息。为了对图G的链接信息进行编码,MPNNa利用弱注意力机制,基于线性变换来区分自类型边和邻类型边,其中φ(u)∈{self,neigh}。MPNNa 实例化为:
(1)
(2)
其中 N(v) 表示 v 的相邻节点,分别表示最后一层的 u 和 v 的隐藏表示。?一个从节点的邻域控制消息聚合过程。?交流(?) 定义将来自节点自身的消息与来自其相邻节点的消息组合在一起的方法。?C(?) 表示激活功能。上述三个操作的候选选项定义为:?一个(?)∈{sum,max,mean}, ?交流(?)∈{sum,concat} 和 ?C(?)∈{ReLU,PReLU}.
接下来,MPNNr 通过逐层连接和逐层聚合跨层获取信息。逐层连通性操作将输出嵌入 H 组合在一起k?1第 k 个 MPNNa,输出嵌入 Hk从当前图层到新表示 Hk,然后将其送入下一层。逐层连通性操作定义为:
(3)
?缺点(?) 表示逐层连通性函数,其中跳过连通性 [48] 与其他两个函数相结合有助于缓解过度平滑问题 [49],W 是线性变换矩阵。逐层聚合操作通过MGNNa每层生成的逐层聚合表示来实现自适应表示学习,定义如下。
(4)
在哪里?AGG公司(?) 表示层聚合函数。
读出阶段
要获得最终边特征表示 He从 G 中隐藏嵌入的节点集合中,我们引入了强大的池化操作 σ(?)∈{max,concat,sum},其表示如下:
(5)
autoGNN模型采用随机可微分SNAS算法[50],通过重参数化使多个操作的搜索目标可微分。这导致了通过自适应搜索实现的高效GNN框架。假设操作的搜索空间ε是从分布 p 中采样的w(ε)由结构化参数w参数化,定义如下:
(6)
其中 o 表示候选操作,Uo~Uniform(0,1) 表示均匀分布采样,τ 表示 softmax 激活函数的容差。这确保了采样概率 o(即 εo= 1) 与其重量成正比 wo.此外,随机可微松弛在收敛时变得无偏,因为 具有 的 1-hot 特性。搜索问题可以表述如下:
(7)
其中 f(?) 表示所设计的 AutoGNN 模型的操作组合ε与图 G 上的权重 θ 的性能,E(?) 表示期望值。
查询相关癌症排名
LTR是一种强大的技术,可以在信息检索领域将关联问题转化为排名问题[51]。从本质上讲,LTR 使我们能够根据给定的查询从候选集中检索相关文档并对其进行排名。LTR 的显着优势在于它能够消除构建负样本的需要,使其非常适合处理具有不平衡类的数据。值得注意的是,LTR在生物信息学的各个领域都表现出卓越的性能,例如:预测miRNA疾病鉴定[52]、药物靶点结合亲和力预测[53]、蛋白质结构和功能[54]以及蛋白质远程同源检测[55]。
LTR 算法可分为三类:逐点、成对和列表,通过不同的输入和损失函数来区分。逐点方法侧重于单个文档与查询之间的绝对相关性,成对方法通过比较不同文档的顺序来评估相对相关性,列表方法直接优化整个序列以对评估指标进行排名。但是,LTR 的主要重点是对项目进行排序,而不是提供精确的评分输出。因此,在本文中,我们采用LTR来提供相对评分结果。
在这项研究中,我们采用列表类型的LambdaMART将circRNA-癌症和药物-癌症关联的预测任务重构为circRNA或药物相关癌症的排序任务,用于模型训练。此过程与信息检索平行。在主题文档检索中,LambdaMART 利用每个主题及其相应的候选文档集的联合特征作为输入。然后,该算法根据相关程度对特定主题的候选文档集的相关性进行排名。对于circRNA或药物相关癌症的排名任务,circRNA或药物作为查询,而多种癌症作为候选者。LambdaMART 的目标是在每个查询的排名列表中确定相关癌症的优先级。可以在 Ranklib (https://sourceforge.net/p/lemur/wiki/RankLib/) 中访问 LambdaMART 的开源工具包。
该模型的输入和输出数据格式分别为 [label,qid,features] 和 [qid,did,score]。在输入数据中,每行代表一个circRNA(或药物)-癌症对样本,同一查询circRNA i(或药物j)的样本具有相同的qid,标签表示circRNA(或药物)-癌症对的相关程度,当标签=1时,表示该样本已被实验验证为相关;否则,label = 0,特征是circRNA(或药物)-癌症对的边缘特征,由方程5获得。在输出数据中,其中 did 是查询 qid 相关的顶级癌症的唯一 id,score 表示该模型计算的相应 circRNA(或药物)-癌症对的预测分数。
评价标准
对于 AutoEdge-CCP 的性能评估,我们采用了一套全面的链路预测和排名措施,包括 k 处的接收者工作特征曲线 (ROC)、ROC 下面积 (AUC) 和精确召回曲线 (AUPR)、归一化贴现累积增益 (NDCG)、平均倒数秩 (MRR) 和平均平均精度 (MAP),详细信息在 S2 文本中提供。
支持信息
circRNA、癌症和药物分子的属性特征表示的构建过程。
显示 1/3: pcbi.1011851.s001.pdf
跳到无花果分享导航
很抱歉,我们无法加载您的数据。
1 / 3
下载
无花果分享
S1 文本。 circRNA、癌症和药物分子的属性特征表示的构建过程。
https://doi.org/10.1371/journal.pcbi.1011851.s001
(PDF格式)
S2 文本。 评估指标 ROCk、NDCG、NDCG@K、MRR 和 MAP 的详细说明。
https://doi.org/10.1371/journal.pcbi.1011851.s002
(PDF格式)
S1 表。 模型实现中超参数的值列表。
https://doi.org/10.1371/journal.pcbi.1011851.s003
(PDF格式)
引用
1.张莹, 陈 F, 钱德拉谢卡尔 DS, 瓦兰巴利 S, 克赖顿 CJ.2002 年人类癌症的蛋白质基因组学表征揭示了泛癌分子亚型和相关途径。自然通讯。2022;13(1):2669.PMID:35562349
查看文章PubMed/NCBI的Google 学术搜索
2.康恩·西蒙 J、皮尔曼·凯瑟琳 A、图比亚 J、康恩·凡妮莎 M、萨尔曼尼迪斯 M、菲利普斯·卡罗琳 A 等。RNA 结合蛋白 Quaking 调节 circRNA 的形成。细胞。2015;160(6):1125–34.PMID:25768908
查看文章PubMed/NCBI的Google 学术搜索
3.Wang X, Jian W, Luo Q, Fang L. CircSEMA4B 通过编码一种新型蛋白质 SEMA4B-211aa 并调节 AKT 磷酸化来抑制乳腺癌的进展。细胞死亡与疾病。2022;13(9):794.PMID:36115854
查看文章PubMed/NCBI的Google 学术搜索
4.习 Y, 沈 Y, 吴 D, 张 J, 林 C, 王 L, 等.CircBCAR3 通过海绵 miR-27a-3p 加速食管癌的肿瘤发生和转移。分子癌症。2022;21(1):145.PMID:35840974
查看文章PubMed/NCBI的Google 学术搜索
5.Shan C, Zhang Y, Hao X, Gao J, Chen X, Wang K. circRNAs在胃癌中的生物发生、功能和临床意义.分子癌症。2019;18(1):136.PMID:31519189
查看文章PubMed/NCBI的Google 学术搜索
6.Chen Y, Wei S, Wang X, Zhu X, Han S. 环状RNA在肺癌中的作用研究进展.世界外科肿瘤学杂志。2018;16(1):215.PMID:30400981
查看文章PubMed/NCBI的Google 学术搜索
7.Dickson M, 加农 JP.新药发现和开发成本上升的关键因素。Nature 评论药物发现。2004;3(5):417–29.PMID:15136789
查看文章PubMed/NCBI的Google 学术搜索
8.Pushpakom S、Iorio F、Eyers PA、Escott KJ、Hopper S、Wells A 等。药物再利用:进展、挑战和建议。Nature 评论药物发现。2019;18(1):41–58.PMID:30310233
查看文章PubMed/NCBI的Google 学术搜索
9.Tamimi NAM, Ellis P. 药物开发:从概念到营销!肾单位临床实践。2009;113(3):C125–C31。PMID:19729922
查看文章PubMed/NCBI的Google 学术搜索
10.Padhy B, Gupta Y. 药物重新定位:重新研究现有药物的新治疗适应症。研究生医学杂志。2011;57(2):153–60.PMID:21654146
查看文章PubMed/NCBI的Google 学术搜索
11.洛特菲·沙赫雷扎 M、加迪里 N、穆萨维 SR、瓦尔肖萨兹 J、格林 JR。基于网络的药物重新定位方法的综述。生物信息学简报。2018;19(5):878–92.PMID:28334136
查看文章PubMed/NCBI的Google 学术搜索
12.潘旭, 林旭, 曹大, 曾旭, 俞玲, 何玲, 等.用于药物再利用的深度学习:方法、数据库和应用。WIREs 计算分子科学。2022;12(4):e1597.
查看文章Google 学术搜索
13.曾旭, 王芳, 罗莹, 康淑刚, 唐杰, 莱特斯通FC, 等.深度生成分子设计重塑药物发现。细胞报告医学。2022;3(12):100794.PMID:36306797
查看文章PubMed/NCBI的Google 学术搜索
14.范C, 雷X, 吴F-X.基于异构网络的KATZ模型预测CircRNA-疾病关联。国际生物科学杂志。2018;14(14):1950–9.PMID:30585259
查看文章PubMed/NCBI的Google 学术搜索
15.Zhang W, Yu C, Wang X, Liu F. 通过线性邻域标记传播法预测 CircRNA-疾病关联.IEEE接入。2019;7:83474–83.
查看文章Google 学术搜索
16.武拉尔 H, 卡亚 M, 哈吉 R.基于随机游走和重启的模型,用于预测异构网络上的circRNA-疾病关联。2019年IEEE/ACM社交网络分析与挖掘进展国际会议论文集;加拿大不列颠哥伦比亚省温哥华:计算机协会;2020 年,第 929–32 页。
17.Yang M, Luo H, Li Y, Wang J. 基于有界核范数正则化的药物重新定位.生物信息学。2019;35(14):I455–I63。PMID:31510658
查看文章PubMed/NCBI的Google 学术搜索
18.Xie G, Li J, Gu G, Sun Y, Lin Z, Zhu Y, et al. BGMSDDA:一种用于药物-疾病关联预测的多重相似性积分的二分图扩散算法.分子组学。2021;17(6):997–1011.PMID:34610633
查看文章PubMed/NCBI的Google 学术搜索
19.Niu M, Zou Q, Wang C. GMNN2CD: 基于变分推理和图马尔可夫神经网络的circRNA-疾病关联的识别.生物信息学。2022;38(8):2246–53.PMID:35157027
查看文章PubMed/NCBI的Google 学术搜索
20.Lu C, Zeng M, Zhang F, Wu FX, Li M, Wang J. 深度矩阵分解改进了对人类 CircRNA-疾病关联的预测.IEEE生物医学与健康信息学杂志。2021;25(3):891–9.PMID:32750925
查看文章PubMed/NCBI的Google 学术搜索
21.Sadeghi S, Lu J, Ngom A.一种基于网络的药物再利用方法,通过非负基质分解。生物信息学。2022;38(5):1369–77.电话:34875000
查看文章PubMed/NCBI的Google 学术搜索
22.Yu Z, Huang F, Zhao X, Xiao W, Zhang W. 通过层注意力图卷积网络预测药物与疾病的关联.生物信息学简报。2021;22(4):BBAA243.PMID:33078832
查看文章PubMed/NCBI的Google 学术搜索
13 分钟王莹, 邓 G, 曾娴, 宋旭, 庄莹. 基于神经网络邻域信息聚合的药物-疾病关联预测.IEEE接入。2019;7:50581–7.
查看文章Google 学术搜索
14 分钟邓 L, 刘 Z, 钱 Y, 张 J. 通过图注意力自动编码器预测circRNA-药物敏感性关联.BMC生物信息学。2022;23(1):160.PMID:35508967
查看文章PubMed/NCBI的Google 学术搜索
25.Perozzi B、Al-Rfou R、Skiena S. DeepWalk:社会表征的在线学习。第 20 届 ACM SIGKDD 知识发现和数据挖掘国际会议论文集;美国纽约州纽约市:计算机协会;2014 年,第 701–10 页。
26.Grover A, Leskovec J. node2vec:网络的可扩展特征学习。第 22 届 ACM SIGKDD 知识发现和数据挖掘国际会议论文集;美国加利福尼亚州旧金山:计算机协会;2016 年,第 855–64 页。
27.Tang J, Qu M, Wang M, Zhang M, Yan J, Mei Q. LINE: 大规模信息网络嵌入.第24届万维网国际会议论文集;意大利佛罗伦萨:国际万维网会议指导委员会;2015 年,第 1067–77 页。
18 分钟王 D, 崔 P, 朱 W. 结构深度网络嵌入.第 22 届 ACM SIGKDD 知识发现和数据挖掘国际会议论文集;美国加利福尼亚州旧金山:计算机协会;2016 年,第 1225–34 页。
29.Lan X, Liu X, Sun J, Yuan Q, Li J. CircRAD23B 通过海绵化 miR-5095 促进食管癌细胞的增殖和侵袭。生物化学和生物物理研究通讯。2019;516(2):357–64.PMID:31208717
查看文章PubMed/NCBI的Google 学术搜索
30.Han B, Wang X, Yin X. 敲低 circRAD23B 通过调节 miR-1205/TRIM44 轴在结直肠癌中发挥抗肿瘤反应。消化系统疾病与科学。2022;67(2):504–15.PMID:33634427
查看文章PubMed/NCBI的Google 学术搜索
31.Zhuang Q, Huang Z, Zhuang W, Hong Y, Huang Y. 敲低 circ-RAD23B 通过 miR-142-3p/MAP4K3 轴抑制非小细胞肺癌进展。胸部癌症。2022;13(5):750–60.PMID:35106926
查看文章PubMed/NCBI的Google 学术搜索
32.Lee K-H, Lee J-H, Han S-W, Im S-A, Kim T-Y, Oh D-Y, et al.NVP-AUY922 是一种新型热休克蛋白 90 抑制剂,在人胃癌细胞中的抗肿瘤活性是通过客户蛋白的蛋白酶体降解介导的。癌症科学。2011;102(7):1388–95.PMID:21453385
查看文章PubMed/NCBI的Google 学术搜索
33.Jensen MR, Schoepfer J, Radimerski T, Massey A, Guy CT, Brueggen J, et al. NVP-AUY922:一种在临床前乳腺癌模型中具有有效抗肿瘤活性的小分子 HSP90 抑制剂。乳腺癌研究。2008;10(2):R33.PMID:18430202
查看文章PubMed/NCBI的Google 学术搜索
34.Garon EB、Finn RS、Hamidi H、Dering J、Pitts S、Kamranpour N 等。HSP90 抑制剂 NVP-AUY922 有效抑制非小细胞肺癌的生长。分子癌症治疗学。2013;12(6):890–900.PMID:23493311
查看文章PubMed/NCBI的Google 学术搜索
35.Lee D-H, Sung KS, Bartlett DL, Kwon YT, Lee YJ.HSP90 抑制剂 NVP-AUY922 通过抑制结直肠癌细胞中的 JAK2-STAT3-Mcl-1 信号转导通路来增强 TRAIL 诱导的细胞凋亡。蜂窝信号传导。2015;27(2):293–305.PMID:25446253
查看文章PubMed/NCBI的Google 学术搜索
36.田中 S, 森 M, 真船 K-i, 大野 S, 杉町 K.微卫星稳定食管癌中转化生长因子β受体 II 型基因的显性阴性突变。英国癌症杂志。2000;82(9):1557–60.
查看文章Google 学术搜索
37.Choi J, Goh G, Walradt T, Hong BS, Bunick CG, Chen K, et al.皮肤T细胞淋巴瘤的基因组图。自然遗传学。2015;47(9):1011–9.PMID:26192916
查看文章PubMed/NCBI的Google 学术搜索
38.郭莹, 张旭, 谭婷, 孙婷, 赵旭, 等.血小板 12-脂氧合酶 Arg261Gln 多态性:功能表征以及与食管鳞状细胞癌风险的关联与 COX-2 多态性相结合。药物遗传学和基因组学。2007;17(3).PMID:17460548
查看文章PubMed/NCBI的Google 学术搜索
39.Berman HM、Westbrook J、Feng Z、Gilliland G、Bhat TN、Weissig H 等。蛋白质数据库。核酸研究。2000;28(1):235–42.PMID:10592235
查看文章PubMed/NCBI的Google 学术搜索
40.Sj?blom T、Jones S、Wood LD、Parsons DW、Lin J、Barber TD 等。人类乳腺癌和结直肠癌的共识编码序列。科学。2006;314(5797):268–74.PMID:16959974
查看文章PubMed/NCBI的Google 学术搜索
41.Morin PJ、Sparks AB、Korinek V、Barker N、Clevers H、Vogelstein B 等。通过 β-catenin 或 APC 突变激活结肠癌中 β-catenin-tcf 信号传导。科学。1997;275(5307):1787–90.
查看文章Google 学术搜索
42.Liu T、Tannerg?rd P、Hackman P、Rubio C、Lindmark G、Kressner U 等。与结直肠癌相关的 hMLH1 错义突变。人类遗传学。1999;105(5):437–41.PMID:10598809
查看文章PubMed/NCBI的Google 学术搜索
43.罗莹, 赵旭, 周 J, 杨 J, 张莹, 匡W, 等.一种基于异构信息的药物-靶点相互作用预测和计算药物重新定位的网络集成方法。自然通讯。2017;8(1):573.PMID:28924171
查看文章PubMed/NCBI的Google 学术搜索
44.Hou J, Wei H, Liu B. iPiDA-GCN:基于图卷积网络的 piRNA 疾病关联鉴定。PLOS计算生物学。2022;18(10):e1010671.PMID:36301998
查看文章PubMed/NCBI的Google 学术搜索
45.金S, 洪Y, 曾玲, 江 Y, 林彦, 魏玲, 等.一种用于微观到宏观生物医学网络中药物多任务预测的通用超图学习算法。PLOS计算生物学。2023;19(11):e1011597.PMID:37956212
查看文章PubMed/NCBI的Google 学术搜索
46.Wang ZL, Di SM, Chen L. AutoGEL:具有显式链接信息的自动图神经网络.神经信息处理系统进展 34 (NEURIPS 2021)2021.
查看文章Google 学术搜索
47.周 K, 黄 X, 宋 Q, 陈 R, 胡 X. Auto-GNN: 图神经网络的神经架构搜索.大数据前沿。2022;5:1029307.PMID:36466713
查看文章PubMed/NCBI的Google 学术搜索
48.Li G、Müller M、Thabet A、Ghanem B,编辑。DeepGCN:GCN 能像 CNN 一样深入吗?2019 IEEE/CVF计算机视觉国际会议(ICCV);2019 2019年10月27日至11月2日。
查看文章Google 学术搜索
49.李庆明, 韩志强, 吴旭明, 阿艾.更深入地了解用于半监督学习的图卷积网络。第三十二届AAAI人工智能会议/第三十届人工智能创新应用会议/第八届AAAI人工智能教育进展研讨会INTELLIGENCE2018。第3538-45页。
查看文章Google 学术搜索
50.Xie S, Zheng H, Liu C, Lin L. SNAS:随机神经架构搜索。arXiv预印本arXiv:181209926。2018.
查看文章Google 学术搜索
51.李晖学习排名的简短介绍。IEICE信息与系统汇刊。2011;E94型。D(10):1854–62。
查看文章Google 学术搜索
52.Zhang W, Wei H, Liu B. idenMD-NRF:miRNA-疾病关联鉴定的排名框架。生物信息学简报。2022;23(4):BBAC224.PMID:35679537
查看文章PubMed/NCBI的Google 学术搜索
53.Ru X, Ye X, Sakurai T, Zou Q. NerLTR-DTA:基于邻居关系和学习排名的药物-靶标结合亲和力预测。生物信息学。2022;38(7):1964–71.PMID:35134828
查看文章PubMed/NCBI的Google 学术搜索
54.You R, Zhang Z, Xiong Y, Sun F, Mamitsuka H, Zhu S. GOLabeler:通过学习排名来改进基于序列的大规模蛋白质功能预测。生物信息学。2018;34(14):2465–73.PMID:29522145
查看文章PubMed/NCBI的Google 学术搜索
55.Jin X, Liao Q, Wei H, Zhang J, Liu B. SMI-BLAST:一种基于 PSI-BLAST 的新型监督搜索框架,用于蛋白质远程同源检测。生物信息学。2021;37(7):913–20.PMID:32898222
查看文章PubMed/NCBI的Google 学术搜索