免费医学论文发表-一种用于可解释癌症药物反应预测的子组件引导深度学习方法
抽象
准确预测癌症药物反应(CDR)是现代肿瘤学中长期存在的挑战,也是个性化治疗的基础。目前的计算方法通过模拟整个药物和细胞系之间的反应来实现CDR预测,而不考虑反应结果可能主要归因于一些更精细的“亚组件”,例如药物的特权亚结构或癌细胞的基因特征,从而产生难以解释的预测。在本文中,我们提出了SubCDR,一种用于可解释CDR预测的子组件引导的深度学习方法,以识别驱动响应结果的最相关的子组件。从技术上讲,SubCDR建立在一系列深度神经网络之上,该网络能够从每种药物和细胞系谱中提取一组功能亚组分,并将CDR预测分解为识别亚组分之间的成对相互作用。这样的子组件交互表单可以提供可跟踪的路径,以明确指示哪些子组件对响应结果的贡献更大。我们通过在GDSC数据集上进行广泛的计算实验,验证了SubCDR优于最先进的CDR预测方法。至关重要的是,我们发现了许多预测病例,证明了SubCDR在寻找驱动反应的关键子组件和利用这些子组件来发现新的治疗药物方面的优势。这些结果表明,SubCDR对生物医学研究人员非常有用,特别是在抗癌药物设计方面。
作者摘要
预测癌症患者对治疗药物的反应的能力是现代肿瘤学的主要目标。计算方法在预测癌症药物反应(CDR)方面取得了重大进展,但它们忽略了反应结果可能与特定的“亚组件”高度相关,例如药物的特权亚结构或癌细胞的基因特征。为了理解子组件在CDR预测中的影响,我们提出了一种子组件引导的深度学习方法,称为SubCDR。SubCDR基于多个深度神经网络,能够从药物SMILES和细胞系转录组中提取功能亚组分,并将药物和细胞系之间的反应预测分解为识别其各自亚组分之间的成对相互作用。通过这种交互形式,我们可以获得一个可追溯的路径,以明确识别对响应结果有显着贡献的子组件。我们在GDSC数据集上验证了我们的方法,并展示了对最先进的CDR预测方法的改进。此外,我们展示了SubCDR在解释CDR和从亚组分相互作用的角度发现具有敏感反应的新药方面的优势。
数字
Table 1Fig 7图1图2图3Fig 4Fig 5Fig 6Table 1Fig 7图1图2图3
引文: 刘 X, 张 W (2023) 一种用于可解释癌症药物反应预测的子组件引导深度学习方法。公共科学图书馆计算生物学19(8): e1011382. https://doi.org/10.1371/journal.pcbi.1011382
编辑 器: 塞尔达尔·博兹达格, 美国北德克萨斯大学
收到: 4月 2023, 24;接受: 七月 2023, 21;发表: 2023月 <>, <>
版权所有: ? 2023 刘张.这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 本研究使用的源数据可从GDSC数据库(https://www.cancerrxgene.org/),COSMIC数据库(http://cancer.sanger.ac.uk/census)和PubChem库(https://pubchem.ncbi.nlm.nih.gov/)获得。我们方法的源代码可以从 https://github.com/liuxuan666/SubCDR 免费下载。
资金: 这项工作得到了国家自然科学基金(WZ批准号:62072206;WZ批准号:61772381;WZ资助62102158)、中央高校基本科研业务费(No.2662021JC008,WZ;No.2662022JC004,转WZ),华中农业大学科技自主创新基金(致WZ)。资助者在研究设计、数据收集、数据分析、数据解释或手稿写作方面没有任何作用。
竞争利益: 提交人声明他们没有竞争利益。
1 引言
精确识别癌症中的药物反应对于开发个性化治疗方案以提高生存率和减少患者费用具有很大的希望。由于出于实际和经济原因,为癌症患者测试多种药物是不可行的[1],因此迫切需要能够准确预测癌症药物反应(CDR)的计算方法。然而,目前具有药物反应标签的临床患者数据还不足以训练准确的模型。近年来,一些临床前抗癌药物筛选项目,如癌细胞系百科全书(CCLE)[2]和癌症药物敏感性基因组学(GDSC)[3],为数千种癌细胞系提供了大量的药物敏感性谱。由于这些宝贵的资源,研究人员已经能够开发有效的CDR预测计算方法,并系统地研究了癌症生物学。
近年来,已经提出了许多用于预测CDR的计算方法,这些方法旨在将输入(例如,药物的结构谱,细胞系的组学谱以及药物和细胞系之间的关联信息)与所需的输出(灵敏度/抗性分类或特定反应值)相关联。早期基于网络的方法构建了具有细胞系,药物及其已知关联的生物网络,然后将问题转换为链接预测任务,在随机游走[4]或信息流[5]上进行。基于矩阵分解的方法通过分解因子的乘积重构已知CDR的邻接矩阵,实现了CDR预测[6,7]。传统的基于机器学习的方法组装了能够表示细胞系和药物的手工特征来训练分类器或回归器,包括支持向量机[8]和随机森林[9]。如今,基于深度学习(DL)的方法因其能够提供从细胞系和药物的特征提取到预测的端到端解决方案而受到普及,其中基于卷积神经网络(CNN)的[10,11]和基于图神经网络(GNN)的[12-14]模型表现出强大的表征能力。这些计算方法在预测CDR方面取得了显着的成功,但大多数是所谓的“黑匣子”,其中预测背后的推理是未知的。这在癌症治疗中是不可取的,因为临床医生需要解释为什么药物对患者有效。为了提高可解释性,一些努力[15-18]侧重于将信号通路知识纳入基于深度学习的方法的结构中,以便预测可以追溯到真实生物网络中的特定通路节点,如基因本体(GO)[19]。他们的解释,如DRPreter [18],主要面向与癌细胞系相关的通路特征。
在CDR预测的背景下,反应结果或生物活性不仅与信号通路相关,而且还可能与更精细的“亚组分”高度相关,例如药物分子的特权亚结构和癌细胞的基因特征[20-23]。例如,抗癌药物Devazepide中的苯二氮卓类支架亚结构对阿片受体和其他蛋白质靶标具有活性[24]。不同癌症中肿瘤抑制基因(TSG)的不同表达状态和调控功能在紫杉醇耐药中起主要作用[25]。显然,对CDR中药物/细胞系亚组分的影响进行建模具有巨大的希望,可以揭示驱动反应结果的相关决定因素并解释预测,从而使新治疗药物的发现和设计能够克服化疗耐受性。不幸的是,现有的CDR预测方法框架仅关注整个药物水平和细胞系水平的建模,阻止他们更精细地探索药物和细胞系之间的反应行为。因此,CDR预测的一个关键挑战是开发一种新的可解释计算框架,使模型能够感知子组件并提供与预测相关的可追溯路径。这样的框架还引入了药物签名对建模的关注,与以前的可解释工作相比,有可能对可解释的CDR预测提供更多的见解。
为了解决上述挑战,我们提出了一种子组件引导的深度学习方法,用于准确且可解释的CDR预测,称为SubCDR。我们首先设计了一个知识驱动的分解模块来提取具有生物学功能的亚组分,而不是在整个药物(或细胞系)水平上进行建模。对于药物(或细胞系),亚组分被描述为由分子结构(或转录组谱)分解的一组亚结构(或基因亚集)。之后,我们将每种药物和细胞系之间的CDR过程模拟为各自亚组分之间的成对相互作用,并采用评分函数来测量成对相互作用的强度,从而产生相互作用图。最后,在交互图上部署一个强大的图卷积网络(GCN),以学习用于解码为响应结果的表示。受具有侧面信息的推荐系统[26]的启发,我们还在已知CDR关联的构建响应矩阵上强制执行矩阵分解,以推导出药物和细胞系的侧面信息,这可以作为辅助模型训练的潜在知识。通过端到端训练,可以将交互图视为可追溯的路径,以明确指示哪些子组件对响应结果的贡献更大,从而有助于理解模型的决策。在计算实验中,SubCDR在GDSC数据集上优于其他最先进的CDR预测方法,并且在解释预测和从子组件相互作用的角度发现具有敏感反应的新药方面表现出独特的优势。我们相信SubCDR对生物医学研究人员非常有用,特别是在抗癌药物设计方面。
2 方法论
2.1 数据准备
响应数据。
癌症药物反应(CDR)数据来自最近发布的名为GDSC的大规模药物筛选数据集[3]。GDSC v2 数据集包含 135 种药物和 242 种不同人类癌细胞系的 190,810 个实例,其中每个实例都带有 IC50(自然对数转换)值对应于药物-细胞系组合。集成电路50 [27]表示药物在抑制癌细胞系和小IC生长方面的有效性50价值揭示了高度的药物疗效,意味着药物对相应的细胞系敏感。
细胞系表达谱。
基因表达谱主要用于在研究癌症生物学时模拟癌细胞系。COSMIC数据库中的细胞系项目[28]提供了1000多个癌细胞系的基因表达谱,其中基因表达的TPM值是log2转化的,z评分归一化。在这里,我们只考虑了来自COSMIC癌症基因普查(CGC)门户的656个癌症驱动基因相关的数据,并使用它们来表示细胞系。
药物微笑。
简化的分子输入线输入系统(SMILES)被广泛认可,并用作化学信息处理化合物的标准图谱。PubChem数据库[29]为每种药物提供了SMILES字符串。我们根据PubChem数据库中药物的化合物ID(CID)收集了药物的微笑,并用它来代表药物。
CDR 数据的预处理。
我们通过丢弃在PubChem中共享相同CID的药物并去除COSMIC中无法获得基因表达数据的细胞系来处理GDSC v2数据集。然后,我们排除了所有不明确的实例,只留下对数变换IC最高的实例50值(即 ln(IC50)).因此,我们编译了一个包含 117,665 个实例的数据集,用于测量对数变换的 IC50800 种细胞系和 175 种药物的值。考虑到所有800×175 = 140,000个药物 - 细胞系组合,所有组合的响应值中约有15.95%(22,335)未测量/未知。
2.2 模型架构
SubCDR的概述如图1所示,它以端到端的方式涉及以下模块。给定一个药物细胞系实例,我们首先使用分子切割算法(或CGC基因分类)将药物的SMILES(或细胞系的转录组谱)分解为一组亚结构(或基因亚集),并将它们视为药物(或细胞系)亚组分,其中每个亚组分通过GRU(或CNN)层嵌入到潜在特征中。为了模拟CDR中亚组分的影响,我们将CDR过程分解为药物和细胞系的亚组分之间的成对相互作用,并采用评分函数来测量成对相互作用的强度,从而产生相互作用图。然后,我们将交互作用图构建为网络,以更好地表征子组件之间的交互关联,并利用GCN层捕获隐藏在邻域关联的表示。此外,我们从已知的CDR中提取药物和细胞系的侧面信息,为模型训练提供潜在的知识。最终,边信息和学习的表示被连接起来并馈送到解码器中,以输出预测的响应值。在以下部分中,我们将详细介绍每个模块,并提供我们操作方式的详细信息。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 子CDR概述。
(1)药物亚成分的提取。利用金砖国家算法将SMILES串分解为一组片段,得到药物的子结构(作为子组分),采用GRU层捕捉子结构的潜在特征。(2)细胞系亚组分的提取。转录组谱根据CGC分类转换为一组基因亚群(作为亚组分),CNN层学习基因亚群的潜在特征。(3)子组件交互的构建。由方程5生成测量子组件之间相互作用强度的交互图,并进一步建立为网络。稍后,我们利用GCN层来学习隐藏在网络中的表示。(4)侧面信息的提取。药物和细胞系的侧面信息是通过奇异值分解(SVD)算法从已知的CDR中获取的。(5)预测CDR。与学习的表示相结合的侧信息被馈送到解码器(多层感知器)中,以输出最终响应值。
https://doi.org/10.1371/journal.pcbi.1011382.g001
提取药物亚成分。
反合成有趣化学亚结构的破坏(BRICS)[30]提供了一种强大的分解分子的算法,该算法打破了与一组化学反应相匹配的分子中的战略键,并保留了具有有价值的亚结构和功能含量的分子片段(例如,芳环和侧链)。受金砖国家倡议的启发,我们将每种药物SMILES分解为有序的子结构序列:
(1)
其中获得的子结构被认为是子组件。以药物阿司匹林为例(图2),其微笑CC(= O)Oc1ccccc 1 C(= O)O可以分为有序序列,包括*C(C)= O,*O*,*c1 ccccc1*和*C(= O)O,其中“假”原子(“*”)连接到裂解位点的每一端,标记两个子组分可以连接在一起的位置。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 对金砖国家程序的描述。
树的根(阿司匹林)是要分裂的分子,其中叶子(用虚线圆圈包围)代表提取的亚结构,“*”表示虚拟原子。在每次迭代中,根据SMILES顺序从左到右扫描分子原子,一旦找到可断裂键,就立即提取子结构。重复该过程,直到无法进一步分割其余子结构。带有绿色突出显示的虚线债券是使用金砖国家规则选择打破的债券。
https://doi.org/10.1371/journal.pcbi.1011382.g002
对于药物的有序子组件序列,我们构建了一个递归神经网络(RNN)模块将其转换为上下文特征空间。具体来说,每个子组件g我使用扩展连接指纹(ECFP)嵌入到特征向量中[31]。然后使用门控循环单元(GRU)[32]层从嵌入式子组件序列中捕获上下文特征:
(2)
其中零向量,r我是一个复位栅极矢量,b我是一个更新门向量,W 和 U 是权重矩阵,Sigmoid(?) 和 Tanh(?) 代表激活函数,o我是一个新的隐藏状态,⊙表示逐元素乘法。由于每种药物分解的序列长度(即亚组分的数量)可能不同,因此所有药物的亚组分序列需要固定为最大长度td以满足 GRU 的输入要求。对于长度小于最大长度的序列,将执行零填充。
提取细胞系亚组分。
COSMIC数据库的癌症基因普查(CGC)为数百个癌症驱动基因(CGC基因)提供了大量注释。每个CGC基因根据其体细胞突变谱和在肿瘤发生中的功能作用分为33类(癌基因、肿瘤抑制基因、融合基因和功能未知基因)[3]。这四类CGC基因之间存在大量重叠。按照CGC的分类,在这里,我们首先将每个细胞系的CGC基因分成n个基因亚群,没有重叠(如图1所示)。然后,使用收集的基因表达数据将这些子集映射到特征向量中,表示为 。鉴于COSMIC中的每个CGC基因也用它所处理的肿瘤类型进行注释,在这里我们通过匹配肿瘤类型仅保留和使用每个细胞系的相关基因(肿瘤特异性部分),并且相关基因的数量在不同的肿瘤类型中有所不同(详见S0(a)文本)。从技术上讲,我们对每个细胞系采用[1,656]基因掩蔽过滤器(即1维二元载体),其中“0”代表相关基因,“<>”代表其余基因。通过将掩蔽过滤器与基因表达载体相乘,可以确保只有与其肿瘤类型相对应的CGC基因参与下游计算:
(3)
其中面具j是细胞系J的基因掩蔽过滤器,每个被掩蔽的基因亚群表达(C)被视为一个亚组分。与药物分子亚结构不同,基因亚群没有结构联系。
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. CGC基因分类。
我们工作中的所有656个CGC基因最初根据其在癌症中的作用分为八个基因亚群(即癌基因,肿瘤抑制基因(TSG),融合基因,功能未知基因(none)及其四个重叠)。数字对应于每个基因子集中的基因数量。请注意,细胞系中CGC基因的具体分类因肿瘤类型而异。
https://doi.org/10.1371/journal.pcbi.1011382.g003
对于细胞系的子组件集,我们实现了一个简单的CNN将其转换为潜在特征空间。具体来说,由于每个子组件由不同数量的基因组成,因此我们首先对基因数量小于最大t的子组件执行零填充。c,以便所有子组件的特征满足相同的维度。之后,我们通过按行连接所有子组件来获得特征矩阵,然后利用具有 n 个通道的一维 CNN 从特征矩阵中捕获潜在特征:
(4)
子组件 I 的潜在特征在哪里。值得注意的是,细胞系亚组分的潜在特征在尺寸上与药物亚组分一致。
构建子组件交互。
为了测量药物中每个亚组分与细胞系中每个亚组分之间的成对相互作用,我们设计了一个具有简单双线性评分的相互作用函数:
(5)
其中表示可训练的参数矩阵。函数输出是一个标量(交互得分),范围为 [0 到 1],明确指示各个子组件交互的强度。在此基础上,药物-细胞系实例中所有亚组分相互作用的强度可以表征为二维相互作用图。通过端到端学习,如果一对子组件显著归因于预测,它们将在下游层进行更新,并在相应的Ω位置分配更高的分数。经过训练的交互映射可以被视为可跟踪的路径,它提供了有关哪些子组件导致响应结果的提示。
由于相邻子组件在触发交互时可能会相互影响,因此还应考虑子组件交互之间的关联。在图卷积的力量的激励下,我们将Ω形式化为一个完整的二分网络/图,其中表示对应于两个实体(细胞系的子组件和药物的子组件)的节点集,表示指示两个实体之间所有可能相互作用的边缘集,存储与边缘对应的权重(即Ω中的交互得分), 并且是通过独热编码初始化的节点属性。然后我们利用图卷积网络 (GCN) [34] 层 fg到交互网络 G,以便可以捕获和聚合所有交互之间的关联。具体来说,GCN 使用以下传播规则对相邻节点进行迭代卷积来计算每个节点的隐藏嵌入 z。
(6)
其中代表节点 v 在第 k 层中的嵌入 ;σ是使用LeakyRelu的激活函数; 表示与 ; 中的 v 相邻的一组节点;Θ 是可学习矩阵参数; 表示从节点 V 到节点 U 的边权重。在 K GCN 层之后,我们得到了网络中所有节点的学习嵌入:Z(K).
接下来,我们将全局池化层应用于所有节点 Z 的学习嵌入(K)要为整个交互网络生成汇总表示 h:
(7)
其中通用汽车斧头P/GM伊恩P 是全局最大/平均池化层,∥表示向量串联运算符。
提取侧面信息。
除了上述子组件的生化特征外,我们还希望挖掘更多的知识来指导模型训练。在人工智能中,侧面信息是既不来自输入空间也不来自输出空间的数据[26],其目的是借助其他可用的潜在知识来丰富输入空间。获取药物和细胞系侧信息的一种有效方法是提取隐藏在已知CDR中的关联信息。详细地说,我们定义了一个响应矩阵,其中 Rij = 如果训练集中药物和细胞系之间没有测量的反应值,则为空;否则 Rij等于其相应的对数变换IC50价值。随后,我们利用奇异值分解(SVD)[35]将响应矩阵分解为两个低秩矩阵(I和J),作为药物和细胞系的侧面信息。最小化 SVD 的目标如下:
(8)
M 是一个掩码矩阵,其中 Mij= 1 如果 Rij是测量的响应值;否则 Mij= 0。|? |F代表弗罗贝尼乌斯规范。受益于矩阵分解范式,I 和 J 是响应矩阵的潜在因子,包含代表已知 CDR 关联的潜在知识,其中 I[i, :]/J[j, :] 表示有关第 i/j 个药物/细胞系的侧面信息。此外,我们将 I 和 J 馈入全连接层 f一个将其潜在向量输出为最终的侧信息(和),就像子组件提取管道一样。
预测 CDR。
为了输出药物细胞系实例(i,j)的最终响应结果,我们从学习的表示(hij) 和对数变换 IC 的侧信息 ()50价值:
(9)
其中MLP是多层感知器。Huber 损失 [36] 是稳健回归中使用的均方误差 (MSE) 和平均绝对误差 (MAE) 的组合,被采用为我们的目标函数,公式为:
(10)
其中 CDR 实例的训练集,pij表示药物 I 和细胞系 j 之间响应的真实值,δ 是一个标度参数,用于定义损失函数从二次过渡到线性的边界。
设置。
建议按如下方式使用 SubCDR 的超参数。在药物亚组分的提取中,我们将ECFP的半径和固定长度分别设置为2和512;最大长度 td由分解最多分子亚结构的药物决定;GRU 层数设置为 2。在提取细胞系亚组分时,最大tc由基因数量最多的细胞系亚组分决定,CNN层数设置为2。我们为f选择一个2层简化GCNg更新处理交互网络的节点嵌入。该 f一个在提取侧信息时是具有批量归一化的 2 层全连接网络。在预测 CDR 时,解码器是具有 Dropout 的 3 层 MLP,比例参数δ固定为 1。我们使用学习率为 0.0001 的 Adam 来优化整个模型。详细的超参数设置列在我们的源代码 (https://github.com/liuxuan666/SubCDR) 中。
2.3 实验设置
绩效评估。
为了全面评估SubCDR的性能,我们从数据集中随机选择了90%的实例来编译交叉验证集,并使用剩余的10%实例作为独立测试集。对于交叉验证集,我们执行了以下三个实际场景:
热启动。5 倍交叉验证 (5-CV) 是通过将所有实例随机分成 5 个相等的部分来实现的,训练集和测试集共享共同的药物和细胞系。
细胞系冷启动。5-CV是通过在细胞系上随机拆分实例来实现的,以保证测试集仅包括训练集中看不见的细胞系。
药物冷启动。与上述场景类似,5-CV是在药物上进行的,其中测试集仅包含训练集中不存在的药物。
此外,我们在整个交叉验证集上训练模型,然后对独立测试集进行预测,以进行更客观的评估(也称为独立测试)。在回归任务下,三个常用指标用于测量观测值与预测响应值之间的统计相关性,包括均方根误差 (RMSE)、皮尔逊相关系数 (PCC) 和决定系数 (R2).为了进一步确认模型的分类精度,我们对对数变换的IC进行了二值化50值符合先前研究中使用的阈值[37],以生成敏感(阳性)和抗性(阴性)实例。具有对数转换 IC 的药物细胞系实例50值低于 -2.0(-2.0 对应于 IC50约0.135 μM)被归类为阳性实例;否则,它们被归类为负面实例。正负实例的比例约为 1:10。然后,我们将上述SubCDR框架扩展到分类任务中,方法是在最后一层添加Sigmoid激活,并以二进制交叉熵(BCE)作为损失函数。分类性能通过两个指标进行评估:曲线下面积 (AUC) 和精度召回率曲线下面积 (AUPR)。
基线方法。
我们根据几种最先进的CDR预测方法评估了我们的方法。
tCNNs[10]利用CNN预测CDR,药物的SMILES序列和细胞系的基因组突变数据用于输入特征。
DeepCDR [12]整合了细胞系和药物化学结构的多组学图谱,然后开发了混合GNN来预测CDR。
DrugCell [15] 开发了一种具有可见神经网络的可解释深度学习模型,用于进行 CDR 预测,该模型组装了癌症的基因型嵌入和药物的结构嵌入。
GraphCDR [13] 完成了基于细胞系表达谱、药物化学结构及其对 CDR 预测的已知反应的基于 GNN 的框架。
Bi-GNN [14] 通过图表示学习方法预测 CDR,该方法结合了有关细胞系灵敏度和抗性的信息。
上述方法的实现细节在S1(b)文本中描述。
3 结果
3.1 性能比较
SubCDR和基线方法的性能如图4a所示。在热启动中,SubCDR实现了更低的RMSE,更高的PCC和R2得分比基线方法高1.0126、0.9350和0.8722,表明其预测CDR的能力较强。相比之下,细胞系和药物的冷启动更具挑战性,这测试了模型在预测看不见的细胞系和药物方面的性能。据观察,在这两种情况下,所有方法的性能都显着下降。在所有方法中,SubCDR在细胞系的冷启动中具有竞争性的性能,但在药物的冷启动中具有次优性能。在解决冷启动问题时,核心思想是在分子结构/基因表达相似的情况下,将可见药物/细胞系的反应值分配给看不见的药物/细胞系。然而,我们的子组件形式不可避免地破坏了药物分子的整个结构并降解了原始特征,这使得我们的模型难以转移到看不见的药物上。另一方面,所有方法在药物冷启动中的性能都低于细胞系。一个可能的原因是数据集中的药物类型数量(175)远远少于细胞系类型的数量(800),因此模型更难获得足够的知识来迁移看不见的药物。从冷启动的总体结果来看,我们的模型可以适用于看不见的药物/细胞系的预测。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. SubCDR和基线方法的性能。
(a) RMSE、PCC 和 R2三种场景和独立测试的所有方法的分数。(b)不同癌症类型细胞系(在TCGA研究中定义,向上)和靶途径类型药物(向下)的所有方法的RMSE评分。
https://doi.org/10.1371/journal.pcbi.1011382.g004
从独立测试的回归性能(图4a)来看,SubCDR的表现优于所有基线,并超过了最佳基线:Bi-GNN和GraphCDR,RMSE分数分别为1.75%和6.16%,PCC分数分别为0.34%和0.93%,R为3.69%和1.60%。2分数。对于我们在独立测试中执行的分类任务,所有方法的性能都显示在S1图中。因此,SubCDR在所有比较方法中分别获得了最高的AUC和AUPR得分,分别为0.9885和0.9103,验证了其在回归和分类任务中的高泛化能力和较强的预测能力。
除了这些方法的全球性能外,我们还关注了分为不同癌症和靶向通路类型的实例的预测结果。根据GDSC数据库(S1(a)表)对每种药物进行靶标通路类型注释,并使用癌症基因组图谱(TCGA)研究中定义的癌症类型注释每个细胞系[38](S1(b)表)。如图4b所示,我们分别根据上述两种类型对独立测试结果进行分组,然后计算其RMSE分数进行评估。在 32 种不同的癌症类型中,SubCDR 在大多数癌症类型中表现出最高的平均预测准确性,并通过实现 0.7247 到 1.1230 的 RMSE 评分显示出始终如一的高性能。同时,与其他基线相比,SubCDR还被证明在22种类型的靶标途径中提供了更高的准确性。在其他指标的结果中:PCC、R2、AUC 和 AUPR,如 S2 和 S3 图所示,SubCDR 在大多数癌症和靶向通路类型中仍显示出更高的预测准确性,并且这些类型之间存在微小差异。不同的癌症/靶向通路类型在分类任务上显示出比回归任务更显着的差异。这种现象可能是由于不平衡比率造成的,即不同类型之间敏感和抗性实例数量之间的差异。
3.2 从子组件交互解释预测
在预测阶段,SubCDR 为输入药物细胞系实例生成了子组件之间的交互作用图,对响应结果有显著贡献的子组件(或其相互作用)将返回更高的分数。在这里,我们将交互图可视化为热图,以突出显示得分较高的子组件交互。通过比较和分析许多实例的热图,我们观察到部分案例可以证明SubCDR在突出影响响应结果的关键子组件并以生物学上有意义的顺序解释预测方面的实力:
在图5a中,癌基因亚组分在阿法替尼与肺癌细胞系NCI-H1666和NCI-H1648的相互作用图中产生最高的相互作用强度。大量研究[39]还指出,阿法替尼是一种不可逆的ErbB家族阻滞剂,靶向EGFR、ERBB2和ERBB3等癌基因(也包含在两种细胞系的癌基因亚组分中),并广泛用于肺癌的治疗。通过观察图5b中的相互作用图,发现前列腺癌细胞系VCaP和PC-3的TSG基因亚组分与硼替佐米的敏感反应高度相关。从先前的前列腺癌试验[40]来看,硼替佐米是一种蛋白酶体抑制剂,在前列腺癌的细胞/动物模型中具有抗癌作用。已知TSG基因(例如VCaP和PC-53的TSG基因亚组分中的TP1、AXIN3和PTEN)会影响前列腺癌的侵袭性[41],对应于Wnt信号通路,Wnt信号通路也是与硼替佐米相关的靶标通路[42]。在图5c中,我们发现膀胱癌细胞系HTB-9与药物Foretinib,Ipatasertib和他莫昔芬的反应中存在共享苯基,其与融合基因的相互作用在其热图中具有很高的系数。除此之外,我们观察到吉非替尼与细胞系NCI-H1650和NCI-H1568产生近似的相互作用图(两个热图的评分分布相似),两者都属于非小细胞肺癌(NSCLC)(S4(a)图)。在八个细胞系亚组分中,融合基因已被报道为NSCLC肿瘤发生的根本原因[43,44],其相关亚组分也在相互作用图中突出显示。在Dactolisib对淋巴细胞白血病细胞KARPAS-45和P30-OHK的反应中也发现了类似的发现(S4(b)图),表明“更近”的细胞系可能具有近似的反应结果和与相同药物的相互作用图。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图5. 亚组分相互作用的可视化,其中每个相互作用图由Softmax处理并生成为热图,图上的行/列表示细胞系/药物亚组分。
(a) 药物阿法替尼对细胞系NCI-H1666和NCI-H1648的反应病例。(b) 药物硼替佐米对细胞系VCaP和PC-3的反应病例。(c)细胞系HTB-9对Foretinib,Ipatasertib和Tamoxifen的反应病例。(d) 药物氟达拉滨和奈拉滨对细胞系EM-2、KU812和LAMA-84有反应的病例。(e) 药物OF-1和OSI-027对细胞系EC-GI-10有反应的病例,以及药物AGI-6780和AZ6102对细胞系T47D有反应的病例。
https://doi.org/10.1371/journal.pcbi.1011382.g005
除了上述解释性案例外,我们注意到一些结构相似的药物对同一细胞系的反应不同,这可能导致亚组分变化。例如,在氟达拉滨(成为奈拉滨)中添加羰基显着降低了对EM-2,KU812和LAMA-84等慢性粒细胞系的敏感性,并且羰基在其亚组分图中也获得了最高分(图5d)。这可能是由于氟原子的替代,其修饰药物已被证明可诱导白血病细胞凋亡[45]。在阿糖胞苷和吉西他滨对肺腺癌细胞系HCC78,NCI-H1792和NCI-H1993(S4(c)图)有反应的情况下,它们的相互作用图突出了二氟基团似乎是敏感反应发生的主要决定因素,并且许多多氟化合物,例如Entrectinib,Gemzar和Lumakras,也被FDA批准用于肺癌治疗(https://www.cancer.gov/about-cancer/treatment/drugs/lung).否则,具有不同结构的几种药物在同一细胞系上产生相似的反应结果。例如,泛BRPF溴结构域抑制剂OF-1和mTOR激酶抑制剂OSI-027在分子结构上存在显着差异,但它们在食管癌细胞系EC-GI-10中的反应相似,并且在药物AGI-6780和AZ6102对乳腺浸润癌细胞系T47D的反应中也发生了类似的情况(图5e).从我们的亚组分相互作用中解释,两种药物共享的亚组分(即分别在图5e中突出显示的羧基和苯基)可能是导致这些情况的关键。
3.3 利用子组件交互发现新的CDR
由于SubCDR的可解释性强调了关键的子组分,在这里我们研究这些子组分是否可以指导具有敏感反应的新药的发现。根据图5d中的发现,我们在看不见的白血病细胞系MV-4-11上测试了药物氟达拉滨和奈拉滨。此外,我们观察到羰基导致这两种药物之间从敏感性(预测值的-1.493)切换到耐药性(预测值的2.271)(图6a),并且预测的反应分类能够在先前的研究中得到验证[46]。此外,我们根据S366(c)图的发现预测了药物吉西他滨对看不见的NSCLC细胞系HCC4的反应,其相互作用图也强调了二氟基团的主要影响(图6b),敏感性结果(预测值的-3.585)得到了[47]的支持。这些案例表明,SubCDR的可解释性可以为发现新型抗癌药物提供有价值的指导。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图6. 具有代表性的例子说明了SubCDR在发现具有敏感反应的新药方面的优势。
(a)细胞系MV-4-11对药物氟达拉滨和奈拉滨的反应病例。(b)细胞系HCC366对药物吉西他滨的反应病例。
https://doi.org/10.1371/journal.pcbi.1011382.g006
为了进一步验证SubCDR发现新型敏感CDR的能力,我们关注了第2.1节中提到的未测量的药物-细胞系组合。我们使用数据集中的所有测量实例训练SubCDR,然后预测未测量的组合。在这里,两种临床批准的药物吉西他滨和硼替佐米被采取验证。我们选择了预测对数转化IC最低的前10个细胞系50这两种药物的值(值也需要小于-2)作为可能产生敏感反应的候选药物(表1),然后指导文献检索,发现七个预测的CDR与先前研究的观察结果一致。例如,根据Smith等人的研究[48],吉西他滨在体外对淋巴瘤细胞系DoHH-2具有细胞毒性,而DoHH-2细胞被吉西他滨用IC抑制生长。50的 1 nM。当神经干细胞H9用吉西他滨处理时,测量的IC50报告仅为 0.0015 μM(即对数变换 IC50= -6.502) [49],可以通过[3]中提供的阈值识别为灵敏度。许多研究[50]还表明,吉西他滨是一种批准的化疗药物,在NCI-H2135细胞系等非小细胞肺癌(NSCLC)中具有活性。细胞系DoHH-2对硼替佐米表现出敏感性,硼替佐米诱导的最大细胞死亡率在24小时内达到[51]。据报道,硼替佐米通过激活的半胱天冬酶-5介导的细胞凋亡来减少黑色素瘤细胞系SK-MEL-3的生长[52]。在Liew等人的试验[53]中,卵巢腺癌细胞EFO-27及其亚克隆细胞的增殖在暴露于硼替佐米后受到抑制。已发现恶性胸膜间皮瘤细胞(如NCI-H2803和MSTO-211H)对临床批准的蛋白酶体抑制剂硼替佐米敏感[54]。上述证据支持了我们的说法,即SubCDR可用于发现可能有效的癌症治疗药物。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
表 1. 两种已批准药物中预测反应值最低的前 10 个细胞系。
https://doi.org/10.1371/journal.pcbi.1011382.t001
3.4 完整版子CDR展现最佳性能
SubCDR 提供了一个可解释的 CDR 预测框架,该框架集成了一系列用于处理子组件提取、子组件交互和侧信息获取的模块。为了研究模型架构中每个模块的必要性,我们对SubCDR及其变体进行了几次比较:
没有边信息的子CDR(无SI)。我们删除了从已知的CDR矩阵中学习到的侧面信息。
没有GRU和CNN层(无GC)的SubCDR。我们去除了用于提取药物/细胞系亚组分隐藏特征的GRU/CNN层,直接使用ECFP和基因表达数据来计算相互作用图谱。
没有交互网络的子CDR(没有IG)。我们删除了交互网络和GCN层,然后通过将扁平化层应用于交互图来输出学习的嵌入。
没有GCN层的子CDR(没有GCN)。我们用门控GNN [55]替换了GCN层,该GNN能够处理加权网络,以从我们的交互网络中学习嵌入。
不带子组件部件的子CDR(不带SP)。我们去除了与药物和细胞系亚组分相关的提取和相互作用模块,并将其余模块组装成一个简化的预测模型,ECFP作为药物输入,基因表达数据作为细胞系输入。
比较是在独立测试中进行的,结果如图7所示。当去除侧面信息(无SI)时,RMSE,PCC和R方面的性能2分别从0.9535下降到1.2437,从0.9428下降到0.8813,从0.8701下降到0.8166,暗示这种潜在知识的有用性。变异(w/o GC)的结果表明,使用GRU/CNN层提取药物/细胞系亚组分的潜在特征有助于预测。正如预期的那样,变体(无IG)的性能表明,使用交互网络捕获子组件交互之间的关联来增强预测。从变体(w/o GCN)结果中,我们观察到GCN层在CDR预测中优于门控GNN。去除子组件部件(无SP)后,SubCDR的性能没有提高,而是略有下降,这表明这样的子组件设计确实增强了可解释性并促进了预测。总体而言,SubCDR 与上述五个模块一起提供了卓越的预测性能,删除任何模块都会损害其预测能力。
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图 7. SubCDR及其变体的性能(消融分析)。
https://doi.org/10.1371/journal.pcbi.1011382.g007
4 讨论
预测癌症药物反应(CDR)是计算机辅助抗癌药物发现和精准医学癌症研究的主要目标。在这项工作中,我们开发了一种用于可解释CDR预测的亚组件引导深度学习模型,称为SubCDR,它提供了一种理解预测背后的生物学意义的新观点,即药物和细胞系之间的亚组分相互作用。SubCDR的预测能力已在GDSC数据集上得到验证,并与各种评估设置下的最新方法进行了比较。广泛的案例研究表明,SubCDR在解释预测和寻找驱动响应结果的相关子组件方面的能力。
尽管我们作出了努力,但仍有改进的余地。在预测看不见的药物和细胞系的CDR时,SubCDR的性能低于预期。在这种冷启动问题中,没有关于看不见的药物/细胞系的先验知识,SubCDR只能根据看得见和看不见的药物/细胞系之间特征空间的相似性来推断反应。受生物医学领域知识图谱(KG)的启发[56],将与看不见的药物/细胞系相关的其他领域知识(例如药物靶标亲和力,靶点途径或基因调控网络)纳入我们的框架,有可能缓解这个问题。此外,SubCDR的可解释性有望不断扩展,特别是在子组件的设计和提取方面。对于细胞系,有两种选择:(1)可以根据基因突变的位置和类型定义亚组分,以确定主要致癌突变在CDR预测中的作用,(2)亚组分可以作为生物途径实施(即,参与协调上调或下调的给定通路的基因集),以显示来自细胞系的通路特征如何对CDR预测起作用。对于药物,多样化的亚组分形式,包括但不限于指纹片段[57]和分子基序[58],也可以通过适当的修改植入我们的框架中。
支持信息
S1 文本 -
显示 1/6: pcbi.1011382.s001.tif
跳到无花果共享导航
https://ndownloader.figstatic.com/files/42092202/preview/42092202/preview.jpg
1 / 6
下载
无花果分享
S1 文本。
(a) 不同癌细胞系中CGC基因的分类。(b) 基线方法的实施。
https://doi.org/10.1371/journal.pcbi.1011382.s001
(提夫)
S1 图 SubCDR和基线方法在独立测试分类任务中的受试者工作特征(ROC)和精度召回率(PR)曲线。
https://doi.org/10.1371/journal.pcbi.1011382.s002
(提夫)
S2 图 PCC(向上)和 R2(向下)不同癌症类型(在TCGA研究中定义)的细胞系和靶向通路类型的药物的所有方法的分数。
https://doi.org/10.1371/journal.pcbi.1011382.s003
(提夫)
S3 图
不同癌症类型(在TCGA研究中定义)的细胞系和靶向通路类型的药物的所有方法的AUC(上)和AUPR(下)评分。值得注意的是,对于某些靶路组数据,无法计算AUC/AUPR评分,因为它们不包括阳性(敏感)标签的实例,即ln(IC50) 值均大于 -2。
https://doi.org/10.1371/journal.pcbi.1011382.s004
(TIF)
S4 图
(a)药物吉非替尼对细胞系NCI-H1650和NCI-H1568的反应病例。(b) 药物Dactolisib对细胞系KARPAS-45和P30-OHK的反应病例。(c) 药物阿糖胞苷和吉西他滨分别对细胞系HCC78、NCI-H1792和NCI-H1993有反应的病例。
https://doi.org/10.1371/journal.pcbi.1011382.s005
(提夫)
S1 表。
(a) 药物注释信息。(b) 细胞系的注释信息。
https://doi.org/10.1371/journal.pcbi.1011382.s006
(文档)
引用
1.Adam G,Rampá?ek L,Safikhani Z,Smirnov P,Haibe-Kains B,Goldenberg A.药物反应预测的机器学习方法:挑战和最新进展。NPJ精准肿瘤学。2020;4(1):1–10.密码:32566759
查看文章PubMed/NCBI谷歌学术搜索
2.巴雷蒂娜 J, 卡波尼格罗 G, 斯特兰斯基 N, 文卡特桑 K, 马戈林 AA, 金 S, 等.癌细胞系百科全书能够预测抗癌药物敏感性的模型。自然界。2012;483(7391):603–607.密码:22460905
查看文章PubMed/NCBI谷歌学术搜索
3.Iorio F, Knijnenburg TA, Vis DJ, Bignell GR, Menden MP, Schubert M, et al.癌症中药物基因组相互作用的景观。细胞。2016;166(3):740–754.pmid:27397505
查看文章PubMed/NCBI谷歌学术搜索
4.Stanfield Z, Co?kun M, Koyutürk M. 药物反应预测作为链接预测问题。科学报告。2017;7(1):1–13.
查看文章谷歌学术搜索
5.张峰, 王敏, 席军, 杨军, 李阿.一种基于异构网络的新型方法,用于预测癌细胞系中的药物反应。科学报告。2018;8(1):1–9.密码:29463808
查看文章PubMed/NCBI谷歌学术搜索
6.Suphavilai C,Bertrand D,Nagarajan N.使用推荐系统预测癌症药物反应。生物信息学。2018;34(22):3907–3914.密码:29868820
查看文章PubMed/NCBI谷歌学术搜索
7.王林, 李X, 张林, 高Q.使用具有相似性正则化的矩阵分解改进细胞系中的抗癌药物反应预测。BMC 癌症。2017;17(1):1–12.密码:28768489
查看文章PubMed/NCBI谷歌学术搜索
8.杨杰, 李阿, 李毅, 郭鑫, 王敏.一种通过网络表征学习预测癌细胞系药物反应的新方法。生物信息学。2019;35(9):1527–1535.密码:30304378
查看文章PubMed/NCBI谷歌学术搜索
9.林德AP,安德森PC。通过基于最小基因组信息和化学特性的随机森林模型预测药物对癌细胞的活性。普洛斯一。2019;14(7):e0219774.密码:31295321
查看文章PubMed/NCBI谷歌学术搜索
10.刘平, 李华, 李淑, 梁建胜.使用深度卷积网络改进对癌细胞系表型药物反应的预测。BMC生物信息学。2019;20(1):1–14.
查看文章谷歌学术搜索
11.Chawla S, Rockstroh A, Lehman M, Ratther E, Jain A, Anand A, et al.基于基因表达的癌症药物敏感性推断。自然通讯。2022;13(1):1–15.密码:36167836
查看文章PubMed/NCBI谷歌学术搜索
12.DeepCDR:用于预测癌症药物反应的混合图卷积网络。生物信息学。2020;36(Supplement_2):i911–i918.pmid:33381841
查看文章PubMed/NCBI谷歌学术搜索
13.GraphCDR:一种具有对比学习的图神经网络方法,用于癌症药物反应预测。生物信息学简报。2022;23(1):bbab457.
查看文章谷歌学术搜索
14.Hostallero DE,Li Y,Emad A.看BiG图片:在药物反应预测中结合二分图。生物信息学。2022;38(14):3609–3620.pmid:35674359
查看文章PubMed/NCBI谷歌学术搜索
15.Kuenzi BM, Park J, Fong SH, Sanchez KS, Lee J, Kreisberg JF, et al.使用人类癌细胞的深度学习模型预测药物反应和协同作用。癌细胞。2020;38(5):672–684.pmid:33096023
查看文章PubMed/NCBI谷歌学术搜索
16.Deng L, Cai Y, Zhang W, Yang W, Gao B, Liu H. 通路引导的深度神经网络对药物敏感性的可解释和预测建模。化学信息与建模杂志。2020;60(10):4497–4505.密码:32804489
查看文章PubMed/NCBI谷歌学术搜索
17.Snow O, Sharifi-Noghabi H, Lu J, Zolotareva O, Lee M, Ester M. 使用基于知识的神经网络进行可解释的药物反应预测。在:第27届ACM SIGKDD知识发现和数据挖掘会议记录;2021.第3558–3568页。
18.Shin J, Piao Y, Bang D, Kim S, Jo K. DRPreter:使用知识引导图神经网络和转换器的可解释抗癌药物反应预测。国际分子科学杂志。2022;23(22):13919.密码:36430395
查看文章PubMed/NCBI谷歌学术搜索
19.Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, et al.基因本体论:生物学统一的工具。自然遗传学。2000;25(1):25–29.pmid:10802651
查看文章PubMed/NCBI谷歌学术搜索
20.霍顿达,伯恩GT,斯迈思ML。双环特权结构或特权子结构的组合合成。化学评论。2003;103(3):893–930.pmid:12630855
查看文章PubMed/NCBI谷歌学术搜索
21.Khan SA,Virtanen S,Kallioniemi OP,Wennerberg K,Poso A,Kaski S.识别与癌症药物反应相关的化学物质的结构特征:系统的数据驱动分析。生物信息学。2014;30(17):i497–i504.密码:25161239
查看文章PubMed/NCBI谷歌学术搜索
22.帕利亚里尼 R, 邵 W, 塞勒斯 WR.癌基因成瘾:治疗反应、耐药性和治愈路线图的途径。EMBO报道。2015;16(3):280–296.密码:25680965
查看文章PubMed/NCBI谷歌学术搜索
23.黄丹, 萨维奇, 卡利纳万, 林春, 张斌, 王平, 等.与癌症铂类耐药性相关的基因的高度注释数据库。基因。2021;40(46):6395–6405.密码:34645978
查看文章PubMed/NCBI谷歌学术搜索
24.Marsters JC Jr, McDowell RS, Reynolds ME, Oare DA, Somers TC, Stanley MS, et al.苯二氮卓类拟肽抑制剂的法呢基转移酶。生物有机与药物化学。1994;2(9):949–957.密码:7712130
查看文章PubMed/NCBI谷歌学术搜索
25.肿瘤抑制基因及其在癌症治疗中紫杉醇耐药性中的潜在相互作用.癌细胞国际。2016;16:1–10.密码:26900348
查看文章PubMed/NCBI谷歌学术搜索
26.孙志, 郭琪, 杨军, 方华, 郭刚, 张军, 等.附信息推荐研究评论:调查和研究方向。电子商务研究与应用。2019;37:100879.
查看文章谷歌学术搜索
27.Sebaugh J. 准确估计EC50 / IC50的指南。药品统计。2011;10(2):128–134.pmid:22328315
查看文章PubMed/NCBI谷歌学术搜索
28.Forbes SA, Beare D, Gunasekaran P, Leung K, Bindal N, Boutselakis H, et al. COSMIC: 探索人类癌症中体细胞突变的世界知识。核酸研究。2015;43(D1):D 805–D811.pmid:25355519
查看文章PubMed/NCBI谷歌学术搜索
29.金 S, 陈 J, 程 T, 金杜利特 A, 何 J, 何 S, 等.PubChem 2019更新:改进了对化学数据的访问。核酸研究。2019;47(D1):D 1102–D1109.密码:30371825
查看文章PubMed/NCBI谷歌学术搜索
30.德根 J, 韦格沙伊德-格拉赫 C, 扎利亚尼 A, 拉雷里 M.关于编纂和使用“类药物”化学碎片空间的艺术。ChemMedChem:化学支持药物发现。2008;3(10):1503–1507.pmid:18792903
查看文章PubMed/NCBI谷歌学术搜索
31.罗杰斯D,哈恩M.扩展连接指纹。化学信息与建模杂志。2010;50(5):742–754.pmid:20426451
查看文章PubMed/NCBI谷歌学术搜索
32.Chung J, Gulcehre C, Cho K, Bengio Y. 门控递归神经网络在序列建模上的实证评估。在:2014年深度学习研讨会NIPS,2014年2014月;<>.
33.桑德卡Z,班福德S,科尔CG,沃德SA,邓纳姆I,福布斯SA。宇宙癌症基因普查:描述所有人类癌症的遗传功能障碍。自然评论癌症。2018;18(11):696–705.密码:30293088
查看文章PubMed/NCBI谷歌学术搜索
34.Wu F, Souza A, Zhang T, Fifty C, Yu T, Weinberger K. 简化图卷积网络.在:机器学习国际会议。PMLR;2019.第6861–6871页。
35.哈尔科N,马丁森PG,特罗普JA。寻找具有随机性的结构:用于构建近似矩阵分解的概率算法。暹罗审查。2011;53(2):217–288.
查看文章谷歌学术搜索
36.迈耶GP。对胡贝尔损失的另一种概率解释。在:IEEE / CVF计算机视觉和模式识别会议论文集;2021.第5261–5269页。
37.张毅, 朴华, 杨海杰, 李淑贤, 李琪, 金天, 等.癌症药物反应谱扫描(CDRscan):一种深度学习模型,可通过癌症基因组特征预测药物有效性。科学报告。2018;8(1):8857.密码:29891981
查看文章PubMed/NCBI谷歌学术搜索
38.Tomczak K, Czerwińska P, Wiznerowicz M. 回顾癌症基因组图谱(TCGA):一个不可估量的知识来源。当代肿瘤学/Wspó?czesna Onkologia。2015;2015(1):68–77.密码:25691825
查看文章PubMed/NCBI谷歌学术搜索
39.Ioannou N, Dalgleish A, Seddon A, Mackintosh D, Guertler U, Solca F, et al.阿法替尼(一种不可逆的ErbB家族阻滞剂)在人胰腺肿瘤细胞中的抗肿瘤活性。英国癌症杂志。2011;105(10):1554–1562.密码:21970876
查看文章PubMed/NCBI谷歌学术搜索
40.郑瑞, 王文, 魏炳.硼替佐米抑制前列腺癌中的细胞增殖。实验和治疗医学。2015;10(3):1219–1223.pmid:26622468
查看文章PubMed/NCBI谷歌学术搜索
41.Velez MG, Kosiorek HE, Egan JB, McNatty AL, Riaz IB, Hwang SR, et al.肿瘤抑制基因(TP53,PTEN,RB1)改变和治疗结果对转移性激素敏感前列腺癌的不同影响。前列腺癌和前列腺疾病。2022;25(3):479–483.密码:34294873
查看文章PubMed/NCBI谷歌学术搜索
42.张茹, 刘琪, 魏文, 张刚, 严思, 戴蕊, 等.硼替佐米通过抑制前列腺癌细胞中的Wnt/β-连环蛋白信号通路来增强米托蒽醌的抗肿瘤活性。BMC 癌症。2021;21(1):1–10.邮编:34645397
查看文章PubMed/NCBI谷歌学术搜索
43.谭思, 苟炳, 蒲文, 郭春, 杨莹, 吴珂, 等.由EML4-ALK融合基因产生的环状RNA F-circEA作为非小细胞肺癌的新型液体活检生物标志物。细胞研究。2018;28(6):693–695.pmid:29628502
查看文章PubMed/NCBI谷歌学术搜索
44.张永生, 涂思杰, 颜建昌, 李玉彤, 方海, 张建刚.台湾非小细胞肺癌患者的融合基因景观.癌症。2021;13(6):1343.pmid:33809651
查看文章PubMed/NCBI谷歌学术搜索
45.Isanbor C,O'Hagan D.药物化学中的氟:抗癌剂的综述。氟化学学报.2006;127(3):303–319.
查看文章谷歌学术搜索
46.宋G,瓦尔迪兹BC,李Y,刘Y,尚普林RE,安德森BS.索拉非尼与白消安和核苷类似物在人FMS样酪氨酸激酶3内部串联重复中的协同细胞毒性 - 阳性急性髓系白血病细胞。血液和骨髓移植生物学。2014;20(11):1687–1695.密码:25111583
查看文章PubMed/NCBI谷歌学术搜索
47.Ischenko I,Zhi J,Hayman MJ,Petrenko O. KRAS依赖性抑制MYC增强癌细胞对细胞毒性药物的敏感性。肿瘤靶标。2017;8(11):17995.密码:28152508
查看文章PubMed/NCBI谷歌学术搜索
48.Smith MR,Joshi I,Jin F,Obasaju C.吉西他滨与抗CD20单克隆抗体联合抗CD20 +非霍奇金淋巴瘤细胞系在体外和小鼠中的功效增强。BMC 癌症。2005;5(1):1–9.
查看文章谷歌学术搜索
49.Morfouace M, Shelat A, Jacus M, Freeman BB, Turner D, Robinson S, et al.培美曲塞和吉西他滨作为治疗3组髓母细胞瘤的联合疗法。癌细胞。2014;25(4):516–529.密码:24684846
查看文章PubMed/NCBI谷歌学术搜索
50.比安科五世, 罗齐 A, 托尼尼 G, 桑蒂尼 D, 马格诺尔菲 E, 文森齐 B, 等.吉西他滨作为老年III-IV期非小细胞肺癌(NSCLC)患者的单药化疗:一项II期研究。抗癌研究。2002;22(5):3053–3056.密码:12530041
查看文章PubMed/NCBI谷歌学术搜索
51.贾 L, 戈皮纳坦 G, 苏库马尔 JT, 格里本 JG.阻断自噬通过减少淋巴瘤细胞中的 I-κ Bα降解来防止硼替佐米诱导的 NF-κB 活化。普洛斯一。2012;7(2):e32584.pmid:22393418
查看文章PubMed/NCBI谷歌学术搜索
52.Webster MR, Kamat C, Connis N, Zhao M, Weeraratna AT, Rudek MA, et al.双膦酰胺氯膦酸盐前药对黑色素瘤细胞系表现出选择性细胞毒性活性。分子癌症治疗。2014;13(2):297–306.密码:24310621
查看文章PubMed/NCBI谷歌学术搜索
53.廖柏, 黄荣林, 翁玉昌, 方玲, 黄慧明, 赖慧.黏液性卵巢癌的明显甲基化特征显示对蛋白酶体抑制剂的敏感性。国际癌症杂志。2018;143(2):355–367.密码:29451304
查看文章PubMed/NCBI谷歌学术搜索
54.杨华, 徐丹, 施密德, 彭瑞文.生物标志物引导的恶性胸膜间皮瘤靶向和免疫疗法。肿瘤内科的治疗进展。2020;12:1758835920971421.密码:33240401
查看文章PubMed/NCBI谷歌学术搜索
55.Li Y, Zemel R, Brockschmidt M, Tarlow D. Gated Graph Sequence Neural Networks. In: Proceedings of ICLR’16; 2016.
56.叶琪, 谢泽, 杨志, 康毅, 陈杰, 曹丹, 等.基于知识图谱和推荐系统的统一药物-靶点相互作用预测框架.自然通讯。2021;12(1):1–12.密码:34811351
查看文章PubMed/NCBI谷歌学术搜索
57.Huang K, Xiao C, Glass LM, Sun J. MolTrans: 用于药物-靶标相互作用预测的分子相互作用转换器.生物信息学。2021;37(6):830–836.密码:33070179
查看文章PubMed/NCBI谷歌学术搜索
58.张孜, 刘琪, 王华, 陆春, 李珂. 基于基序的图自监督学习用于分子性质预测.神经信息处理系统的进展。2021;34:15870–15882.
查看文章谷歌学术搜索