前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Ebiomedicine | 通过稀疏可解释网络发现药物作用机制

Ebiomedicine | 通过稀疏可解释网络发现药物作用机制

作者头像
DrugAI
发布2024-06-18 15:42:56
1160
发布2024-06-18 15:42:56
举报
文章被收录于专栏:DrugAIDrugAI

DRUGAI

今天为大家介绍的是来自Angel Rubio团队的一篇论文。尽管深度神经网络(DDNs)在预测癌症药物疗效方面取得了成功,但其决策过程缺乏可解释性仍然是一个重大挑战。先前的研究提出模仿基因本体结构,以便解释网络中的每个神经元。然而,这些先前的方法需要大量的GPU资源,并且阻碍了其向全基因组模型的扩展。作者开发了SparseGO,这是一种稀疏且可解释的神经网络,用于预测癌症细胞系中的药物反应及其作用机制(MoA)。为了确保模型的泛化性,作者在多个数据集上对其进行了训练,并使用三种交叉验证方案评估其性能。该模型的高效性使其能够使用基因表达数据。此外,SparseGO结合了可解释人工智能(XAI)技术DeepLIFT和支持向量机,以计算方式发现药物的作用机制。与其他方法相比,SparseGO的稀疏实现显著减少了GPU内存使用量和训练速度,使其能够处理基因表达数据而不是突变数据。使用基因表达数据的SparseGO提高了准确性,并使其可以用于药物重新定位。此外,基因表达数据可以使用265种药物进行训练来预测其作用机制。

随着组学和临床数据的兴起,伴随着为患者寻找明确解决方案的紧迫性,深度学习算法在生物医学领域的使用得到了极大的推动。现在的问题不是找到“治愈”癌症的方法,而是根据患者的基因组和临床历史找到最佳的治疗方法。深度学习(DL)算法收集了大量的临床数据,并通过在网络中的神经元之间建立关系,提供了非常准确的解决方案。然而,在临床环境中,卓越的预测并不足够。理解药物的作用机制(MoA)对于多个方面都是至关重要的,比如确定剂量的合适性和反应的潜伏期、识别最有可能对药物有反应的患者以及了解药物的副作用,它甚至可以引导药物和组合治疗策略的开发。

本文的目标是构建一个有效且生物学上可解释的神经网络:1)为任何癌细胞系提供准确的药物反应预测,2)使用任何选择的突变或表达数据集,3)优化GPU内存需求,4)优化训练和测试时间,5)提供网络决策的准确解释。

SparseGO完全满足这些目标。通过使用稀疏层,它减少了所需的计算资源。因此,输入层可以更大:作者已经测试了它在使用突变(3008个基因)和表达(约15,000个基因)时的表现。使用突变数据时,结果显示SparseGO与使用相同输入层的最先进模型(DrugCell)具有显著相似性(SparseGO稍有优势),且训练网络所需时间仅为其一小部分。为了提高泛化性和准确性,作者用额外的数据集训练了另一个模型,并在一个独立的数据集上进行了测试。此外,使用表达数据提高了模型的性能,并使其可以用于药物重新定位。作者还开发了一种名为DeepMoA的方法,通过DeepLIFT发现的结果和从‘ChEMBL蛋白靶点精简’和CTRPv2收集的MoA注释,准确预测药物的MoA。MoA预测方法的准确性在265种药物上进行了计算验证(使用训练-验证-测试方案)。为了确认该算法能够推断药物如何发挥其治疗作用,作者还检查了一些未注释药物的结果,发现它们与体内测试或文献中的其他研究结果一致。

模型架构

图 1

SparseGO的架构基于DrugCell的双分支结构,包括捕捉GO图层次关系的可见神经网络(VNN)和整合化合物Morgan指纹的人工神经网络(ANN)(见图1)。需要注意的是,虽然SparseGO中的ANN架构与DrugCell相当,但VNN层显著不同。为了生成特定药物的反应,两分支的输出结合并集成到另一个全连接网络中。预测的连续值代表剂量反应曲线下面积(AUDRC)标准化方式如下:AUDRC = 0表示完全细胞死亡,AUDRC = 1表示没有效果,而AUDRC > 1表示治疗促进了细胞生长。SparseGO使用稀疏矩阵表示GO层次结构的连接。如果矩阵的大多数条目为空,那么它就是稀疏的。存储稀疏矩阵的方法有多种,如果空条目的比例很大,它们所需的内存较少,并且在执行计算时更有效率。

如图1所示,VNN的结构由已知的GO层次结构中的父子关系创建。层次结构的最低层包含基因,较高层包含GO术语。基因只链接到其被注释的术语。为了保持层次结构的合理大小,作者规定每个术语必须注释到最少数量的基因,并且这些基因中至少有一部分与其子术语不同。此外,网络只能在底层子系统之上具有有限数量的父子关系。如果一个术语不符合标准,它将被删除,其子术语和注释基因将分配给其父术语。

为了确保公平比较,作者采用了DrugCell用于两个突变模型的本体,该本体是类似地创建的。对于表达模型,至少注释了5个基因并且这些基因中至少有10个不同于其子术语的基因的术语被保留。最终,层次结构被限制为最多8个子系统的深度。此外,如图1所示,每个GO术语由一组k个神经元表示,使其能够涵盖多种值。在所有模型中,作者采用了6个神经元来定义每个GO术语。

图 2

由于GO结构为有向无环图,重要的是要考虑到一个GO术语可能与其不直接在其上的父术语有关系。SparseGO使用表示层间连接的稀疏矩阵。为了克服术语只能连接到相邻层的限制,作者根据需要引入了虚拟节点,以在不直接相邻的术语之间建立连接。图2a是GO层次结构的一个子集,图2b展示了包括一些虚拟术语的相同网络,以便仅通过相邻层之间的连接来表示相同的本体。

图 3

在其中一个突变模型中,批量归一化层位于激活层之后(见图3a)以类似于DrugCell的结构。然而,实验结果表明,结合独立成分(IC)层可以通过减少过拟合来提高性能。IC层结合了批量归一化和Dropout,并放置在权重层之前(见图3b)。该层的目的是增强训练过程的稳定性,加速收敛速度,并提高泛化性能。

模型训练

为了确保模型的泛化性和稳健性,作者采用了五折交叉验证方法。四组用于训练,剩余一组用于测试,从训练数据中提取一部分样本用于验证。作者采用了三种不同的数据分离方法进行交叉验证。这些方法主要评估模型预测新细胞系和化合物药物敏感性的能力,这些测试特别具有挑战性,因为它们评估了模型在完全不同数据上的表现。剂量反应对从CTRPv2、GDSC1和GDSC2合并创建了一个统一的数据集,该数据集用于交叉验证。为了进一步测试,作者使用了独立的数据集PRISM评估模型的泛化性能,它包含测试在癌细胞系上的非肿瘤药物并且能够评估模型处理未见数据的效果。

图 4

标准方法涉及随机将剂量反应对分为K组。一组从训练集中移除,并用于预测(见图4a)。这种方法预测用于细胞的药物的效果,即使训练集中没有特定的药物-细胞系组合。DrugCell采用了这种方法。为了使用独立数据集(PRISM)进行类似测试,作者选择了训练数据集和PRISM共有的药物和细胞系,然后使用完全训练的模型(使用所有可用样本训练)预测这些药物在PRISM中的AUDRC2。

在LELO方法中,细胞系分为K组。在这种情况下,模型使用一些细胞系进行训练,并预测未使用细胞系的药物效果(见图4b)。这种情况模拟了将模型数据外推到未见细胞系的场景,非常适合药物重新定位。由于找不到PRISM中不同细胞系的数据,因此作者没有使用独立数据集进行测试。

在LECO方法中,药物分为K组。模型使用一些药物进行训练,并预测未在训练集中使用的药物在细胞系中的反应(见图4c)。这种方法非常适合用于计算机模拟药物敏感性测试。然而,由于化合物具有非常不同的反应模式和化学特性,这种情况比前两种更具挑战性。在独立数据集测试中,作者选择了PRISM数据集中未包含在训练数据集中的药物(1144种药物),然后使用完全训练的模型预测这些药物的AUDRC2值。

药物特异性作用机制的识别

图 5

首先,为了评估DeepLIFT分数是否对MoA识别有用,作者使用可视化方法将药物分数映射到低维向量空间。为了可视化DeepLIFT,作者使用了T-SNE算法,该算法能够降低DeepLIFT分数的维度,并以视觉上可解释的格式表示它们。在确认DeepLIFT分数能够提供相关见解后,作者开发了DeepMoA方法(见图5)。

首先,将训练好的SparseGO模型输入药物的指纹以及所有细胞系的基因表达(图5的第1部分)。接下来,VNN分支被引入DeepLIFT算法,该算法计算每个细胞系对特定药物的GO术语的重要性。每个GO术语由6个神经元表示,因此每个细胞系对每个GO术语有6个重要性分数。这个过程对所有药物进行,通过改变输入向量的Morgan指纹来实现。生成的3D张量包括每个细胞系-药物对的GO术语归因(图5的第2部分)。如前所述,每个GO术语由6个神经元表示,结果是6个3D张量。然后,作者添加了细胞系分数以保持对神经元重要性的全局视图,结果是每个药物每个GO术语有六个归因分数(图5的第3部分)。然后,将每个术语的神经元归因除以其标准偏差,得到的分数被用作SVM模型的输入参数。

另一方面,作者从‘ChEMBL蛋白靶点精简’和CTRPv2获取要预测的MoA。‘ChEMBL蛋白靶点精简’是一个基于GO的工具,收集来自ChEMBL的药物靶点蛋白的生物信息。首先,作者从所有药物中选择那些在ChEMBL中有注释的药物,并提取其靶点蛋白。除此之外,作者直接提取了CTRPv2数据库中已经含有的一些药物的GO注释。然后,作者将所有注释向上扩展(即如果一个药物被注释到一个GO术语,它也会被注释到其所有上位术语),得到了一个包含某些药物注释GO术语(MoA标签)的矩阵。最后,作者使用RBF Kernel SVM模型测试了DeepLIFT归因评分是否可以预测MoA标签。图5描述了一个简化的关于如何建立一个GO项的SVM决策边界的例子,其中6个GO:XXXXX神经元的分数被用来作为参数,以确定一种药物是否有GO:XXXXX作为其MoA。

实验结果

为了便于比较,作者首先使用用于训练DrugCell的数据来训练SparseGO。作者在非常相似的训练条件下对两个模型进行了训练和交叉验证,并使用相同的GO层次结构(3008个基因突变和2086个GO术语)来构建它们,并在ANN分支中使用了相同的特征。

图 6

如图6a所示,SparseGO和DrugCell的预测结果相似,SparseGO在预测的AUDRC1值和实际值之间的Spearman相关性总体准确性略有提高(DrugCell的相关性为0.777,SparseGO为0.784)。这些结果与DrugCell的作者报告的结果非常相似(ρ = 0.8)。这是由于神经网络的结构相同,所以性能差异很小。然而,与DrugCell相比,SparseGO的训练时间减少了80%,测试时间减少了96%,GPU内存使用减少了94%,存储内存减少了96%(见图6b)。然后,为了确定数据集中有多少药物具有较高的预测准确性(ρ > 0.5),作者计算了每种药物的单独性能。如图6c所示,对于DrugCell,高置信度预测的药物比例为32%,而SparseGO为35%。在这种情况下,SparseGO使用更少的资源得到了略好一些的结果。常见的抗微管剂长春新碱在两种算法中的预测性能最佳,相关性超过0.8。ML-030、KX2-391和坦螺旋霉素与多西他赛的组合也是两种网络预测效果最佳的药物之一,再次强调了这两种模型的相似性。

图 7

在标准交叉验证方案中,使用突变数据时,SparseGO预测的AUDRC2值与实测值之间的整体Pearson相关性为0.814。然而,当使用基因表达数据时,相关性增加到0.84。高置信度药物预测的比例在使用突变数据时为20%。相反,当使用基因表达数据进行预测时,这一比例增加到29%(见图7)。这一发现非常重要,因为它表明使用表达模型可以扩大更可靠药物预测的范围。与图6c相比,这些比例较小,主要是因为使用了AUDRC2而不是AUDRC1,模型是基于三个不同的研究进行训练的,并且每个研究使用了不同的筛选测试方法。

使用XAI预测作用机制

医生不仅需要良好的预测,还需要了解原因。SparseGO的主要目标是可解释的,这是通过提供准确的预测对药物的反应和药物产生其作用的过程来实现的。在证明了前者之后,作者实现了DeepMoA,它是一种能够使用训练过的SparseGO模型来预测药物的MoA的方法。

图 8

DeepLIFT是一种可解释人工智能(XAI)算法,它能够识别关键神经元,这些神经元在模型中代表GO术语,并影响预测值。如图5所示,作者使用DeepLIFT通过将所有细胞系的基因表达和药物引入训练好的SparseGO模型,计算SparseGO的VNN分支所有神经元的分数。作者使用T-SNE方法将DeepLIFT分数可视化到低维向量空间中。通过从clue.io网站获取了一些药物的已知分类,作者选择并绘制了那些分类由两个或更多药物共享的药物(共214种药物)。图中的每个点代表一个药物的所有分数的二维表示。然后,作者使用mclust算法在该向量空间中找到集群。图8显示了几个共享MoA的化合物在同一个集群中。例如,MEK抑制剂、EGFR抑制剂和BCL抑制剂之间的分数投影相似。

图 9

为了验证 DeepMoA方法,作者首先确定了每个SVM模型的AUROC以比较GO术语的真实MoA标签与同一GO术语的预测概率(见图9a)。作者发现超过48%的SVM模型的 AUROC高于或等于0.70(见图9b)。如图所示,参与凋亡信号通路的线粒体外膜通透性调控、凋亡执行阶段的负调控和细胞内pH降低是预测效果最佳的MoAs之一。此外,按GO层次结构级别检查性能时(见图9c),一般术语下的精确率-召回率曲线下面积(AUPR)更高,即预测一般术语比预测具体术语更容易,而AUROC在更具体的术语下更好。作者计算了AUROC以比较药物的真实MoA标签与预测概率。在这种情况下,几乎所有药物的AUROC都高于0.7(见图9d)。这表明当使用所有模型来预测某种药物时,大多数预测是正确的。

3个有趣Go术语的验证

图 10

ERK1/ERK2级联信号通路,也被称为MAPK通路,在包括细胞增殖、分化、生存和凋亡等多种细胞过程中发挥着关键作用(GO:0070372)。在已注释的药物中,有22种与GO:0070372相关。如预期的那样,这些药物包括EGFR和HER2抑制剂以及EGFR和VEGFR2抑制剂。图10a展示了最终SVM模型成功区分这些注释药物的能力,其测试AUROC = 0.81,同时也暗示了其他未注释药物可能具有相同的MoA。其中WZ4002、CP-724714以及PD153035这些药物被预测为具有该MoA,一种MET激酶抑制剂也被预测为具有该MoA。

通过内质网(ER)应激诱导凋亡是癌症药物常见的作用模式(GO:0070059)。图10b展示了模型的测试AUROC为0.9。在已注释的术语中,包含了像Venetoclax和Navitoclax这样的BCL-2抑制剂,以及其他21种药物。该预测突显了BCL-2抑制剂ABT-737诱导ER应激的潜力,这与先前研究表明的ABT-737在人体黑色素瘤细胞和人类肝细胞癌中诱导ER应激的能力一致。

梭形体组织是细胞分裂过程中准确染色体分离的关键过程(GO:0007051)。最终的SVM模型的测试AUROC为0.93,其识别出几种已知对梭形体组织有影响的药物,包括极光激酶抑制剂(如Barasertib和Ispinesib)、紫杉烷类药物(如紫杉醇)和长春碱类药物(如长春新碱)。在预测结果中,SB-743921是一种驱动蛋白梭形体蛋白抑制剂,其与梭形体组织的关联得到了实验证据的支持。此外,GW843682x已被发现可以破坏梭形体的形成并在肺癌细胞中诱导异常的有丝分裂过程 。如图10c所示,模型还预测了另外两种药物,即硫磷精胺和三磷酰胺,它们已被证明会干扰小鼠卵母细胞中的梭形体活动。

其他未标记药物MoA的验证

图 11

Parbendazole是一种有效的微管组装抑制剂,已显示其能够解聚细胞质微管,导致每个中心粒仅与一两个微管相关联。这种破坏显著影响了有丝分裂纺锤体的形成和功能,导致染色体分离和组织的明显缺陷。如图11a所示,作者的方法提供了Parbendazole处理与这些关键生物过程之间密切关联的有力证据。模型的预测表明,它与染色体分离(GO:0007059)、核染色体分离(GO:0098813)、中心体周期(GO:0007098)、有丝分裂细胞周期的负调控(GO:0045930)、纺锤体组织(GO:0007051)、沿微管的细胞器运输(GO:0072384)和微管组织中心组织(GO:0031023)等术语有很强的关联。

PD153035是一种酪氨酸激酶抑制剂,以其对表皮生长因子受体(EGFR)酪氨酸激酶的特异性和强效抑制而闻名,它是ErbB受体家族的一部分。如图11b所示,它与包括ErbB信号通路(GO:0038127)和细胞对表皮生长因子刺激的反应(GO:0071364)等术语有较强的关联。在宫颈癌实验中,PD153035处理导致EGFR表达以及PI3K和AKT磷酸化的显著抑制。结果表明,该药物与蛋白质丝氨酸/苏氨酸激酶和蛋白质激酶B相关术语有关系。

讨论

研究人员开发的SparseGO模型在癌症药物反应预测中取得了重大突破。该模型通过显著提高计算资源利用效率,实现了更快的训练和测试速度,并减少了GPU内存和存储需求。在全面评估中,SparseGO在使用基因表达数据时展示了更高的预测准确性和高置信度药物预测比例。此外,采用DeepMoA方法,SparseGO模型通过DeepLIFT算法准确识别了药物的作用机制(MoA),验证了其在文献中的一致性。SparseGO的高效性和可解释性为癌症药物预测和作用机制研究提供了新的方法和视角,展现了其在未来癌症治疗中的巨大潜力。

编译 | 于洲

审稿 | 王建民

参考资料

Del Real K S, Rubio A. Discovering the mechanism of action of drugs with a sparse explainable network[J]. Ebiomedicine, 2023, 95.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云服务器利旧
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档