首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >J Cheminform | SimVec:一种新型的基于知识图谱的药物副作用预测模型

J Cheminform | SimVec:一种新型的基于知识图谱的药物副作用预测模型

作者头像
智药邦
发布于 2022-11-16 08:48:35
发布于 2022-11-16 08:48:35
5430
举报
文章被收录于专栏:智药邦智药邦

2022年7月26日,来自JetBrains Research的Nina Lukashina等人[1]在Journal of Cheminfomatics上发表文章。文章提出了一种新方法SimVec,该方法通过使用结构感知的节点初始化和加权药物相似性边,来增强药物互相作用的知识图谱结构,并设计了一个新的三步学习过程,它迭代地更新了与副作用边缘,相似性边缘和有限知识的药物有关的节点嵌入。所提出的方法显著优于现有的模型。

背景

在同时使用多种药物时,必须尽可能降低由于药物-药物相互作用导致的副作用风险。然而,几乎不可能测试所有可能的药物对是否存在副作用,因此,对多药副作用进行可靠的自动预测,是医疗行业的一项重要任务。Zitnik等人[2]利用知识图谱(knowledge graph,KG)构建药物间的复杂网络,将多药副作用预测问题表述为异构图中的链接预测问题。该模型通过求解多模式网络中的多关系链路预测任务来预测特定药物对之间的确切副作用。图中的节点表示药物和蛋白质,而边表示药物-药物和蛋白质-蛋白质相互作用。

然而,如果某一特定药物仅存在少量已知的与其他药物的关联,该模型将难以预测新的联系。这对于预测系统的实际使用可能是一个严峻问题,因为新药最需要分析,而它们没有许多已知的关联。因此,根据药物的化学结构,添加药物的学习表示,学习知识图谱中已知连接数较少的药物组合的多药副作用,非常关键。

本文的主要贡献是,在有限的已知关联的情况下,对药物的多药副作用进行了预测。通过在节点初始化时考虑化学结构和对应于药物节点之间化学相似性的新的边,知识图谱的表示能力得到增强。作者设计了一个新的三步学习过程,它迭代地更新了与副作用边缘,相似性边缘和有限知识的药物有关的节点嵌入。

方法

如图1,SimVec通过结构感知节点初始化和加权药物相似性边缘来增强知识图谱。图中有两种类型的节点(实体):药物和蛋白质。SimVec用化学结构学习到表示,来初始化知识图谱中的药物节点,其目的是为模型提供一些关于药物化学结构的先验知识,以改进对弱节点的推理。如果特定药物的已知多药副作用数量有限,该模型可以根据药物的化学性质做出假设。SimVec使用了三种类型的100维化学嵌入,包括Morgan指纹、RDKit分子指纹、以及来自预训练双曲变分自编码器的表示向量。节点h和t之间的边权重计算方式为

其中

window_size(h,t)=l_bound+InvDeg(h)InvDeg(t)(u_bound−l_bound),degx为节点x的度,窗口区间为[l_bound, u_bound]。

图1. SimVec模型图

SimVec的学习过程分为以下三步:

1.对于副作用边,考虑一个由节点s经过边p到达节点o的三元组(s,p,o),损失函数为

2.对于加权的相似度边,定义新的损失函数

3.对于每种与其他药物已知关联较少的药物(弱节点),寻找与该药物较为接近,而常见副作用数量较多的一系列药物(强节点),通过加权平均策略学习表示向量。

知识图谱可视为只有正样本,即关于多药相互作用的已知关联。为了获得有效的负样本,通常使用负采样策略生成负样本。给出一个现有边的正样本,通过用均匀采样的随机顶点替换两个链接顶点中的一个,可以生成负样本。基于缓存的NSCaching模型[3]通过将分数较大的罕见负三元组样本存储在缓存中来跟踪它们。从缓存中负样本与正样本之比为1:1的比率采样。考虑到知识图谱中,增加负样本数量可以提高模型精度[4],SimVec将负样本与正样本之比提升到6:1。

此外,作者提出了一种新方法,Strong NSCaching,如图2所示。对于弱节点,使用其强邻居节点的一些样本是有效的。因为强节点的缓存更新更频繁,所以强节点缓存中的示例更好。

从最近强邻居的缓存中以概率搜索样本

并以1-p的概率从节点的缓存中采样。参数α旨在平衡概率p衰减率。α越高,从最近强邻居的缓存中采样的概率越低。因此,当α值较大时,概率p变得接近0。

图2. NSCaching与Strong NSCaching

结果

表1展示了采用均匀负抽样的下列模型的评估结果:

RESCAL_original是[5]中的一个模型。RESCAL_chem和RESCAL_SE是RESCAL模型,表示药物节点分别用化学表示和单副作用初始化。

Decagon_original_SE是Decagon模型[2]。值得注意的是,Decagon模型使用节点初始化副作用。Decagon_chem是Decagon模型,其中使用化学表示初始化节点。

TriVec_original是[11]中的模型。TriVec_SE是TriVec模型,其中药物节点以副作用初始化。

SimVec_Chem是用化学表示初始化的模型。

SimVec_weighted是一种具有加权和新的相似边的模型。

SimVec_SE是基于副作用的模型。

SimVec_chem_weighted融合了化学表示初始化和加权边。

SimVec_SE_weighted融合了副作用初始化和加权边。

SimVec_Full融合了所有改进,即化学表示初始化、加权和更新的学习过程。

表1. 不同方法间对比

图3. 不同的边加权和节点初始化策略对比

由于作者提出了不同的结构感知节点初始化方法和边缘加权方法,作者进行了实验以选择最佳选项。图3显示了相应模型验证数据集上的ROC AUC曲线。作者评估了三种不同的表示下的加权策略:基于Morgan指纹、基于RDKit分子描述符、基于双曲空间嵌入。在所有边加权(图a)和节点初始化(图b)策略中,每个策略中只有一个显示出比基础模型更好的性能;即a中基于分子描述符的窗口加权和b中使用Morgan指纹的节点初始化效果最好。

总结

本文研究了基于知识图谱的药物副作用预测模型,通过有限的已知多药关联显著改进了对药物副作用的预测。通过在节点初始化时考虑化学结构和对应于药物节点之间化学相似性的新的边,以及应用新颖的负采样策略,知识图谱的表示能力得到增强。

参考文献

[1] Lukashina et al., SimVec: predicting polypharmacy side effects for new drugs, J Cheminform, 2022

[2] Zitnik et al., Modeling polypharmacy side effects with graph convolutional networks, Bioinformatics, 2018

[3] Zhang et al., Nscaching: simple and efficient negative sampling for knowledge graph embedding, in ICDE, 2019

[4] Trouillon et al., Complex embeddings for simple link prediction, in ICML, 2016

[5] Nickel et al., A three-way model for collective learning on multi-relational data, in ICML, 2011

[6] Novacek et al., Predicting polypharmacy side-effects using knowledge graph embeddings, AMIA Summit Transl Sci Proc, 2020

--------- End ---------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
基于知识图谱嵌入的自动化问答生成
随着自然语言处理(NLP)和人工智能技术的飞速发展,自动化问答系统在各个领域的应用越来越广泛,特别是在客服、教育、医疗等领域中。自动化问答系统能够通过理解用户问题,快速地生成准确的答案,为用户提供高效的服务。传统的问答系统大多依赖于基于规则的匹配或检索式问答,而随着知识图谱(Knowledge Graph)技术的成熟,基于知识图谱的问答系统逐渐成为研究热点。通过知识图谱嵌入(Knowledge Graph Embedding, KGE),我们可以将复杂的图结构数据嵌入到低维向量空间中,从而实现高效的问答生成。
二一年冬末
2024/10/08
5340
基于知识图谱嵌入的自动化问答生成
​基于RotatE模型的知识图谱嵌入技术
知识图谱(Knowledge Graph, KG)是一种以图结构形式表示的知识库,通常用于表示实体(如人、地点、物品)及其之间的关系。知识图谱的应用遍及搜索引擎、推荐系统、问答系统等多个领域。随着大数据技术的发展,知识图谱的规模迅速扩大,导致传统的知识表示方法面临挑战。
二一年冬末
2024/09/28
5310
​基于RotatE模型的知识图谱嵌入技术
Bioinformatics|基于知识图谱嵌入的药物靶标发现
药物靶点的预测对于早期药物分子的成药性评价和老药新用等领域都具有重大意义,但由于通量、精度和费用的限制,实验手段的应用难以广泛开展。作为一类快速而低成本的方法,基于人工智能的药物-靶标预测算法正受到越来越多的重视。
DrugOne
2021/01/29
1.5K0
Bioinformatics|基于知识图谱嵌入的药物靶标发现
KGML-xDTD:基于知识图谱的药物治疗预测和机制描述机器学习框架
今天我想给大家介绍的论文是《KGML-xDTD: A Knowledge Graph-based Machine Learning Framework for Drug Treatment Prediction and Mechanism Description》,是一个基于知识图谱的机器学习框架,用于药物再利用预测和作用机制解释。
DrugOne
2025/03/24
1770
KGML-xDTD:基于知识图谱的药物治疗预测和机制描述机器学习框架
人工智能帮助预测混合用药的副作用
斯坦福大学的科研人员设计出了一种卷积神经网络,能够预测混合使用多种药物可能产生的副作用。
人工智能快报
2018/08/17
5130
KG4SL:用于人类癌症合成致死预测的知识图神经网络
今天给大家介绍一篇来自上海科技大学郑杰教授课题组在2021年7月份发表在《Bioinformatics》上的一篇文章《KG4SL: knowledge graph neural network for synthetic lethality prediction in human cancers》。本文使用了知识图神经网络方法来进行癌症合成致死的预测任务。
DrugOne
2021/07/28
1.7K0
知识图谱嵌入在医疗领域的应用
在医疗领域中,海量的医疗数据充斥着各种疾病、治疗方案、药物使用、临床诊断等丰富的信息。这些数据通常以非结构化形式存在于病历、影像、实验室报告等文档中。因此,如何有效地挖掘这些数据并进行推理是医学领域的一个重要研究方向。知识图谱作为一种能展示实体及其间关系的结构化图模型,在医疗领域的应用逐渐成为趋势。知识图谱嵌入技术(Knowledge Graph Embeddings,KGE)旨在将图中实体和关系编码为低维向量,允许我们使用向量空间中的计算来推断出实体之间的隐藏关系。
二一年冬末
2024/10/06
4740
知识图谱嵌入在医疗领域的应用
Brief Bioinform|KGE-UNIT:药物发现中基于知识图谱的分子相互作用预测与多任务统一学习框架
2024年2月12日,哈尔滨工业大学臧天仪教授、赵天意教授团队,在Briefings in Bioinformatics上发表文章KGE-UNIT: toward the unification of molecular interactions prediction based on knowledge graph and multi-task learning on drug discovery。
智药邦
2024/04/15
7890
Brief Bioinform|KGE-UNIT:药物发现中基于知识图谱的分子相互作用预测与多任务统一学习框架
中山大学杨跃东团队提出MUSE模型,通过变分期望最大化框架预测蛋白质和药物相互作用
了解蛋白质与蛋白质、药物和其他生物分子的相互作用,对于破译生物学过程背后的分子机制和开发新的治疗策略至关重要。
智药邦
2024/09/12
3710
中山大学杨跃东团队提出MUSE模型,通过变分期望最大化框架预测蛋白质和药物相互作用
Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力
2024年1月13日,西北工业大学尚学群教授、彭佳杰教授团队,在Briefings in Bioinformatics上发表文章Predicting drug–target binding affinity with cross-scale graph contrastive learning。
智药邦
2024/03/19
5270
Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力
安全知识图谱|知识图谱视角下的威胁评估
本文为安全知识图谱技术白皮书《践行安全知识图谱,携手迈进认知智能》精华解读系列第三篇——利用知识图谱助力攻击画像与威胁评估。主要利用知识图谱表示学习技术,对攻击源或攻击行为进行威胁评估。
绿盟科技研究通讯
2021/12/05
1.8K0
安全知识图谱|知识图谱视角下的威胁评估
BIB | PreDTIs: 利用梯度增强框架预测药物-靶点相互作用
今天给大家介绍Mohammad Ali Moni与Ulfarsson等人在Briefings in Bioinformatics上发表的文章“PreDTIs: prediction of drug–target interactions based on multiple feature information using gradient boosting framework with data balancing and feature selection techniques”。发现药物 - 靶点(蛋白质)相互作用(DTIS)对于研究和开发新的药物具有重要意义,对制药行业和患者具有巨大的优势。然而,使用实验室实验方法对DTI的预测通常是昂贵且耗时的。因此,已经为此目的开发了不同的基于机器学习的方法,但仍有需要提升的空间。此外,数据不平衡和特征维度问题是药物目标数据集中的一个关键挑战,这可以降低分类器性能。该文章提出了一种称为PreDTIs的新型药物 – 靶点相互作用预测方法。首先,蛋白质序列的特征载体由伪定位特异性评分矩阵(PSEPSSM),二肽组合物(DC)和伪氨基酸组合物(PSEAAC)提取;并且药物用MACCS子结构指数编码。此外,我们提出了一种快速算法来处理类别不平衡问题,并开发MoIFS算法,以删除无关紧要和冗余特征以获得最佳最佳特征。最后,将平衡和最佳特征提供给LightGBM分类器的以识别DTI,并应用5折CV验证测试方法来评估所提出的方法的预测能力。预测结果表明,所提出的模型预测显着优于预测DTIS的其他现有方法,该文章的模型可用于发现未知疾病或感染的新药。
智能生信
2021/04/13
1.2K0
BIB | PreDTIs: 利用梯度增强框架预测药物-靶点相互作用
NeuIPS|在知识图谱上嵌入逻辑查询
今天为大家带来斯坦福大学Jure Leskovec教授课题组发表在NeuIPS上的一篇论文。本文引入了一个框架GQE,以便在不完整的知识图谱上有效地对合取逻辑查询进行预测。在本文的方法中,作者在低维空间中对图节点进行嵌入,并在这个嵌入空间中将逻辑运算符表示为学习过的几何运算(例如平移、旋转)。本文通过在低维嵌入空间中执行逻辑运算,实现了线性时间复杂度的变量查询。
DrugOne
2021/02/01
7370
NeuIPS|在知识图谱上嵌入逻辑查询
MDNN: 一种用于药物-药物反应预测的多模态深度神经网络
今天介绍的是中南大学高建良团队和他人合作发表在IJCAI2021上的一篇文章“MDNN: A Multimodal Deep Neural Network for Predicting Drug-Drug Interaction Events”。本文指出许多基于人工智能的技术已经被提出并用于预测药物-药物反应(DDI),而现有的研究方法较少关注DDI与靶标、酶等多模态数据之间的潜在相关性。为了解决这一问题,作者提出了一个用于DDI预测的多模态深度神经网络(MDNN)。本文设计了一个基于药物知识图谱(DKG)的通道和基于异质特征(HF)的通道的双通道框架来获取药物的多模态表征。最后,通过一个多模态融合神经层来探索药物多模态表征之间的互补关系。作者在真实数据集上进行了广泛的实验。结果表明,MDNN能够准确预测DDI,并优于现有的模型。
DrugOne
2021/09/17
2K0
MDNN: 一种用于药物-药物反应预测的多模态深度神经网络
北京大学王劲卓团队提出DrugLAMP模型,通过多模态预训练语言模型进行药物-靶点相互作用预测
准确预测药物-靶点相互作用(DTI),特别是准确预测新的靶点或药物的相互作用,对于加速药物发现至关重要。预训练语言模型(PLM)和多模态学习的最新进展,为利用大量未标记的分子数据和整合来自多模态的互补信息来增强DTI预测,提供了新的机会。
智药邦
2025/01/13
5340
北京大学王劲卓团队提出DrugLAMP模型,通过多模态预训练语言模型进行药物-靶点相互作用预测
Chemical Science | 通过异构网络中的深度学习对已知药物进行靶标识别
今天给大家介绍的是2020年1月在Chemical Science上发表的论文“Target identification among known drugs by deep learning from heterogeneous networks”。在不了解完整的药物靶标信息的情况下,开发有效的药物是一个巨大的挑战。本研究为药物靶标识别提供了一个功能强大的基于网络的深度学习方法:deepDTnet,以加速药物的重新利用,减少药物开发中的翻译鸿沟。
DrugOne
2021/01/29
1.1K0
Bioinformatics丨SumGNN:基于高效知识图总结的多类型药物相互作用预测
今天为大家介绍的是剑桥大学CaoXiao等人发表在Bioinformatics上的文章“SumGNN: 基于高效知识图总结的多类型药物相互作用预测”。由于药物-药物相互作用(DDI)数据集和大型生物医学知识图(KGs)的不断增加,使用机器学习模型准确检测不良的DDI成为可能。然而,如何有效地利用生物医学大噪声KGs进行DDI检测仍是一个有待解决的问题。此外,以往的研究多集中于二值DDI预测,而多型DDI的药理作用预测更有意义,但任务更艰巨。为了填补空白,作者提出了一种新的方法SumGNN: 知识摘要图神经网络。这个网络是通过子图提取模块实现的,该子图提取模块可以有效地锚定KG中的相关子图,从而在子图中生成推理路径,以及多通道知识和数据集成模块,该模块利用大量外部生物医学知识,显著改善了多类型DDI的预测。SumGNN比最佳模型的性能高出5.54%,在低数据关系类型中性能提高尤其显著。此外,SumGNN通过为每个预测生成的推理路径提供可解释的预测。
智能生信
2021/07/22
8860
JCIM|DENVIS:使用具有原子和表面蛋白口袋特征的图神经网络进行可扩展和高通量的虚拟筛选
2022年9月26日,希腊DeepLab的Krasoulis等人在Journal of Chemical Information and Modeling上发表文章。作者提出了DENVIS(DEep Neural VIrtual Screening),一种使用具有原子和表面蛋白袋特征的图神经网络进行可扩展和高通量虚拟筛选的新型算法。DENVIS使用原子和表面特征的组合进行蛋白质口袋建模,实现了具有竞争力的先进的虚拟筛选性能。
智药邦
2022/11/16
8180
JCIM|DENVIS:使用具有原子和表面蛋白口袋特征的图神经网络进行可扩展和高通量的虚拟筛选
JCIM综述|知识图谱嵌入技术在化学领域中的研究进展与应用
2024年10月14日,来自郑州大学的南晓斐副教授等人在Journal of Chemical Information and Modeling上发表综述文章Research Progresses and Applications of Knowledge Graph Embedding Technique in Chemistry。
智药邦
2024/10/21
4210
JCIM综述|知识图谱嵌入技术在化学领域中的研究进展与应用
中山大学杨跃东团队提出AIxFuse模型,通过基于药效团组合协同学习的结构感知进行双靶点药物设计
双靶点药物设计在癌症和自身免疫性疾病等复杂疾病的治疗中引起了很大的关注。一种广泛采用的设计策略是结合药效团来利用两个靶点的结构-活性关系的知识。然而,药效团的结合经常受限于长期和昂贵的试验,因为两个靶点的蛋白质口袋施加了复杂的结构限制。
智药邦
2024/10/14
3630
中山大学杨跃东团队提出AIxFuse模型,通过基于药效团组合协同学习的结构感知进行双靶点药物设计
推荐阅读
基于知识图谱嵌入的自动化问答生成
5340
​基于RotatE模型的知识图谱嵌入技术
5310
Bioinformatics|基于知识图谱嵌入的药物靶标发现
1.5K0
KGML-xDTD:基于知识图谱的药物治疗预测和机制描述机器学习框架
1770
人工智能帮助预测混合用药的副作用
5130
KG4SL:用于人类癌症合成致死预测的知识图神经网络
1.7K0
知识图谱嵌入在医疗领域的应用
4740
Brief Bioinform|KGE-UNIT:药物发现中基于知识图谱的分子相互作用预测与多任务统一学习框架
7890
中山大学杨跃东团队提出MUSE模型,通过变分期望最大化框架预测蛋白质和药物相互作用
3710
Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力
5270
安全知识图谱|知识图谱视角下的威胁评估
1.8K0
BIB | PreDTIs: 利用梯度增强框架预测药物-靶点相互作用
1.2K0
NeuIPS|在知识图谱上嵌入逻辑查询
7370
MDNN: 一种用于药物-药物反应预测的多模态深度神经网络
2K0
北京大学王劲卓团队提出DrugLAMP模型,通过多模态预训练语言模型进行药物-靶点相互作用预测
5340
Chemical Science | 通过异构网络中的深度学习对已知药物进行靶标识别
1.1K0
Bioinformatics丨SumGNN:基于高效知识图总结的多类型药物相互作用预测
8860
JCIM|DENVIS:使用具有原子和表面蛋白口袋特征的图神经网络进行可扩展和高通量的虚拟筛选
8180
JCIM综述|知识图谱嵌入技术在化学领域中的研究进展与应用
4210
中山大学杨跃东团队提出AIxFuse模型,通过基于药效团组合协同学习的结构感知进行双靶点药物设计
3630
相关推荐
基于知识图谱嵌入的自动化问答生成
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档