前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >J. Med. Chem. | TarIKGC - 一种基于知识图谱补全与多模态特征融合的创新靶标识别计算工具

J. Med. Chem. | TarIKGC - 一种基于知识图谱补全与多模态特征融合的创新靶标识别计算工具

作者头像
DrugAI
发布2025-02-18 22:47:49
发布2025-02-18 22:47:49
910
举报
文章被收录于专栏:DrugAIDrugAI

2024年1月2日,中山大学药学院与中南大学湘雅药学院等在《J Med Chem》期刊发表题“TarIKGC: A Target Identification Tool Using Semantics-Enhanced Knowledge Graph Completion with Application to CDK2 Inhibitor Discovery” 的研究论文。该研究提出了一种创新的靶标识别计算工具——TarIKGC。该工具融合了知识图谱补全技术与多模态特征融合策略,旨在深入挖掘生物医学知识图谱中潜在的分子相互作用。

研究背景

靶标确证在药物发现中至关重要,而整合多维生物网络有望揭示潜在的分子相互作用。然而,现有基于网络的方法往往未能充分利用生物医学实体的语义信息,而基于深度学习的模型则常忽视生物异构网络中丰富的拓扑信息。尽管化合物-靶标相互作用预测领域已有诸多进展,但在提升推荐性能方面仍存在巨大潜力。

为克服这些挑战,作者构建了一个包含化合物-靶标-疾病关系的生物活性知识图谱,并提出了基于语义增强的知识图谱补全技术工具——TarIKGC,以提升潜在靶标的优先级排序性能。TarIKGC在药物重定位、计算钓靶及脱靶效应预测等多个任务中表现优异。特别在CDK2抑制剂发现任务中,TarIKGC成功识别了两个具有全新骨架的CDK2抑制剂,展现了优异的抗增殖活性。

数据与方法

作者收集并整理了大量生物医学数据,构建了一个包含化合物-靶标相互作用、靶标-疾病关联及化合物-疾病关联等信息的生物活性知识图谱(KG)。TarIKGC将靶标识别视为知识图谱的链接预测任务,通过补全当前图谱推断新的相互作用。

该框架由编码器和解码器组成,整合了化合物结构、基因本体论(GO)注释的蛋白靶标、ICD-10编码的疾病实体及生物图网络。基于注意力机制的图神经网络(GNN)用于提取拓扑信息,而GO嵌入层、Graph Transformer及ICD2Vec则挖掘局部实体的语义特征。多模态特征融合模块整合不同模态知识,生成化合物、蛋白质和疾病等实体的特征表示。知识图谱嵌入(KGE)解码器用于捕捉实体间的交互。在预测阶段,TarIKGC根据合理性评分对潜在的化合物-靶标相互作用进行排序,优先推荐最可能的相互作用。

消融实验

为了评估拓扑特征和语义特征对模型性能的贡献,作者通过分别去除知识图谱的拓扑特征和生物实体的语义特征,构建了不同的模型变体(TarIKGC_SF和TarIKGC_TF)。实验结果显示, 去除拓扑特征或者语义特征后,模型的分类性能的在AUC和AUPR上均有所下降,特别是在数据不平衡的情况下。值得注意的是,缺失化合物的语义特征对性能的影响最大,其次是蛋白质特征,而疾病特征对分类性能的影响最小。此外, 排名指标显示, TarIKGC在MRR和HITS@K(K=1, 3, 10)指标上均优于模型变体。消融实验证明了通过多模态特征融合模块整合拓扑和语义特征对提高模型分类和推荐性能的重要性。

模型可解释性

知识图谱是通过构建语义网络进行知识表示的一种流行范式。数据驱动模型的可解释性对于决策建立信任至关重要。为此,该工作通过分析TarIKGC生成的生物实体嵌入向量与实体属性间的关系,探讨了知识表示的可解释性。可视化结果显示,共享相同靶标的药物实体在嵌入空间中紧密聚集,如去甲肾上腺素-多巴胺再摄取抑制剂。基于GO功能注释的热图可视化揭示了高生物功能相似性区域。化合物-靶标相互作用网络显示,靶标共享区域拥有更多活性化合物。T-SNE投影清晰展示了靶标实体的聚集与分离,表明GO注释为蛋白质特征提供了有意义且可学习的表示, 且与GO注释的生物学意义相对应,为理解化合物-靶标相互作用模式提供了新视角。

实验结果

为验证TarIKGC的实际应用能力,作者使用商业筛选库进行了靶向CDK2的计算钓靶实验。在对136个已知CDK2抑制剂的测试中,TarIKGC有效地将CDK2列为首要候选靶标,HITS@3达到了99.2%。此外,该模型还推荐了两个未报道的、具有新骨架的靶向CDK2活性化合物。通过表面等离子体共振(SPR)实验测量,这两种化合物均表现出与CDK2纳摩尔级的亲和力,KD值分别为0.35 μM和4.63 μM。分子动力学(MD)模拟则进一步揭示了这两个化合物在CDK2的ATP结合位点的结合模式。此外,与现有抑制剂CVT-313相比,这两个化合物对多种癌细胞系均表现出竞争性的抗增殖活性,同时对非癌细胞系(如THLE-2和293T)的毒性较小,这为平衡化合物的疗效和毒性提供了一个潜在的治疗窗口。综上所述,实验结果有力地证实了这两个化合物作为潜在CDK2抑制剂的抗肿瘤活性,并验证了TarIKGC在发现新的化合物-靶标关联方面的可靠性。

参考文献

Shen, X., Yan, S., Zeng, T., Xia, F., Jiang, D., Wan, G., ... & Wu, R. (2025). TarIKGC: A Target Identification Tool Using Semantics-Enhanced Knowledge Graph Completion with Application to CDK2 Inhibitor Discovery. Journal of Medicinal Chemistry.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 研究背景
  • 数据与方法
  • 消融实验
  • 模型可解释性
  • 实验结果
  • 参考文献
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档