药物-靶点结合亲和力(DTA, Drug-Target Binding Affinity)预测是药物研发中的重要课题之一。它不仅决定了药物与靶点之间的相互作用强度,还对药物筛选、优化和临床应用具有重要指导意义。然而,由于药物化合物和潜在靶点数量庞大,通过生物实验全面测量DTA既费时又费力。因此,开发高效准确的计算方法来预测DTA值成为当务之急。
2025年1月10日,ACS Omega上发表的文章Deep Drug–Target Binding Affinity Prediction Based on Multiple Feature Extraction and Fusion,提出了一种名为BTDHDTA的深度学习模型,创新性地结合多特征提取模块和高效的特征融合机制,在多个数据集上的性能显著优于现有方法。
本文将结合文献内容,从研究背景、模型原理、实验结果和应用前景等方面对该研究进行详细解读。
研究背景
1 DTA预测的意义
药物开发的核心在于找到特定靶点与化合物之间的高亲和性相互作用。通过精准预测DTA,可以:提高药物开发效率,减少实验筛选所需的化合物数量;优化药物设计:为后续分子优化提供数据支持;促进精准医疗,为个性化治疗选择潜在有效的药物。
2 现有方法的局限性
现有的DTA预测方法大致分为基于序列的模型和基于图结构的模型。
基于序列的模型直接将药物和靶点表示为一维序列输入模型,例如DeepDTA和AttentionDTA。这些方法虽然简单高效,但在捕获全局和局部特征方面仍有不足。
基于图结构的模型通过将化合物和蛋白质结构转换为图形式,利用图神经网络(GNN)学习特征,例如GraphDTA和DGraphDTA。然而,图结构方法需要复杂的预处理过程,计算成本较高。
此外,现有方法在以下两方面存在显著问题:特征提取不足,无法有效整合长程信息与局部特征;交互学习有限,药物与靶点特征的简单拼接未能深入挖掘复杂交互关系。
BTDHDTA模型概述
图1: BTDHDTA模型示意图
1 模型结构
BTDHDTA是一个端到端的深度学习模型,主要由四个模块组成:
数据处理模块:将药物和靶点序列分别表示为SMILES和FASTA格式,并通过双向门控循环单元(BiGRU)捕获时序关系。
特征提取模块:结合Trans块和Dilated-CNN块分别提取全局和局部特征。
特征融合模块:利用Highway网络和卷积神经网络(CNN)融合药物与靶点特征,构建其交互关系。
预测模块:通过全连接层解码融合特征,预测DTA值。
2 特征提取机制
Trans块:基于改进的Transformer编码器,采用多头注意力机制捕获序列的全局特征。
Dilated-CNN块:通过膨胀卷积扩展感受野,在绑定位点提取多尺度局部特征。
多特征组合:将全局和局部特征进行拼接,形成更为丰富的信息表示。
3 特征融合与交互
现有模型普遍采用特征拼接进行交互建模,忽略了药物与靶点的复杂关系。BTDHDTA引入Highway网络,通过门控机制过滤和融合全局与局部特征,同时引入一维卷积捕获药物和靶点间的细粒度交互。
研究成果与分析
图2: 预测亲和力值的散点图和频率直方图
图3: 预测亲和力值的核密度估计图
1 数据集与评估指标
研究团队选取了三个公开数据集(Davis、KIBA和Metz)进行模型验证,并采用以下评估指标:MSE,衡量预测值与真实值的均方误差;CI,评估预测值与真实值排序的一致性;Rm²,衡量模型对新数据的预测能力。
实验结果显示,BTDHDTA在所有数据集上的关键指标均优于当前最先进模型。
2 实验结果分析
全局与局部特征提取的贡献
Trans块捕获的全局特征提升了模型的预测一致性,而Dilated-CNN块通过多尺度局部特征提取进一步改善了模型的精度。例如,在Davis数据集中,引入Dilated-CNN后,模型的CI值从0.902提升至0.905。
特征融合模块的效果
与简单拼接方法相比,Highway网络显著提升了模型的性能。在KIBA数据集中,BTDHDTA的融合模块相比其他注意力机制,CI值从0.894提升至0.898。
与其他模型的比较
TDHDTA在所有数据集上的预测精度均超越其他方法。例如,在Davis数据集中,BTDHDTA的MSE为0.201,显著低于DeepDTA的0.261和DeepCDA的0.248。
3 案例研究:新冠病毒相关药物筛选
研究团队利用BTDHDTA预测了3137种FDA批准药物与新冠病毒六种复制相关蛋白的结合亲和力,筛选出潜在有效的抗病毒药物。例如,BTDHDTA成功预测出已被批准用于新冠治疗的瑞德西韦(Remdesivir),进一步验证了模型的实际应用价值。
应用前景与挑战
药物研发中的应用。BTDHDTA的高精度预测能力适用于高通量药物筛选,可加速药物开发流程,降低研发成本。
跨领域应用。模型的设计思想还可推广至其他生物医学领域,例如非编码RNA与小分子药物的相互作用预测。
挑战与未来方向:1)数据不平衡问题:现有数据集中结合位点数据量较少,影响模型的泛化能力;2)模型解释性:深度学习模型的“黑箱”特性限制了其在实际应用中的可信度;3)结构信息的整合:未来可将BTDHDTA与三维结构信息结合,进一步提升预测性能。
总结
BTDHDTA通过创新性的多特征提取和融合机制,为DTA预测提供了高效解决方案。其在多个数据集上的优异表现,展示了该模型在药物研发中的潜力和前景。同时,通过真实场景中的案例验证,进一步证明了其在新药发现中的应用价值。未来,随着模型的不断优化和扩展,BTDHDTA有望在精准医疗和新药开发领域发挥更大的作用。
参考资料:
Li, Z., Zeng, Y., Jiang, M., & Wei, B. (2025). Deep Drug–Target Binding Affinity Prediction Based on Multiple Feature Extraction and Fusion. ACS Omega.
https://doi.org/10.1021/acsomega.4c08048