DRUGONE
蛋白质-配体相互作用在多种生物过程中发挥核心作用,并在药物设计中具有关键意义。深度学习方法正逐步成为高通量实验筛选的高性价比替代手段。研究人员在此基础上提出了Ligand-Transformer,这是一种基于Transformer架构的深度学习方法,用于预测蛋白质与小分子之间的结合亲和力。Ligand-Transformer采用序列驱动策略,以靶蛋白的氨基酸序列和小分子的拓扑结构作为输入,进而预测两者复合物的构象空间。
研究人员将该模型应用于筛选靶向EGFRLTC突变型激酶的抑制剂,并在实验中成功识别出具有纳摩尔级效力的化合物。此外,Ligand-Transformer还能预测ABL激酶在配体结合后引起的构象群体变化。这些结果表明,Ligand-Transformer具备准确预测蛋白质-小分子相互作用的潜力,包括结合亲和力和结合后自由能景观的变化,为药物设计的起始阶段提供支持。
近期研究显示,深度学习不仅可用于预测蛋白结构,还具备推断蛋白动态与相互作用的能力。这些进展促使研究人员在药物设计早期阶段探索深度学习应用,以应对传统药物研发流程效率逐步下降的挑战。高通量筛选作为寻找配体的常用方法,往往伴随着高昂成本、时间消耗及假阳性和假阴性率高等问题,迫切需要计算方法的辅助。
研究人员提出一种序列驱动的药物设计方法,超越传统基于结构和基于配体的方法。该策略通过输入蛋白质序列和小分子结构,输出蛋白-配体复合物的构象空间及其结合亲和力预测,从而挖掘其结合机制。
结果
与现有结合亲和力预测方法的性能比较
研究人员利用PDBbind2020数据集评估了Ligand-Transformer的性能。通过与三种深度学习模型的对比,Ligand-Transformer在亲和力预测中表现出更高或相当的相关性。此外,该模型还能有效预测蛋白-配体间的距离矩阵,大部分残基间误差低于0.5Å,残基与配体原子间误差多数低于2Å,展现出良好的结构捕捉能力。
EGFRLTC抑制剂的识别
EGFR突变(L858R/T790M/C797S)导致现有药物失效,研究人员构建了一个包含290个抑制剂的数据集(EGFRLTC-290),并通过十折交叉验证对模型进行微调后,亲和力预测相关性由0.57提升至0.88。
进一步分析显示,预测的构象差异反映了配体结合引起的αC螺旋区域移动,特别是E762与G857之间的距离变化,可作为活性与非活性状态的指示。此外,模型还揭示了别构性抑制剂倾向于使αC螺旋外翻,与实验结构一致。
在TargetMol的9,090个化合物中筛选后,研究人员获得了12个预测IC50在1-100 nM之间的候选物,并在体外验证中发现其中6个具有抑制活性,2个(C1和C10)表现出纳摩尔级高效抑制作用。
进一步分析表明,这些活性化合物大多结合于ATP口袋或靠近活性位点,C5可能兼具正构和别构双重作用位点,模型构建结果与实验观察一致。
ABL激酶抑制剂的构象选择性
ABL激酶存在三种主要构象状态:一个活性态(A)与两个非活性态(I1与I2)。研究人员收集了12种具有已知结合偏好的抑制剂,并基于NMR数据和PDB结构集合(6XR6、6XR7、6XRG)重建了60个代表性结构。
通过预测的残基距离矩阵约束,Ligand-Transformer成功重建了结合后构象群体分布,并在11/12个抑制剂中准确预测了其主导构象。研究人员进一步分析了关键结构区(αC螺旋、P-loop、激活环)的距离特征,发现模型预测与真实构象的变化趋势一致,能够区分不同构象状态的特征。
讨论
研究人员提出了一种基于序列的虚拟筛选方法,能够预测蛋白-配体复合物的构象空间,克服了传统方法仅依赖游离态结构的局限性。该方法输出结合亲和力及配体与蛋白之间的距离矩阵,从而揭示结合模式。
模型基于AlphaFold2和GraphMVP的预训练表征,并通过复合物的距离矩阵学习结构信息,在亲和力预测方面优于现有方法。通过对EGFRLTC的筛选实验,Ligand-Transformer展示出良好的泛化能力与高筛选效率,其速度比传统对接方法提升百倍以上。
此外,该模型能够预测结合引起的构象群体转变,尤其在激酶研究中,辅助设计对特定构象状态具有选择性的配体,例如别构调节剂和类型IV抑制剂。预测构象变化对于理解药物机制与避免脱靶效应具有重要价值,特别适用于具有多构象的药物靶点如ABL激酶。
综上所述,Ligand-Transformer不仅在亲和力预测上表现优异,还能捕捉自由能景观的变化,是一项具有推广潜力的虚拟筛选新方法,可助力早期药物发现流程的提速与智能化转型。
整理 | DrugOne团队
参考资料
Zhang, S., Huo, D., Horne, R.I. et al. Sequence-based virtual screening using transformers. Nat Commun 16, 6925 (2025).
https://doi.org/10.1038/s41467-025-61833-8