在现代药物研发链条中,虚拟筛选(VS)是连接化合物库与先导化合物发现的核心计算枢纽。它能从海量化合物中快速锁定具有潜在生物活性的分子,大幅降低实验筛选的成本与时间。
然而,传统虚拟筛选方法长期受限于预测精度与计算效率的双重瓶颈。近期,发表于预印本平台的研究《On the rise of AI technologies for virtual screening 》,为解决这一行业痛点提供了探索性方案。该研究证实,AI模型Boltz-2 在超高难度靶点筛选任务中,性能全面超越传统方法,为药物发现的规模化、精准化发展开辟了新路径。
一、传统虚拟筛选的技术瓶颈 传统虚拟筛选技术主要分为两类,均存在难以规避的缺陷。
经典方法的局限性 以分子对接、药效团建模、基于配体的相似性搜索为代表的经典方法,无法精准捕捉受体柔性、溶剂效应和熵贡献等关键因素。这直接导致其对蛋白-配体结合亲和力的预测误差较大,在化合物结构相似性高的场景下,难以区分活性与非活性分子。物理模拟方法的困境 以炼金术自由能模拟为基础的绝对结合自由能(ABFE)和相对结合自由能(RBFE)计算,虽能提升预测精度,但计算成本极高。这类方法无法适配大规模化合物库的筛选需求,难以在药物研发早期阶段推广应用。尤其在面对ULVSH数据集 这类高难度测试集时,传统方法的短板被进一步放大。该数据集包含943个虚拟筛选命中物(427个真阳性,516个假阳性),涵盖7个GPCR、1个激酶、1个膜受体和1个转运蛋白 。其筛选难点体现在四个方面:
虚拟命中物由高命中率的对接实验筛选而来,无明显非结合分子; 活性与非活性化合物的化学空间高度重叠,无法通过结构相似性区分; 两类分子均无特异性相互作用模式作为判别依据; 靶点以跨膜蛋白为主 ,这类蛋白的建模与模拟本身就极具挑战性。此前研究已证实,多种主流重打分策略在该数据集上均无法实现活性分子的有效甄别。
二、Boltz-2的技术优势与核心性能表现 Boltz-2是一款基于AI的蛋白-配体相互作用预测模型,其核心在于无需依赖蛋白三维结构 ,仅通过蛋白的FASTA序列和配体的SMILES表达式,就能精准预测蛋白-配体复合物的三维结构及结合亲和力。
研究团队通过严格的对照实验,验证了Boltz-2的综合性能优势。
实验设计与方法 研究以ULVSH数据集为测试对象,基于配体的MOL2坐标和蛋白的FASTA序列,构建自动化流程完成Boltz-2的输入文件准备、模型运行与亲和力预测。同时,选取分子对接、经验打分(HYDE)、机器学习(Δvina、Gnina)、端点自由能计算(MMPBSA、MMGBSA)等8类主流重打分方法作为对照,以ROC-AUC值为核心评价指标,对比各方法的分类性能。核心性能突破 精度领先 :Boltz-2的平均ROC-AUC值达到0.70,显著高于所有对照方法。当以ROC-AUC>0.7作为“成功分类”的标准时,Boltz-2的成功率为7/10,是第二名方法的两倍以上。效率优势显著 :在单张最新GPU卡(RTX 4500 Ada Generation)上,Boltz-2预测单个配体的结合亲和力需约100秒,全数据集处理时间不超过1天。该速度较传统物理模拟方法提升了三个数量级,且在不同GPU硬件(RTX A4500)上表现出良好的稳定性,靶标间ROC-AUC偏差绝对值低于0.04。普适性强 :无需依赖蛋白的三维晶体结构,可直接应用于未被结构解析的靶点,极大拓展了虚拟筛选的适用范围。局限性分析 值得注意的是,Boltz-2在CNR1和MTR1A两个靶点上的预测性能不佳,ROC-AUC值分别仅为0.40和0.45。研究团队通过优化模型参数、引入实验结构模板、缩减蛋白序列域等多种策略进行改进,但均未显著提升这两个靶点的预测精度。排除这两个靶点后,Boltz-2的平均ROC-AUC值可提升至0.77,进一步印证了其在多数靶点上的优异性能。三、AI驱动虚拟筛选的行业价值与未来方向 Boltz-2的出现,不仅是技术层面的突破,更标志着药物发现领域正迎来从传统方法向AI驱动的范式转移 。
填补技术鸿沟 传统虚拟筛选方法难以兼顾 大规模筛选 与 高精度预测 的需求。Boltz-2凭借高效的计算能力,在单GPU卡上可实现日均1000个配体的筛选规模【日均应该在1000以下,还是比较慢的】。若基于20个GPU的中型计算集群,月均筛选能力可达50万个配体,有效填补了超大库筛选与先导化合物优化之间的技术鸿沟。未来发展方向 模型优化 :针对Boltz-2的短板靶点,需进一步探索模型结构改进、训练数据集扩充等策略,提升模型对特殊靶点的适应性。多技术融合 :将AI模型与ABFE等高精度物理计算方法结合,形成 AI快速初筛+物理计算精准验证 的复合 workflow,兼顾效率与精度。未知靶点拓展 :验证模型对未参与训练的全新靶点的预测能力,是实现AI虚拟筛选技术广泛应用的关键。结语 从AlphaFold3到Boltz-2,AI技术正持续重塑生物大分子与小分子相互作用的研究范式。Boltz-2的突破性表现,让 用更低成本、更短时间发现高质量先导化合物 成为可能。随着模型的持续优化与多技术融合,AI驱动的虚拟筛选必将在药物研发领域发挥愈发关键的作用,加速新药从实验室走向临床的进程。
参考文献:Marco Cecchini, Hryhory Sinenka, On the rise of AI technologies for virtual screening, bioRxiv 2026.01.14.699425