首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >nvMolKit:GPU加速的 RDKit 核心函数集

nvMolKit:GPU加速的 RDKit 核心函数集

作者头像
DrugAI
发布2026-01-06 12:38:11
发布2026-01-06 12:38:11
1050
举报
文章被收录于专栏:DrugAIDrugAI

DRUGONE

过去 15-20 年间,传统的化学信息学工具逐渐难以跟上现代分子发现的需求。造成这一趋势的原因主要有三点:

  • 可合成化学空间的指数级扩张
  • 深度学习的崛起
  • 基础模型的兴起

随着化学数据的快速积累与共享,以及合成可行性障碍的逐步消除,广阔的分子空间正逐渐变得触手可及。这为生成式化学和药物发现提供了前所未有的机遇。

RDKit 的瓶颈

在化学信息学中,RDKit 是应用最广泛的数据科学工具包之一,提供了分子操作、分析与可视化的完整功能,支撑着几乎所有基于 AI 的化学工作流。然而,随着数据与模型规模的急剧扩大,RDKit 基于 CPU 的计算逐渐成为高通量任务中的性能瓶颈。

为此,研究团队与 RDKit 开发者紧密合作,将关键函数迁移到 GPU 上,并显著加速其性能,推出了独立库 nvMolKit。

nvMolKit:GPU 驱动的性能飞跃

nvMolKit 直接对接 RDKit 的 C++ API,同时通过 Python 提供简洁接口,用户几乎可以将其作为 RDKit 函数的无缝替代。它保持了与 RDKit 相同的功能与精度,但在速度上实现了 1–4 个数量级的提升。

五大核心加速函数

  • Morgan 指纹生成:在 H100 GPU 上可获得 5–8 倍加速。
  • Tanimoto 相似度:在大规模(10k+)交叉相似度矩阵上,GPU 加速可达 4000 倍。
  • 余弦相似度:提升高达 1750 倍。
  • MMFF 力场几何优化:在 8 GPU vs. 112 CPU 的对比下,速度提升 25 倍。
  • ETKDG 构象生成:实现 10–12 倍加速,且随着分子规模增加加速效果更显著。

这些结果不仅在 H100 上得以验证,在 A100 平台上同样展现出稳定的加速性能。

高通量应用的影响

高通量筛选与分子生成

加速的相似性计算对于虚拟筛选至关重要。研究人员可以快速在庞大化学空间中进行迭代探索,从而提高先导化合物发现效率。同时,在分子生成或类似物设计中,实时相似性约束也能成为可能,支持大规模专利空间分析和结构创新。

分子建模与性质预

快速生成并优化三维分子结构是计算化学中的核心任务。借助 nvMolKit 的加速,研究人员能够高效进行:

  • 配体-受体对接
  • 构象优化与去除空间冲突
  • 低能量构象筛选
  • 配体应变能计算

这些操作为基于三维结构的分子性质预测奠定了坚实基础,加速了 AI 药物设计的下游工作流。

展望

nvMolKit 的代码已在 GitHub 开源(https://github.com/NVIDIA-Digital-Bio/nvMolKit),并提供了完整的 API 文档(https://nvidia-digital-bio.github.io/nvMolKit)。

团队目前正在完善函数集的加速实现,并欢迎社区反馈更多亟待优化的计算瓶颈。未来,nvMolKit 有望成为化学信息学与生成式化学中不可或缺的高性能工具,进一步推动 GPU 驱动的药物发现新时代。

整理 | DrugOne团队

参考资料

  • https://research.nvidia.com/labs/dbr/blog/nvMolKit/?ncid=so-twit-838593
  • https://github.com/NVIDIA-Digital-Bio/nvMolKit

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档