
DRUGONE
过去 15-20 年间,传统的化学信息学工具逐渐难以跟上现代分子发现的需求。造成这一趋势的原因主要有三点:
随着化学数据的快速积累与共享,以及合成可行性障碍的逐步消除,广阔的分子空间正逐渐变得触手可及。这为生成式化学和药物发现提供了前所未有的机遇。

RDKit 的瓶颈
在化学信息学中,RDKit 是应用最广泛的数据科学工具包之一,提供了分子操作、分析与可视化的完整功能,支撑着几乎所有基于 AI 的化学工作流。然而,随着数据与模型规模的急剧扩大,RDKit 基于 CPU 的计算逐渐成为高通量任务中的性能瓶颈。
为此,研究团队与 RDKit 开发者紧密合作,将关键函数迁移到 GPU 上,并显著加速其性能,推出了独立库 nvMolKit。
nvMolKit:GPU 驱动的性能飞跃
nvMolKit 直接对接 RDKit 的 C++ API,同时通过 Python 提供简洁接口,用户几乎可以将其作为 RDKit 函数的无缝替代。它保持了与 RDKit 相同的功能与精度,但在速度上实现了 1–4 个数量级的提升。
五大核心加速函数
这些结果不仅在 H100 上得以验证,在 A100 平台上同样展现出稳定的加速性能。

高通量应用的影响
高通量筛选与分子生成
加速的相似性计算对于虚拟筛选至关重要。研究人员可以快速在庞大化学空间中进行迭代探索,从而提高先导化合物发现效率。同时,在分子生成或类似物设计中,实时相似性约束也能成为可能,支持大规模专利空间分析和结构创新。
分子建模与性质预测
快速生成并优化三维分子结构是计算化学中的核心任务。借助 nvMolKit 的加速,研究人员能够高效进行:
这些操作为基于三维结构的分子性质预测奠定了坚实基础,加速了 AI 药物设计的下游工作流。
展望
nvMolKit 的代码已在 GitHub 开源(https://github.com/NVIDIA-Digital-Bio/nvMolKit),并提供了完整的 API 文档(https://nvidia-digital-bio.github.io/nvMolKit)。
团队目前正在完善函数集的加速实现,并欢迎社区反馈更多亟待优化的计算瓶颈。未来,nvMolKit 有望成为化学信息学与生成式化学中不可或缺的高性能工具,进一步推动 GPU 驱动的药物发现新时代。
整理 | DrugOne团队
参考资料
内容为【DrugOne】公众号原创|转载请注明来源