Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >RDKit | 化学信息学与AI(专辑)

RDKit | 化学信息学与AI(专辑)

作者头像
DrugOne
发布于 2021-02-02 03:33:04
发布于 2021-02-02 03:33:04
2.8K0
举报
文章被收录于专栏:DrugAIDrugAI

RDKit | 化学信息学与AI

介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚类分析、化学反应处理、可视化与化学空间探索及RDkit相关的机器学习、深度学习应用过程详解

1

RDKit简介

开源化学信息学与机器学习工具

  • RDKit在2000-2006年期间在Rational Discovery开发和使用,用于构建吸收、分布、代谢、代谢、毒性和生物活性的预测模型。
  • 2006年6月Rational Discovery被关闭,但该工具包在BSD许可证下作为开源发布。
  • 目前,RDKit的开源开发由诺华积极贡献,其中包括诺华捐赠的源代码。

2

RDKit特点

  • 商业友好型BSD许可证
  • 核心数据结构和算法由C ++编写
  • 使用Boost.Python生成的Python 3.x包装器
  • 用SWIG生成的Java和C#包装器
  • 2D和3D分子操作
  • 机器学习与深度学习的分子指纹和分子描述符生成
  • PostgreSQL分子数据库集成
  • KNIME的化学信息学Nod

RDKit提供各种功能,如不同的化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),mol2和蛋白质结构文件(PDB);子结构搜索; 标准SMILES; 手性支持;化学转化;化学反应;分子序列化;相似性/多样性选择;二维药效团;三维维药效团;分层子图/片段分析; Bemis和Murcko骨架;逆合成组合分析及分子碎裂(RECAP); 多分子最大共同亚结构;功能图;基于形状的相似性;基于RMSD的分子比对;基于形状的对齐;使用Open3-DALIGN算法的无监督分子-分子比对;与PyMOL进行3D可视化集成;功能基团过滤;分子描述符库;相似图;机器学习等。

3

‘’RDKit | 化学信息学与AI”专栏介分类整理

RDKit安装

LinuxCentOS 7_x64位)系统下安装RDkit

https://blog.csdn.net/u012325865/article/details/78046781

创建独立的Python化学信息学环境

https://blog.csdn.net/u012325865/article/details/80419755

基于RDKit的分子读写及入门

RDKit:基于分子文件输出分子结构

https://blog.csdn.net/u012325865/article/details/82318084

RDKit | 分子处理入门

https://blog.csdn.net/u012325865/article/details/100808051

RDKit | 可视化分子来自于xyz文件

https://blog.csdn.net/u012325865/article/details/102589553

RDKit | 统计分子库中某种元素出现的次数

https://blog.csdn.net/u012325865/article/details/102590698

RDKit | 生物大分子的HELM表示法

https://blog.csdn.net/u012325865/article/details/102037029

基于RDKit的分子指纹与描述符计算

分子指纹

RDKit:化学指纹(Chemical Fingerprinting)

https://blog.csdn.net/u012325865/article/details/81784517

RDKit | 基于SMILES查找化合物的MACCS密钥

https://blog.csdn.net/u012325865/article/details/101697880

RDKit | 基于分子指纹的相似性图

https://blog.csdn.net/u012325865/article/details/102595442

分子描述符

RDKit 描述符计算及可视化

https://blog.csdn.net/u012325865/article/details/78578046

RDKit | 计算化合物描述符

https://blog.csdn.net/u012325865/article/details/101682612

RDKit | 删除方差低的描述符

https://blog.csdn.net/u012325865/article/details/101103957

RDKit | 计算拓扑极性表面积TPSA

https://blog.csdn.net/u012325865/article/details/102552770

RDKit | 基于RDKit描述三维分子形状(3D描述符)

https://blog.csdn.net/u012325865/article/details/102627024

RDKit | 化合物芳香度分子描述符的计算与相关性比较

https://blog.csdn.net/u012325865/article/details/102524904

RDKit | 定量评估类药性(QED)

基于RDKit的构象与RMSD计算

RDKit | 分子的多种构象

https://blog.csdn.net/u012325865/article/details/100832810

RDKit | 分子的力场优化

https://blog.csdn.net/u012325865/article/details/100826445

RDKit | 小分子构象的生成和比对

https://blog.csdn.net/u012325865/article/details/102515273

RDKit:计算不同分子或构象之间的RMSD

https://blog.csdn.net/u012325865/article/details/78578658

基于RDKit的相似性与分子图

RDKit | 基于分子指纹的分子相似性

https://blog.csdn.net/u012325865/article/details/102543725

RDKit | 基于相似图可视化原子贡献

https://blog.csdn.net/u012325865/article/details/102505583

RDKit | 子结构搜索和MCS算法

https://blog.csdn.net/u012325865/article/details/102626236

RDKit | 基于Fraggle算法评估化合物的相似性

https://blog.csdn.net/u012325865/article/details/102795069

RDKit | 化合物亚结构搜索与结果输出

https://blog.csdn.net/u012325865/article/details/102464673

RDKit | 化合物库的相似性分析

https://blog.csdn.net/u012325865/article/details/100916060

RDKit:化合物相似性搜索

https://blog.csdn.net/u012325865/article/details/82153557

RDKit:化合物亚结构(Substructure)搜索

https://blog.csdn.net/u012325865/article/details/82534661

RDKit与药效团

RDKit:可视化药效团(Pharmacophore)

https://blog.csdn.net/u012325865/article/details/92669296

RDKit | 聚类分析与可视化

RDKit | 比较化合物并通过PCA可视化化学空间

https://blog.csdn.net/u012325865/article/details/101693464

RDKit | 基于Ward方法对化合物进行分层聚类

https://blog.csdn.net/u012325865/article/details/101108342

RDKit | 基于PCA探索化学空间

https://blog.csdn.net/u012325865/article/details/100727712

Python脚本:聚类小分子数据集

https://blog.csdn.net/u012325865/article/details/81202123

RDKit与化学反应

RDKit | 基于RDKit绘制化学反应

https://blog.csdn.net/u012325865/article/details/103687862

RDKit | 基于RDKit和SMARTS的化学反应处理

https://blog.csdn.net/u012325865/article/details/103680157

RDKit | 基于RDKit通过SMARTS定义反应模式来生成反应产物

https://blog.csdn.net/u012325865/article/details/103679476

RDKit | 基于RDKit处理化学信息学中的反应方程式

https://blog.csdn.net/u012325865/article/details/103686941

基于RDKit与Python的应用

RDKit | 基于Lipinski规则过滤化合物库

https://blog.csdn.net/u012325865/article/details/102485055

RDKit | 通过评估合成难度(SA Score)筛选化合物

https://blog.csdn.net/u012325865/article/details/102488056

RDKit | 天然产物的相似度评分(NP-likeness)

https://blog.csdn.net/u012325865/article/details/102593918

RDKit | RDKit 中的RECAP进行分子裂解

https://blog.csdn.net/u012325865/article/details/102524938

基于RDKit探索DrugBank

https://blog.csdn.net/u012325865/article/details/82954600

RDKit:化合物骨架分析

https://blog.csdn.net/u012325865/article/details/82082317

RDKit与AI、深度学习和机器学习

RDKit | 基于随机森林的化合物活性二分类模型

https://blog.csdn.net/u012325865/article/details/83830763

RDKit | 基于Pytorch和RDKit建立QSAR模型

https://blog.csdn.net/u012325865/article/details/81585844

RDKit | 基于神经网络的溶解度预测和回归分析

https://blog.csdn.net/u012325865/article/details/82725777

RDKit | 基于机器学习的化合物活性预测模型

https://blog.csdn.net/u012325865/article/details/82467904

RDKit:基于RDKit的溶解度预测的机器学习模型

https://blog.csdn.net/u012325865/article/details/82318276

RDKit:基于支持向量回归预测logP

https://blog.csdn.net/u012325865/article/details/88085254

RDkit&mol2vec :基于逻辑回归的靶标抑制剂活性二分类对比

https://blog.csdn.net/u012325865/article/details/92801149

RDKit | 基于随机森林(RF)的机器学习模型预测hERG阻断剂活性

https://blog.csdn.net/u012325865/article/details/89857801

RDKit | 基于Smiles2vec预测化合物物理性质

https://blog.csdn.net/u012325865/article/details/100879193

DeepChem | DeepChem的图卷积特征化器

https://blog.csdn.net/u012325865/article/details/102461491

RDKit | 化合物活性数据的不平衡学习

https://blog.csdn.net/u012325865/article/details/102466647

RDKit | 基于不同描述符和指纹的机器学习模型预测logP

https://blog.csdn.net/u012325865/article/details/102475761

RDKit | 基于RDKit和scikit-learn的KNN模型预测Ames的致突变性

https://blog.csdn.net/u012325865/article/details/102706596

DGL | 基于深度学习框架DGL的分子图初探

DGL | 基于深度图学习框架DGL的分子图生成

DGL | 基于JTNN可视化给定分子的邻居分子

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
RDKit相关文章汇总
RDKit在2000-2006年期间在Rational Discovery开发和使用,用于构建吸收、分布、代谢、代谢、毒性和生物活性的预测模型。2006年6月Rational Discovery被关闭,但该工具包在BSD许可证下作为开源发布。目前,RDKit的开源开发由诺华积极贡献,其中包括诺华捐赠的源代码。
DrugOne
2021/02/01
6400
开源化学信息学工具包(Open Access Cheminformatics Toolkits)
CDK是结构化学信息学和生物信息学的开源Java库。 该项目由Christoph Steinbeck,Egon Willighagen与Jmol和JChemPaint的开发人员Dan Gezelter于2000年发起。迄今为止,它是在科学界广泛支持下开展的最活跃的开源化学信息学项目之一。
DrugOne
2021/02/01
2.6K0
RDKit:化合物亚结构(Substructure)搜索
当一个化合物合成出来之后,化学工作者常常关心的是分子中某一部分(如功能团)的有关信息,因而,亚结构(substructure)检索,从某种角度上讲,对于化学工作者来说是最为重要的手段。
DrugOne
2021/01/28
1.9K0
DGL & RDKit | 基于GCN的多任务分类模型
纽约大学、纽约大学上海分校、AWS上海研究院以及AWS MXNet Science Team共同开源了一个面向图神经网络及图机器学习的全新框架,命名为Deep Graph Library(DGL)。
DrugOne
2021/02/01
2.2K1
Drug Discov Today|化学分子指纹的概念和应用
分子指纹(Molecular fingerprints)可以低计算成本的方式表示大规模化学数据集中化合物的化学(结构、物理化学等)性质。它们在将化学数据集中的分子转换为适合于计算方法的一致输入格式(bit向量或数值)方面发挥着重要作用。在这篇综述中,作者将常见和最先进的分子指纹归纳并分类为8种不同类型(基于字典的、圆形的(circular)、拓扑的、药效团的(pharmacophore)、蛋白质-配体相互作用的、基于形状的、强化的和多种的)。作者还强调了分子指纹在早期药物研发中的应用。因此,本综述为药物研发使用合适的化合物(或配体-蛋白质复合物)指纹的选择提供了指南。
智药邦
2023/02/14
3.2K0
Drug Discov Today|化学分子指纹的概念和应用
JCIM|药物发现的超大型化合物数据集概述
2022年4月14日,美国国家癌症研究所 (NCI) 计算机辅助药物设计研究课题组的Wendy等人在JCIM杂志上发表综述,整理了当前用于药物研发的超大型数据库以及检索技术的情况。
智药邦
2022/06/08
1.4K0
JCIM|药物发现的超大型化合物数据集概述
RDkit&mol2vec :靶标抑制剂活性二分类模型对比
RDKit提供各种功能,如不同的化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),Corina mol2和蛋白质数据库(PDB)。子结构搜索; 标准SMILES; 手性支持;化学转化;化学反应;分子序列化;相似性/多样性选择;二维药效团;分层子图/片段分析; Bemis和Murcko骨架;逆合成组合分析程序(RECAP); 多分子最大共同亚结构;功能图;基于形状的相似性;基于RMSD的分子分子比对;基于形状的对齐;使用Open3-DALIGN算法的无监督分子-分子比对;与PyMOL进行3D可视化集成;功能组过滤;分子描述符库;相似图;机器学习等。
DrugOne
2021/01/29
1.3K0
Nat. Commun. | ClickGen: 一种基于模块化反应和强化学习对可合成化学空间定向探索的生成式AI模型
本文介绍一篇浙江大学药学院侯廷军教授、谢昌谕教授以及碳硅智慧联合于在‌《Nature Communications》上发表的分子生成新方法的论文。该论文提出了一种基于生成式AI的全新药物设计模型ClickGen,该模型能够利用模块化反应(如点击化学)组装分子,并结合强化学习和图像补全技术,确保生成的分子具备高度的多样性、新颖性、靶标高亲和性以及优秀的可合成性。此外,本文还针对ClickGen生成的多聚腺苷二磷酸-核糖聚合酶1(PARP1)配体分子进行了实验验证。由于该模型确保了生成分子的高合成性,并提供了合成路线参考,仅20天内便成功合成并测试了这些新化合物的体外生物活性。在生物活性实验中,两个先导化合物表现出对癌细胞株抗增殖效果、对正常细胞的低毒性,以及对PARP1酶的纳摩尔级抑制活性。该方法有望使得基于AI的自动化实验和分子设计的闭环更进一步。
DrugOne
2024/11/26
5030
Nat. Commun. | ClickGen: 一种基于模块化反应和强化学习对可合成化学空间定向探索的生成式AI模型
RDKit | 基于不同描述符和指纹的机器学习模型预测logP
log P(油水分配系数)是确定化合物是否适合用作药物的最重要属性之一。当前,用于计算机预测log P的大多数可用回归模型都在实验测得的log P值(PHYSPROP数据库)。但是,该数据库中的大多数化合物并不高度代表药物样化学空间。不幸的是,当前缺乏可用于训练更好的预测工具的公开可用的实验log P数据集。
DrugOne
2021/01/28
4.9K0
徐峻|人工智能与药物设计学:新范式探索 (4)
随着信息技术的不断发展,药物设计方法学的新概念、新方法和新思路持续更新,药物发现范式也与时俱进。人工智能作为新工具,已应用于药物发现过程的多个方面,引起了制药行业的高度关注,也带来了对药物发现科学理论和方法学的新思考和新探索。
智药邦
2022/04/13
5480
徐峻|人工智能与药物设计学:新范式探索 (4)
JCIM|深度学习用于血液毒性预测和血液毒性化合物的结构分析
2022年12月6日,中南大学湘雅药学院曹东升教授团队和浙江大学药学院侯廷军教授团队合作在Journal of Chemical Information and Modeling期刊上发表论文“Structural Analysis and Prediction of Hematotoxicity Using Deep Learning Approaches”。
智药邦
2023/02/28
1.5K0
JCIM|深度学习用于血液毒性预测和血液毒性化合物的结构分析
RDKit:化合物骨架分析
新药研发是一项耗时长且耗资巨大的工程,据资料显示由安全性问题与药物代谢动力学性质不良引起新化学实体成药失败的比例高达60%,且这一比例还在逐年升高。代谢稳定性是影响药代动力学性质的主要因素之一,它一般用来描述化合物代谢的速度和程度,也是决定药物小分子生物利用度的一个重要因素。骨架修饰是改变代谢途径、提高代谢稳定性的重要化学结构改造策略之一,通过骨架修饰进行先导化合物优化,能够显著提高先导化合物的代谢稳定性。
DrugOne
2021/02/01
1.8K0
JCIM|VenomPred2.0:基于AI的药物分子毒性预测工具
人工智能和机器学习方法在计算毒理学和药物设计中的应用越来越受欢迎,这一方法在评估化合物安全性、优化ADMET以及满足3R原则(the rules of 3R)等领域被认为非常具有前景。
智药邦
2024/05/08
1.5K3
JCIM|VenomPred2.0:基于AI的药物分子毒性预测工具
Nat. Rev. Drug Discov. | 定量构效关系(QSAR)建模和深度学习在药物发现中的应用
今天为大家介绍的是来自Artem Cherkasov团队的一篇综述。定量构效关系(QSAR)建模是60年前提出的一种方法,并广泛应用于计算机辅助药物设计中。近年来,人工智能技术(尤其是深度学习)、分子数据库的迅速增长和计算能力的显著提升,共同促进了一个新领域的出现,作者称之为“深度QSAR”。自深度QSAR在小分子药物发现领域的首次应用已有十年,这篇综述描述了这一领域的关键进展,包括在分子设计中应用深度生成和强化学习方法、用于合成规划的深度学习模型,以及在基于结构的虚拟筛选中应用深度QSAR模型。文章还关注了量子计算的出现,这一技术有望进一步加速深度QSAR应用,并强调了开源和民主化资源在支持计算机辅助药物设计中的必要性。
DrugOne
2023/12/26
1.5K0
Nat. Rev. Drug Discov. | 定量构效关系(QSAR)建模和深度学习在药物发现中的应用
JCIM|用机器学习预测分子活性,应充分考虑活性悬崖问题
分子性质预测的核心原则之一是相似性原则,但是分子对之间存在活性悬崖的情况(即分子结构相似但是活性却相差巨大的情况)。
智药邦
2023/02/14
1.6K1
JCIM|用机器学习预测分子活性,应充分考虑活性悬崖问题
徐峻|人工智能与药物设计学:新范式探索 (3)
随着信息技术的不断发展,药物设计方法学的新概念、新方法和新思路持续更新,药物发现范式也与时俱进。人工智能作为新工具,已应用于药物发现过程的多个方面,引起了制药行业的高度关注,也带来了对药物发现科学理论和方法学的新思考和新探索。
智药邦
2022/04/13
8130
徐峻|人工智能与药物设计学:新范式探索 (3)
J. Chem. Inf. Model. | 自动监测化学反应的核磁谱图识别算法MatCS
华东理工大学/华东师范大学的李洪林教授/刁妍妍团队在Journal of Chemical Information and Modeling上发表文章:Enhancing Chemical Reaction Monitoring with a Deep Learning Model for NMR Spectra Image Matching to Target Compounds,报道了一个用于自动化学反应监测的深度学习模型MatCS。该模型旨在通过预测目标化合物的SMILES和核磁共振光谱(包括1H NMR和13C NMR)谱图之间的对应关系,实现对化学反应进程的自动监测。
DrugOne
2024/07/16
3820
J. Chem. Inf. Model. | 自动监测化学反应的核磁谱图识别算法MatCS
J. Chem. Inf. Model. | 预测化学反应产率面临的挑战
今天为大家介绍的是来自Varvara Voinarovska团队的一篇论文。这篇论文讨论了器学习(ML)在预测化学领域的高级特性(如产率、化学合成的可行性和最佳反应条件)时面临的挑战。这些挑战来源于预测任务的高维性质以及涉及的众多关键变量,包括反应物、试剂、催化剂、温度和纯化过程等。成功开发出可靠的预测模型不仅有助于优化高通量实验,还可以提升现有的逆合成预测方法,并在该领域内的多种应用中发挥重要作用。
DrugOne
2024/02/23
6140
J. Chem. Inf. Model. | 预测化学反应产率面临的挑战
Drug Discov Today|赛诺菲:机器学习引导的早期小分子药物发现
2022年3月29日,赛诺菲的NikhilPillai等人在Drug Discov Today杂志发表文章,分析和反思了机器学习在临床前小分子药物发现中的多种应用,并简要介绍了机器学习任务中的分子表征方法。
智药邦
2022/04/13
8460
Drug Discov Today|赛诺菲:机器学习引导的早期小分子药物发现
J. Pharm. Anal. | 化学自然语言引导基于扩散的生成式类药分子编辑
扩散模型已成为分子设计与优化中的一种前沿范式。然而,大多数基于扩散的分子生成模型主要聚焦于2D图形或3D几何结构的建模,对分子序列扩散模型的研究相对较少。国际纯粹与应用化学联合会 (IUPAC) 命名系统与化学自然语言更为相似,而非有机化合物的SMILES编码。2024年11月2日发表在Journal of Pharmaceutical Analysis上的研究论文Diffusion-based generative drug-like molecular editing with chemical natural language提出了一种基于IUPAC名称引导的条件扩散模型DiffIUPAC,用于从化学自然语言到化学语言 (SMILES) 的分子编辑。该研究探索了扩散模型的预训练生成性能能否迁移至化学自然语言领域。研究人员开发的DiffIUPAC是一种可控的分子编辑扩散模型,能够将IUPAC名称转换为SMILES字符串。评估结果显示,DiffIUPAC模型在语义规则捕捉方面优于现有方法,成功掌握了两种化学语言的语义规则。为了展示该模型在药物设计中的潜在应用,还进行了官能团编辑、类似物设计和Linker设计的案例研究。
DrugOne
2024/11/23
1670
J. Pharm. Anal. | 化学自然语言引导基于扩散的生成式类药分子编辑
推荐阅读
相关推荐
RDKit相关文章汇总
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档