首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用RDKit计算sdf文件和结构微笑之间的田本相似度?

RDKit是一个用于化学信息学的开源软件包,可以用于计算化学结构之间的相似度。田本相似度(Tanimoto similarity)是一种常用的相似度度量方法,用于比较化学结构的相似性。

要使用RDKit计算sdf文件和结构之间的田本相似度,可以按照以下步骤进行:

  1. 导入RDKit库和相关模块:
代码语言:txt
复制
from rdkit import Chem
from rdkit import DataStructs
  1. 读取sdf文件并转换为分子对象:
代码语言:txt
复制
suppl = Chem.SDMolSupplier('input.sdf')
molecules = [mol for mol in suppl if mol is not None]
  1. 计算分子的指纹(fingerprint):
代码语言:txt
复制
fps = [Chem.RDKFingerprint(mol) for mol in molecules]
  1. 计算田本相似度:
代码语言:txt
复制
similarity_matrix = []
for i in range(len(molecules)):
    similarities = []
    for j in range(len(molecules)):
        similarity = DataStructs.FingerprintSimilarity(fps[i], fps[j])
        similarities.append(similarity)
    similarity_matrix.append(similarities)
  1. 输出田本相似度矩阵:
代码语言:txt
复制
for i in range(len(molecules)):
    for j in range(len(molecules)):
        print(f"Molecule {i+1} and Molecule {j+1}: {similarity_matrix[i][j]}")

这样就可以使用RDKit计算sdf文件中分子结构之间的田本相似度了。

RDKit是一个功能强大的化学信息学工具,可以广泛应用于药物设计、化学数据分析等领域。腾讯云提供了云计算平台和相关产品,可以帮助用户进行大规模的计算和数据处理。具体推荐的腾讯云产品和产品介绍链接地址可以参考腾讯云官方网站或咨询腾讯云客服人员。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

RDKit相关文章汇总

RDKit简介: ---- RDKit在2000-2006年期间在Rational Discovery开发使用,用于构建吸收、分布、代谢、代谢、毒性生物活性预测模型。...RDKit提供各种功能,如不同化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),Corina mol2蛋白质数据库(PDB...;功能图;基于形状相似性;基于RMSD分子分子比对;基于形状对齐;使用Open3-DALIGN算法无监督分子-分子比对;与PyMOL进行3D可视化集成;功能组过滤;分子描述符库;相似图;机器学习等等...描述符计算及可视化: RDKit toolkit实战:描述符计算及可视化 RDKit分子间RMSD计算RDKit计算不同分子或构象之间RMSD RDKit计算不同小分子构象之间RMSD...RMSD:通过旋转计算两个分子间最小rmsd RDKit分子格式转换sdf转smiles: 基于RDKitPython脚本:SDF格式转SMILES格式 RDKit小分子聚类: 聚类小分子数据集

55540

RDKit | 化学信息学与AI(专辑)

内容涵盖了基于RDKitPython3分子读写、化合物分子指纹分子描述符计算、化合物2D/2D比对、化合物相似性搜索、化合物骨架分析结构搜索、RMSD计算与构象生成优化、分子相似图与聚类分析...2 RDKit特点 商业友好型BSD许可证 核心数据结构算法由C ++编写 使用Boost.Python生成Python 3.x包装器 用SWIG生成JavaC#包装器 2D3D分子操作 机器学习与深度学习分子指纹分子描述符生成...RDKit提供各种功能,如不同化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),mol2蛋白质结构文件(PDB);子结构搜索...; 多分子最大共同亚结构;功能图;基于形状相似性;基于RMSD分子比对;基于形状对齐;使用Open3-DALIGN算法无监督分子-分子比对;与PyMOL进行3D可视化集成;功能基团过滤;分子描述符库.../102515273 RDKit计算不同分子或构象之间RMSD https://blog.csdn.net/u012325865/article/details/78578658 基于RDKit相似性与分子图

2.1K61
  • 开源化学信息学工具包(Open Access Cheminformatics Toolkits)

    RDKit提供各种功能,如不同化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),Corina mol2蛋白质数据库(PDB...PNG,SVGPDF文件 分子反应描述 芳香化kekulization 规范(异构)SMILES计算 分子反应精确结构匹配 支持匹配突出显示 互变异构体共振结构匹配 计算分子反应指纹...其中一些功能指纹是使用Open BabelRDKit派生使用MOPAC,ChemoPy计算大量3D分子描述符。...该软件包第一个版本于2008年出版。它包含用于化合物之间二维结构相似性比较功能,针对化合物数据库相似性搜索,用于聚类整个化合物库功能,以及聚类结果可视化。...Chemkit提供主要功能包括I/O化学文件格式(pdb、cml、cjson、cube、fhz、fps、inchi、mol、mol2、sdf、smi等),访问Web资源,计算各种分子描述符,自动原子分型拓扑构建以及基于

    2.2K31

    DGL & RDKit | 基于GCN多任务分类模型

    用于图上深度学习,支持PyTorch、MXNet等多种深度学习框架。 RDKit RDKit 是一款开源化学信息学与机器学习工具包,提供C++ python API 接口。...RDKit提供各种功能,如不同化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),Corina mol2蛋白质数据库(PDB...子结构搜索; 标准SMILES; 手性支持;化学转化;化学反应;分子序列化;相似性/多样性选择;二维药效团;分层子图/片段分析; BemisMurcko骨架;逆合成组合分析程序(RECAP); 多分子最大共同亚结构...;功能图;基于形状相似性;基于RMSD分子分子比对;基于形状对齐;使用Open3-DALIGN算法无监督分子-分子比对;与PyMOL进行3D可视化集成;功能组过滤;分子描述符库;相似图;机器学习等等...,且均优化过或在计算中引用由C或C++写函数,因此速度非常快,特别是可以直接计算 dssp定义蛋白质二级结构而无需提前安装 dssp (利用Biopython计算二级结构需要先装dssp);(2)

    2K60

    RDKit:化合物亚结构(Substructure)搜索

    当一个化合物合成出来之后,化学工作者常常关心是分子中某一部分(如功能团)有关信息,因而,亚结构(substructure)检索,从某种角度上讲,对于化学工作者来说是最为重要手段。...RDKit提供各种功能,如不同化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),Corina mol2蛋白质数据库(PDB...子结构搜索; 标准SMILES; 手性支持;化学转化;化学反应;分子序列化;相似性/多样性选择;二维药效团;分层子图/片段分析; BemisMurcko骨架;逆合成组合分析程序(RECAP); 多分子最大共同亚结构...;功能图;基于形状相似性;基于RMSD分子分子比对;基于形状对齐;使用Open3-DALIGN算法无监督分子-分子比对;与PyMOL进行3D可视化集成;功能组过滤;分子描述符库;相似图;机器学习等.../usr/bin/python3 from rdkit.Chem import AllChem as ch from rdkit.Chem import Draw as d #载入分子库 suppl

    1.6K31

    RDkit&mol2vec :靶标抑制剂活性二分类模型对比

    RDKit RDKit是用C ++Python编写化学信息学机器学习工具包。...RDKit提供各种功能,如不同化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),Corina mol2蛋白质数据库(PDB...子结构搜索; 标准SMILES; 手性支持;化学转化;化学反应;分子序列化;相似性/多样性选择;二维药效团;分层子图/片段分析; BemisMurcko骨架;逆合成组合分析程序(RECAP); 多分子最大共同亚结构...;功能图;基于形状相似性;基于RMSD分子分子比对;基于形状对齐;使用Open3-DALIGN算法无监督分子-分子比对;与PyMOL进行3D可视化集成;功能组过滤;分子描述符库;相似图;机器学习等...mol2vec安装 pip install git+https://github.com/samoturk/mol2vec RDkit&mol2vec 分别采用RDkit计算分子指纹mol2vec产生分子矢量作为输入特征

    1.2K50

    Nucleic Acids Research | PROTAC-DB:PROTACs在线数据库

    使用RDKIT工具包(http://www.rdkit.org)ALOGPS计算了与类药物相关10个重要理化性质,包括分子量、精确质量、分配系数(LogP)、水溶性(Log)、重原子计数、环计数、氢键受体计数...对于基于结构搜索,用户可以在ChemDoodle编辑器中输入SMILES字符串、上传MOL/SDF文件或绘制分子草图。...在相似性搜索中,利用类FCFP指纹中位向量Morgan指纹来计算两个分子之间Tanimoto相似。可以选择数据集(PROTAC、弹头、E3配体或Linker)进行搜索。...Summary:如图3A所示,summary选项卡显示了PROTAC、弹头、LinkerE3配体结构。为了方便用户,还增加了相似搜索工具,以便在数据库中查找该PROTAC相似化合物。...这里相似性阈值是≥0.80。化合物MOLSDF文件也可在其中下载。此外,如果用户对弹头、Linker或E3配体感兴趣,可以点击“详细信息”按钮打开相应详细信息页面以获取更多信息。

    2.7K41

    基于AI新药研发!⛵

    ② 通过向量检索引擎,对化合物分子之间关系分析:子结构检索、相似性检索、重复结构检索。...Milvus,即可应用不同计算方式完成对化合物相似检索』、『子结构检索』『超结构检索』。...指纹距离度量与相似计算 Milvus工具本身支持各种常用相似计算指标,包括『欧氏距离』、『内积』、『汉明距离』『Jaccard距离』等。...因为指纹是二值型数据向量,我们可以选择 Jaccard/Substructure(子结构)/Superstructure(超结构) 距离计算相似。...我们定义以下表示: 图片 根据以上定义,化学式指纹之间距离相似度度量计算,可以如下表中描述来计算: 图片 参考资料 AI in small-molecule drug discovery: a coming

    66481

    Milvus 赋能 AI 药物研发

    | 系统概览 MolSearch 系统中运用虚拟化合物筛选技术,首先通过 RDKit 工具[3]将化合物分子化学式转换为化学式指纹 (Chemical Fingerprint),就是一组特征向量,然后通过计算这些向量之间距离来分析化合物分子之间相似性...化学指纹生成 化学指纹通常用来做结构检索相似检索,如下图所示,指纹是 (1/0) 位表示有序列表,每一位代表化学结构中例如指定元素,分子片段等存在。...化合物检索 通过将生成向量导入 Milvus 建立化合物库,根据不同计算方式可以实现对化合物相似检索、子结构检索结构检索。...化学指纹计算 Milvus 支持各种常用相似计算指标,包括欧氏距离、内积、汉明距离杰卡德距离等。...针对二值型数据 MolSearch 系统选择 Jaccard/Substructure/Superstructure 距离计算相似。 ?

    1K10

    RDKit | 基于Murcko骨架聚类化合物库

    化合物多样性评估 一种方法是使用合适指纹技术将化合物矢量化并评估他们之间距离。这种方法经常被使用,但是对于人类很难直观地理解化合物之间距离。...基于Murcko骨架,分子大致聚集在化合物骨架中,并且每个簇中顶部化合物都作为候选化合物。此方法非常符合人类直觉,因此可以预期人将通过查看候选化合物列表来自动缩小化合物范围。...Murcko骨架 Murcko骨架通过从化合物中去除多余侧链并仅表达连接它们“环结构“连接子”,可以执行更简单化合物表达。 ?...Murcko骨架生成 基于Murcko骨架聚类化合物库 导入库 import numpy as np from rdkit import Chem from rdkit.Chem import Draw...= Chem.SDMolSupplier("Enamine_Premium_processed.sdf") ### load from multisdfile mol_list = [ mol for

    2.4K50

    FindKey-CADD-交流群-半月结-No.1-2021.03.31

    Q1:没有编程基础,就能够切割从zinc数据库下载smi格式分子文件方法 A:1,rdkit+Knime;2,随便一个文本编辑器,打开,编辑就可以,用记事打开 剪切出来-再粘贴到新文件就好了...就是我配体小分子是手性,但是对接,模拟,我没法确定它一定是r还是s A:初始构象弄好,然后再计算就好了,一般都是这样做手性,约束不能保证完全是R型,先换成手性再加氢,薛定谔换手性, ?...mol2文件中原子编号和顺序不一样,现在想把同一个配体不同坐标mol2文件原子编号和顺序mapping一致,大家有什么好办法吗?...比如某部位是直,我让它变弯 A:Avogadro,Pymol也可以,一些在线免费网站也很多 用pymol,自己设置a螺旋b折叠 Q8:柔性对接“全柔性“对接有什么区别 A:全柔对接 只是个别活性位点氨基酸柔性...A:分子描述符,1.rdkit;2.openbabel;3CDK;4:padel descriptor;5,pydpi Q12:如何把sdf格式小分子转换成pdb格式 A:openbabel Q13:

    98920

    . | 自动监测化学反应核磁谱图识别算法MatCS

    随着化学合成技术朝着智能化连续性方向发展,需要高效计算机辅助结构解析 (CASE) 技术来取代耗时耗力的人工分析。...然而,目前CASE方法主要从光谱数据推导精确化学结构,存在准确低、计算成本高依赖化学数据库等缺点。在现实合成反应中,研究人员首先关注是是否获得目标产物,而并非精确解析获得化合物。...在这项工作中,使用RDKit对来自PubChemGDB-13数据库分子SMILES进行过滤处理,以排除无法解析SMILES、重复项、含有金属离子、卤素或带电离子分子,同时移除具有超过3个芳香环分子...testdiff负样本来自结构差异显著化合物,Morgan指纹相似接近0;而testsim负样本则选择与真实分子指纹相似最高不匹配谱图,以测试模型区分高度相似结构能力。...梓静、戴妍为研究共同第一作者,参与工作还有胡枫、沈子豪、徐洪玲、张红文、徐津航、胡玉婷、邓文帅等同学,通讯作者为李洪林教授刁妍妍老师。

    16310

    RDKit:化合物骨架分析

    药物分子由药效团结构骨架构成,由苗头化合物演化为先导化合物,继而通过先导化合物优化成为候选化合物过程,也是保持药效团、变换分子结构、修饰基因边链过程。...骨架迁越 骨架迁越最早是以计算技术引入到新药研发,其目的是在已知数据库中,寻找与苗头化合物完全不同拓扑骨架,但仍保持原有的生物活性。...也就是从已知活性分子结构出发,通过计算化学方法发现新拓扑结构活性分子。...由苗头化合物到先导化合物演化过程,以及先导化合物优化到候选药物,大都涉及了骨架变换,骨架迁越改变已有活性分子母体结构,目的有以下几种: (1)将亲脂性骨架用极性骨架替换,可增加药物溶解; (...---- 基于RDKit骨架分析 导入库 from rdkit importChem from rdkit.ChemimportDraw from rdkit.Chem.ScaffoldsimportMurckoScaffold

    1.6K50

    JCIM|深度学习用于血液毒性预测血液毒性化合物结构分析

    (chemically advanced template search, CATS)特征,一种计算原子对之间距离药效团指纹。...研究使用Murcko骨架核碳骨架探索了血液毒性数据集化学多样性。...相似ADRF模型中性能最好结构指纹RDKit指纹。...值得注意是,尽管AD以外AUC值都有所下降,但作者预测模型仍然可以获得66.7%至73.5%之间值,这表明该模型对于AD以外化合物仍然具有一定可预测性,并且平均相似高于0.57化合物更有可能具有可靠预测...4 结论 研究收集了由2383个血液毒性非血液毒性分子组成数据集,并使用7种机器学习算法9种不同分子表示组合构建了一系列分类模型。

    1.2K10
    领券