前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >有机小分子生物活性数据(Pubchem)

有机小分子生物活性数据(Pubchem)

作者头像
专利数据商
修改于 2020-04-01 11:01:53
修改于 2020-04-01 11:01:53
2.2K0
举报
文章被收录于专栏:专利数据库专利数据库

PubChem,即有机小分子生物活性数据,是一种化学模组的数据库,由美国国家健康研究院( US National Institutes of Health,NIH)支持,美国国家生物技术信息中心负责维护。

PubChem数据库包括 3个子数据库: PubChem BioAssay 库用于存储生化实验数据,实验数据主要来自高通量筛选实验和科技文献; PubChem Compound 库用于存储整理后的化合物化学结构信息; PubChem Substance 用于存储机构和个人上传的化合物原始数据

提供2D Structure,3D Conformer,SDF,ASNT,JSON,XML格式原始数据下载

包含

InChIInChI Key

XLOGP3 AA

精确分子量 Exact Mass

分子式 Molecular Formula

摩尔分子量 Molecular Weight

Canonical SMILES

ISO SMILES

TPSA

单一同位素重量 Monoisotopic Weight

总电荷 Total Charge

重原子数 Heavy Atom Count

定义原子立体中心计数 Defined Atom Stereo Center Count

未定义原子立体中心计数 Undefined Atom Stereo Center Count

定义键立体中心计数 Defined Bond Stereo Center Count

未定义键立体中心计数 Undefined Bond Stereo Center Count

同位素原子计数 Isotope Atom Count

组件计数 Component Count

自动计数 Auto Count

规范化 Canonicalized:1

复杂性 Complexity

氢键受体计数 Hydrogen Bond Acceptor Count

氢键供体计数 Hydrogen Bond Donor Count

旋转键计数 Rotatable Bond Count

子密钥 Subs key

坐标类型 Coordinate Type

键注释 Bond Annotations

http://www.pubchem.cn/

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
暂无评论
推荐阅读
编辑精选文章
换一批
R语言中的分子描述的计算
学习药化的同志们应该都了解化合物分子的特征描述有很多计算软件,今天我们来给大家展示下在R语言中如何实现分子特征描述的计算。主要以MACCS分子指纹的实现作为案例。
一粒沙
2019/07/31
2.1K0
SMILES & InChI | 化学结构的线性表示法
可以将一个分子视为一个以原子为节点,结合为边的图。图形可以表示一个原子如何连接到另一个原子。如果已知原子之间的键数,则可以在以后添加氢原子,因此在计算机上表示分子时通常会省略氢原子。
DrugAI
2021/02/01
4K0
J Pharm Anal|化学自然语言引导基于扩散的生成式类药分子编辑
扩散模型已成为分子设计与优化中的一种前沿范式。然而,大多数基于扩散的分子生成模型主要聚焦于2D图形或3D几何结构的建模,对分子序列扩散模型的研究相对较少。国际纯粹与应用化学联合会 (IUPAC) 命名系统与化学自然语言更为相似,而非有机化合物的SMILES编码。
智药邦
2024/12/30
1620
J Pharm Anal|化学自然语言引导基于扩散的生成式类药分子编辑
Drug Discov Today|化学分子指纹的概念和应用
分子指纹(Molecular fingerprints)可以低计算成本的方式表示大规模化学数据集中化合物的化学(结构、物理化学等)性质。它们在将化学数据集中的分子转换为适合于计算方法的一致输入格式(bit向量或数值)方面发挥着重要作用。在这篇综述中,作者将常见和最先进的分子指纹归纳并分类为8种不同类型(基于字典的、圆形的(circular)、拓扑的、药效团的(pharmacophore)、蛋白质-配体相互作用的、基于形状的、强化的和多种的)。作者还强调了分子指纹在早期药物研发中的应用。因此,本综述为药物研发使用合适的化合物(或配体-蛋白质复合物)指纹的选择提供了指南。
智药邦
2023/02/14
3K0
Drug Discov Today|化学分子指纹的概念和应用
J. Pharm. Anal. | 化学自然语言引导基于扩散的生成式类药分子编辑
扩散模型已成为分子设计与优化中的一种前沿范式。然而,大多数基于扩散的分子生成模型主要聚焦于2D图形或3D几何结构的建模,对分子序列扩散模型的研究相对较少。国际纯粹与应用化学联合会 (IUPAC) 命名系统与化学自然语言更为相似,而非有机化合物的SMILES编码。2024年11月2日发表在Journal of Pharmaceutical Analysis上的研究论文Diffusion-based generative drug-like molecular editing with chemical natural language提出了一种基于IUPAC名称引导的条件扩散模型DiffIUPAC,用于从化学自然语言到化学语言 (SMILES) 的分子编辑。该研究探索了扩散模型的预训练生成性能能否迁移至化学自然语言领域。研究人员开发的DiffIUPAC是一种可控的分子编辑扩散模型,能够将IUPAC名称转换为SMILES字符串。评估结果显示,DiffIUPAC模型在语义规则捕捉方面优于现有方法,成功掌握了两种化学语言的语义规则。为了展示该模型在药物设计中的潜在应用,还进行了官能团编辑、类似物设计和Linker设计的案例研究。
DrugAI
2024/11/23
1290
J. Pharm. Anal. | 化学自然语言引导基于扩散的生成式类药分子编辑
Nucleic Acids Research | PROTAC-DB:PROTACs在线数据库
今天给大家介绍的是浙江大学侯廷军教授团队发表在Nucleic Acids Research上的一篇文章“PROTAC-DB:an online database of PROTACs”。蛋白水解靶向嵌合体(PROTACs)是一种通过泛素-蛋白酶体系统选择性降解靶蛋白的新型治疗技术,具有传统抑制策略无法比拟的优势。目前PROTAC的设计仍然是一个巨大的挑战,为了对PROTACs进行合理设计,本文提出了一个基于Web的开放式数据库PROTAC-DB,它集成了PROTACs的结构信息和实验数据。目前,PROTAC-DB已经囊括了1662个PROTAC、202个弹头(靶向目标蛋白质的小分子)、65个E3配体(能够招募E3连接酶的小分子)和806个Linker以及它们的化学结构、生物活性和理化性质。其中,PROTAC-DB详细提供了弹头和E3配体的生物活性以及PROTAC的降解能力、结合亲和力和细胞活性。PROTAC-DB可以通过两种常用的搜索方法进行查询:基于文本的(靶点名称、化合物名称或ID)和基于结构的。
DrugAI
2021/02/01
3.1K0
Nucleic Acids Research | PROTAC-DB:PROTACs在线数据库
Nature子刊|华中师范大学杨光富/王凡团队提出DigFrag,用AI精准分割分子片段,并生成44个药物/农药分子
过去几十年,基于片段的药物发现 (FBDD) 通过识别与靶标蛋白有微弱相互作用的小分子片段,并优化这些片段的结构信息,可以开发出活性更高的先导化合物,在新药研发中发挥了重要作用。
智药邦
2024/12/19
3740
Nature子刊|华中师范大学杨光富/王凡团队提出DigFrag,用AI精准分割分子片段,并生成44个药物/农药分子
JCIM|用机器学习预测分子活性,应充分考虑活性悬崖问题
分子性质预测的核心原则之一是相似性原则,但是分子对之间存在活性悬崖的情况(即分子结构相似但是活性却相差巨大的情况)。
智药邦
2023/02/14
1.5K1
JCIM|用机器学习预测分子活性,应充分考虑活性悬崖问题
蛋白质组学第10期 定量方法介绍
知识回顾定量蛋白质组学一、无标定量(相对定量)1.概念2.原理参考文献3.理论基础方法一方法二4.流程5.特点二、有标定量1.概念2.原理3.种类4. ITRAQ1)参考文献2)原理3)ITRAQ4)实验流程5)峰谱结果6)特点5、SILAC1)基本原理和流程2)参考文献3)优势
生信技能树
2019/09/12
5.9K0
蛋白质组学第10期 定量方法介绍
使用python爬取pubchem药物分子数据
所以 sid cid 和aid其实都是一些化合物的id,我们可以通过请求这个id来获得与其对应的属性:
Tom2Code
2024/01/26
8220
使用python爬取pubchem药物分子数据
稳定同位素——如何玩转质谱内标定量 - MedChemExpress
质谱分析具有灵敏度高、样品用量少、分析速度快、分离和鉴定同时进行等优点。随着质谱定量检测技术的广泛发展,稳定同位素类化合物作为内标定量 (Stable Isotope-Labeled Internal Standard,简称 SIL-IS) 目前已被公认为是质谱定量分析领域好的选择。因为稳定同位素类化合物与被分析物具有几乎完全相同的分子结构 (图 1)、化学性质、色谱和质谱行为,可以有效地消除电离变化和基质效应[1],因而受到越来越多科研人员的推崇,广泛用于临床医学研究及生物医学、环境科学、食品检测等领域。
MedChemExpress
2022/12/26
5430
稳定同位素——如何玩转质谱内标定量 - MedChemExpress
Nat Commun|语言模型可以学习复杂的分子分布
2022年6月7日,来自多伦多大学计算机科学系的Daniel Flam-Shepherd等人在Nat Commun发表研究工作,研究为分子的深度生成模型引入了三个复杂的建模任务来测试化学语言模型的能力,结果显示语言模型是可以学习任何复杂分子分布的非常强大的生成模型。
智药邦
2022/11/16
4120
Nat Commun|语言模型可以学习复杂的分子分布
三篇Nature子刊谱写分子世界模型三部曲|ImageMol,VideoMol,SketchMol
随着人工智能从大语言模型(LLM)向世界模型(world model)的进一步探索,基于分子图像的“分子世界模型”,正成为革新药物研发流程的关键引擎。近几年,湖南大学DrugAI实验室提出了分子图像系列世界模型ImageMol(NMI 2022),Video Mol(NC 2024),SketchMol(NMI 2025),以新颖的分子视觉思路为药物发现带来了革命性突破。
智药邦
2025/02/25
1220
三篇Nature子刊谱写分子世界模型三部曲|ImageMol,VideoMol,SketchMol
Nat. Mach. Intell. | MolCLR:一个用于分子表征学习的自监督框架
今天介绍的是卡内基梅隆大学化学工程系的Amir Barati Farimani 教授最新发表在 Nature Machine Intelligence上的文章 ”Molecular contrastive learning of representations via graph neural networks”. 该文提出一种自监督的图神经网络框架MolCLR,利用大量无监督的标签进行自监督学习,有效缓解了因为数据标记有限而阻碍将分子机器学习推广到巨大的化学空间的难题。同时,本文提出了三种全新的分子图的增强方法:原子屏蔽、键删除以及子图删除,所提的分子图增强方法保证了增强时同一分子的一致性最大化以及不同分子一致性的最小化。实验表明,MolCLR 大大改善了 GNN 在各种分子特性基准上的表现。
DrugAI
2022/03/25
4950
Nat. Mach. Intell. | MolCLR:一个用于分子表征学习的自监督框架
BMC Bioinform | 拓扑增强的分子图表示用于抗乳腺癌药物的筛选
2022年9月19日,北京邮电大学傅湘玲团队在BMC Bioinformatics上发表文章。作者提出了ABCD-GGNN(Anti-Breast Cancer Drug selection method utilizing Gated Graph Neural Networks),一种使用门控图神经网络(GGNN)架构来筛选抗乳腺癌药物的新型算法。ABCD-GGNN通过每个不同化合物的原子描述符构建原子级图,可以拓扑地学习候选药物的隐式结构和子结构特征,然后将表示与显式离散分子描述符集成,生成分子级表示。因此,ABCD-GGNN的表示可以归纳地预测ERα、药代动力学特性和每种候选药物的安全性。
智药邦
2022/11/16
5450
BMC Bioinform | 拓扑增强的分子图表示用于抗乳腺癌药物的筛选
Commun Chem|分子切分是基于人工智能的药物开发途径中的关键步骤
2024年2月1日,由南通大学智能信息研究中心Med-AI实验室负责人王理教授组织撰写,博士生邵劲松为第一作者的题为Molecular fragmentation as a crucial step in the AI-based drug development pathway的综述发表在Communications Chemistry上。
智药邦
2024/03/05
2970
Commun Chem|分子切分是基于人工智能的药物开发途径中的关键步骤
李洪林团队发布分子切割算法MacFrag快速生成高质量药物片段
分子片段在药物研发中具有重要作用,如通过基于片段的从头药物设计获得高活性化合物、通过基于分子片段的骨架跃迁获得新颖结构。将化合物按照预先定义的规则进行拆分,是获得分子片段的有效途径。然而,作为基础工具,分子片段化方法的创新研究近年来并未引起足够的重视。
DrugAI
2023/02/17
1.2K0
李洪林团队发布分子切割算法MacFrag快速生成高质量药物片段
耶鲁大学提出分子语言模型MolLM,结合生物医学文本与分子的二维和三维表示
目前用于分子和文本联合表示的深度学习模型主要依赖于一维或二维分子格式,而忽略了提供有价值的物理见解的重要三维结构信息,因此限制了模型在广泛的模态范围内的多功能性和适应性。相反,专注于明确的三维表示的有限研究往往忽略了生物医学领域内的文本数据。因此,将二维和三维分子信息以及生物医学文本相结合的分子表示学习模型仍十分缺乏。
智药邦
2024/08/07
2170
耶鲁大学提出分子语言模型MolLM,结合生物医学文本与分子的二维和三维表示
Science|类药有机分子的快速自动化组装
2022年2月8日,Nature杂志发表文章Automated iterative Csp3-C bond formation,介绍了一种利用TIDA-硼酸盐连接物自动组装有机分子的方法。
智药邦
2022/03/04
3090
Science|类药有机分子的快速自动化组装
Nat. Rev. Chem. | 药物发现中的分子变色龙
今天为大家介绍的是来自Jan Kihlberg团队的一篇论文。分子变色龙具有一种灵活性,使它们能够根据环境的属性动态地遮蔽或暴露极性功能团。尽管分子变色龙的概念早在1970年就已引入,但自2010年代以来,随着药物发现越来越多地关注新的化学方式,对它们的兴趣显著增长。这些新的化学方式包括环状肽、大环和蛋白水解靶向嵌合体,它们都位于远离传统小分子药物的化学空间。药物的口服吸收需要细胞渗透性和水溶性。将这些属性以及强效的靶标结合引入到更大的新方式中,比对传统小分子药物来说是一个更加艰巨的任务。变色龙适应不同环境的能力可能对成功至关重要。
DrugAI
2024/02/23
4160
Nat. Rev. Chem. | 药物发现中的分子变色龙
推荐阅读
相关推荐
R语言中的分子描述的计算
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档