分子结构优化的精度直接决定了计算化学与分子设计任务的可靠性。研究人员提出了一种基于物理约束黎曼流形的去噪模型(R-DM),用于实现具有化学精度的分子结构优化。不...
蛋白–配体对接是结构生物学与药物发现中的核心问题。尽管近年来出现了大量基于深度学习的对接与共折叠方法,但这些方法在真实应用场景中的泛化能力仍缺乏系统评估。研究人...
研究人员提出了一种基于伪数据(pseudodata)的分子结构生成模型,用于探索真实世界中尚未被实验或数据库记录的未知化学物质。该方法通过从实验质谱谱图中自动构...
从 DNA 序列预测基因表达和功能产物是生物学的核心问题之一。早期模型(如 Enformer、Borzoi 等)在批量数据层面实现了较高精度,但难以处理细胞类型...
多重耐药菌的快速蔓延凸显了新型抗生素的迫切需求。研究人员将小分子高通量筛选(HTS)与深度学习虚拟筛选策略相结合,开发出一种名为 GNEprop 的图神经网络模...
在 Enamine 多样性数据集和 ChEMBL 数据集上,SynLlama 的重建率显著高于 SynNet、ChemProjector 等方法,并能在仅用更少...
计算机辅助药物设计依赖于准确的评分函数来预测蛋白–配体相互作用的结合亲和力。然而,PDBbind 数据库与评分函数比较评估基准(CASF)之间存在严重的训练–测...
实验数据稀缺且偏倚严重,易导致模型过拟合。为此,研究人员普遍采用“预训练 + 微调”策略:先在大规模配体数据上学习化学规律,再在特定蛋白–配体集合上细化训练。
AE 将高维分子数据压缩到低维潜空间并重构,可用于分子分类、化学空间探索与反应坐标提取。其变体(如 VAE、β-VAE)通过引入先验与物理约束获得更具解释性的潜...
酶是生命的分子机器,其功能核心在于底物特异性——即识别并选择性作用于特定底物的能力。这种特异性来源于酶活性位点的三维结构与复杂的过渡态构象。然而,数百万已知酶仍...
在药物研发领域,药物代谢预测始终是药代动力学研究的核心难题。一方面,酶促反应的机制复杂性让实验解析成本居高不下;另一方面,现有计算工具要么局限于单一预测任务,要...
本文介绍一篇由浙江大学药学院侯廷军教授与谢昌谕教授团队联合发表在 Chemical Reviews 上的综述文章——《Graph Neural Networks...
设想一下,当 AI 系统预测“某种药物可能治疗某种疾病”时,它不仅给出结果,还能同时展示背后的逻辑路径——涉及的分子、关系和机制。这听起来像是科研人员梦寐以求的...
翻译后修饰(PTMs)是蛋白质功能的重要调控因子,其受扰动是错义变异导致疾病的重要机制。深度学习能够帮助预测PTM位点并识别受变异影响的PTM,但受限于缺乏大规...
人工智能模型正借助语言模型和分子扰动策略,尝试解决RNA药物研发领域长期存在的数据稀缺难题。
AI的预测能力也取决于训练数据。如果训练数据存在偏差或不完整,其预测结果可能不可靠。例如,如果训练数据过度依赖于某一群体(如西方白人男性),那么在其他人群中应用...
在 QM9 数据集上,LDM-3DG 的训练时间从 EDM 的 26.7小时 降至 2.2小时,快了12倍。在更大的 Drugs 数据集上,差距更加惊人——从 ...
在AI驱动药物发现的浪潮中,靶标感知分子生成模型被寄予厚望——它们理论上能精准锚定蛋白质靶标特征,高效生成具有潜在活性的新型化合物,大幅缩短早期药物研发周期。但...
SMILES 枚举对比学习提供了通用的数据增强范式。在其他涉及多重表示的领域,如蛋白质序列、化学反应、知识图谱等,类似策略都可能发挥作用。核心思想是利用数据的对...