首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展,提供“原创、专业、实例”的解读分享。
专栏成员
1398
文章
899537
阅读量
127
订阅数
J. Am. Chem. Soc. | 图神经网络驱动的隐式溶剂模型,实现有机溶剂中小分子构象的极速解析
理解和操控分子在不同溶剂环境中的动态行为,是药物发现和有机合成领域中的重要研究方向。分子动力学(MD)模拟通过显式地加入溶剂分子,被认为是在给定力场精度下计算这类构象集合的“金标准”,它能够补充实验发现并支持对实验结果的解释。然而,传统方法往往面临计算成本高(显式溶剂)或精度不高(隐式溶剂)的问题。该研究展示了如何利用基于图神经网络(GNN)的隐式溶剂方法(GNNIS)快速计算小分子在39种常见有机溶剂中的构象集合,并高精度地重现显式溶剂模拟结果。该研究通过核磁共振(NMR)实验对该方法进行了验证,从而识别出对实验可观测量贡献最大的构象。该方法将准确预测构象集合所需的时间从几天缩短至几分钟,同时预测结果与实验值的误差控制在一个k BT以内。
DrugAI
2025-05-09
800
Nat. Commun. | 经过实验验证!MolE预训练赋能抗生素发现
今天为大家介绍的是来自德国慕尼黑大学Christian L. Müller率领的团队发表的一篇论文。抗生素耐药性正在全球范围内日益严重,这使得常见抗生素的效力不断下降。通过实验方法测试新化学化合物的抗菌活性不仅耗时,而且成本高昂。尽管以化合物为中心的深度学习模型有望加速这一筛选过程,但现有方法通常需要大量专门的训练数据。本研究提出了一种轻量级计算策略用于抗菌素发现,该策略基于MolE(Molecular representation through redundancy reduced Embedding)。MolE是一种自我学习的深度学习框架,它能够利用未标记的化学结构数据自动学习分子的通用特征表示。作者将MolE的表示学习能力与已有的实验验证数据相结合,开发出一个通用预测模型,可以评估化合物的抗菌潜力。作者的模型成功识别了近期发现的生长抑制化合物,这些化合物在结构上与现有抗生素有明显区别。更重要的是,通过这一方法,作者发现并实验证实了三种原本用于人类治疗的药物可以有效抑制金黄色葡萄球菌的生长。这一研究框架为加速抗生素发现提供了一种可行且经济高效的策略,有望帮助解决日益严峻的抗生素耐药性挑战。
DrugAI
2025-05-09
370
Nat. Commun. | 用于荧光分子设计的模块化AI平台
荧光成像在基础研究和临床实践中不可或缺,其发展离不开荧光染料的进步。然而,尽管近年来荧光染料数量迅速增长,许多现有分子仍存在性能不足的问题,其开发过程高度依赖试错实验,受限于微妙的结构-性质关系和复杂的溶剂效应。
DrugAI
2025-05-08
720
Nat. Commun. | CodonTransformer:使用上下文感知神经网络的多物种密码子优化器
今天为大家介绍的是来自法国索邦大学Amir Pandi与Ariel B. Lindner团队的一篇论文。遗传密码具有简并性,这意味着多种不同的DNA序列可以编码同一种蛋白质。然而,为特定生物体优化密码子(codon)使用时,可能的组合数量庞大,使得这一任务极具挑战性。幸运的是,自然界中经过进化优化的序列为机器学习算法提供了宝贵的学习资源。作者提出了CodonTransformer,这是一个多物种深度学习模型,它通过分析来自164个涵盖生命所有领域生物体的超过100万对DNA-蛋白质序列进行训练。借助Transformer架构和创新的序列表示方法(结合了生物体、氨基酸和密码子编码),该模型展现出优秀的上下文理解能力。CodonTransformer能够生成针对特定宿主的DNA序列,这些序列不仅具有接近自然的密码子分布特征,还最大限度地减少了不良的顺式调控元件。研究团队还提出了共享Token表示和编码与对齐多重掩码(STREAM)策略,并开发了一个可定制的开源模型和用户友好的Google Colab界面,使研究人员能够轻松进行密码子优化,为基因设计和合成生物学提供了实用工具。
DrugAI
2025-05-08
900
Nat. Commun. | 跨物种线粒体靶向序列的生成式设计
线粒体在能量生成和代谢中发挥关键作用,因此成为代谢工程和疾病治疗中具有前景的靶点。然而,尽管已知乘客蛋白会影响定位效率,但目前已被系统表征的线粒体定位标签仍然十分有限。为解决这一限制,研究人员利用变分自编码器(Variational Autoencoder, VAE)设计新型的线粒体靶向序列。计算分析显示,所生成肽段中有高达90.14%的比例具有功能性,并呈现出有助于线粒体定位的关键特征。研究人员在四种真核生物中对这些人工肽段进行了验证,并在概念验证实验中展示了其实际应用价值:通过代谢通路的亚细胞定位,3-羟基丙酸的产量得到提升,同时5-氨基乙酰丙酸合酶的递送效率分别提高了1.62倍和4.76倍。此外,研究人员还通过潜在空间插值探索了双重定位序列的进化起源。总体而言,该研究展示了生成式人工智能在基础线粒体生物学研究与实际应用中的潜力。
DrugAI
2025-05-08
910
Nat. Commun. | 蛋白序列建模新方式?贝叶斯流模型生成蛋白优于自回归与离散扩散模型
今天为大家介绍的是来自英国InstaDeep公司的一篇论文。探索广阔且大部分尚未被探索的氨基酸序列领域对于理解复杂蛋白质功能和设计新型治疗蛋白质至关重要。虽然生成式机器学习已经推进了蛋白质序列建模,但现有方法在无条件和条件生成方面都不够精通。在本研究中,作者提出贝叶斯流网络(BFNs)——一个最近引入的生成建模框架,可以解决这些挑战。作者提出了ProtBFN,一个在UniProtKB蛋白质序列数据上训练的6.5亿参数模型,它能生成类自然、多样、结构连贯且新颖的蛋白质序列,明显优于领先的自回归和离散扩散模型。此外,作者在来自观测抗体空间的重链上微调ProtBFN,得到了一个特定于抗体的模型AbBFN,用于评估零样本条件生成能力。研究发现,当应用于预测单个框架或互补决定区域时,AbBFN与特定于抗体的BERT风格模型相比具有竞争力或更优。
DrugAI
2025-05-08
600
Nat. Commun. | 用于功能性RNA分子设计的生成与预测神经网络
RNA是一种高度多功能的分子,已被研究人员设计用于治疗、诊断以及体内信息处理系统等多种应用。然而,RNA序列、结构与功能之间复杂的关系,往往需要对大量候选序列进行广泛的实验筛选。为此,研究人员提出了一种通用且高效的神经网络架构——SANDSTORM(Sequence AND Structure-informed RNA Modeling),该模型利用RNA分子的序列与结构信息,在多种场景下实现功能预测。研究人员还将该预测模型与生成对抗式RNA设计网络(GARDN)相结合,使其能够以目标实验属性为条件,生成多样化的功能性RNA分子。该方法不仅能够设计出在功能上优于训练集中实例或传统热力学算法返回结果的新型序列候选,还可在仅使用384个示例序列的情况下部署。SANDSTORM与GARDN因此成为开发功能增强型RNA分子的强大预测与生成工具。
DrugAI
2025-05-06
990
Nat. Commun. | 预测49种人体组织的基因表达异常,AbExp解释基因表达可变性
今天为大家介绍的是来自德国慕尼黑工业大学的Julien Gagneur团队发表的一篇论文。在医学研究中,基因表达异常(aberrant gene expression)经常与疾病的发生有关,但科学界一直缺乏能够预测个体异常基因表达的有效算法。为解决这一问题,研究人员收集了一个大型数据库,包含了633名个体在49种不同人体组织中的8.2百万个罕见基因变异。现有的基因致病性评分系统CADD和功能缺失预测工具LOFTEE,虽然不是专门用于预测基因表达异常,但也显示出了一定的预测能力,平均准确率在1-1.6%之间。基于这些发现,研究团队开发了新的AbExp模型。该模型考虑了组织特异性,并综合分析了基因表达的变化规律、基因变异对不同形式蛋白质(异构体)的影响,以及基因剪接异常等因素,使预测准确率提升到12%。更重要的是,当研究团队将临床上容易获取的组织样本的基因表达数据纳入分析后,预测准确率又提高了一倍。在英国生物银行的血液特征研究中,使用AbExp的连续性、组织特异性评分替代传统的LOFTEE方法后,不仅提高了发现相关基因的灵敏度,还改善了对人体特征的预测效果。
DrugAI
2025-05-06
1050
Nat. Biotechnol. | 组织特异性蛋白互作图谱助力候选致病基因优先排序
尽管蛋白–蛋白相互作用图谱已取得显著进展,其在不同组织中的特异性仍研究不足。在本研究中,研究人员基于蛋白质共丰度可预测功能关联的前提,整合并分析了来自11个人体组织的7,811个蛋白质组学样本的蛋白丰度数据,构建了一个组织特异性的蛋白相互作用图谱。研究人员发现,该方法不仅能复现已知的蛋白复合物,还能揭示细胞的更大结构组织。稳定蛋白复合物的相互作用在各组织中高度保守,而细胞类型特异性的结构(如突触成分)则是组织间差异的重要驱动因素。
DrugAI
2025-05-05
1010
Chem. Sci. | TRAP: 基于对比学习的高泛化性能T细胞表位免疫原性预测框架
本文介绍一篇由浙江大学侯廷军教授、谢昌谕教授及碳硅智慧近期在化学领域国际知名期刊Chemical Science上发表题为《TRAP: A Contrastive Learning-Enhanced Framework for Robust TCR-pMHC Binding Prediction with Improved Generalizability》的研究论文,第一作者为浙江大学博士研究生戈婧萱。
DrugAI
2025-05-04
1230
J. Cheminform. | 基于活性悬崖感知强化学习的全新药物设计
今天为大家介绍的是来自清华大学和微软研究院发表于Journal of Cheminformatics的一篇论文。在药物发现领域,全新(de novo)分子设计面临的核心挑战之一是结构-活性关系(SAR)的复杂性,尤其是活性悬崖(activity cliffs)现象——微小的分子结构变化可能导致生物活性的显著差异。传统AI模型往往将活性悬崖化合物视为统计异常值,而未能充分利用其在药物设计中的关键价值。针对这一问题,作者提出了活性悬崖感知强化学习框架(ACARL),首次将活性悬崖现象显式整合到AI驱动的分子生成过程中。实验表明,ACARL在多个靶点蛋白的分子生成任务中显著优于现有方法,为药物发现提供了更精准的设计工具。
DrugAI
2025-05-04
1100
Cell. Syst. | 蛋白编码如何学习结构,功能与进化知识?
今天为大家介绍的是来自美国约翰霍普金斯大学Jeffrey J. Gray团队的一篇论文。在蛋白质中,任何位置上的最佳残基是由其结构、进化和功能环境决定的——这很像语言中如何可以从上下文推断出一个词。作者训练了掩码标签预测模型,以学习不同环境中氨基酸残基的表示。作者关注进化和结构灵活性的问题,以及通过预训练和微调获得的上下文编码是否以及如何改进专门环境的表示。从作者学习的表示中采样的序列可以折叠成模板结构,并反映了相关蛋白质中观察到的序列变异。对于灵活的蛋白质,采样序列可以遍历天然序列的完整构象空间,这表明可塑性已经编码在模板结构中。对于蛋白质-蛋白质界面,生成的序列在体外模拟中复制了野生型结合能量,跨越了各种界面和结合强度。对于抗体-抗原界面,微调重现了保守的序列模式,而在一般环境下的预训练改善了超可变H3环的序列恢复。
DrugAI
2025-05-04
1090
Nat. Commun. | 人工智能驱动下的抗胰腺癌协同用药发现
胰腺癌治疗常依赖多药联合方案,但最优组合仍未明确。本研究利用美国国家转化科学促进中心(NCATS)提供的数据,筛选了32种抗癌药物在PANC-1细胞中的496种组合,实验测定其协同或拮抗效应。研究人员(来自NCATS、北卡大学和麻省理工)进一步采用机器学习方法,预测160万种潜在组合中的协同作用。在验证的88组中,51组显示出协同效应,其中图卷积网络命中率最高,随机森林模型精度最佳。本研究不仅展示了机器学习在药物组合筛选中的潜力,还提供了307组经实验验证的协同组合,具有重要的抗胰腺癌应用价值。
DrugAI
2025-05-02
840
Cell. Syst. | 几何深度学习融合多实例学习,解读3D图像预测药物效果
今天为大家介绍的是来自伦敦癌症研究所癌症生物学系Chris Bakal教授带领团队发表的一篇论文。这项研究介绍了一个名为MorphoMIL的创新计算方法,它结合了几何深度学习(geometric deep learning)和基于注意力的多实例学习(attention-based multiple-instance learning),用于分析细胞及其细胞核的三维形态特征。研究团队采用3D点云数据作为输入,不仅能在单个细胞层面捕捉形态特征,还能分析整个细胞群体的特征,同时考虑了细胞群体中个体差异(表型异质性)。他们对超过95,000个黑色素瘤细胞进行了实验,这些细胞分别接受了具有临床意义的药物处理、基因改造,以及影响细胞内部支架结构的处理。该方法不仅能准确预测药物对细胞的影响和细胞状态,还能发现药物带来的细微形态变化,找出与细胞信号活动相关的关键形状特征,并帮助我们理解为什么同一群细胞会表现出不同状态。MorphoMIL不仅表现出色,而且适用于各种不同类型的数据集,这为未来在药物研发中进行大规模、高效的细胞形态分析开辟了新途径。
DrugAI
2025-05-02
540
Nat. Mach. Intell. | 机器学习助力酶最适pH值的智能预测
酶的催化活性与pH之间的关系,尤其是酶在最适pH值(pHopt)下的功能表现,对于生物技术应用至关重要。因此,开发能够预测pHopt的计算方法,将有助于推动酶的发现与设计,不仅能够准确识别在特定pH条件下高效作用的酶,还能够揭示序列与功能之间的关联关系。在本研究中,研究人员提出并评估了多种机器学习方法用于pHopt的预测,进行了超过11,000个模型实例的超参数优化和训练。结果表明,基于语言模型嵌入的模型在pHopt预测方面显著优于其他方法。研究人员进一步构建并发布了EpHod模型,其在预测pHopt方面表现最佳,并已向科研界公开。EpHod能够从酶的序列数据中直接学习与pHopt相关的结构和生物物理特征,包括残基到催化中心的距离以及溶剂分子的可及性。总体而言,EpHod为pHopt预测提供了有前景的进展,并有望加速酶技术的开发。
DrugAI
2025-05-01
840
Nat. Commun. | 覆盖1560种疾病!中科大/阿里巴巴等团队开发综合性生物医学预测和风险评估模型UKB-MDRMF
近日,中国科学技术大学团队、阿里巴巴团队联合美国北卡罗来纳大学团队,通过整合来自英国生物银行的多模态数据,提出了可预测和评估1560种疾病健康风险的综合框架UKB-MDRMF。与单一疾病模型不同,UKB-MDRMF结合了多发病机制,具有更高的预测准确性,在所有疾病类型的风险评估中都表现更好。研究团队利用UKB-MDRMF预测和评估了多种疾病,有效揭示了风险因素和疾病之间的共同和独特联系,为健康和多病机制提供了更广阔的视角。
DrugAI
2025-05-01
1240
Nat. Biotechnol. | 呼吁为生成式AI工具内置生物安全防护机制
在生物技术领域,生成式人工智能(AI)的快速应用带来了巨大的潜力,但同时也引发了严重的安全担忧。用于蛋白质工程、基因组编辑和分子合成的AI模型可能被滥用,用于增强病毒毒性、设计毒素或修改人类胚胎,而伦理和政策讨论仍远远滞后于技术进步。
DrugAI
2025-04-30
840
Nat. Commun. | 机器学习揭秘肺部脂质组学,深入解析污染物暴露效应
今天为大家介绍的是来自California Davis大学Oliver Fiehn团队的一篇论文。了解吸入毒物的区域性反应对理解在空气污染暴露下的肺部疾病发病机制至关重要。作者评估了过敏原致敏和臭氧暴露的联合效应,如何引起小鼠肺部脂质分布的空间差异,这可能导致哮喘中臭氧诱导的加重。作者通过应用已建立的机器学习算法,展示了对高分辨率质谱成像数据进行标准化和分割的能力。有趣的是,作者的分割区域与组织学验证的肺区域重叠,使得能够在生物重复样本间进行区域分析。作者的数据揭示了空间上不同脂质(lipid)丰度(abundance)的差异,支持脂质饱和度在健康肺功能中的潜在作用,并且强调了臭氧暴露后区域性肺脂质分布的性别差异。作者的研究为未来的质谱成像实验提供了框架,这些实验能够在生物重复样本之间进行相对定量,并扩展到多种样本类型,包括人体组织。
DrugAI
2025-04-30
890
Nat. Commun. | 利用群体关联建模增强对多重耐药微生物的诊断
今天为大家介绍的是来自美国杜兰大学医学院的Tony Ye Hu与Wenshu Zheng团队发表的一篇论文。科研人员开发出一种新的群体关联模型(Group Association Model, GAM),用于发现细菌对抗生素产生抗药性的遗传变异特征。这个模型不需要依赖已有的专业知识库,就能准确找出与耐药性相关的基因变异,同时还能减少错误判断细菌对多种药物同时产生抗性的情况。研究团队用这个模型分析了超过7000株结核分枝杆菌(Mycobacterium tuberculosis, Mtb)样本。结果显示,与世界卫生组织(WHO)现有的基于专家经验的突变检测方法相比,GAM在识别各类药物的目标基因时表现相当,但更少出现误判。为了证明模型的通用性,研究人员还分析了近4000株金黄色葡萄球菌(S. aureus)样本,同样取得了很高的预测准确率。通过引入机器学习(ML)技术对GAM进行优化,模型在处理小规模或不完整数据时的预测能力得到进一步提升。研究团队在三个不同地点收集的427个结核分枝杆菌样本中验证了这一发现,结果表明GAM提供的数据比WHO的方法更适合用于机器学习预测。这种结合了GAM和机器学习的新方法有望突破现有耐药性预测技术的限制,为耐药性细菌感染的治疗方案选择提供更好的指导。
DrugAI
2025-04-30
770
Adv. Sci. | “分子螺栓”紧锁冻结新冠病毒刺突蛋白
华东师范大学药学院/人工智能新药创智中心李洪林/李诗良教授团队、香港中文大学(深圳)医学院杜洋研究员团队、武汉大学徐可教授团队联合海军军医大学等于2025年4月26日在国际学术期刊Advanced Science发表题为“Dual-Locking the SARS-CoV-2 Spike Trimer: An Amphipathic Molecular “Bolt” Stabilizes Conserved Druggable Interfaces for Coronavirus Inhibition”的研究论文。
DrugAI
2025-04-28
900
点击加载更多
活动推荐
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档