首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | PSV-PPO 算法:通过实时 SMILES 验证提升强化学习在药物设计中的分子生成有效性与多样性

AI+Drug 文献速递 | PSV-PPO 算法:通过实时 SMILES 验证提升强化学习在药物设计中的分子生成有效性与多样性

作者头像
用户1151118
发布2026-01-08 12:47:31
发布2026-01-08 12:47:31
260
举报

1. Leveraging Partial SMILES Validation Scheme for Enhanced Drug Design in Reinforcement Learning Frameworks

期刊: arXiv 链接: https://arxiv.org/abs/2505.00530v1

简介: 针对强化学习(RL)在基于SMILES的分子生成中存在的灾难性遗忘和无效分子生成问题,论文提出Partial SMILES Validation-PPO(PSV-PPO)算法,通过在自回归生成的每一步引入实时部分SMILES验证机制,动态惩罚无效令牌选择,确保生成分子的有效性并促进探索。方法上结合PSV真值表评估令牌有效性,引入PSV驱动的熵损失、Hellinger距离损失等新损失项,防止模式崩溃并维持多样性。实验在PMO和GuacaMol基准数据集上进行,结果显示PSV-PPO在有效性、多样性和对接分数上优于传统RL方法,如Reinvent和LSTM PPO,尤其在GuacaMol的20个任务中14项得分最高。该研究为SMILES-based分子生成提供了更稳定且高效的RL框架,平衡了探索与利用,提升了生成分子的质量和多样性。


2. TarMGDif: Target-specific Molecular Graphs Generation Based on Diffusion Model

期刊: IEEE Journal of Biomedical and Health Informatics 链接: https://doi.org/10.1109/JBHI.2025.3569105

简介: 论文提出TarMGDif,一种基于离散扩散模型的靶向分子图生成框架,解决现有方法在生成针对特定蛋白质的分子时依赖3D结构信息和高计算成本的问题。该模型通过全局特征编码网络捕捉分子环结构,并引入节点到边的注意力模块建模原子与化学键的依赖关系,结合多数据集预训练和迁移学习生成目标特异性分子。在QM9、ZINC250k、ChEMBL等数据集上的实验表明,TarMGDif生成的分子在有效性、新颖性和多样性上表现优异,尤其在迁移学习至DRD2蛋白数据集时,生成分子与已知抑制剂结构相似且结合亲和力更高。该研究为靶向药物设计提供了高效的分子生成工具。


3. Fate-tox: fragment attention transformer for E(3)-equivariant multi-organ toxicity prediction

期刊: Journal of Cheminformatics 链接: https://doi.org/10.1186/s13321-025-01012-5

简介: 针对多器官毒性预测中结构特征提取和可解释性的挑战,论文提出FATE-Tox框架,结合片段注意力Transformer和E(3)等变图神经网络,利用BRICS、Bemis-Murcko支架和RDKit官能团三种碎片化方法捕捉不同尺度的分子特征,并通过注意力机制可视化潜在毒性基团。在MoleculeNet和TDC的多个毒性数据集(如BBBP、SIDER、DILI)上,FATE-Tox的单任务和多任务学习性能均优于传统机器学习和图神经网络模型,AUROC提升最高达3.01%。案例分析显示,模型能准确识别与血脑屏障穿透性和致癌性相关的关键子结构,为药物开发中的系统性毒性评估提供了可解释的工具。


4. Generating diversity and securing completeness in algorithmic retrosynthesis

期刊: Journal of Cheminformatics 链接: https://doi.org/10.1186/s13321-025-00981-x 代码: https://github.com/Bayer-Group/bayer-retrosynthesis-search

简介: 该论文聚焦于算法逆向合成中生成多样且完整的合成路线问题,提出新的化学多样性评分(CDS)以量化路线多样性,并改进深度优先证明数搜索(DFPN)算法(即DFPN),使其在生成多样路线的同时保证完整性。方法上通过引入节点惩罚机制迫使算法探索不同路径,并结合阈值控制算法(TCA)证明了DFPN的完整性。实验在DUD-E数据库的1000个分子上对比DFPN与蒙特卡洛树搜索(MCTS),结果显示DFPN在多样性评分(CDS)上显著更高,且在中等和长时间搜索中反应步数更少、效率更高。该研究为计算机辅助合成规划提供了更优的搜索算法,平衡了多样性与效率,有助于化学家选择合适的合成路线。


5. Pharmacophore-Conditioned Diffusion Model for Ligand-Based De Novo Drug Design

期刊: arXiv 链接: https://arxiv.org/abs/2505.10545v1

简介: 论文提出PharmaDiff,一种基于药效团条件的扩散模型,用于无需蛋白质结构的3D分子生成,解决传统方法在配体设计中难以精确满足药效团空间排列约束的问题。模型通过Transformer架构融合原子级药效团特征,结合inpainting和交叉注意力机制强制生成分子符合预设药效团假设,并利用SE(3)等变图Transformer保持空间变换不变性。实验在GEOM-Drugs数据集上训练,对比PGMG、TransPharmer等基线模型,PharmaDiff在药效团匹配分数(MS=0.8964)和完美匹配率(PMR=0.6990)上表现更优,且在结构基设计中对BRD4、VEGFR2等靶点的对接分数优于DiffSBDD。研究表明,PharmaDiff通过整合药效团建模与3D生成技术,为无结构靶点的药物设计提供了有效工具。


6. Protein FID: Improved Evaluation of Protein Structure Generative Models

期刊: arXiv 链接: https://arxiv.org/abs/2505.08041v1

简介: 针对现有蛋白质结构生成模型评估指标的不足,论文提出蛋白质弗雷歇初始距离(FID) metric,通过预训练模型(如ESM3)将结构嵌入潜在空间,计算生成分布与天然蛋白质分布的高斯近似瓦瑟斯坦距离,以评估模型对训练数据分布的捕捉能力。实验验证FID能检测结构扰动、复现FoldSeek聚类和CATH层级结构,并发现当前SOTA模型(如MultiFlow、RFDiffusion)生成的蛋白质与天然结构存在显著FID差距,表现为接触序较低、三级基序冗余度高。通过调整采样参数优化FID可提升生成结构的复杂性和多样性。该研究为蛋白质生成模型提供了新的评估维度,揭示了现有模型在捕捉天然结构分布上的不足,指引模型优化方向。


7. Beyond the Leaderboard: Leveraging Predictive Modeling for Protein-Ligand Insights and Discovery

期刊: bioRxiv 链接: https://doi.org/10.1101/2025.05.12.653449 代码: https://github.com/kalifadan/ProtLigand

简介: 论文提出ProtLigand模型,首次将配体信息整合到蛋白质语言模型(PLM)中,通过跨注意力机制融合蛋白质序列、结构与配体化学特征,提升蛋白质功能预测的准确性并揭示配体介导的生物机制。方法上,模型以SaProt为基础编码器,结合ChemBERTa编码配体SMILES,通过跨注意力层生成配体感知的蛋白质表示,并引入配体生成器预测未知配体。实验在HumanPPI、Thermostability等六项基准任务上进行,使用PDBbind数据集训练,结果显示ProtLigand在Fmax、Smin等指标上显著优于SaProt等基线模型,尤其在配体相关任务(如血红素结合蛋白分类)中表现突出。研究表明,整合配体信息能增强模型对蛋白质功能和稳定性的预测能力,为无结构数据的靶点提供新见解,推动基于配体的药物发现。


8. ProtFun: A Protein Function Prediction Model Using Graph Attention Networks with a Protein Large Language Model

期刊: bioRxiv 链接: https://doi.org/10.1101/2025.05.13.653854 代码: https://github.com/bozdaglab/ProtFun

简介: 论文提出ProtFun模型,通过图注意力网络(GAT)融合蛋白质大语言模型(LLM)嵌入和InterPro特征,提升蛋白质功能预测的准确性。方法上,利用ANKH LLM生成蛋白质序列嵌入作为图节点特征,构建基于InterPro家族、结构域和基序的蛋白质家族网络(PFN),通过GAT学习图结构特征,并与InterPro签名的潜在表示结合进行多标签分类。实验在NetGO、DeepGOZero等三个基准数据集上进行,结果显示ProtFun在Fmax、Smin和AUPRC等指标上优于DeepGOPlus、DeepGraphGO等现有方法,尤其在跨物种预测中表现稳健。消融实验表明,LLM嵌入与图特征的结合是性能提升的关键,模型为蛋白质功能注释提供了多模态融合的新范式,适用于大规模、跨物种的功能预测任务。


9. A Graph-Attention-Based Deep Learning Network for Predicting Biotech–Small-Molecule Drug Interactions

期刊: bioRxiv 链接: https://doi.org/10.1101/2025.05.13.653666 代码: https://github.com/BioinformaticsIASBS/BSI-Net

简介: 论文提出BSI-Net,一种基于图注意力网络的深度学习框架,用于预测生物药与小分子药物的相互作用(BSI),解决现有方法对生物药复杂结构处理不足的问题。方法上,结合小分子的SMILES图特征(通过DGL生成)和生物药的ProtBERT序列嵌入,利用GAT提取结构和序列特征,并融合基于相似性的交互矩阵,通过多层感知机(MLP)进行多分类预测。实验使用新构建的DrugBank数据集(含196种生物药、2148种小分子),在微、宏、加权三种评估模式下,BSI-Net的准确率、F1分数和AUROC均优于SVM、随机森林和CNN等基线模型,尤其在加权F1分数上达到0.9861,显著提升多类DDI预测性能。研究为生物药与小分子联合疗法的相互作用预测提供了有效工具,推动复杂药物组合的发现。


10. Hyperparameter optimization and neural architecture search algorithms for graph Neural Networks in cheminformatics

期刊: Computational Materials Science 链接: https://doi.org/10.1016/j.commatsci.2025.113904

简介: 论文综述了图神经网络(GNN)在化学信息学中的超参数优化(HPO)和神经架构搜索(NAS)策略,强调自动化优化对提升GNN性能的重要性。通过分析网格搜索、随机搜索、贝叶斯优化、进化算法等方法,总结其在分子性质预测、药物发现等任务中的应用效果。实验部分涵盖ESOL、FreeSolv、QM9等数据集,结果表明贝叶斯优化和进化算法在高维搜索空间中表现更优,例如TPE算法在Lipophilicity数据集上的RMSE低于随机搜索和CMA-ES。研究指出,尽管传统方法如网格搜索易于实现,但自动化方法在复杂任务中更具优势,未来需结合元启发式算法和多目标优化提升模型泛化性与效率。该综述为GNN在化学信息学中的优化提供了系统框架,推动自动化方法在药物设计和分子建模中的应用。


11. Integrating AI for next-generation cancer vaccine design

期刊: Science Bulletin 链接: https://doi.org/10.1016/j.scib.2025.04.044

简介: 论文提出整合人工智能(AI)技术优化癌症疫苗设计,聚焦于T细胞受体(TCR)-肽-HLA复合物的免疫原性预测与抗原肽生成。通过多模态数据输入(如肽序列、HLA等位基因、TCR结构),结合深度学习模型(如NetMHC、TransPHLA、DeepTCR)预测肽-HLA结合亲和力及TCR识别特异性,并利用强化学习框架(如NEOM)生成高免疫原性肽候选。实验验证中,NEOM在黑色素瘤和非小细胞肺癌数据中表现出高效的抗原优化能力,结合分子动力学模拟可进一步提升模型对复合物结构动态的理解。研究表明,AI驱动的多模型整合(如AlphaFold3预测结构、对比学习优化特征)能显著提高疫苗设计的准确性和个性化,为解决肿瘤免疫治疗中的抗原筛选难题提供了新范式。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Leveraging Partial SMILES Validation Scheme for Enhanced Drug Design in Reinforcement Learning Frameworks
  • 2. TarMGDif: Target-specific Molecular Graphs Generation Based on Diffusion Model
  • 3. Fate-tox: fragment attention transformer for E(3)-equivariant multi-organ toxicity prediction
  • 4. Generating diversity and securing completeness in algorithmic retrosynthesis
  • 5. Pharmacophore-Conditioned Diffusion Model for Ligand-Based De Novo Drug Design
  • 6. Protein FID: Improved Evaluation of Protein Structure Generative Models
  • 7. Beyond the Leaderboard: Leveraging Predictive Modeling for Protein-Ligand Insights and Discovery
  • 8. ProtFun: A Protein Function Prediction Model Using Graph Attention Networks with a Protein Large Language Model
  • 9. A Graph-Attention-Based Deep Learning Network for Predicting Biotech–Small-Molecule Drug Interactions
  • 10. Hyperparameter optimization and neural architecture search algorithms for graph Neural Networks in cheminformatics
  • 11. Integrating AI for next-generation cancer vaccine design
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档